Стандартно отклонение срещу вариация

Стандартно отклонение и промяна са статистически мерки за разпространение на Стандартно отклонениевариранеМатематическа формула Квадратният корен на Variance Средна стойност на квадратите отклонения на всяка стойност от средната стойност в пробата. символ Гръцка буква сигма - σ Без специален символ; изразени като стандартно отклонение или други стойности. Стойности спрямо дадения набор от данни Същата скала като стойностите в дадения набор от данни; следователно, изразени в същите единици. Мащаб по-голям от стойностите в дадения набор от данни; не се изразява в една и съща единица като самите стойности. Стойностите са отрицателни или положителни? Винаги неотрицателен Винаги неотрицателен Приложение за реален свят Вземане на проби от населението; идентифициране на остатъците Статистически формули, финанси.

Съдържание: Стандартно отклонение срещу вариация

  • 1 Важни понятия
  • 2 символа
  • 3 формули
  • 4 Пример
    • 4.1 Защо да квадратят отклоненията?
  • 5 приложения в реалния свят
    • 5.1 Намиране на външни хора
  • 6 Примерно стандартно отклонение
  • 7 Позовавания

Важни понятия

  • Означава: средната стойност на всички стойности в набор от данни (добавете всички стойности и разделете тяхната сума на броя стойности).
  • Отклонение: разстоянието на всяка стойност от средната стойност. Ако средната стойност е 3, стойност 5 има отклонение 2 (извадете средната стойност от стойността). Отклонението може да бъде положително или отрицателно.

Символи

Формулата за стандартно отклонение и дисперсия често се изразява с помощта на:

  • x̅ = средната стойност или средната стойност на всички точки от данни в проблема
  • X = индивидуална точка от данни
  • N = броят точки в набора от данни
  • ∑ = сумата от [квадратите на отклоненията]

Формули

Вариантността на набор от н също толкова вероятни стойности могат да бъдат записани като:

Стандартното отклонение е квадратният корен на дисперсията:

Формулите с гръцки букви имат начин да изглеждат поразително, но това не толкова сложно, колкото изглежда. За да го поставите в прости стъпки:

  1. намерете средната стойност на всички точки от данни
  2. разберете колко далеч е всяка точка от средната стойност (това е отклонението)
  3. квадрат всяко отклонение (т.е. разликата на всяка стойност от средната стойност)
  4. разделете сумата от квадратите на броя точки.

Това дава вариацията. Вземете квадратния корен на дисперсията, за да намерите стандартното отклонение.

Това отлично видео от Академия Хан обяснява концепциите за дисперсия и стандартно отклонение:

пример

Да кажем, че набор от данни включва височината на шест глухарчета: 3 инча, 4 инча, 5 инча, 4 инча, 11 инча и 6 инча.

Първо, намерете средната стойност на точките с данни: (3 + 4 + 5 + 4 + 11 + 7) / 6 = 5,5

Значи средната височина е 5,5 инча. Сега имаме нужда от отклоненията, така че откриваме разликата на всяко растение от средната стойност: -2,5, -1,5, -,5, -1,5, 5,5, 1,5

Сега квадрат всяко отклонение и намерете тяхната сума: 6.25 + 2.25 + .25 + 2.25 + 30.25 + 2.25 = 43.5

Сега разделете сумата от квадратите на броя точки от данни, в този случай растения: 43.5 / 6 = 7.25

Така че дисперсията на този набор от данни е 7,25, което е доста произволно число. За да го преобразувате в измерване в реалния свят, вземете квадратния корен от 7,25, за да намерите стандартното отклонение в инчове.

Стандартното отклонение е около 2,69 инча. Това означава, че за пробата всяко глухарче в рамките на 2.69 инча от средното (5.5 инча) е „нормално“.

Защо да квадратят отклоненията?

Отклоненията са в квадрат, за да се предотврати отрицателните стойности (отклонения под средната стойност) да отменят положителните стойности. Това работи, защото отрицателното число в квадрат се превръща в положителна стойност. Ако имате прост набор от данни с отклонения от средната стойност на +5, +2, -1 и -6, сумата на отклоненията ще излезе като нула, ако стойностите не са квадратни (т.е. 5 + 2 - 1 - 6 = 0).

Реални приложения

Вариантността се изразява като математическа дисперсия. Тъй като това е произволно число спрямо оригиналните измервания на набора от данни, е трудно да се визуализира и приложи в реално отношение. Намирането на дисперсията обикновено е само последната стъпка преди да се намери стандартното отклонение. Стойностите на вариациите понякога се използват във финансови и статистически формули.

Стандартното отклонение, което се изразява в оригиналните единици от набора от данни, е много по-интуитивно и по-близо до стойностите на оригиналния набор от данни. Най-често се използва за анализ на демографски данни или проби от населението, за да се добие представа за нормалното в популацията.

Намиране на остатъци

Нормално разпределение (Bell крива) с ленти, съответстващи на 1σ

При нормално разпределение около 68% от популацията (или стойностите) попада в рамките на 1 стандартно отклонение (1σ) от средната стойност и около 94% попадат в рамките на 2σ. Стойности, които се различават от средната стойност от 1.7σ или повече, обикновено се считат за извънредни.

На практика системите за качество като Six Sigma се опитват да намалят честотата на грешките, така че грешките да станат по-далечни. Терминът "шест сигма процес" идва от схващането, че ако човек има шест стандартни отклонения между средната стойност на процеса и най-близката граница на спецификация, практически нито един елемент няма да изпълни спецификациите.[1]

Примерно стандартно отклонение

В приложенията в реалния свят използваните набори от данни обикновено представляват извадки от населението, а не цели популации. Използва се леко модифицирана формула, за да се направят изводите за цялата популация от частична извадка.

Използва се „стандартно отклонение на извадката“, ако всичко, което имате, е извадка, но искате да направите изявление за стандартното отклонение на популацията, от което се взема пробата

Единствената формула за стандартно отклонение на извадката се различава от формулата за стандартно отклонение е "-1" в знаменателя.

Използвайки примера с глухарче, тази формула би била необходима, ако извадихме само 6 глухарчета, но искахме да използваме тази проба, за да посочим стандартното отклонение за цялото поле със стотици глухарчета.

Сумата от квадрати сега ще бъде разделена на 5 вместо 6 (n - 1), което дава отклонение от 8,7 (вместо 7,25) и стандартно отклонение на извадката от 2,95 инча, вместо 2,69 инча за първоначалното стандартно отклонение. Тази промяна се използва за намиране на граница на грешка в извадката (9% в този случай).

Препратки

  • Прост пример за изчисляване на стандартното отклонение - AppSpot
  • Стандартни формули за отклонение - Математиката е забавна
  • Абсолютно отклонение и вариация - Laerd статистика
  • Стандартно отклонение и вариация - Математиката е забавна
  • Уикипедия: Стандартно отклонение
  • Уикипедия: Вариант # Свойства
  • Обхват, дисперсия и стандартно отклонение като мерки за дисперсия - Академия Хан
  • Начини, медиани и средства: обединяваща перспектива