Стандартно отклонение и промяна са статистически мерки за разпространение на
Формулата за стандартно отклонение и дисперсия често се изразява с помощта на:
Вариантността на набор от н също толкова вероятни стойности могат да бъдат записани като:
Стандартното отклонение е квадратният корен на дисперсията:
Формулите с гръцки букви имат начин да изглеждат поразително, но това не толкова сложно, колкото изглежда. За да го поставите в прости стъпки:
Това дава вариацията. Вземете квадратния корен на дисперсията, за да намерите стандартното отклонение.
Това отлично видео от Академия Хан обяснява концепциите за дисперсия и стандартно отклонение:
Да кажем, че набор от данни включва височината на шест глухарчета: 3 инча, 4 инча, 5 инча, 4 инча, 11 инча и 6 инча.
Първо, намерете средната стойност на точките с данни: (3 + 4 + 5 + 4 + 11 + 7) / 6 = 5,5
Значи средната височина е 5,5 инча. Сега имаме нужда от отклоненията, така че откриваме разликата на всяко растение от средната стойност: -2,5, -1,5, -,5, -1,5, 5,5, 1,5
Сега квадрат всяко отклонение и намерете тяхната сума: 6.25 + 2.25 + .25 + 2.25 + 30.25 + 2.25 = 43.5
Сега разделете сумата от квадратите на броя точки от данни, в този случай растения: 43.5 / 6 = 7.25
Така че дисперсията на този набор от данни е 7,25, което е доста произволно число. За да го преобразувате в измерване в реалния свят, вземете квадратния корен от 7,25, за да намерите стандартното отклонение в инчове.
Стандартното отклонение е около 2,69 инча. Това означава, че за пробата всяко глухарче в рамките на 2.69 инча от средното (5.5 инча) е „нормално“.
Отклоненията са в квадрат, за да се предотврати отрицателните стойности (отклонения под средната стойност) да отменят положителните стойности. Това работи, защото отрицателното число в квадрат се превръща в положителна стойност. Ако имате прост набор от данни с отклонения от средната стойност на +5, +2, -1 и -6, сумата на отклоненията ще излезе като нула, ако стойностите не са квадратни (т.е. 5 + 2 - 1 - 6 = 0).
Вариантността се изразява като математическа дисперсия. Тъй като това е произволно число спрямо оригиналните измервания на набора от данни, е трудно да се визуализира и приложи в реално отношение. Намирането на дисперсията обикновено е само последната стъпка преди да се намери стандартното отклонение. Стойностите на вариациите понякога се използват във финансови и статистически формули.
Стандартното отклонение, което се изразява в оригиналните единици от набора от данни, е много по-интуитивно и по-близо до стойностите на оригиналния набор от данни. Най-често се използва за анализ на демографски данни или проби от населението, за да се добие представа за нормалното в популацията.
При нормално разпределение около 68% от популацията (или стойностите) попада в рамките на 1 стандартно отклонение (1σ) от средната стойност и около 94% попадат в рамките на 2σ. Стойности, които се различават от средната стойност от 1.7σ или повече, обикновено се считат за извънредни.
На практика системите за качество като Six Sigma се опитват да намалят честотата на грешките, така че грешките да станат по-далечни. Терминът "шест сигма процес" идва от схващането, че ако човек има шест стандартни отклонения между средната стойност на процеса и най-близката граница на спецификация, практически нито един елемент няма да изпълни спецификациите.[1]
В приложенията в реалния свят използваните набори от данни обикновено представляват извадки от населението, а не цели популации. Използва се леко модифицирана формула, за да се направят изводите за цялата популация от частична извадка.
Използва се „стандартно отклонение на извадката“, ако всичко, което имате, е извадка, но искате да направите изявление за стандартното отклонение на популацията, от което се взема пробата
Единствената формула за стандартно отклонение на извадката се различава от формулата за стандартно отклонение е "-1" в знаменателя.
Използвайки примера с глухарче, тази формула би била необходима, ако извадихме само 6 глухарчета, но искахме да използваме тази проба, за да посочим стандартното отклонение за цялото поле със стотици глухарчета.
Сумата от квадрати сега ще бъде разделена на 5 вместо 6 (n - 1), което дава отклонение от 8,7 (вместо 7,25) и стандартно отклонение на извадката от 2,95 инча, вместо 2,69 инча за първоначалното стандартно отклонение. Тази промяна се използва за намиране на граница на грешка в извадката (9% в този случай).