Разлика между стандартното отклонение и стандартната грешка

Въведение

стандарт давиация (SD) и Сtandard Error (SE) привидно са подобни терминологии; те обаче са толкова разнообразни, че се използват почти взаимозаменяемо в статистическата литература. И двата термина обикновено се предхождат от символ плюс-минус (+/-), който е показателен за факта, че те определят симетрична стойност или представляват диапазон от стойности. Неизменно и двата термина се появяват със средна стойност (средна стойност) от набор от измерени стойности.

Интересното е, че SE няма нищо общо със стандартите, с грешките или с предаването на научни данни.

Подробният поглед върху произхода и обяснението на SD и SE ще разкрие защо професионалните статистици и тези, които го използват настойчиво, и двамата са склонни да грешат.

Стандартно отклонение (SD)

SD е a описателен статистика, описваща разпространението на дадена дистрибуция. Като показател е полезно, когато данните се разпространяват нормално. Въпреки това е по-малко полезно, когато данните са силно изкривени или бимодални, защото не описват много добре формата на разпределението. Обикновено ние използваме SD при отчитане на характеристиките на извадката, защото възнамеряваме да описвам колко данни варират около средната стойност. Други полезни статистически данни за описване на разпространението на данните са междуквартилният диапазон, 25-тият и 75-ият процентили и обхватът на данните.

Фигура 1. SD е мярка за разпространението на данните. Когато данните са извадка от нормално разпределена дистрибуция, тогава се очаква две трети от данните да лежат в рамките на 1 стандартно отклонение от средната стойност.

Вариантът е a описателен статистически също и той се определя като квадрат на стандартното отклонение. Обикновено не се отчита при описване на резултатите, но е по-математически проследима формула (a.k.a. сумата от отклоненията в квадрат) и играе роля в изчисляването на статистиката.

Например, ако имаме две статистически данни P & Q с известни вариации Var(Р) & Var(Q), след това вариацията на сумата P + Q е равна на сумата от дисперсиите: Var(Р) +Var(Q). Вече е очевидно защо статистиците обичат да говорят за разновидности.

Но стандартните отклонения имат важно значение за разпространението, особено когато данните се разпространяват нормално: Средната стойност на интервала +/ - 1 SD може да се очаква да обхване 2/3 от пробата и средната стойност на интервала +- 2 SD може да се очаква да обхване 95% от пробата.

SD предоставя индикация доколко отделните отговори на въпрос варират или „се отклоняват“ от средната стойност. SD казва на изследователя колко разпространени са отговорите - концентрирани ли са около средната стойност или са разпръснати далеч и широко? Всички ваши респонденти оцениха ли продукта ви по средата на скалата или някои го одобриха, а някои не го одобриха?

Помислете за експеримент, при който от респондентите се изисква да оценят продукта по серия от атрибути по 5-бална скала. Средната стойност за група от десет респонденти (обозначени с „A“ до „J“ по-долу) за „добра стойност на парите“ беше 3,2 при SD 0,4, а средната стойност за „надеждност на продукта“ беше 3,4 при SD от 2,1.

На пръв поглед (гледайки само на средствата) изглежда, че надеждността е оценена по-високо от стойността. Но по-високата SD за надеждност може да показва (както е показано в разпределението по-долу), че отговорите са много поляризирани, където повечето респонденти нямат проблеми с надеждността (оцени атрибута „5“), но по-малък, но важен сегмент от анкетираните проблем с надеждността и оцени атрибута „1“. Само погледнато средното разказва само част от историята, но по-често това е, върху което изтъкват изследователите. Разпределението на отговорите е важно да се вземе предвид и СД предоставя ценна описателна мярка за това.

отговарящ Добра стойност за парите Надеждност на продукта
А 3 1
B 3 1
° С 3 1
д 3 1
E 4 5
F 4 5
G 3 5
Н 3 5
аз 3 5
J 3 5
Означава 3.2 3.4
Std. Dev. 0.4 2.1

Първо проучване: Респондентите оценяват продукт по 5-бална скала

Две много различни разпределения на отговорите на 5-точкова скала за оценка могат да дадат една и съща стойност. Помислете следния пример, показващ стойностите на отговора за две различни оценки.

В първия пример (Оценка „А“) SD е нула, защото ВСИЧКИ отговори бяха точно средната стойност. Отделните отговори изобщо не се отклоняват от средната стойност.

В оценка „B“, въпреки че средната стойност на групата е същата (3.0) като първото разпределение, стандартното отклонение е по-високо. Стандартното отклонение от 1,15 показва, че индивидуалните отговори средно * са били малко над 1 точка от средната стойност.

отговарящ Оценка „A“ Оценка „B“
А 3 1
B 3 2
° С 3 2
д 3 3
E 3 3
F 3 3
G 3 3
Н 3 4
аз 3 4
J 3 5
Означава 3.0 3.0
Std. Dev. 0.00 1.15

Второ проучване: Респондентите оценяват продукт по 5-точкова скала

Друг начин за разглеждане на SD е чрез очертаване на разпределението като хистограма на отговорите. Разпределението с нисък SD ще се покаже като висока тясна форма, докато голяма SD ще бъде обозначена с по-широка форма.

По принцип SD не посочва "правилно или грешно" или "по-добре или по-лошо" - по-ниската SD не е непременно по-желана. Използва се чисто като описателна статистика. Той описва разпределението по отношение на средната стойност.

Tтехнически отказ от отговорност, свързани със SD

Мисленето на SD като „средно отклонение“ е отличен начин за концептуално разбиране на неговия смисъл. Всъщност обаче тя не се изчислява като средна стойност (ако беше, ние бихме я нарекли „средно отклонение“). Вместо това той е „стандартизиран“, донякъде сложен метод за изчисляване на стойността, използвайки сумата от квадратите.

За практически цели изчисляването не е важно. Повечето програми за таблици, електронни таблици или други инструменти за управление на данни ще изчислят SD за вас. По-важно е да се разбере какво предава статистиката.

Стандартна грешка

Стандартна грешка е дедуктивен статистика, която се използва, когато се сравняват примерни средства (средни стойности) за популациите. Това е мярка за прецизност от средната проба Средната извадка е статистика, получена от данни, които имат базисно разпределение. Не можем да го визуализираме по същия начин като данните, тъй като сме извършили един експеримент и имат само една стойност. Статистическата теория ни казва, че средната проба (за голяма "достатъчно" извадка и при няколко условия на редовност) е приблизително нормално разпределена. Стандартното отклонение на това нормално разпределение е това, което наричаме стандартна грешка.

Фигура 2. Разпределението в долната част repreизпраща разпределението на данните, докато разпределението в горната част е теоретичното разпределение на средната проба. SD от 20 е мярка за разпространението на данните, докато SE от 5 е мярка за несигурност около средната проба.

Когато искаме да сравним средните резултати от двупробен експеримент на Лечение А срещу Лечение Б, тогава трябва да преценим колко точно сме измерили средствата.

Всъщност ни интересува как точно сме измерили разликата между двете средства. Наричаме тази мярка стандартната грешка на разликата. Може да не се изненадате, когато научите, че стандартната грешка на разликата в извадковите средства е функция на стандартните грешки на средствата:

След като разбрахте, че стандартната грешка на средната стойност (SE) и стандартното отклонение на разпределението (SD) са две различни зверове, може би се чудите как те се объркаха на първо място. Макар и да се различават концептуално, те имат проста математическа връзка:

,където n е броят на точките от данни.

Забележете, че стандартната грешка зависи от два компонента: стандартното отклонение на пробата и размера на пробата н. Това има интуитивен смисъл: колкото по-голямо е стандартното отклонение на извадката, толкова по-малко точна можем да бъдем за нашата оценка на истинската средна стойност.

Освен това, колкото по-голям е размерът на извадката, толкова повече информация имаме за населението и по-точно можем да преценим истинската средна стойност.

SE е индикация за надеждността на средната стойност. Малка SE е индикация, че средната проба е по-точно отражение на реалната средна популация. По-големият размер на извадката обикновено води до по-малък SE (докато SD не е пряко засегнат от размера на извадката).

Повечето проучвания включват изготвяне на извадка от популация. След това правим изводи за популацията от резултатите, получени от тази извадка. Ако е направена втора проба, резултатите вероятно няма да съвпадат точно с първата проба. Ако средната стойност за атрибут за оценка беше 3,2 за една проба, тя може да бъде 3,4 за втора извадка със същия размер. Ако извадим безкраен брой проби (с еднакъв размер) от нашата популация, бихме могли да покажем наблюдаваното средство като разпределение. След това бихме могли да изчислим средна стойност от всички наши примерни средства. Това означава, че би било равно на средното население. Можем също да изчислим SD на разпределението на примерните средства. SD на това разпределение на примерни средства е SE на всяка отделна средна проба.

Така ние имаме най-значимото си наблюдение: SE е SD на населението средно.

проба Означава
1-ви 3.2
2-ри 3.4
трета 3.3
4-ти 3.2
5-ти 3.1
... . ... .
... . ... .
... . ... .
... . ... .
... . ... .
Означава 3.3
Std. Dev. 0.13

Таблица, илюстрираща връзката между SD и SE

Вече е ясно, че ако SD на тази дистрибуция ни помогне да разберем колко далече е средната извадка от истинската средна популация, тогава можем да използваме това, за да разберем колко точна е средната стойност на отделната извадка спрямо истинската средна стойност. Това е същността на SE.

В действителност ние съставихме само една извадка от нашето население, но можем да използваме този резултат, за да дадем оценка на надеждността на нашата наблюдавана проба средно.

Всъщност SE ни казва, че можем да бъдем 95% уверени, че наблюдаваната ни проба средно е плюс или минус приблизително 2 (всъщност 1.96) Стандартни грешки от населението означават.

По-долу таблицата показва разпределението на отговорите от първата ни (и единствена) извадка, използвана за нашите изследвания. SE от 0,13, тъй като е сравнително малък, ни показва, че средната ни стойност е сравнително близка до истинската средна за цялото ни население. Границата на грешка (с 95% доверие) за нашата средна стойност е (приблизително) два пъти по-голяма от тази стойност (+/- 0,26), което ни казва, че истинската средна стойност е най-вероятно между 2,94 и 3,46.

отговарящ оценка
А 3
B 3
° С 3
д 3
E 4
F 4
G 3
Н 3
аз 3
J 3
Означава 3.2
Std. заблуждавам 0.13

резюме

Много изследователи не разбират разликата между стандартно отклонение и стандартна грешка, въпреки че обикновено са включени в анализа на данните. Макар че действителните изчисления за стандартното отклонение и стандартната грешка изглеждат много сходни, те представляват две много различни, но допълващи се мерки. SD ни казва за формата на нашата дистрибуция, доколко близките стойности на отделните данни са от средната стойност. SE ни казва колко близо е средната ни извадка до истинската средна за цялото население. Заедно те помагат да се даде по-пълна картина, отколкото може да ни каже само средната стойност.