Разлика между населението и стандартното отклонение на извадката

Население срещу примерно стандартно отклонение

В статистиката се използват няколко индекса, за да опишат набор от данни, съответстващ на неговата централна тенденция, дисперсия и косост. Стандартното отклонение е една от най-често срещаните мерки за разпръскване на данните от центъра на набора от данни.

Поради практически трудности няма да е възможно да се използват данни от цялото население, когато се тества хипотеза. Следователно ние използваме стойности на данни от проби, за да правим изводи за популацията. В такава ситуация те се наричат ​​оценители, тъй като те оценяват стойностите на параметрите на популацията.

Изключително важно е да се използват безпристрастни оценители в извода. Казва се, че един оценител е безпристрастен, ако очакваната стойност на този оценител е равна на параметъра на популацията. Например използваме примерната средна стойност като безпристрастен оценител за средната популация. (Математически може да се покаже, че очакваната стойност на средната проба е равна на средната популация). В случай на оценка на стандартното отклонение на популацията, стандартното отклонение на извадката също е безпристрастен оценител.

Какво е стандартно отклонение на популацията?

Когато могат да се вземат предвид данните от цялото население (например в случай на преброяване), е възможно да се изчисли стандартното отклонение на населението. За да се изчисли стандартното отклонение на популацията, първо се изчисляват отклоненията на стойностите на данните от средната стойност на населението. Коренният среден квадрат (квадратична средна стойност) на отклоненията се нарича стандартно отклонение на популацията.

В клас от 10 ученици лесно могат да се събират данни за студентите. Ако хипотезата се тества върху тази популация от студенти, не е необходимо да се използват примерни стойности. Например теглото на 10-те ученици (в килограми) се измерва на 70, 62, 65, 72, 80, 70, 63, 72, 77 и 79. Тогава средното тегло на десетте души (в килограми) е (70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79) / 10, което е 71 (в килограми). Това е средната стойност на населението.

Сега, за да изчислим стандартното отклонение на популацията, изчисляваме отклоненията от средната стойност. Съответните отклонения от средната стойност са (70 - 71) = -1, (62 - 71) = -9, (65 - 71) = -6, (72 - 71) = 1, (80 - 71) = 9, (70 - 71) = -1, (63 - 71) = -8, (72 - 71) = 1, (77 - 71) = 6 и (79 - 71) = 8. Сумата от квадрати на отклонение е ( 1)2 + (-9)2 + (-6)2 + 12 + 92 + (-1)2 + (-8)2 + 12 + 62 + 82 = 366. Стандартното отклонение на популацията е √ (366/10) = 6,05 (в килограми). 71 е точното средно тегло на учениците от класа и 6,05 е точното стандартно отклонение на теглото от 71.

Какво е стандартно отклонение на извадката?

Когато за оценка на параметрите на популацията се използват данни от извадка (с размер n), се изчислява стандартното отклонение на извадката. Първо се изчисляват отклоненията на стойностите на данните от средната проба. Тъй като средната проба се използва вместо средната популация (което е неизвестно), вземането на квадратичната средна стойност не е подходящо. За да се компенсира използването на средната проба, сумата от квадрати отклонения се дели на (n-1) вместо n. Стандартното отклонение на извадката е квадратният корен на това. В математическите символи S = ​​√ ∑ (xаз-х)2 / (n-1), където S е стандартното отклонение на извадката, ẍ е средната проба и xазса точките от данни.

Сега да предположим, че в предишния пример населението са учениците от цялото училище. Тогава класът ще бъде само извадка. Ако тази проба се използва при оценката, стандартното отклонение на извадката ще бъде √ (366/9) = 6,38 (в килограми), тъй като 366 е разделено на 9, вместо на 10 (размерът на пробата). Фактът да се отбележи е, че това не е гарантирано, че е точната стойност на стандартното отклонение на популацията. Това е просто оценка за това.

    Каква е разликата между стандартното отклонение на населението и стандартното отклонение на извадката?

    • Стандартното отклонение на популацията е точната стойност на параметъра, използвана за измерване на дисперсията от центъра, докато стандартното отклонение на извадката е безпристрастен оценител за него.

    • Стандартното отклонение на населението се изчислява, когато са известни всички данни за всеки индивид от популацията. Освен това се изчислява стандартното отклонение на пробата.

    • Стандартното отклонение на популацията е дадено с σ = √ ∑ (xi-µ)2/ n където µ е средната стойност на популацията и n е размерът на популацията, но стандартното отклонение на извадката се дава от S = √ ∑ (xi-ẍ)2 / (n-1) където ẍ е средната проба и n е размерът на извадката.