Средно срещу Средно срещу Режим
Средното, средната и режимът са основни мерки с централна тенденция използван в описателната статистика. Те са напълно различни един от друг и случаите, в които се използват за обобщаване на данните, също са различни.
Означава
Аритметичната средна стойност е сумата от стойностите на данните, разделена на броя на стойностите на данните, т.е..
Ако данните са от примерно пространство, това се нарича примерна средна стойност (), което е описателна статистика на извадката. Въпреки че това е най-често използваната описателна мярка за извадка, тя не е стабилна статистика. Той е много чувствителен към отклоненията и трептенията.
Например, помислете за средния доход на гражданите на определен град. Тъй като всички стойности на данните се сумират и след това се разделят, доходите на изключително богат човек влияят значително на средната стойност. Следователно средните стойности не са винаги добро представяне на данните.
Също така, в случай на променлив сигнал, токът, преминаващ през елемент, периодично варира от положителната посока към отрицателна посока и обратно. Ако вземем средния ток, преминаващ през елемента за един период, той ще даде 0, което означава, че през елемента не е преминал ток, което очевидно не е вярно. Следователно и в този случай средноаритметичната стойност не е добра мярка.
Аритметичната средна стойност е добър показател, когато данните са равномерно разпределени. За нормално разпределение средната стойност е равна на режим и медиана. Той има и най-ниските остатъци, когато се има предвид грешката на коренната средна стойност; следователно, най-добрата описателна мярка, когато се изисква да представлява набор от данни чрез едно число.
Медиана
Стойностите на средната точка от данни след подреждането на всички стойности на данни във възходящ ред се определят като медианата на набора от данни. Медианата е 2-ри кватил, 5-ти децил и 50-ти перцентил.
• Ако броят на наблюденията (точки от данни) е нечетен, то средната е наблюдението точно в средата на подредения списък.
• Ако броят на наблюденията (точки от данни) е четен, то средната е средната стойност на двете средни наблюдения в подредения списък.
Медиана разделя наблюдението на две групи; т.е. група (50%) от стойности по-високи и група (50%) от стойности по-ниски от средната. Медианите се използват специално при изкривени разпределения и представляват данни сравнително по-добре от средната аритметика.
вид
Режимът е най-срещаното число в набор от наблюдения. Режимът на набор от данни се изчислява чрез намиране на честотата на всеки елемент в рамките на набора.
• Ако не се появи стойност повече от веднъж, тогава наборът данни няма режим.
• В противен случай всяка стойност, която възниква с най-голяма честота, е режим на набора от данни.
В набор могат да съществуват повече от 1 режим; следователно режимът не е уникална статистика на набор от данни. При еднакво разпределение има един режим. Режимът на дискретно разпределение на вероятността е точката, в която функцията на вероятностната маса достига най-високата си точка. Представяйки по-горе тълкувания, можем да кажем това глобални максимуми са режими.
Помислете за прилагането на трите мерки към следния набор от данни.
ДАННИ: 1, 1, 2, 3, 5, 5, 5, 5, 6, 6, 8, 8, 9, 9, 9, 9, 9, 10, 10, 10, 14, 14, 15, 15 , 15
Средно = (1+ 1+ 2+ 3+ 5+ 5+ 5+ 5+ 6+ 6+ 8+ 8+ 9+ 9+ 9+ 9+ 10+ 10+ 10+ 14+ 14+ 15+ 15+ 15 ) / 25 = 8.12
Медиана = 9 (13-ти елемент)
Режим = 9 (честота 9 = 5)
Каква е разликата между Средно, Средно и Режим?
• Аритметичната средна стойност е сумата от стойностите (наблюденията), разделена на броя на наблюденията. Не е стабилна статистика и силно зависи от нормалния характер на разпространение в рамките на разглежданата дистрибуция. Еднократно може да доведе до значително изместване на средната стойност, което дава относително подвеждащи стойности. Концепцията може да бъде разширена до средно геометрично, хармонично, средно претеглено и така нататък.
• Медиана е средните стойности на набора от наблюдения и тя е относително по-малко засегната от външните хора. Той може да даде добра оценка като обобщена статистика при силно изкривени случаи.
• Режимът е най-често срещаните стойности за наблюдение в набора от данни. Ако разпределението е положително изкривено, режимът лежи на медианата и, ако е отрицателно изкривен, режимът лежи право на медианата.
• Ако е положително наклонен, средното е правилно спрямо медианата; ако отрицателно изкривената средна стойност е отляво на медианата.
• При нормално разпределение и трите средни, режим и медиана са равни.