Вариант срещу ковариация
Вариантността и ковариацията са две мерки, използвани в статистиката. Вариантността е мярка за разсейването на данните, а ковариацията показва степента на промяна на две случайни променливи заедно. Вариантността е по-скоро интуитивно понятие, но ковариацията е дефинирана математически по не толкова интуитивна в началото.
Повече за Variance
Вариантът е мярка за разпръскване на данните от средната стойност на разпределението. Той разказва колко далеч се намират точките от средата на разпределението. Той е един от основните дескриптори на разпределението на вероятностите и един от моментите на разпределението. Също така, дисперсията е параметър за популацията, а дисперсията на извадка от популацията действа като оценка за дисперсията на популацията. От една гледна точка тя се определя като квадрат на стандартното отклонение.
На обикновен език той може да бъде описан като средна стойност на квадратите на разстоянието между всяка точка от данни и средната стойност на разпределението. Следната формула се използва за изчисляване на дисперсията.
Var (X) = Е [(X-μ)2 ] за население, и
Var (X) = Е [(X-~x)2 ] за извадка
Освен това може да се опрости, за да се даде Var (X) = E [X2 ] - (Е [Х])2.
Variance има някои свойства на подпис и често се използва в статистиката, за да направи използването по-лесно. Вариантът е неотрицателен, защото е квадратът на разстоянията. Обхватът на дисперсията обаче не е ограничен и зависи от конкретното разпределение. Дисперсията на постоянна случайна променлива е нула и дисперсията не се променя по отношение на параметър на местоположението.
Повече за ковариацията
В статистическата теория ковариацията е мярка за това колко две случайни променливи се променят заедно. С други думи, ковариацията е мярка за силата на корелацията между две случайни променливи. Също така може да се разглежда като обобщение на концепцията за дисперсия на две случайни променливи.
Ковариацията на две случайни променливи X и Y, които са разпределени заедно с краен втори импулс, е известна като σXY= Е [(X-E [X]) (Y-E [Y])]. От това вариацията може да се разглежда като специален случай на ковариация, при който две променливи са еднакви. Cov (X, X) = Var (X)
Чрез нормализиране на ковариацията може да се получи коефициентът на линейна корелация или коефициентът на корелация на Пирсън, който се определя като ρ = E [(X-E [X]) (Y-E [Y])] / (σх σY ) = (Cov (X, Y)) / (σх σY)
Графично ковариацията между двойка точки от данни може да се разглежда като площта на правоъгълника с точките от данни в противоположните върхове. Тя може да се интерпретира като мярка за величината на разделяне между двете точки от данни. Като се имат предвид правоъгълниците за цялото население, припокриването на правоъгълниците, съответстващи на всички точки от данни, може да се счита за силата на разделянето; дисперсия на двете променливи. Ковариацията е в две измерения поради две променливи, но опростяването й до една променлива дава дисперсията на единица като разделянето в едно измерение.
Каква е разликата между вариацията и ковариацията?
• Вариантността е мярката за разпространение / дисперсия в популация, докато ковариацията се счита за мярка за изменение на две случайни променливи или силата на корелацията.
• Вариантността може да се разглежда като специален случай на ковариация.
• Вариантността и ковариацията зависят от големината на стойностите на данните и не могат да се сравняват; следователно те се нормализират. Ковариацията се нормализира в коефициента на корелация (разделяне на произведението на стандартните отклонения на двете случайни променливи) и дисперсията се нормализира в стандартното отклонение (чрез вземане на квадратния корен)