Корелация срещу ковариация
Корелацията и ковариацията са тясно свързани понятия в теоретичната статистика. Те са важни за определяне на връзката между две случайни променливи.
Какво е корелация?
Корелацията е мярка за силата на връзката между две променливи. Коефициентът на корелация количествено определя степента на промяна на една променлива въз основа на промяната на другата променлива. В статистиката корелацията е свързана с понятието зависимост, което е статистическата връзка между две променливи
Коефициентът на корелация на Пиърсън или просто коефициентът на корелация r е стойност между -1 и 1 (-1≤r≤ + 1). Той е най-често използваният коефициент на корелация и е валиден само за линейна връзка между променливите. Ако r = 0 не съществува връзка и ако r≥0 връзката е пряко пропорционална; стойността на една променлива се увеличава с увеличаването на другата. Ако r≤0 връзката е обратно пропорционална; една променлива намалява с увеличаване на другата.
Поради условието за линейност, коефициентът на корелация r може да се използва и за установяване наличието на линейна връзка между променливите.
Какво е ковариация?
В статистическата теория ковариацията е мярка за това колко две случайни променливи се променят заедно. С други думи, ковариацията е мярка за силата на корелацията между две случайни променливи.
В друга перспектива може да се види, че корелацията е само нормализираната версия на ковариацията, при която ковариацията е разделена на произведението на стандартните отклонения на двете случайни променливи. Обхватът на ковариация може да бъде голям; следователно не е лесно да се сравни. Тази трудност се преодолява чрез привеждане на стойностите на ковариацията до диапазон, където тя може да бъде сравнена чрез нормализиране (като например това, което прави z-score). Въпреки че ковариацията и отклонението са свързани помежду си по горепосочения начин, техните вероятностни разпределения не са прикрепени един към друг по прост начин и трябва да бъдат разгледани отделно.
Каква е разликата между корелация и ковариация?
• Корелацията и ковариацията са мерки за връзка между две случайни променливи. Корелацията е мярката на силата на линейността на двете променливи, а ковариацията е мярка за силата на корелацията.
• Стойностите на коефициента на корелация са стойност между -1 и +1, докато обхватът на ковариацията не е постоянен, но може да бъде или положителен, или отрицателен. Но ако случайните променливи са стандартизирани преди изчисляване на ковариацията, тогава ковариацията е равна на корелацията и има стойност между -1 и +1.