Асоциация срещу корелация
Асоциацията и корелацията са два метода за обяснение на връзка между две статистически променливи. Асоциацията се отнася до по-обобщен термин и корелацията може да се разглежда като специален случай на свързване, където връзката между променливите е линейна по своя характер.
Какво е асоциация?
Статистическата терминова асоциация се дефинира като връзка между две случайни променливи, което ги прави статистически зависими. Отнася се до по-скоро обща връзка, без да се споменават специфики на връзката и не е необходимо да бъде причинно-следствена връзка.
Много статистически методи се използват за установяване на връзката между две променливи. Коефициент на корелация на Пиърсън, коефициент на коефициент, корелация на разстоянието, Ламбда на Гудман и Крускал и rho (ρ) на Пирсън са няколко примера.
Какво е корелация?
Корелацията е мярка за силата на връзката между две променливи. Коефициентът на корелация количествено определя степента на промяна на една променлива въз основа на промяната на другата променлива. В статистиката корелацията е свързана с понятието зависимост, което е статистическата връзка между две променливи
Коефициентът на корелация на Пиърсън или просто коефициентът на корелация r е стойност между -1 и 1 (-1≤r≤ + 1). Той е най-често използваният коефициент на корелация и е валиден само за линейна връзка между променливите. Ако r = 0, не съществува връзка и ако r≥0, отношението е пряко пропорционално; стойността на една променлива се увеличава с увеличаването на другата. Ако r≤0, връзката е обратно пропорционална; една променлива намалява с увеличаване на другата.
Поради условието за линейност, коефициентът на корелация r може да се използва и за установяване наличието на линейна връзка между променливите.
Коефициентът на коефициент на корелация на Спиърман и коефициентът на корелация на Кендрал измерват силата на връзката, с изключение на линейния фактор. Те отчитат степента, в която една променлива се увеличава или намалява с другата. Ако и двете променливи се увеличат заедно, коефициентът ще бъде положителен и ако една променлива се увеличава, а другата намалява, стойността на коефициента ще бъде отрицателна.
Коефициентите за корелация на ранг се използват само за установяване на типа на връзката, но не и за подробно изследване като коефициента на корелация на Пиърсън. Те също така се използват за намаляване на изчисленията и правят резултатите по-независими от ненормалността на разглежданите разпределения.
Каква е разликата между асоциацията и корелацията?
• Асоциацията се отнася до общата връзка между две случайни променливи, докато корелацията се отнася до повече или по-малко линейна връзка между случайните променливи.
• Асоциацията е понятие, но корелацията е мярка за свързване и се предоставят математически инструменти за измерване на степента на корелация.
• Коефициентът на корелация на момента на Pearson продукт установява наличието на линейна връзка и определя естеството на връзката (независимо дали те са пропорционални или обратно пропорционални).
• Коефициентите на корелация на ранга се използват за определяне само на естеството на връзката, с изключение на линейността на връзката (тя може или не може да бъде линейна, но ще покаже дали променливите се увеличават заедно, намаляват заедно или една се увеличава, докато другата намалява или обратно).