Разлика между регресия и корелация

Регресия срещу корелация

В статистиката е важно определянето на връзката между две случайни променливи. Дава възможност да се правят прогнози за една променлива спрямо другите. Регресионният анализ и корелацията се прилагат при прогнозите за времето, поведението на финансовия пазар, установяването на физически взаимоотношения чрез експерименти и в много по-реални сценарии в реалния свят.

Какво е регресия?

Регресията е статистически метод, използван за извличане на връзката между две променливи. Често при събиране на данни може да има променливи, които зависят от другите. Точната връзка между тези променливи може да се установи само чрез методите на регресия. Определянето на тази връзка помага да се разбере и прогнозира поведението на една променлива към друга.

Най-честото приложение на регресионния анализ е да се оцени стойността на зависимата променлива за дадена стойност или диапазон от стойности на независимите променливи. Например, използвайки регресия, можем да установим връзката между цената на стоката и потреблението въз основа на данните, събрани от произволна извадка. Регресионният анализ произвежда регресионната функция на набор от данни, който е математически модел, който най-добре се вписва в наличните данни. Това лесно може да бъде представено чрез разпръснат сюжет. Графично, регресията е еквивалентна на намирането на най-подходящата крива за набора от данни. Функцията на кривата е регресионната функция. Използвайки математическия модел, търсенето на стока може да се предвиди за дадена цена.

Следователно, регресионният анализ се използва широко при прогнозиране и прогнозиране. Използва се също така за установяване на връзки в експериментални данни, в областта на физиката, химията и много природни науки и инженерни дисциплини. Ако връзката или регресионната функция е линейна функция, тогава процесът е известен като линейна регресия. В разпръснатия сюжет той може да бъде представен като права линия. Ако функцията не е линейна комбинация от параметри, тогава регресията е нелинейна.

Какво е корелация?

Корелацията е мярка за силата на връзката между две променливи. Коефициентът на корелация количествено определя степента на промяна в една променлива въз основа на промяната в другата променлива. В статистиката корелацията е свързана с понятието зависимост, което е статистическата връзка между две променливи.

Коефициентът на корелация на Pearsons или просто коефициентът на корелация r е стойност между -1 и 1 (-1≤r≤ + 1). Той е най-често използваният коефициент на корелация и е валиден само за линейна връзка между променливите. Ако r = 0, не съществува връзка и ако r≥0, отношението е пряко пропорционално; т.е. стойността на една променлива се увеличава с увеличаването на другата. Ако r≤0, връзката е обратно пропорционална; т.е. една променлива намалява с увеличаване на другата.

Поради условието за линейност, коефициентът на корелация r може да се използва и за установяване наличието на линейна връзка между променливите.

Каква е разликата между регресия и корелация?

Регресията дава формата на връзката между две случайни променливи, а корелацията дава степента на силата на връзката.

Регресионният анализ създава регресионна функция, която помага за екстраполиране и прогнозиране на резултатите, докато корелацията може да даде информация само в каква посока може да се промени.

По-точните модели на линейна регресия се дават от анализа, ако коефициентът на корелация е по-висок. (| R | ≥0.8)