Регресия срещу ANOVA
Регресия и ANOVA (анализ на вариацията) са два метода в статистическата теория за анализ на поведението на една променлива в сравнение с друга. В регресия често е изменението на зависимата променлива на базата на независима променлива, докато в ANOVA това е изменението на атрибутите на две проби от две популации.
Повече за регресията
Регресията е статистически метод, използван за извличане на връзката между две променливи. Често при събиране на данни може да има променливи, които зависят от другите. Точната връзка между тези променливи може да се установи само чрез регресионни методи. Определянето на тази връзка помага да се разбере и прогнозира поведението на една променлива към друга.
Най-честото приложение на регресионния анализ е да се оцени стойността на зависимата променлива за дадена стойност или диапазон от стойности на зависимите променливи. Например, използвайки регресия, можем да установим връзката между цената на стоката и потреблението въз основа на данните, събрани от произволна извадка. Регресионният анализ ще произведе регресионна функция на набора от данни, който е математически модел, който най-добре отговаря на наличните данни. Това лесно може да бъде представено чрез разпръснат сюжет. Графичната регресия е еквивалентна на намирането на най-подходящата крива за набора от данни. Функцията на кривата е регресионната функция. Използвайки математическия модел, използването на дадена стока може да се предвиди за дадена цена.
Следователно, регресионният анализ се използва широко при прогнозиране и прогнозиране. Използва се също така за установяване на връзки в експериментални данни, в областта на физиката, химията и много природни науки и инженерни дисциплини. Ако връзката или регресионната функция е линейна функция, тогава процесът е известен като линейна регресия. В разпръснатия сюжет той може да бъде представен като права линия. Ако функцията не е линейна комбинация от параметри, тогава регресията е нелинейна.
Повече за ANOVA (анализ на вариацията)
ANOVA не включва анализа на връзка между две или повече променливи изрично. По-скоро проверява дали две или повече проби от различни популации имат еднаква средна стойност. Например, помислете за резултатите от теста на изпит, проведен за оценка в училището. Въпреки че тестовете са различни, производителността може да е еднаква от клас на клас. Един метод за проверка на това е чрез сравняване на средствата на всеки клас. ANOVA или Анализът на вариацията позволява да се тества тази хипотеза. В основата си ANOVA може да се разглежда като разширение на t-теста, където се сравняват средствата на двете проби, взети от две популации.
Основната идея на ANOVA е да разгледа вариацията в пробата и вариацията между пробите. Разнообразието в извадката може да се отдаде на случайността, докато изменението между пробите може да се отдаде както на случайността, така и на други външни фактори. Анализът на дисперсията се основава на три модела; модел с фиксирани ефекти, модел със случайни ефекти и модел на смесени ефекти.
Каква е разликата между Регресия и ANOVA?
• ANOVA е анализът на вариация между две или повече проби, докато регресията е анализ на връзка между две или повече променливи.
• Теорията на ANOVA се прилага с помощта на три основни модела (модел с фиксирани ефекти, модел със случайни ефекти и модел на смесени ефекти), докато регресията се прилага с помощта на два модела (линейна регресионна модель и модел на множествена регресия).
• ANOVA и Regression са и двете версии на General Linear Model (GLM). ANOVA се основава на категорични променливи променливи, докато регресията се основава на количествени променливи променливи.
• Регресията е по-гъвкавата техника и се използва за прогнозиране и прогнозиране, докато ANOVA се използва за сравнение на равенството на две или повече популации.