Линейна срещу логистична регресия
В статистическия анализ е важно да се идентифицират връзките между съответните променливи към изследването. Понякога това може да е единствената цел на самия анализ. Един силен инструмент, използван за установяване съществуването на връзка и идентифициране на връзката, е регресионен анализ.
Най-простата форма на регресионен анализ е линейната регресия, където отношението между променливите е линейна връзка. В статистически план той разкрива връзката между обяснителната променлива и променливата на отговора. Например, използвайки регресия, можем да установим връзката между цената на стоката и потреблението въз основа на данни, събрани от произволна извадка. Регресионният анализ ще произведе регресионна функция на набора от данни, който е математически модел, който най-добре отговаря на наличните данни. Това лесно може да бъде представено чрез разпръснат сюжет. Графичната регресия е еквивалентна на намирането на най-подходящата крива за дадения набор от данни. Функцията на кривата е регресионната функция. Използвайки математическия модел, може да се предвиди използването на стока за дадена цена.
Следователно, регресионният анализ се използва широко при прогнозиране и прогнозиране. Използва се и за установяване на връзките в експерименталните данни, в областта на физиката, химията и в много природни и инженерни дисциплини. Ако връзката или регресионната функция е линейна функция, тогава процесът е известен като линейна регресия. В разпръснатия сюжет той може да бъде представен като права линия. Ако функцията не е линейна комбинация от параметри, тогава регресията е нелинейна.
Логистичната регресия е сравнима с многовариантната регресия и създава модел, който да обясни влиянието на множество прогнози върху променливата на отговора. В логистичната регресия обаче променливата на крайния резултат трябва да бъде категорична (обикновено разделена; т.е. двойка постижими резултати, като смърт или оцеляване, въпреки че специалните техники позволяват моделиране на по-категоризирана информация). Непрекъсната променлива на резултатите може да се трансформира в категорична променлива, която да се използва за логистична регресия; обаче сриването на непрекъснати променливи по този начин е най-вече обезкуражено, защото намалява точността.
За разлика от линейната регресия, спрямо средната стойност, променливите на прогнозата в логистичната регресия не трябва да бъдат принуждавани да бъдат линейно свързани, често разпределени или да имат еднаква разлика във всеки клъстер. В резултат на това връзката между променливите на прогноза и резултатите не е линейна функция.
Каква е разликата между логистичната и линейна регресия?
• При линейна регресия се приема линейна връзка между обяснителната променлива и променливата на отговора и чрез анализ се откриват параметри, удовлетворяващи модела, за да се даде точната връзка.
• Линейната регресия се провежда за количествени променливи и получената функция е количествена.
• В логистичната регресия използваните данни могат да бъдат категорични или количествени, но резултатът винаги е категоричен.