Разлика между класификация и регресия

Най- ключова разлика между класификацията и регресионното дърво е това в класификацията зависимите променливи са категорични и неподредени, докато в регресия зависимите променливи са непрекъснати или подредени цели стойности.

Класификацията и регресията са техники за учене за създаване на модели за прогнозиране от събрани данни. И двете техники са представени графично като дървета за класификация и регресия, или по-скоро блок-схеми с разделяне на данни след всяка стъпка, или по-скоро "разклонение" в дървото. Този процес се нарича рекурсивен дял. Полетата като Mining използват тези техники за класифициране и регресионно обучение. Тази статия се фокусира върху дървото на класификацията и дървото за регресия.

СЪДЪРЖАНИЕ

1. Преглед и ключова разлика
2. Какво е класификация
3. Какво е регресия
4. Паралелно сравнение - класификация срещу регресия в таблична форма
5. Резюме

Какво е класификация?

Класификацията е техника, използвана за постигане на схема, която показва организацията на данни, започваща с променлива прекурсор. Зависимите променливи са това, което класифицира данните.

Фигура 01: Извличане на данни

Дървото за класификация започва с независимата променлива, която се разделя на две групи, както е определено от съществуващите зависими променливи. Целта е да се изяснят отговорите под формата на категоризация, породена от зависимите променливи.

Какво е регресия

Регресията е метод за прогнозиране, който се основава на предполагаема или известна числова изходна стойност. Тази изходна стойност е резултат от поредица от рекурсивни дялове, като всяка стъпка има една числова стойност и друга група зависими променливи, които се разклоняват към друга двойка като тази.

Дървото на регресия започва с една или повече променливи променливи и завършва с една крайна изходна променлива. Зависимите променливи са непрекъснати или дискретни числови променливи.

Каква е разликата между класификацията и регресията?

 Класификация срещу регресия

Модел на дърво, където целевата променлива може да приеме дискретен набор от стойности. Модел на дърво, при който целевата променлива може да приема непрекъснати стойности, обикновено реални числа.
Зависима променлива
За дървото на класификацията зависимите променливи са категорични. За дървото на регресията зависимите променливи са числови.
Стойности
Има зададено количество непоредни стойности. Има или дискретни все още подредени стойности, или неразделни стойности.
Цел на строителството
Целта на конструирането на регресионното дърво е да монтира регресионна система към всеки детерминантен клон по начин, по който се очаква очакваната стойност на изхода. Дървото за класификация се разклонява, както е определено от зависима променлива, получена от предишния възел.

Обобщение - Класификация срещу регресия

Регресионните и класификационните дървета са полезни техники за очертаване на процеса, който сочи изследван резултат, независимо дали е класификация или единична числова стойност. Разликата между класификационното дърво и регресионното дърво е тяхната зависима променлива. Класификационните дървета имат зависими променливи, които са категорични и нередовни. Регресионните дървета имат зависими променливи, които са непрекъснати стойности или подредени цели стойности.

справка:

1. „Обучение на дърво за решения“. Wikipedia, Фондация Wikimedia, 13 май 2018 г. Достъпно тук 

С любезност на изображенията:

1.'Data Mining'By Arbeck - Собствена работа, (CC BY 3.0) чрез Commons Wikimedia