Контролираното обучение и безконтролното обучение са две основни концепции за машинно обучение. Надзорното обучение е задача за машинно обучение за усвояване на функция, която картографира вход към изход въз основа на примерните двойки вход-изход. Неуправляемото обучение е задачата за машинно обучение за извеждане на функция за описване на скрита структура от незабелязани данни. Най- ключова разлика между контролираното и неподдържаното машинно обучение е това контролираното обучение използва белязани данни, докато неподдържаното обучение използва неозначени данни.
Машинното обучение е поле в компютърните науки, което дава възможност на компютърна система да се учи от данни, без да е изрично програмирана. Той позволява да се анализират данните и да се предвидят модели в тях. Има много приложения на машинното обучение. Някои от тях са разпознаване на лица, разпознаване на жестове и разпознаване на реч. Съществуват различни алгоритми, свързани с машинното обучение. Някои от тях са регресия, класификация и групиране. Най-често срещаните езици за програмиране за разработване на приложения, базирани на машинно обучение, са R и Python. Могат да се използват и други езици като Java, C ++ и Matlab.
1. Преглед и ключова разлика
2. Какво е контролирано обучение
3. Какво е необучавано обучение
4. Прилики между контролираното и безконтролното машинно обучение
5. Паралелно сравнение - Супервизирано срещу Неконтролирано машинно обучение в таблична форма
6. Резюме
В системите, базирани на машинно обучение, моделът работи според алгоритъм. При контролираното обучение моделът се контролира. Първо се изисква обучението на модела. С получените знания може да прогнозира отговори за бъдещите случаи. Моделът се обучава с помощта на обозначен набор от данни. Когато в системата се предоставят извадки от примерни данни, тя може да предвиди резултата. Следва малко извлечение от популярната база данни IRIS.
Според горната таблица атрибутите се наричат дължина на Сепал, ширина на Сепал, дължина на Пател, ширина на Пател и видове. Колоните са известни като функции. Един ред има данни за всички атрибути. Следователно един ред се нарича наблюдение. Данните могат да бъдат или цифрови, или категорични. Моделът получава наблюденията със съответното име на вида като вход. Когато се даде ново наблюдение, моделът трябва да предвиди вида на вида, към който принадлежи.
При контролираното обучение има алгоритми за класификация и регресия. Класификацията е процесът на класифициране на етикетираните данни. Моделът създаде граници, които разделят категориите данни. Когато се предоставят нови данни на модела, той може да се категоризира въз основа на мястото, където съществува точката. K-Най-близките съседи (KNN) е модел за класификация. В зависимост от k стойността се решава категорията. Например, когато k е 5, ако определена точка от данни е близо до осем точки от данни в категория A и шест точки от данни в категория B, точката от данни ще бъде класифицирана като A.
Регресията е процесът на прогнозиране на тенденцията на предишните данни за прогнозиране на резултата от новите данни. При регресия изходът може да се състои от една или повече непрекъснати променливи. Прогнозирането се извършва с помощта на линия, която обхваща повечето точки от данни. Най-простият регресионен модел е линейна регресия. Той е бърз и не изисква настройка на параметри, като например в KNN. Ако данните показват параболична тенденция, тогава моделът на линейна регресия не е подходящ.
Това са някои примери за контролирани алгоритми за обучение. По принцип резултатите, генерирани от контролирани методи на обучение, са по-точни и надеждни, тъй като входните данни са добре известни и етикетирани. Следователно машината трябва да анализира само скритите модели.
При обучението без надзор моделът не се контролира. Моделът работи самостоятелно, за да прогнозира резултатите. Той използва алгоритми за машинно обучение, за да стигне до заключения относно незабелязаните данни. Обикновено алгоритмите за обучение без надзор са по-трудни от алгоритмите за контролирано обучение, тъй като има малко информация. Клъстерирането е вид обучение без надзор. Може да се използва за групиране на непознатите данни с помощта на алгоритми. K-средната и базирана на плътност клъстеризация са два алгоритъма на клъстериране.
k-среден алгоритъм, поставя k centroid на случаен принцип за всеки клъстер. Тогава всяка точка от данни се присвоява на най-близкия центроид. Евклидовото разстояние се използва за изчисляване на разстоянието от точката на данни до центроида. Точките от данни са класифицирани в групи. Позициите за k центроиди се изчисляват отново. Новата централна позиция се определя от средната стойност на всички точки в групата. Отново всяка точка от данни е присвоена на най-близкия центроид. Този процес се повтаря, докато центроидите вече не се променят. k-средно е алгоритъм за бързо клъстериране, но няма определена инициализация на точките на клъстеринг. Също така, има голяма вариация на модели на клъстери, базирани на инициализация на точки от клъстери.
Друг алгоритъм за клъстериране е Клъстериране на базата на плътност. Известен е още като приложения за пространствено клъстериране на базата на плътност с шум. Той работи, като дефинира клъстер като максимален набор от точки, свързани с плътност. Те са два параметъра, използвани за клъстериране на базата на плътност. Те са Ɛ (epsilon) и минимални точки. Ɛ е максималният радиус на квартала. Минималните точки са минималният брой точки в квартала Ɛ за определяне на клъстер. Това са някои примери за групиране, което попада в неуправляемо обучение.
Като цяло, резултатите, генерирани от алгоритмите за непрекъснато обучение не са много точни и надеждни, тъй като машината трябва да дефинира и маркира входните данни, преди да определи скритите модели и функции.
Супервизиран срещу Неподдържано машинно обучение | |
Надзорното обучение е задачата за машинно обучение за усвояване на функция, която картографира вход към изход въз основа на примерни двойки вход-изход. | Неуправляемото обучение е задачата за машинно обучение за извеждане на функция за описване на скрита структура от неозначени данни. |
Основна функционалност | |
При контролирано обучение моделът прогнозира резултата въз основа на обозначените входни данни. | При обучението без надзор моделът прогнозира резултата без етикетирани данни, като идентифицира моделите самостоятелно. |
Точност на резултатите | |
Резултатите, генерирани от контролирани методи на обучение, са по-точни и надеждни. | Резултатите, генерирани от неподдържан метод на обучение, не са много точни и надеждни. |
Основни алгоритми | |
Съществуват алгоритми за регресия и класификация в контролираното обучение. | Съществуват алгоритми за групиране в обучението без надзор. |
Контролираното обучение и Ненадзорното обучение са два вида машинно обучение. Надзорното обучение е задачата за машинно обучение за усвояване на функция, която картографира вход към изход въз основа на примерни двойки вход-изход. Ненадзорното обучение е задачата за машинно обучение за извеждане на функция за описване на скрита структура от незабелязани данни. Разликата между контролираното и не контролираното машинно обучение е, че контролираното обучение използва маркирани данни, докато неподдържаното накланяне използва неозначени данни.
1.TheBigDataUniversity. Машинно обучение - Контролирано VS Неподдържано обучение, Когнитивен клас, 13 март 2017 г. Достъпно тук
2. „Неуправляемо обучение“. Уикипедия, Фондация Уикимедия, 20 март 2018 г. Достъпно тук
3. „Контролирано обучение.“ Уикипедия, Фондация Уикимедия, 15 март 2018 г. Достъпно тук
1.'2729781 'от GDJ (Public Domain) чрез pixabay