Както задълбоченото, така и укрепващото обучение са силно свързани с изчислителната мощ на изкуствения интелект (AI). Те са автономни функции за машинно обучение, които проправят път на компютрите да създават свои собствени принципи при разработването на решения. Тези два вида учене могат също да съществуват в няколко програми. По принцип задълбоченото обучение използва текущи данни, докато засилващото обучение използва метода за изпробване и грешка при намирането на прогнози. Следващите дискусии по-нататък задълбочават такива различия.
Дълбокото обучение се нарича също дълбоко структурирано обучение или йерархично обучение. Това е представено за първи път през 1986 г. от Рина Дехтер, професор по компютърни науки. Той използва текущата информация в алгоритмите за преподаване, за да търси подходящи модели, които са от съществено значение при прогнозиране на данните. Такава система използва различни нива на изкуствени невронни мрежи, подобни на невроналния състав на човешкия мозък. С помощта на сложни връзки алгоритъмът може да бъде в състояние да обработи милиони информация и да въведе зона при по-конкретно прогнозиране.
Този вид обучение може да се приложи, когато разработчиците искат софтуер, който да забележи цветното виолетово върху различни снимки. Програмата ще бъде захранена с редица изображения (следователно „дълбоко“ обучение) с и без виолетови цветове. Чрез клъстериране програмата ще може да идентифицира модели и да научи кога да маркира цвят като виолетов. Дълбокото обучение се използва в различни програми за разпознаване като анализи на изображения и задачи за прогнозиране като прогнози във времеви серии.
Укрепването на обучението обикновено изчислява прогнозите чрез опит и грешка. По отношение на своята история от гледна точка на ИИ, тя е разработена в края на 80-те години; тя се основаваше на резултатите от експерименти с животни, концепции за оптимален контрол и временни различия. Наред с контролираното и неуправляемото обучение, укрепването е една от основните парадигми в машинното обучение. Както подсказва името му, алгоритъмът се тренира чрез награди.
Например AI е разработен да играе с хора в определена мобилна игра. Всеки път, когато AI загуби, алгоритъмът се ревизира, за да увеличи максимално резултата си. Така този вид техника се учи от грешките си. След многобройни цикли ИИ се разви и стана по-добър в побеждаването на човешки играчи. Укрепването на обучението се прилага в различни авангардни технологии като подобряване на роботиката, извличане на текст и здравеопазване.
Дълбокото обучение е в състояние да изпълни целевото поведение чрез анализ на съществуващите данни и прилагане на наученото към нов набор от информация. От друга страна, обучението за подсилване е в състояние да промени своя отговор чрез адаптиране на непрекъсната обратна връзка.
Дълбокото обучение работи с вече съществуващи данни, тъй като е наложително при обучението на алгоритъма. Що се отнася до обучението за подсилване, то има изследователски характер и може да бъде разработено без актуален набор от данни, тъй като се учи чрез проба и грешка.
Дълбокото обучение се използва при разпознаване на изображения и реч, дълбоко търсене в мрежата и намаляване на измеренията. За сравнение, обучението за подсилване се използва при взаимодействие с външни стимули с оптимално управление, като например в роботиката, планирането на асансьори, телекомуникациите, компютърните игри и здравето.
Дълбокото обучение е известно още като йерархично обучение или задълбочено структурирано обучение, докато укрепващото обучение няма други широко известни термини.
Дълбокото обучение е един от многото методи за машинно обучение. От друга страна, обучението за подсилване е област на машинното обучение; тя е една от трите основни парадигми.
В сравнение с задълбоченото обучение, обучението за подсилване е по-близо до възможностите на човешкия мозък, тъй като този вид интелигентност може да бъде подобрена чрез обратна връзка. Дълбокото обучение е главно за признаване и е по-малко свързано с взаимодействие.
Дълбокото обучение е въведено за първи път през 1986 г. от Рина Дехтер, докато обучението за подсилване е разработено в края на 80-те години на основата на концепциите за експерименти с животни, оптимален контрол и временни различия.