Машинното обучение е набор от методи, използвани за създаване на компютърни програми, които могат да се учат от наблюдения и да правят прогнози. Машинното обучение използва алгоритми, регресии и свързани науки за разбиране на данните. Тези алгоритми обикновено могат да се разглеждат като статистически модели и мрежи.
Дълбокото обучение е подмножество от методи за машинно обучение. Данните се анализират през множество слоеве на дълбока учебна мрежа, така че мрежата да може да прави заключения и да взема решения относно данните. Дълбоките методи за обучение позволяват голяма точност при големи набори от данни, но тези характеристики правят дълбокото обучение много по-интензивно от класическото машинно обучение.
В продължение на няколко десетилетия машинното обучение се използва като метод за постигане на изкуствен интелект в машините. В основата си областта на машинното обучение е съсредоточена върху създаването на компютри, които могат да учат и да вземат решения, което прави машинното обучение добре пригодено за изследвания на изкуствения интелект. Не всички модели на машинно обучение обаче имат за цел да развият „истински“ изкуствен интелект, който напълно съвпада или надвишава човешкия интелект. Вместо това, моделите често са предназначени за изследване на специфични, ограничени проблеми.
Дълбокото обучение беше предложено в ранните етапи на дискусиите за машинно обучение, но малко изследователи следваха методи на дълбоко обучение, тъй като изчислителните изисквания за дълбокото обучение са много по-големи, отколкото при класическото машинно обучение. Въпреки това, изчислителната мощ на компютрите нараства експоненциално от 2000 г., което позволява на изследователите да направят огромни подобрения в машинното обучение и изграждането на изкуствен интелект. Тъй като моделите за дълбоко обучение се мащабират добре с увеличаване на данните, дълбокото обучение има потенциал да преодолее значителни пречки при създаването на истински изкуствен интелект.
Машинното обучение и задълбоченото обучение са алгоритмични. При класическото машинно обучение изследователите използват сравнително малко количество данни и решават кои са най-важните характеристики в рамките на данните, от които се нуждае алгоритъмът, за да правят прогнози. Този метод се нарича конструкторска функция. Например, ако програма за машинно обучение се обучаваше да разпознава образа на самолет, неговите програмисти биха направили алгоритми, които позволяват на програмата да разпознава типичните форми, цветове и размери на търговски самолети. С тази информация програмата за машинно обучение би направила прогнози дали изображенията са представени с включени самолети.
Дълбокото обучение обикновено се разграничава от класическото машинно обучение чрез многото му слоеве при вземане на решения. Мрежите за дълбоко обучение често се считат за „черни кутии“, тъй като данните се анализират чрез множество мрежови слоеве, всеки от които прави наблюдения. Това може да направи резултатите по-трудни за разбиране, отколкото резултатите от класическото машинно обучение. Точният брой слоеве или стъпки при вземане на решение зависи от вида и сложността на избрания модел.
Машинното обучение традиционно използва малки набори от данни, от които да се учи и да прави прогнози. С малко количество данни изследователите могат да определят точни характеристики, които ще помогнат на програмата за машинно обучение да разбере и да се поучи от данните. Ако обаче програмата се натъкне на информация, която не може да класифицира въз основа на съществуващите си алгоритми, изследователите обикновено ще трябва ръчно да анализират проблемните данни и да създадат нова функция. Поради това класическото машинно обучение обикновено не се мащабира добре с огромни количества данни, но може да сведе до минимум грешките при по-малки набори от данни.
Дълбокото обучение е особено подходящо за големи набори от данни и моделите често изискват големи набори от данни, за да бъдат полезни. Поради сложността на мрежа за дълбоко обучение, мрежата се нуждае от значително количество данни за обучение и допълнителни данни, за да тества мрежата след обучение. В момента изследователите усъвършенстват мрежи за дълбоко обучение, които могат да бъдат по-ефективни и използват по-малки набори от данни.
Машинното обучение има променливи изисквания за производителност на компютъра. Има много модели, които могат да се стартират на средния персонален компютър. Колкото по-напреднали стават статистическите и математическите методи, толкова по-трудно е компютърът бързо да обработва данни.
Дълбокото обучение е много интензивно. Разделянето на големи количества информация чрез множество слоеве за вземане на решения изисква много изчислителна мощ. Тъй като компютрите стават по-бързи, задълбоченото обучение става все по-достъпно.
Традиционно машинното обучение има няколко общи и значителни ограничения. Overfitting е статистически проблем, който може да засегне алгоритъм за машинно обучение. Алгоритъмът за машинно обучение съдържа определено количество „грешка“ при анализиране и прогнозиране с данни. Предполага се, че алгоритъмът показва връзка между съответните променливи, но при преоборудването той започва да улавя и грешката, което води до "по-шумни" или неточни модели. Моделите на машинно обучение могат също да станат предубедени към идиосинкразиите на данните, с които са обучени, проблем, който е особено очевиден, когато изследователите обучават алгоритми за целия наличен набор от данни, вместо да запазват част от данните, за да тестват алгоритъма срещу.
Дълбокото обучение има същите статистически клопки като класическото машинно обучение, както и няколко уникални проблема. За много проблеми няма достатъчно налични данни за обучение на разумно точна мрежа за дълбоко обучение. Често е рентабилно или невъзможно да се съберат повече данни за или симулират проблем в реалния свят, който ограничава текущия набор от теми, за които може да се използва задълбочено обучение.
Машинното и дълбокото обучение описват методите за преподаване на компютри за учене и вземане на решения. Дълбокото обучение е подмножество от класическото машинно обучение и някои важни различия правят дълбокото учене и машинното обучение всеки подходящ за различни приложения.