DBMS vs Data Mining
СУБД (система за управление на база данни) е цялостна система, използвана за управление на цифрови бази данни, която позволява съхранение на съдържание на база данни, създаване / поддържане на данни, търсене и други функционалности. От друга страна, Data Mining е поле в компютърните науки, което се занимава с извличането на неизвестна досега и интересна информация от сурови данни. Обикновено данните, използвани като вход за процеса на извличане на данни, се съхраняват в бази данни. Потребителите, склонни към статистиката, използват Data Mining. Те използват статистически модели, за да търсят скрити модели в данните. Миньорите на данни се интересуват от намирането на полезни връзки между различни елементи от данни, което в крайна сметка е изгодно за бизнеса.
СУБД
СУБД, понякога наричана само мениджър на база данни, е съвкупност от компютърни програми, която е предназначена за управление (т.е. организация, съхранение и извличане) на всички бази данни, които са инсталирани в система (т.е. твърд диск или мрежа). В света съществуват различни видове системи за управление на бази данни и някои от тях са проектирани за правилното управление на бази данни, конфигурирани за конкретни цели. Най-популярните търговски системи за управление на бази данни са Oracle, DB2 и Microsoft Access. Всички тези продукти осигуряват средства за разпределение на различни нива привилегии за различни потребители, което прави възможно СУБД да бъде контролиран централизирано от един администратор или да бъде разпределен на няколко различни хора. Във всяка система за управление на бази данни има четири важни елемента. Те са езикът за моделиране, структурата на данните, езикът на заявките и механизмът за транзакции. Езикът за моделиране определя езика на всяка база данни, хоствана в СУБД. В момента няколко популярни подхода като йерархичен, мрежов, релационен и обект са на практика. Структурите на данните помагат да се организират данните като отделни записи, файлове, полета и техните дефиниции и обекти като визуални носители. Езикът на заявките за данни поддържа сигурността на базата данни, като следи данните за вход, правата за достъп на различни потребители и протоколите за добавяне на данни в системата. SQL е популярен език за заявки, който се използва в системите за управление на релационни бази данни. И накрая, механизмът, който позволява транзакции, спомага за едновременността и множествеността. Този механизъм ще гарантира, че един и същ запис няма да бъде модифициран от множество потребители едновременно, като по този начин поддържа целостта на данните в такт. Освен това СУБД предоставя резервно копие и други удобства.
Извличане на данни
Извличането на данни е известно още като откриване на знания в данни (KDD). Както бе споменато по-горе, това е лъжливо на информатиката, което се занимава с извличането на неизвестна досега и интересна информация от сурови данни. Поради експоненциалния растеж на данните, особено в области като бизнеса, извличането на данни се превърна в много важен инструмент за преобразуване на това голямо богатство от данни в бизнес разузнаване, тъй като ръчното извличане на модели стана привидно невъзможно през последните няколко десетилетия. Например, в момента се използва за различни приложения като анализ на социалните мрежи, откриване на измами и маркетинг. Извличането на данни обикновено се занимава със следните четири задачи: групиране, класификация, регресия и асоцииране. Клъстерирането е идентифициране на подобни групи от неструктурирани данни. Класификацията е правила за учене, които могат да се прилагат към нови данни и обикновено включват следните стъпки: предварителна обработка на данни, проектиране на моделиране, подбор на учене / характеристики и оценка / оценка. Регресията е намиране на функции с минимална грешка за моделиране на данни. А асоциацията търси връзки между променливи. Извличането на данни обикновено се използва за отговор на въпроси като кои са основните продукти, които биха могли да помогнат за получаване на висока печалба през следващата година в Wal-Mart?
Каква е разликата между DBMS и Data mining?
СУБД е пълноценна система за настаняване и управление на набор от цифрови бази данни. Data Mining обаче е техника или концепция в компютърните науки, която се занимава с извличане на полезна и неизвестна досега информация от сурови данни. Повечето пъти тези сурови данни се съхраняват в много големи бази данни. Следователно миньорите на данни използват съществуващите функционалности на СУБД, за да обработват, управляват и дори да обработват сурови данни преди и по време на процеса на извличане на данни. Само че една СУБД система не може да се използва за анализ на данни. Но понастоящем някои СУБД имат вградени инструменти или възможности за анализ на данни.