Най- ключова разлика между RDBMS и Hadoop е, че RDBMS съхранява структурирани данни, докато Hadoop съхранява структурирани, полуструктурирани и неструктурирани данни.
RDBMS е система за управление на база данни, базирана на релационния модел. Hadoop е софтуер за съхранение на данни и стартиране на приложения в клъстери от хардуер на стоки.
1. Преглед и ключова разлика
2. Какво е RDBMS
3. Какво е Hadoop
4. Паралелно сравнение - RDBMS срещу Hadoop в таблична форма
5. Резюме
RDBMS означава релационна система за управление на бази данни, базирана на релационния модел. В RDBMS таблиците се използват за съхранение на данни, а ключовете и индексите помагат за свързването на таблиците. Таблица е съвкупност от елементи от данни и те са субектите. Той съдържа редове и колони. Редовете представляват един запис в таблицата. Графите представляват атрибутите.
Например, базата данни за продажби може да има субекти на клиенти и продукти. Клиентът може да има атрибути като customer_id, име, адрес, phone_no. Елементът може да има атрибути като product_id, име и т.н. Основният ключ на таблицата на клиента е customer_id, докато основният ключ на таблицата с продукти е product_id. Поставянето на product_id в клиентската таблица като чужд ключ свързва тези две единици. По същия начин и таблиците са свързани помежду си. Те осигуряват цялост на данните, нормализиране и много други. Малко от често срещаните RDBMS са MySQL, MSSQL и Oracle. Те използват SQL за заявки.
Hadoop е рамка с отворен код на Apache, написана на Java. Той помага да се съхраняват и обработват голямо количество данни в клъстери от компютри, използвайки прости модели за програмиране. Основната цел на Hadoop е да съхранява и обработва големи данни, което се отнася до голямо количество сложни данни. Пропускателната способност на Hadoop, която е способността да обработва обем от данни в определен период от време, е висока.
В архитектурата на Hadoop има четири модула. Те са Hadoop common, YARN, Hadoop Distributed File System (HDFS) и Hadoop MapReduce. Общият модул съдържа Java библиотеки и помощни програми. Той също има файловете, за да стартира Hadoop. Hadoop YARN извършва планиране на задачите и управление на ресурсите на клъстери.
Освен това, Hadoop Разпределената файлова система (HDFS) е системата за съхранение на Hadoop. Използва архитектурата master-slave. Главният възел е NameNode и управлява метаданните на файловата система. Други компютри са подчинени възли или DataNodes. Те съхраняват действителните данни. От друга страна, Hadoop MapReduce прави разпределените изчисления. Той разполага с алгоритмите за обработка на данните. В HDFS възелът Master има инструмент за проследяване на задачи. Тя работи с карта за намаляване на работните места в подчинените възли. Има Task Tracker за всеки подчинен възел, за да завърши обработката на данни и да изпрати резултата обратно към главния възел. Като цяло Hadoop осигурява масивно съхранение на данни с висока мощност на обработка.
RDBMS срещу Hadoop | |
RDBMS е системен софтуер за създаване и управление на бази данни, който се основава на релационния модел. | Hadoop е колекция от софтуер с отворен код, който свързва много компютри за решаване на проблеми, включващи голямо количество данни и изчисления. |
Разнообразие от данни | |
RDBMS съхранява структурирани данни. | Hadoop съхранява структурирани, полуструктурирани и неструктурирани данни. |
Хранилище за данни | |
RDBMS съхранява средното количество данни. | Hadoop съхранява голямо количество данни от RDBMS. |
скорост | |
В RDBMS четенията са бързи. | В Hadoop четенето и записването става бързо. |
скалируемост | |
RDBMS има вертикална мащабируемост. | Hadoop има хоризонтална мащабируемост. |
железария | |
RDBMS използват сървъри от висок клас. | Hadoop използва стоков хардуер. |
магистрала | |
Пропускателната способност на RDBMS е по-висока. | Пропускателната способност на Hadoop е по-ниска. |
Тази статия обсъжда разликата между RDBMS и Hadoop. Ключовата разлика между RDBMS и Hadoop е, че RDBMS съхранява структурирани данни, докато Hadoop съхранява структурирани, полуструктурирани и неструктурирани данни..
1.Учебни точки. „Концепции за SQL RDBMS.“ , Учебен пункт, 8 януари 2018. Достъпно тук
2.Учебен пункт. „Учебник Hadoop.“ , Учебен пункт, 8 януари 2018. Достъпно тук
1.'8552968000 'чрез Intel Free Press (CC BY-SA 2.0) чрез Flickr