Разлика между RDBMS и Hadoop

Най- ключова разлика между RDBMS и Hadoop е, че RDBMS съхранява структурирани данни, докато Hadoop съхранява структурирани, полуструктурирани и неструктурирани данни.

RDBMS е система за управление на база данни, базирана на релационния модел. Hadoop е софтуер за съхранение на данни и стартиране на приложения в клъстери от хардуер на стоки.

СЪДЪРЖАНИЕ

1. Преглед и ключова разлика
2. Какво е RDBMS
3. Какво е Hadoop
4. Паралелно сравнение - RDBMS срещу Hadoop в таблична форма
5. Резюме

Какво е RDBMS?

RDBMS означава релационна система за управление на бази данни, базирана на релационния модел. В RDBMS таблиците се използват за съхранение на данни, а ключовете и индексите помагат за свързването на таблиците. Таблица е съвкупност от елементи от данни и те са субектите. Той съдържа редове и колони. Редовете представляват един запис в таблицата. Графите представляват атрибутите.

Например, базата данни за продажби може да има субекти на клиенти и продукти. Клиентът може да има атрибути като customer_id, име, адрес, phone_no. Елементът може да има атрибути като product_id, име и т.н. Основният ключ на таблицата на клиента е customer_id, докато основният ключ на таблицата с продукти е product_id. Поставянето на product_id в клиентската таблица като чужд ключ свързва тези две единици. По същия начин и таблиците са свързани помежду си. Те осигуряват цялост на данните, нормализиране и много други. Малко от често срещаните RDBMS са MySQL, MSSQL и Oracle. Те използват SQL за заявки.

Какво е Hadoop?

Hadoop е рамка с отворен код на Apache, написана на Java. Той помага да се съхраняват и обработват голямо количество данни в клъстери от компютри, използвайки прости модели за програмиране. Основната цел на Hadoop е да съхранява и обработва големи данни, което се отнася до голямо количество сложни данни. Пропускателната способност на Hadoop, която е способността да обработва обем от данни в определен период от време, е висока.

В архитектурата на Hadoop има четири модула. Те са Hadoop common, YARN, Hadoop Distributed File System (HDFS) и Hadoop MapReduce. Общият модул съдържа Java библиотеки и помощни програми. Той също има файловете, за да стартира Hadoop. Hadoop YARN извършва планиране на задачите и управление на ресурсите на клъстери.

Освен това, Hadoop Разпределената файлова система (HDFS) е системата за съхранение на Hadoop. Използва архитектурата master-slave. Главният възел е NameNode и управлява метаданните на файловата система. Други компютри са подчинени възли или DataNodes. Те съхраняват действителните данни. От друга страна, Hadoop MapReduce прави разпределените изчисления. Той разполага с алгоритмите за обработка на данните. В HDFS възелът Master има инструмент за проследяване на задачи. Тя работи с карта за намаляване на работните места в подчинените възли. Има Task Tracker за всеки подчинен възел, за да завърши обработката на данни и да изпрати резултата обратно към главния възел. Като цяло Hadoop осигурява масивно съхранение на данни с висока мощност на обработка.

Каква е разликата между RDBMS и Hadoop?

RDBMS срещу Hadoop

RDBMS е системен софтуер за създаване и управление на бази данни, който се основава на релационния модел. Hadoop е колекция от софтуер с отворен код, който свързва много компютри за решаване на проблеми, включващи голямо количество данни и изчисления.
 Разнообразие от данни
RDBMS съхранява структурирани данни. Hadoop съхранява структурирани, полуструктурирани и неструктурирани данни.
Хранилище за данни
RDBMS съхранява средното количество данни. Hadoop съхранява голямо количество данни от RDBMS.
 скорост
В RDBMS четенията са бързи. В Hadoop четенето и записването става бързо.
скалируемост
RDBMS има вертикална мащабируемост. Hadoop има хоризонтална мащабируемост.
железария
RDBMS използват сървъри от висок клас. Hadoop използва стоков хардуер.
  магистрала
Пропускателната способност на RDBMS е по-висока. Пропускателната способност на Hadoop е по-ниска.

Обобщение - RDBMS срещу Hadoop

Тази статия обсъжда разликата между RDBMS и Hadoop. Ключовата разлика между RDBMS и Hadoop е, че RDBMS съхранява структурирани данни, докато Hadoop съхранява структурирани, полуструктурирани и неструктурирани данни..

справка:

1.Учебни точки. „Концепции за SQL RDBMS.“ , Учебен пункт, 8 януари 2018. Достъпно тук  
2.Учебен пункт. „Учебник Hadoop.“ , Учебен пункт, 8 януари 2018. Достъпно тук  

С любезност на изображенията:

1.'8552968000 'чрез Intel Free Press (CC BY-SA 2.0) чрез Flickr