Razlika med RDBMS in Hadoop

The ključna razlika med RDBMS in Hadoopom je to RDBMS hrani strukturirane podatke, medtem ko Hadoop hrani strukturirane, polstrukturirane in nestrukturirane podatke.

RDBMS je sistem za upravljanje baz podatkov, ki temelji na relacijskem modelu. Hadoop je programska oprema za shranjevanje podatkov in zagon aplikacij na grozdih strojne opreme.

VSEBINA

1. Pregled in ključne razlike
2. Kaj je RDBMS
3. Kaj je Hadoop
4. Primerjava ob strani - RDBMS proti Hadoop v tabeli
5. Povzetek

Kaj je RDBMS?

RDBMS pomeni sistem za upravljanje relacijskih podatkovnih baz, ki temelji na relacijskem modelu. V RDBMS se tabele uporabljajo za shranjevanje podatkov, ključi in indeksi pa pomagajo pri povezovanju tabel. Tabela je zbirka podatkovnih elementov in so entitete. Vsebuje vrstice in stolpce. Vrstice predstavljajo en vnos v tabeli. Stolpci predstavljajo atribute.

Na primer, prodajna baza podatkov ima lahko stranke in izdelke. Stranka ima lahko atribute, kot so customer_id, ime, naslov, telefon_no. Element lahko ima atribute, kot so product_id, ime itd. Primarni ključ tabele stranke je customer_id, medtem ko je primarni ključ tabele izdelka product_id. Če postavite product_id v tabelo kupcev kot tuji ključ, ta dva subjekta povezujeta. Prav tako so tabele tudi med seboj povezane. Zagotavljajo celovitost podatkov, normalizacijo in še veliko več. Le nekaj skupnih RDBMS je MySQL, MSSQL in Oracle. Za poizvedovanje uporabljajo SQL.

Kaj je Hadoop?

Hadoop je odprtokodni okvir Apache, napisan na Javi. Pomaga shranjevati in obdelovati veliko količino podatkov v skupinah računalnikov z uporabo preprostih modelov programiranja. Glavni cilj Hadoopa je shranjevanje in obdelava velikih podatkov, ki se nanaša na veliko količino zapletenih podatkov. Pretok Hadoopa, ki je zmožnost obdelave količine podatkov v določenem časovnem obdobju, je velik.

V arhitekturi Hadoop obstajajo štirje moduli. So Hadoop common, YARN, Hadoop Distributed File System (HDFS) in Hadoop MapReduce. Skupni modul vsebuje Java knjižnice in pripomočke. Prav tako ima datoteke za zagon Hadoopa. Hadoop YARN izvaja načrtovanje opravil in upravljanje virov grozdov.

Poleg tega je Hadoop Distributed File System (HDFS) sistem za shranjevanje Hadoop. Uporablja arhitekturo master-slave. Glavno vozlišče je NameNode in upravlja metapodatke datotečnega sistema. Drugi računalniki so podrejena vozlišča ali DataNodes. Hranijo dejanske podatke. Po drugi strani Hadoop MapReduce opravi porazdeljeno računanje. Ima algoritme za obdelavo podatkov. V HDFS ima glavno vozlišče sledilnik opravil. Vodi zemljevid za zmanjšanje delovnih mest na podrejenih vozliščih. Za vsako podrejeno vozlišče obstaja sledilnik opravil, ki dokonča obdelavo podatkov in pošlje rezultat nazaj v glavno vozlišče. Na splošno Hadoop omogoča množično shranjevanje podatkov z visoko procesorsko močjo.

Kakšna je razlika med RDBMS in Hadoopom?

RDBMS proti Hadoop

RDBMS je sistemska programska oprema za ustvarjanje in upravljanje baz podatkov, ki temelji na relacijskem modelu. Hadoop je zbirka odprtokodne programske opreme, ki povezuje veliko računalnikov za reševanje težav, ki vključujejo veliko količino podatkov in računanje.
 Raznolikost podatkov
RDBMS hrani strukturirane podatke. Hadoop hrani strukturirane, polstrukturirane in nestrukturirane podatke.
Shranjevanje podatkov
RDBMS shranjuje povprečno količino podatkov. Hadoop shranjuje veliko količino podatkov kot RDBMS.
 Hitrost
V RDBMS so branja hitra. V Hadoopu hitro berejo in pišejo.
Prilagodljivost
RDBMS ima vertikalno razširljivost. Hadoop ima horizontalno razširljivost.
Strojna oprema
RDBMS uporabljajo strežnike višjega cenovnega razreda. Hadoop uporablja blago strojne opreme.
  Prepustnost
Pretočnost RDBMS je večja. Hadoop prepustnost je nižja.

Povzetek - RDBMS proti Hadoop

Ta članek obravnava razliko med RDBMS in Hadoop. Ključna razlika med RDBMS in Hadoop je, da RDBMS hrani strukturirane podatke, medtem ko Hadoop shranjuje strukturirane, polstrukturirane in nestrukturirane podatke.

Referenca:

1.Tutorialne točke. "Koncepti SQL RDBMS." , Vadbena točka, 8. januar 2018. Dostopno tukaj  
2.Tutorialna točka. "Hadoop vadnica." , Vadbena točka, 8. januar 2018. Dostopno tukaj  

Vljudnost slik:

1.'8552968000'by Intel Free Press (CC BY-SA 2.0) prek Flickr