Was ist der Unterschied von RDBMS und Hive?

In RDMS wie MySQL thereis Datenbank, gibt es die Datenbank auch auf der Hive ?wie ich gelesen habe im manual, hive, nur haben die Tabelle, die ich etwas verwirren darüber..

und was ist anderes Konzept von RDBMS und Hive ?

Tks vor

InformationsquelleAutor troya_adromeda | 2011-08-02

10

Den wichtigsten Unterschied zwischen RDBMs-Datenbanken und-Struktur ist die Spezialisierung. Während MySQL ist Allzweck-Datenbank-geeignet sowohl für die Transaktions-Verarbeitung (OLTP) und Analysen (OLAP), Hive wurde für die Analysen nur. Technisch gesehen ist der wichtigste Unterschied ist das fehlen von update/delete
functioality. Daten können nur Hinzugefügt werden und ausgewählt werden. In der gleichen Zeit-Struktur ist in der Lage Verarbeitung von Datenmengen, die nicht bearbeitet werden können, die von MySQL oder anderen herkömmlichen RDBMS (in schüchtern budget).

MPP (massive parallel proecssing) Datenbanken sind am nächsten an der Struktur, indem Ihre Funktionalität, während Sie haben die volle SQL-Unterstützung, die Sie sind skalierbar mit bis zu Hunderten von Computern.
Ein weiteres ernstes Verschieden - wird der query-Sprache.
Hive nicht unterstützt full-SQL auch in wählen, weil es die Umsetzung. Meiner Ansicht nach wichtigste Unterschied ist die fehlende Verknüpfung für jede Bedingung, die andere ist dann gleich.
Hive query language Syntax ist auch etwas anders, so dass Sie nicht herstellen können report generation software Recht auf Hive.

InformationsquelleAutor David Gruzman
6

Grundsätzlich hive ist eine sql-ähnliche Skriptsprache gebaut auf MapReduce. Wenn Sie Befehle ausführen, die Befehle werden interpretiert und lief über das verteilte system. Da die Dateien, knirschte flach sind, entspricht es läuft ein gleichwertiger code, der in Hadoop und sammeln der Daten. Die ganze Strömung ist viel langsamer als es wäre, wenn Sie Mysql.
- Ich Frage mich, wie viel langsamer? und für welchen Fall verwenden? Manchmal sogar unix-Befehlszeile Sortieren ist schneller als eine mysql Sortieren.
- Mysql kann langsam sein, wenn die Dinge sind nicht indiziert, aber wenn Sie sind, ist es fast sicher zu sein, viel schneller als hive.
InformationsquelleAutor delmet
2

Hive vs Traditionellen Datenbank
Hive --> Schema auf LESEN - es prüft nicht das schema, während es geladen die Daten
Traditionelle Datenbank ---> Schema-on-WRITE - Tabelle-schema erzwungen wird, bei der Daten Last-Zeit-ich.e wenn die Daten geladen werden, bedeutet nicht, konform zum schema in diesem Fall wird es abgelehnt

Hive -->Es ist sehr leicht skalierbar, kostengünstig

Traditionelle Datenbank ---> Nicht viel, Skalierbare, teure scale-up.

Hive -->Es basiert auf hadoop-notation, die wird einmal geschrieben und oft gelesen

Traditionelle Datenbank ---> In der traditionellen Datenbank können wir Lesen und schreiben viel Zeit
Hive -->Rekord-Niveau-updates ist nicht möglich Hive

Traditionelle Datenbank ---> Record-level Aktualisierungen, Einfügungen und
löscht, Transaktionen und Indizes sind möglich

Hive -->OLTP (On-line Transaction Processing) wird noch nicht unterstützt im Hive, aber es unterstützt OLAP (On-line Analytical Processing)
Traditionelle Datenbank --->Beide OLTP (On-line Transaction Processing) und OLAP (On-line Analytical Processing) unterstützt werden in RDBMS.

sonst überprüfen Sie bitte die URL unten

https://sensaran.wordpress.com/2016/01/30/comparison-with-hive-with-traditional-database/
- Ab version 0.14 hive-Unterstützung Rekord-Niveau-update.
InformationsquelleAutor Skumar
1

Dieser nicht ganz eine Antwort auf die ursprüngliche Frage, aber es schien, zu überschreiten die maximale Kommentar Größe von 47 Zeichen.

Wenn Sie ein OLAP-data warehouse mithilfe von HDFS und Hive, Sie sind nicht ganz ausgeschlossen, von der Aktualisierung der Tatsache Daten. Sie können es tun in der gleichen Weise wie viele gute RDBS-basierten data warehouses tun - durch den Austausch von Partitionen, die zwischen der Bühne und dem Lager. Tabelle Partitionen in Hive-Umsetzung in HDFS-Verzeichnissen, also den Austausch von Partitionen ist (fast) plötzlich: es ist die Zeit die benötigt wird zum umbenennen eines HDFS-Verzeichnis. Nun, Sie haben werde, zu nennen HDFS direkt, unter Umgehung der Hive Schnittstelle, und Sie würde wahrscheinlich beschäftigen gerade MapReduce zu erhalten der Bühne, sondern in den datawarehouses, entwickelt von der Firma für die ich arbeite, erwies es sich als ein guter Ansatz.

InformationsquelleAutor Olaf
1

Hive erfunden, bei Facebook und es ist einfach, wie Sql, aber mit wenig Unterstützung für die inneren Abfragen. Es ermöglicht Ihnen die Verwendung aller Typen von Joins, Group-Funktionen in Sql bieten auch benutzerdefinierte Funktionen(UDFs), die geschrieben werden kann in Java oder einer anderen Sprache und kann verwendet werden, im Hive.

Hive hauptsächlich verwendet, wenn die Daten groß ist, so dass die partition oder clustering kann getan werden, und es ist nicht im Allgemeinen für die einzelne Zeile einfügen oder aktualisieren, da wir fertig in Sql.

InformationsquelleAutor dilshad
0

Einen guten Hinweis auf Hive und wie unterscheidet es sich von traditionellen Datenbanken gelesen werden können, etwa auf der post Hive- A SQL like database over Hadoop auf meinem blog : Hadoop,HDFS, Map-reduce und Hive

InformationsquelleAutor Abhishek Jain

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.