Was ist der Unterschied von RDBMS und Hive?
In RDMS wie MySQL thereis Datenbank, gibt es die Datenbank auch auf der Hive ?wie ich gelesen habe im manual, hive, nur haben die Tabelle, die ich etwas verwirren darüber..
und was ist anderes Konzept von RDBMS und Hive ?
Tks vor
Du musst angemeldet sein, um einen Kommentar abzugeben.
Den wichtigsten Unterschied zwischen RDBMs-Datenbanken und-Struktur ist die Spezialisierung. Während MySQL ist Allzweck-Datenbank-geeignet sowohl für die Transaktions-Verarbeitung (OLTP) und Analysen (OLAP), Hive wurde für die Analysen nur. Technisch gesehen ist der wichtigste Unterschied ist das fehlen von update/delete
functioality. Daten können nur Hinzugefügt werden und ausgewählt werden. In der gleichen Zeit-Struktur ist in der Lage Verarbeitung von Datenmengen, die nicht bearbeitet werden können, die von MySQL oder anderen herkömmlichen RDBMS (in schüchtern budget).
MPP (massive parallel proecssing) Datenbanken sind am nächsten an der Struktur, indem Ihre Funktionalität, während Sie haben die volle SQL-Unterstützung, die Sie sind skalierbar mit bis zu Hunderten von Computern.
Ein weiteres ernstes Verschieden - wird der query-Sprache.
Hive nicht unterstützt full-SQL auch in wählen, weil es die Umsetzung. Meiner Ansicht nach wichtigste Unterschied ist die fehlende Verknüpfung für jede Bedingung, die andere ist dann gleich.
Hive query language Syntax ist auch etwas anders, so dass Sie nicht herstellen können report generation software Recht auf Hive.
Grundsätzlich hive ist eine sql-ähnliche Skriptsprache gebaut auf MapReduce. Wenn Sie Befehle ausführen, die Befehle werden interpretiert und lief über das verteilte system. Da die Dateien, knirschte flach sind, entspricht es läuft ein gleichwertiger code, der in Hadoop und sammeln der Daten. Die ganze Strömung ist viel langsamer als es wäre, wenn Sie Mysql.
Hive vs Traditionellen Datenbank
Hive --> Schema auf LESEN - es prüft nicht das schema, während es geladen die Daten
Traditionelle Datenbank ---> Schema-on-WRITE - Tabelle-schema erzwungen wird, bei der Daten Last-Zeit-ich.e wenn die Daten geladen werden, bedeutet nicht, konform zum schema in diesem Fall wird es abgelehnt
Hive -->Es ist sehr leicht skalierbar, kostengünstig
Traditionelle Datenbank ---> Nicht viel, Skalierbare, teure scale-up.
Hive -->Es basiert auf hadoop-notation, die wird einmal geschrieben und oft gelesen
Traditionelle Datenbank ---> In der traditionellen Datenbank können wir Lesen und schreiben viel Zeit
Hive -->Rekord-Niveau-updates ist nicht möglich Hive
Traditionelle Datenbank ---> Record-level Aktualisierungen, Einfügungen und
löscht, Transaktionen und Indizes sind möglich
Hive -->OLTP (On-line Transaction Processing) wird noch nicht unterstützt im Hive, aber es unterstützt OLAP (On-line Analytical Processing)
Traditionelle Datenbank --->Beide OLTP (On-line Transaction Processing) und OLAP (On-line Analytical Processing) unterstützt werden in RDBMS.
sonst überprüfen Sie bitte die URL unten
https://sensaran.wordpress.com/2016/01/30/comparison-with-hive-with-traditional-database/
Dieser nicht ganz eine Antwort auf die ursprüngliche Frage, aber es schien, zu überschreiten die maximale Kommentar Größe von 47 Zeichen.
Wenn Sie ein OLAP-data warehouse mithilfe von HDFS und Hive, Sie sind nicht ganz ausgeschlossen, von der Aktualisierung der Tatsache Daten. Sie können es tun in der gleichen Weise wie viele gute RDBS-basierten data warehouses tun - durch den Austausch von Partitionen, die zwischen der Bühne und dem Lager. Tabelle Partitionen in Hive-Umsetzung in HDFS-Verzeichnissen, also den Austausch von Partitionen ist (fast) plötzlich: es ist die Zeit die benötigt wird zum umbenennen eines HDFS-Verzeichnis. Nun, Sie haben werde, zu nennen HDFS direkt, unter Umgehung der Hive Schnittstelle, und Sie würde wahrscheinlich beschäftigen gerade MapReduce zu erhalten der Bühne, sondern in den datawarehouses, entwickelt von der Firma für die ich arbeite, erwies es sich als ein guter Ansatz.
Hive erfunden, bei Facebook und es ist einfach, wie Sql, aber mit wenig Unterstützung für die inneren Abfragen. Es ermöglicht Ihnen die Verwendung aller Typen von Joins, Group-Funktionen in Sql bieten auch benutzerdefinierte Funktionen(UDFs), die geschrieben werden kann in Java oder einer anderen Sprache und kann verwendet werden, im Hive.
Hive hauptsächlich verwendet, wenn die Daten groß ist, so dass die partition oder clustering kann getan werden, und es ist nicht im Allgemeinen für die einzelne Zeile einfügen oder aktualisieren, da wir fertig in Sql.
Einen guten Hinweis auf Hive und wie unterscheidet es sich von traditionellen Datenbanken gelesen werden können, etwa auf der post
Hive- A SQL like database over Hadoop
auf meinem blog : Hadoop,HDFS, Map-reduce und Hive