Unterschiede zwischen Amazon S3 und S3n in Hadoop
Wenn ich mich mit meiner Hadoop-cluster zu Amazon storage-und heruntergeladenen Dateien in HDFS, fand ich s3://
hat nicht funktioniert. Bei der Suche nach Hilfe im Internet habe ich gefunden, die ich verwenden kann S3n
. Wenn ich S3n
es funktionierte. Ich verstehe nicht die Unterschiede zwischen der Verwendung S3
und S3n
mit meinem Hadoop-cluster, kann sich das jemand erklären?
InformationsquelleAutor der Frage | 2012-05-13
Du musst angemeldet sein, um einen Kommentar abzugeben.
Ich denke, Ihr Hauptproblem war, im Zusammenhang mit
S3
undS3n
als zwei separate Anschlusspunkte für Hadoop.s3n://
bedeutet, "Eine gewöhnliche Datei, lesbar von außerhalb der Welt, in dieser S3-url".s3://
bezieht sich auf ein HDFS-Dateisystem abgebildet in einem S3-bucket, das sitzt auf AWS-storage-cluster. Also, wenn Sie eine Datei von Amazon Speicher-Eimer müssen Sie S3N und das ist, warum Ihr problem behoben ist. Die Informationen Hinzugefügt, die von @Steffen ist auch toll!!InformationsquelleAutor der Antwort AvkashChauhan
Den zwei Dateisystemen für den Einsatz Amazon S3 sind dokumentiert in der jeweiligen Hadoop wiki-Seite Adressierung Amazon S3:
Also der Unterschied ist vor allem damit zu tun, wie die 5 GB Grenze ist, behandelt (das ist die größte Objekt, das in einem einzelnen PUT hochgeladenobwohl Objekte können eine Größe von 1 byte bis 5 Terabytesiehe Wie viel Daten kann ich speichern?): während der Verwendung des S3 Block-Dateisystem (URI-Schema: s3) ermöglicht die Beseitigung des 5GB-limit und speichern von Dateien bis zu 5 TB, es ersetzt HDFS wiederum.
InformationsquelleAutor der Antwort Steffen Opel
Hier ist eine Erklärung: https://notes.mindprince.in/2014/08/01/difference-between-s3-block-and-s3-native-filesystem-on-hadoop.html
So verwenden Sie immer das native Dateisystem. Es ist nicht mehr 5 GB Grenze. Manchmal müssen Sie möglicherweise zu geben
s3://
statts3n://
aber stellen Sie sicher, dass alle Dateien, die Sie erstellen, werden sichtbar in den Eimer explorer im browser.Siehe auch http://docs.aws.amazon.com/ElasticMapReduce/latest/ManagementGuide/emr-plan-file-systems.html.
Er sagt auch, Sie können
s3bfs://
auf das alte block-Datei-system, früher bekannt alss3://
.InformationsquelleAutor der Antwort osa