Holen Sie sich eine Liste von Dateinamen von HDFS mit python

Hadoop-noob hier.

Ich gesucht habe für einige tutorials erste Schritte mit hadoop und python-ohne viel Erfolg. Ich brauche nicht zu arbeiten mit-Mapper und-Reduzierer noch, aber es ist eher ein access-Problem.

Als Teil des Hadoop-Clusters,
es gibt eine Reihe von .dat-Dateien auf dem HDFS.

Werden, um Zugriff auf die Dateien auf meinem client (lokaler computer) auf Basis von Python,

was benötige ich, um auf meinem computer?

Wie kann ich die Abfrage für den Dateinamen auf HDFS ?

Irgendwelche links wären auch hilfreich.

InformationsquelleAutor Raaj | 2015-09-03
Schreibe einen Kommentar