Benutzerdefinierte Partitionierer Beispiel

Ich bin versucht zu schreiben, eine neue Hadoop-job für die Eingabe der Daten ist etwas schief. Eine Analogie HIERFÜR wäre die word count Beispiel in Hadoop tutorial, außer, sagen wir ein bestimmtes Wort vorhanden ist, sehr Häufig.

Ich will eine partition-Funktion, wenn diese einer Taste zugeordnet werden, um mehrere Reduzierstücke und die restlichen Tasten entsprechend Ihrer üblichen hash-paritioning. Ist das möglich?

Vielen Dank im Voraus.

Schreibe einen Kommentar