Gewusst wie: ersetzen von null-Werten mit einem bestimmten Wert im Dataframe mit Funken in Java?

Ich versuche der Verbesserung der Genauigkeit der Logistischen regression-Algorithmus implementiert Spark mit Java. Für dies bin ich versucht zu ersetzen Null oder ungültige Werte vorhanden, die in einer Spalte mit dem häufigsten Wert der Spalte. Zum Beispiel:-

Name|Place
a   |a1
a   |a2
a   |a2
    |d1
b   |a2
c   |a2
c   |
    |
d   |c1

In diesem Fall werde ich alle ersetzen, die NULL-Werte in der Spalte "Name" mit " a " und in der Spalte "Ort" mit 'a2'. Bis jetzt bin ich in der Lage zu extrahieren nur die häufigsten die Spalten in einer bestimmten Spalte. Können Sie mir bitte helfen mit dem zweiten Schritt, wie ersetzen Sie die null oder ungültige Werte mit den häufigsten Werten der Spalte.

InformationsquelleAutor PirateJack | 2017-06-21

Schreibe einen Kommentar