Gibt es eine Möglichkeit zu filtern, ein Feld nicht mit etwas in einem spark-dataframe mit scala?

Hoffentlich bin ich dumm und das wird einfach sein.

Ich habe einen dataframe mit den Spalten " url " und "referrer'.

Möchte ich extrahieren Sie alle Verweise enthalten die top-level-domain 'www.mydomain.com' und 'mydomain.co'.

Kann ich verwenden

val filteredDf = unfilteredDf.filter(($"referrer").contains("www.mydomain."))

Jedoch, dieser zieht aus dem url-www.google.co.uk such-url enthält, die auch mein web-domain aus irgendeinem Grund. Gibt es eine Möglichkeit, mit scala in der Funke, dass ich filtern kann, alles, was mit google in es-unter Beibehaltung des richtigen Ergebnisse habe ich?

Dank

Dean

InformationsquelleAutor Dean | 2015-11-09

Schreibe einen Kommentar