Wie findet man doppelte Namen mit Pandas?
Ich habe eine pandas.DataFrame
mit einer Spalte namens name
mit strings.
Ich würde gerne eine Liste der Namen, die mehr als einmal vorkommen in der Spalte. Wie mache ich das?
Habe ich versucht:
funcs_groups = funcs.groupby(funcs.name)
funcs_groups[(funcs_groups.count().name>1)]
Aber nicht herausfiltern, die die singleton-Namen.
InformationsquelleAutor der Frage Yariv | 2013-03-06
Du musst angemeldet sein, um einen Kommentar abzugeben.
Wenn Sie möchten, suchen Sie die Zeilen mit doppelten Namen (außer das erste mal, dass wir sehen, dass), können Sie versuchen, diese
InformationsquelleAutor der Antwort waitingkuo
Einen one-liner können werden:
der index enthält eine Methode zum Auffinden von Duplikaten, Spalten, scheint nicht zu haben eine ähnliche Methode..
InformationsquelleAutor der Antwort idoda
value_counts geben Sie die Anzahl der Duplikate sowie.
InformationsquelleAutor der Antwort Doctor J
Ich hatte ein ähnliches problem und bin auf diese Antwort.
Ich denke, das funktioniert auch:
sowie
df2.index
wird Ihnen eine Liste von Namen mit DuplikatenInformationsquelleAutor der Antwort mkln
Anderen one-liner können werden:
InformationsquelleAutor der Antwort G Gopi Krishna