Tag: pandas

Pandas ist eine Python-Bibliothek für Panel-Daten-manipulation und-Analyse, z.B. mehrdimensionale Zeitreihen-und Querschnitts-Datensätzen, die üblicherweise in der Statistik, Ergebnisse der experimentellen Wissenschaft, ökonometrie oder finance. WICHTIG: Wenn Sie eine Frage stellen, die dieses tag enthält, Kennzeichnen Sie bitte Ihre Fragen: [python]; [pandas]; [dataframe]/[Reihe]; (optional) [groupby]/[merge]/etc. je nach Ihren spezifischen Anforderungen.

Entfernen NaN und konvertieren float32 in Python Pandas

Anzahl der Antworten 2 Antworten
Ich lese Daten aus einer csv-Datei in ein data-frame, versuchen, entfernen Sie alle Zeilen mit NaN und dann konvertieren Sie es von float64 zu float32. Ich habe verschiedene Lösungen, die ich im Netz gefunden habe, nichts scheint

pct_change für die Spalte Wert

Anzahl der Antworten 2 Antworten
Mit Pandas Dokumentation http://pandas.pydata.org/pandas-docs/version/0.13.1/generated/pandas.DataFrame.pct_change.html Ich versuche zu erstellen, diese Funktion zu berechnen percentage_change . Ich übergebe zwei Parameter, um es def PCT(df,n): d = df['Close'].pct_change(n) Sogar das umschreiben der gleiche code in verschiedenen Art und Weise geben

Zugriff auf den index eines pandas-Serie

Anzahl der Antworten 2 Antworten
Ich versuche zu identifizieren, welches Wort die meisten gezählt, die in ein pandas dataframe (df_temp in meinem code). Auch habe ich dieses : l = df_temp['word'].count_values() l ist dann offensichtlich ein Pandabären-Serie, wo die erste Zeile weist

Mit Hilfe der booleschen Masken in Pandas

Anzahl der Antworten 2 Antworten
Dies ist wahrscheinlich eine triviale Abfrage, aber ich kann nicht arbeiten, es out. Im wesentlichen, ich möchte in der Lage sein, heraus zu filtern, laut tweets von einem dataframe unten <class 'pandas.core.frame.DataFrame'> Int64Index: 140381 entries, 0 to

Wie berechne rolling kumulative Produkt auf Pandas DataFrame

Anzahl der Antworten 3 Antworten
Ich habe eine Zeitreihe von Renditen, rolling beta -, und Rollen-alpha in ein pandas DataFrame. Wie kann ich berechnen, rolling annualisierte alpha für die alpha-Spalte der DataFrame? (Ich will die äquivalent zu =PRODUKT(1+[Letzte 12 Monate])-1 in excel)

Zusammenführen von zwei dataframes basiert auf ein Datum zwischen zwei anderen Terminen ohne eine gemeinsame Spalte

Anzahl der Antworten 1 Antworten
Habe ich zwei dataframes, die ich Zusammenführen müssen, basierend auf, ob oder nicht ein date-Wert passt zwischen zwei andere Termine. Grundsätzlich, ich brauche, um führen Sie eine äußere Verknüpfung, bei der B.event_date ist zwischen A.start_date und A.end_date.

Ändern Int64Index zu Index-und dtype=int64 zu dtype=Objekt

Anzahl der Antworten 1 Antworten
Ich bin versucht, zu schreiben pandas DataFrame und Serien zu xlwt Worksheet-Objekte. Alles geht gut, außer wenn ich versuche zu schreiben numpy.int64-Daten, in dem Fall xlwt Keuchen. Ändern int64 zu float64 in meine Daten und single-level Indizes

So schalten Sie die pandas dataframe Zeile in ordereddict schnell

Anzahl der Antworten 2 Antworten
Suche nach einer schnellen Weg, um eine Zeile in ein pandas dataframe in einen bestellt dict-out-Liste". Liste sind in Ordnung, aber mit großen Datensätzen dauert zu lange. Ich bin mit fiona-GIS-Leser, und die Zeilen werden ordereddicts mit

Pandas-Filterung für mehrere Teilstrings in Serie

Anzahl der Antworten 3 Antworten
Brauche ich zum filtern von Zeilen in einer pandas dataframe, so dass eine bestimmte Zeichenfolge-Spalte enthält mindestens eine aus einer Liste von Teilstrings zur Verfügung gestellt. Die Zeichenketten können ungewöhnliche /regex-Zeichen. Der Vergleich sollte nicht mit regex

Pandas DataFrame Spalte Zuordnung ValueError: Falsche Anzahl der Elemente übergeben

Anzahl der Antworten 1 Antworten
Ich habe ein Problem mit einem Skript, das funktionierte vor einem upgrade von Anaconda (also ein upgrade von pandas und numpy) Ich habe einen DataFrame, dass ich möchte eine Spalte aus und multipliziert die Werte einer Spalte

pandas dataframe index-match

Anzahl der Antworten 3 Antworten
Frage ich mich, ob es eine effizientere Art und Weise zu tun, die eine "index & match" type-Funktion, die beliebt in excel. Zum Beispiel - zwei pandas DataFrames, aktualisieren Sie die df_1 mit Informationen, die in df_2:

So erzeugen Sie ein pandas dataframe aus ordereddict?

Anzahl der Antworten 1 Antworten
Wie kann ich erzeugte ein pandas dataframe von einer ordereddict? Habe ich versucht, mit dem dataframe.from_dict Methode, aber das ist nicht so dass mich das erwartet, dataframe. Was ist der beste Ansatz, um zu konvertieren eine ordereddict

Der Wahrheitswert einer Serie ist mehrdeutig. Verwenden Sie einen.leer, ein.bool(), ein.Element(), ein.jede() oder eine.alle()

Anzahl der Antworten 1 Antworten
meine Eingaben sind Daten im oben Date Time Open High Low Close Volume 02/01/2015 14:30 79.52 79.73 79.52 79.71 10841 02/01/2015 14:31 79.6999 79.6999 79.61 79.67 1426 02/01/2015 14:32 79.69 79.7 79.69 79.7 800 02/01/2015 14:33 79.7

Konvertieren Sie mehrere Spalten eines pandas-Daten-frame zu dummy-Variablen - Python

Anzahl der Antworten 1 Antworten
Habe ich in diesem dataframe: Soweit ich weiß, verwenden die scikit lernen-Paket in Python für die Maschine gelehnt Aufgaben, die kategoriale Variablen umgewandelt werden soll, um dummy-Variablen. Also, zum Beispiel mit einer Bibliothek scikit lernen ich versuchen,

Pandas : to_csv() got an unexpected keyword argument

Anzahl der Antworten 3 Antworten
Während ich bin versucht, einige der Parameter, die in dataframe to_csv Funktion, wird ein TypeError, wie `TypeError: to_csv() got an unexpected keyword argument 'doublequote' df.to_csv('transactions.x', header=False, doublequote=False) oder df.to_csv('transactions.x', doublequote=False) Meine pandas version 0.19.2 (Geprüft mit print(pd.__version__))

pandas Sortieren Sie lambda-Funktion

Anzahl der Antworten 3 Antworten
Gegeben ein dataframe 'a' mit 3 Spalten, A , B , C und 3 Reihen mit numerischen Werten. Wie macht man Sortiere alle Zeilen mit einem comp-Betreiber mit nur das Produkt von A[i]*B[i]. Es scheint, dass die

Pandas monatlichen rolling-Betrieb

Anzahl der Antworten 2 Antworten
Landete ich es herauszufinden beim schreiben dieser Frage, also werde ich nur posten, sowieso und beantworte meine Frage selbst, falls jemand anderes braucht ein wenig Hilfe. Problem Nehmen wir an, wir haben eine DataFrame, df, die diese

Überspringen von Zeilen mit fehlenden Werten in read_csv

Anzahl der Antworten 3 Antworten
Ich habe eine sehr große csv, die ich brauche, um zu Lesen. Um diese schneller und speichern Sie die RAM-Nutzung ich bin mit read_csv und legen Sie die dtype einige Spalten zu np.uint32. Das problem ist, dass

Python matplotlib.pyplot pie-charts: so entfernen Sie den Aufkleber auf der linken Seite?

Anzahl der Antworten 1 Antworten
Ich plot ein piechart mit pyplot. import pylab import pandas as pd test = pd.Series(['male', 'male', 'male', 'male', 'female'], name="Sex") test = test.astype("category") groups = test.groupby([test]).agg(len) groups.plot(kind='pie', shadow=True) pylab.show() Das Ergebnis: Aber ich bin nicht in der

Pandas - Zusammenführen von zwei DataFrames mit Identischen Spaltennamen

Anzahl der Antworten 3 Antworten
Habe ich zwei Daten-Frames mit identischen Spaltennamen und identische IDs in der ersten Spalte. Mit Ausnahme der ID-Spalte, die für jede Zelle, die einen Wert enthält, der in einem DataFrame enthält NaN in der anderen. Hier ist

Openpyxl: 'Arbeitsblatt' - Objekt hat kein Attribut 'Werte'

Anzahl der Antworten 1 Antworten
Mein Ziel ist es zu Lesen in einer excel-Datei und anzeigen des codes in ein pandas dataframe (d.h. '= A3'), anstatt die resultierenden Werte aus excel ausführen des codes, die die pandas Verzug, wenn Lesen mit pandas.

Lesen SAS-Datei mit pandas

Anzahl der Antworten 1 Antworten
Ich versuche, die pandas read_sas() Funktion. Zuerst erstelle ich ein SAS-dataset durch ausführen dieses Codes in SAS: libname tmp 'c:\temp'; data tmp.test; do i=1 to 100; x=rannor(0); output; end; run; Nun, in IPython, Tue ich dies: import

Speichern Sie ein pandas dataframe als Tabelle in Bild-oder pdf-Dokument mit netten multi-index-Anzeige

Anzahl der Antworten 2 Antworten
Ich versuche umfassen einen Daten-frame mit multi-index in einem Bericht im pdf-Format. Ich würde gerne eine schöne Tabelle ausgegeben. Ich gefunden habe, sind diese 2 Lösungen: pandas.df -> HTML> pdf import pandas as pd from IPython.display import

Pretty-printing Zeilenumbrüche in einem string in ein Pandas DataFrame

Anzahl der Antworten 4 Antworten
Habe ich ein Pandas DataFrame, in dem eine der Spalten enthält string-Elemente, und diejenigen, die string Elemente enthalten neue Zeilen, die ich gerne drucken wahrsten Sinne des Wortes. Aber Sie erscheinen als \n in der Ausgabe. Ist,

Pandas bedingte Teilmenge dataframe mit bool-Werte und Ganzzahlen

Anzahl der Antworten 2 Antworten
Ich habe einen dataframe mit drei Serien an. Spalte A enthält eine group_id. Spalte B enthält True oder False. Spalte C enthält einen 1-n-ranking (wo n ist die Anzahl der Zeilen pro group_id). Möchte ich zum speichern

Python Pandas - Wie schreiben in eine bestimmte Spalte in einem Excel-Sheet

Anzahl der Antworten 2 Antworten
Ich habe Probleme mit der Aktualisierung ein Excel-Blatt mit den pandas durch das schreiben neuer Werte. Ich habe bereits einen bestehenden Rahmen df1, der liest die Werte aus MySheet1.xlsx. so muss dieser entweder einen neuen dataframe oder

Truncate table funktioniert nicht mit SQL server-sqlalchemy-Motor und pandas

Anzahl der Antworten 3 Antworten
Kann ich erfolgreich Abfragen und einfügen von Daten mit sqlalchemy und pandas: from sqlalchemy import create_engine import pandas as pd engine = create_engine('mssql://myserver/mydb?driver=SQL+Server+Native+Client+11.0?trusted_connection=yes') Lesen tempy Tabelle: sql_command = """ select top 100 * from tempy """ df

Wie man python-dictionaries in ein pandas Zeitreihen dataframe, wo der Schlüssel ist date-Objekt

Anzahl der Antworten 2 Antworten
Habe ich ein python-dictionaries, wo der Schlüssel ist ein dateobject und der Wert ist der timeseires. timeseries = {datetime.datetime(2013, 3, 17, 18, 19): {'t2': 400, 't1': 1000}, datetime.datetime(2013, 3, 17, 18, 20): {'t2': 300, 't1': 3000} }

sklearn-LinearRegression: could not convert string to float -: '--'

Anzahl der Antworten 2 Antworten
Ich versuche, mit einer LinearRegression aus sklearn und ich bin immer eine "Konnte nicht konvertiert einen string zu float'. Alle Spalten der dataframe sind float und der Ausgang y ist auch float. Ich habe mir andere Beiträge

Pandas Lambda-Funktion mit Nan-Unterstützung

Anzahl der Antworten 4 Antworten
Ich bin versucht zu schreiben, eine lambda-Funktion in der Pandas, der prüft, um zu sehen, ob Col1 ist ein Nan und wenn ja, nutzt eine andere Spalte Daten. Ich habe Probleme bei der code (unten) zu kompilieren/ausführen

Hinzufügen von Ebenen zu MultiIndex, entfernen ohne zu verlieren

Anzahl der Antworten 1 Antworten
Nehmen wir an ich habe eine DataFrame df mit einem MultiIndex und es hat die Ebene L. Gibt es eine Möglichkeit zum entfernen von L vom index und fügen Sie es wieder? df = df.index.drop('L') entfernt L

Wie schreibt man CSV-Dateien in XLSX-Format mit Python Pandas?

Anzahl der Antworten 1 Antworten
Habe ich mehrere .csv-Dateien und ich möchte Sie zu schreiben in einem .xlsx-Datei als Tabellen. Hab ich geladen diese .csv-Dateien in Pandas.DataFrame mit dem folgenden code: df1 = pandas.read_csv('my_file1.csv') df2 = pandas.read_csv('my_file2.csv') ...... df5 = pandas.read_csv('my_file5.csv') Aber

Schnelle Methode zum entfernen von doppelten Spalten in pandas.Dataframe

Anzahl der Antworten 4 Antworten
also mit df_ab = pd.concat([df_a, df_b], axis=1, join='inner') Bekomme ich einen Dataframe so Aussehen: A A B B 0 5 5 10 10 1 6 6 19 19 und ich möchten, entfernen Sie die mehrere Spalten: A

TypeError: unhashable type: 'Scheibe'

Anzahl der Antworten 1 Antworten
Ich versuche, führen Sie eine regression mit folgenden dataframe dfMyRoll den Kopf des dataframe aussieht: SCORE SCORE_LAG date 2007-10-29 -0.031551 NaN 2007-10-30 0.000100 -0.031551 2007-10-31 0.000100 0.000100 2007-11-01 0.000100 0.000100 2007-11-02 0.000100 0.000100 Den code, den ich

Entfernen von Zeilen aus dataframe basierend auf Bedingung

Anzahl der Antworten 3 Antworten
Ich weiß, das muss angesprochen werden, bevor, aber ich kann nicht scheinen, eine Antwort zu finden, die funktioniert Habe ich die Spalten, die ich testen will, die Bedingung gegen und ich möchten, entfernen Sie alle Zeilen aus,

SKLearn MinMaxScaler - Skala nur bestimmte Spalten

Anzahl der Antworten 2 Antworten
Ich würde gerne zu skalieren einige (aber nicht alle) Spalten in ein Pandas dataFrame mit einem MinMaxScaler. Wie kann ich es tun? InformationsquelleAutor lte__ | 2017-05-07

Python Pandas, schreiben DataFrame mit fester Breite-Datei (to_fwf?)

Anzahl der Antworten 5 Antworten
Sehe ich, dass Pandas hat read_fwf, aber muss es so etwas wie DataFrame.to_fwf? Ich bin auf der Suche nach Unterstützung für Feldbreite, numerische Genauigkeit, und string Begründung. Es scheint, dass DataFrame.to_csv dies nicht tut. numpy.savetxt tut, aber

Pandas konvertieren, Spalten-Typ aus der Liste um np.array

Anzahl der Antworten 1 Antworten
Ich bin versucht, eine Funktion in ein pandas dataframe, eine solche Funktion benötigt zwei np.array als Eingabe und passen Sie Sie mit einem gut definierten Modell. Der Punkt ist, dass ich nicht in der Lage, um die

pandas - Gruppe und zählen nunique Werte

Anzahl der Antworten 1 Antworten
Ich habe diese Art des dataframe df: User,C,G 111,ar,1 112,es,1 112,es,1 112,es,2 113,es,2 113,es,3 113,es,3 114,es,4 Was ich möchte zurück, wie die Ausgabe ist: G,nU,ar,es 1,2,1,1 2,2,0,2 3,1,0,1 4,1,0,1 Grundsätzlich für jeden G, ich zähle die Anzahl

Pandas Dataframe Maske basiert auf index

Anzahl der Antworten 2 Antworten
Habe ich Folgendes dataframe: import pandas as pd index = pd.date_range('2013-1-1',periods=10,freq='15Min') data = pd.DataFrame(data=[1,2,3,4,5,6,7,8,9,0], columns=['value'], index=index) Wie kann ich erstellen Sie eine Maske auf der Basis der index-Wert? Ich weiß, dass ich etwas tun kann, wie: data['value']

Edit pandas DataFrame mit Indizes

Anzahl der Antworten 1 Antworten
Gibt es eine Allgemeine und effiziente Möglichkeit, Werte zuzuweisen, eine Teilmenge eines DataFrame in pandas? Ich habe Hunderte von Zeilen und Spalten, die ich direkt zugreifen kann, aber ich habe es nicht geschafft, herauszufinden, wie zu Bearbeiten,

Sortieren pandas value_counts() in Erster Linie durch absteigende zählt und subsidiär nach aufsteigenden Werten

Anzahl der Antworten 1 Antworten
Bei der Anwendung value_counts (), um eine Serie pandas, standardmäßig das zählt in absteigender Reihenfolge sortiert werden, jedoch werden die Werte nicht sortiert sind, innerhalb der einzelnen zählen. Wie kann ich die Werte innerhalb jeder der identischen

pandas mitmachen DataFrame Kraft-suffix?

Anzahl der Antworten 4 Antworten
Wie kann ich erzwingen, ein suffix, das auf einem merge oder join. Ich verstehen, es ist möglich, wenn es eine Kollision, aber in meinem Fall bin ich Zusammenführen von df1 mit df2, die nicht dazu führen, dass

Python Pandas Pivot - Warum Schlägt Fehl

Anzahl der Antworten 1 Antworten
Habe ich versucht für eine Weile, um dieses zu erhalten, wrk und ich kann nicht - ich habe die Dokumentation gelesen und ich muss Missverständnis etwas Habe ich einen Daten-Frame im long-format und ich möchte es breit

Füllen Sie einen DataFrame mit "Zeichen" zahlen

Anzahl der Antworten 3 Antworten
Ich habe einen DataFrame voller schwimmt (positiv und negativ) und einige NaN. Ich würde gerne, Sie zu ersetzen jedes einzelne float-Zahl mit Vorzeichen: if it's NaN -> it remains Nan if positive -> replace with 1 if

Was ist der pandas äquivalent von dplyr zusammenfassen/aggregieren von mehreren Funktionen?

Anzahl der Antworten 2 Antworten
Habe ich Probleme, den übergang zu pandas von R wo dplyr - Paket kann leicht Gruppe durch und führen Sie mehrere Verdichtungen. Bitte helfen Verbesserung meiner bestehenden Python pandas code für mehrere Aggregationen: import pandas as pd

Was passiert, wenn Sie vergleichen 2 pandas Serie

Anzahl der Antworten 1 Antworten
Lief ich gegen unerwartetes Verhalten in pandas beim Vergleich der beiden Serien. Ich wollte wissen, ob dies beabsichtigt ist oder ein bug. vermute ich: import pandas as pd x = pd.Series([1, 1, 1, 0, 0, 0], index=['a',

Benennen Sie Dataframe Spalte basierend auf Spalte index

Anzahl der Antworten 2 Antworten
Gibt es eine eingebaute Funktion zum umbenennen eines pandas dataframe, die durch den index? Ich dachte, ich wüsste den Namen meiner Spalte Header, aber es stellt sich heraus, die zweite Spalte hat einige hexadezimal-Zeichen. Ich werde wahrscheinlich

ersetzen Zeichenfolge in pandas dataframe

Anzahl der Antworten 3 Antworten
Ich habe einen dataframe mit mehreren Spalten. Ich möchte, um sich auf eine Spalte und wenn einer der strings in der Spalte enthalten @, ich möchte Sie zu ersetzen mit einem anderen string. Wie würde ich gehen

Bauen pandas-Daten-frame aus der Liste der numpy-arrays

Anzahl der Antworten 2 Antworten
Frage ich mich, ob es einen einfachen Weg für die offensichtliche Aufgabe erzeugen Sie ein pandas DataFrame aus einer Liste mit numpy-arrays, wo die Spalten des arrays. Das Standard-Verhalten scheint, lassen Sie die Felder, werden die Zeilen,