Tag: pandas
Pandas ist eine Python-Bibliothek für Panel-Daten-manipulation und-Analyse, z.B. mehrdimensionale Zeitreihen-und Querschnitts-Datensätzen, die üblicherweise in der Statistik, Ergebnisse der experimentellen Wissenschaft, ökonometrie oder finance. WICHTIG: Wenn Sie eine Frage stellen, die dieses tag enthält, Kennzeichnen Sie bitte Ihre Fragen: [python]; [pandas]; [dataframe]/[Reihe]; (optional) [groupby]/[merge]/etc. je nach Ihren spezifischen Anforderungen.
2
Antworten
Ich lese Daten aus einer csv-Datei in ein data-frame, versuchen, entfernen Sie alle Zeilen mit NaN und dann konvertieren Sie es von float64 zu float32. Ich habe verschiedene Lösungen, die ich im Netz gefunden habe, nichts scheint
2
Antworten
Mit Pandas Dokumentation http://pandas.pydata.org/pandas-docs/version/0.13.1/generated/pandas.DataFrame.pct_change.html Ich versuche zu erstellen, diese Funktion zu berechnen percentage_change . Ich übergebe zwei Parameter, um es def PCT(df,n): d = df['Close'].pct_change(n) Sogar das umschreiben der gleiche code in verschiedenen Art und Weise geben
2
Antworten
Ich versuche zu identifizieren, welches Wort die meisten gezählt, die in ein pandas dataframe (df_temp in meinem code). Auch habe ich dieses : l = df_temp['word'].count_values() l ist dann offensichtlich ein Pandabären-Serie, wo die erste Zeile weist
2
Antworten
Dies ist wahrscheinlich eine triviale Abfrage, aber ich kann nicht arbeiten, es out. Im wesentlichen, ich möchte in der Lage sein, heraus zu filtern, laut tweets von einem dataframe unten <class 'pandas.core.frame.DataFrame'> Int64Index: 140381 entries, 0 to
3
Antworten
Ich habe eine Zeitreihe von Renditen, rolling beta -, und Rollen-alpha in ein pandas DataFrame. Wie kann ich berechnen, rolling annualisierte alpha für die alpha-Spalte der DataFrame? (Ich will die äquivalent zu =PRODUKT(1+[Letzte 12 Monate])-1 in excel)
1
Antworten
Habe ich zwei dataframes, die ich Zusammenführen müssen, basierend auf, ob oder nicht ein date-Wert passt zwischen zwei andere Termine. Grundsätzlich, ich brauche, um führen Sie eine äußere Verknüpfung, bei der B.event_date ist zwischen A.start_date und A.end_date.
1
Antworten
Ich bin versucht, zu schreiben pandas DataFrame und Serien zu xlwt Worksheet-Objekte. Alles geht gut, außer wenn ich versuche zu schreiben numpy.int64-Daten, in dem Fall xlwt Keuchen. Ändern int64 zu float64 in meine Daten und single-level Indizes
2
Antworten
Suche nach einer schnellen Weg, um eine Zeile in ein pandas dataframe in einen bestellt dict-out-Liste". Liste sind in Ordnung, aber mit großen Datensätzen dauert zu lange. Ich bin mit fiona-GIS-Leser, und die Zeilen werden ordereddicts mit
3
Antworten
Brauche ich zum filtern von Zeilen in einer pandas dataframe, so dass eine bestimmte Zeichenfolge-Spalte enthält mindestens eine aus einer Liste von Teilstrings zur Verfügung gestellt. Die Zeichenketten können ungewöhnliche /regex-Zeichen. Der Vergleich sollte nicht mit regex
1
Antworten
Ich habe ein Problem mit einem Skript, das funktionierte vor einem upgrade von Anaconda (also ein upgrade von pandas und numpy) Ich habe einen DataFrame, dass ich möchte eine Spalte aus und multipliziert die Werte einer Spalte
3
Antworten
Frage ich mich, ob es eine effizientere Art und Weise zu tun, die eine "index & match" type-Funktion, die beliebt in excel. Zum Beispiel - zwei pandas DataFrames, aktualisieren Sie die df_1 mit Informationen, die in df_2:
1
Antworten
Wie kann ich erzeugte ein pandas dataframe von einer ordereddict? Habe ich versucht, mit dem dataframe.from_dict Methode, aber das ist nicht so dass mich das erwartet, dataframe. Was ist der beste Ansatz, um zu konvertieren eine ordereddict
1
Antworten
meine Eingaben sind Daten im oben Date Time Open High Low Close Volume 02/01/2015 14:30 79.52 79.73 79.52 79.71 10841 02/01/2015 14:31 79.6999 79.6999 79.61 79.67 1426 02/01/2015 14:32 79.69 79.7 79.69 79.7 800 02/01/2015 14:33 79.7
1
Antworten
Habe ich in diesem dataframe: Soweit ich weiß, verwenden die scikit lernen-Paket in Python für die Maschine gelehnt Aufgaben, die kategoriale Variablen umgewandelt werden soll, um dummy-Variablen. Also, zum Beispiel mit einer Bibliothek scikit lernen ich versuchen,
3
Antworten
Während ich bin versucht, einige der Parameter, die in dataframe to_csv Funktion, wird ein TypeError, wie `TypeError: to_csv() got an unexpected keyword argument 'doublequote' df.to_csv('transactions.x', header=False, doublequote=False) oder df.to_csv('transactions.x', doublequote=False) Meine pandas version 0.19.2 (Geprüft mit print(pd.__version__))
3
Antworten
Gegeben ein dataframe 'a' mit 3 Spalten, A , B , C und 3 Reihen mit numerischen Werten. Wie macht man Sortiere alle Zeilen mit einem comp-Betreiber mit nur das Produkt von A[i]*B[i]. Es scheint, dass die
2
Antworten
Landete ich es herauszufinden beim schreiben dieser Frage, also werde ich nur posten, sowieso und beantworte meine Frage selbst, falls jemand anderes braucht ein wenig Hilfe. Problem Nehmen wir an, wir haben eine DataFrame, df, die diese
3
Antworten
Ich habe eine sehr große csv, die ich brauche, um zu Lesen. Um diese schneller und speichern Sie die RAM-Nutzung ich bin mit read_csv und legen Sie die dtype einige Spalten zu np.uint32. Das problem ist, dass
1
Antworten
Ich plot ein piechart mit pyplot. import pylab import pandas as pd test = pd.Series(['male', 'male', 'male', 'male', 'female'], name="Sex") test = test.astype("category") groups = test.groupby([test]).agg(len) groups.plot(kind='pie', shadow=True) pylab.show() Das Ergebnis: Aber ich bin nicht in der
3
Antworten
Habe ich zwei Daten-Frames mit identischen Spaltennamen und identische IDs in der ersten Spalte. Mit Ausnahme der ID-Spalte, die für jede Zelle, die einen Wert enthält, der in einem DataFrame enthält NaN in der anderen. Hier ist
1
Antworten
Mein Ziel ist es zu Lesen in einer excel-Datei und anzeigen des codes in ein pandas dataframe (d.h. '= A3'), anstatt die resultierenden Werte aus excel ausführen des codes, die die pandas Verzug, wenn Lesen mit pandas.
1
Antworten
Ich versuche, die pandas read_sas() Funktion. Zuerst erstelle ich ein SAS-dataset durch ausführen dieses Codes in SAS: libname tmp 'c:\temp'; data tmp.test; do i=1 to 100; x=rannor(0); output; end; run; Nun, in IPython, Tue ich dies: import
2
Antworten
Ich versuche umfassen einen Daten-frame mit multi-index in einem Bericht im pdf-Format. Ich würde gerne eine schöne Tabelle ausgegeben. Ich gefunden habe, sind diese 2 Lösungen: pandas.df -> HTML> pdf import pandas as pd from IPython.display import
4
Antworten
Habe ich ein Pandas DataFrame, in dem eine der Spalten enthält string-Elemente, und diejenigen, die string Elemente enthalten neue Zeilen, die ich gerne drucken wahrsten Sinne des Wortes. Aber Sie erscheinen als \n in der Ausgabe. Ist,
2
Antworten
Ich habe einen dataframe mit drei Serien an. Spalte A enthält eine group_id. Spalte B enthält True oder False. Spalte C enthält einen 1-n-ranking (wo n ist die Anzahl der Zeilen pro group_id). Möchte ich zum speichern
2
Antworten
Ich habe Probleme mit der Aktualisierung ein Excel-Blatt mit den pandas durch das schreiben neuer Werte. Ich habe bereits einen bestehenden Rahmen df1, der liest die Werte aus MySheet1.xlsx. so muss dieser entweder einen neuen dataframe oder
3
Antworten
Kann ich erfolgreich Abfragen und einfügen von Daten mit sqlalchemy und pandas: from sqlalchemy import create_engine import pandas as pd engine = create_engine('mssql://myserver/mydb?driver=SQL+Server+Native+Client+11.0?trusted_connection=yes') Lesen tempy Tabelle: sql_command = """ select top 100 * from tempy """ df
2
Antworten
Habe ich ein python-dictionaries, wo der Schlüssel ist ein dateobject und der Wert ist der timeseires. timeseries = {datetime.datetime(2013, 3, 17, 18, 19): {'t2': 400, 't1': 1000}, datetime.datetime(2013, 3, 17, 18, 20): {'t2': 300, 't1': 3000} }
2
Antworten
Ich versuche, mit einer LinearRegression aus sklearn und ich bin immer eine "Konnte nicht konvertiert einen string zu float'. Alle Spalten der dataframe sind float und der Ausgang y ist auch float. Ich habe mir andere Beiträge
4
Antworten
Ich bin versucht zu schreiben, eine lambda-Funktion in der Pandas, der prüft, um zu sehen, ob Col1 ist ein Nan und wenn ja, nutzt eine andere Spalte Daten. Ich habe Probleme bei der code (unten) zu kompilieren/ausführen
1
Antworten
Nehmen wir an ich habe eine DataFrame df mit einem MultiIndex und es hat die Ebene L. Gibt es eine Möglichkeit zum entfernen von L vom index und fügen Sie es wieder? df = df.index.drop('L') entfernt L
1
Antworten
Habe ich mehrere .csv-Dateien und ich möchte Sie zu schreiben in einem .xlsx-Datei als Tabellen. Hab ich geladen diese .csv-Dateien in Pandas.DataFrame mit dem folgenden code: df1 = pandas.read_csv('my_file1.csv') df2 = pandas.read_csv('my_file2.csv') ...... df5 = pandas.read_csv('my_file5.csv') Aber
4
Antworten
also mit df_ab = pd.concat([df_a, df_b], axis=1, join='inner') Bekomme ich einen Dataframe so Aussehen: A A B B 0 5 5 10 10 1 6 6 19 19 und ich möchten, entfernen Sie die mehrere Spalten: A
1
Antworten
Ich versuche, führen Sie eine regression mit folgenden dataframe dfMyRoll den Kopf des dataframe aussieht: SCORE SCORE_LAG date 2007-10-29 -0.031551 NaN 2007-10-30 0.000100 -0.031551 2007-10-31 0.000100 0.000100 2007-11-01 0.000100 0.000100 2007-11-02 0.000100 0.000100 Den code, den ich
3
Antworten
Ich weiß, das muss angesprochen werden, bevor, aber ich kann nicht scheinen, eine Antwort zu finden, die funktioniert Habe ich die Spalten, die ich testen will, die Bedingung gegen und ich möchten, entfernen Sie alle Zeilen aus,
2
Antworten
Ich würde gerne zu skalieren einige (aber nicht alle) Spalten in ein Pandas dataFrame mit einem MinMaxScaler. Wie kann ich es tun? InformationsquelleAutor lte__ | 2017-05-07
5
Antworten
Sehe ich, dass Pandas hat read_fwf, aber muss es so etwas wie DataFrame.to_fwf? Ich bin auf der Suche nach Unterstützung für Feldbreite, numerische Genauigkeit, und string Begründung. Es scheint, dass DataFrame.to_csv dies nicht tut. numpy.savetxt tut, aber
1
Antworten
Ich bin versucht, eine Funktion in ein pandas dataframe, eine solche Funktion benötigt zwei np.array als Eingabe und passen Sie Sie mit einem gut definierten Modell. Der Punkt ist, dass ich nicht in der Lage, um die
1
Antworten
Ich habe diese Art des dataframe df: User,C,G 111,ar,1 112,es,1 112,es,1 112,es,2 113,es,2 113,es,3 113,es,3 114,es,4 Was ich möchte zurück, wie die Ausgabe ist: G,nU,ar,es 1,2,1,1 2,2,0,2 3,1,0,1 4,1,0,1 Grundsätzlich für jeden G, ich zähle die Anzahl
2
Antworten
Habe ich Folgendes dataframe: import pandas as pd index = pd.date_range('2013-1-1',periods=10,freq='15Min') data = pd.DataFrame(data=[1,2,3,4,5,6,7,8,9,0], columns=['value'], index=index) Wie kann ich erstellen Sie eine Maske auf der Basis der index-Wert? Ich weiß, dass ich etwas tun kann, wie: data['value']
1
Antworten
Gibt es eine Allgemeine und effiziente Möglichkeit, Werte zuzuweisen, eine Teilmenge eines DataFrame in pandas? Ich habe Hunderte von Zeilen und Spalten, die ich direkt zugreifen kann, aber ich habe es nicht geschafft, herauszufinden, wie zu Bearbeiten,
1
Antworten
Bei der Anwendung value_counts (), um eine Serie pandas, standardmäßig das zählt in absteigender Reihenfolge sortiert werden, jedoch werden die Werte nicht sortiert sind, innerhalb der einzelnen zählen. Wie kann ich die Werte innerhalb jeder der identischen
4
Antworten
Wie kann ich erzwingen, ein suffix, das auf einem merge oder join. Ich verstehen, es ist möglich, wenn es eine Kollision, aber in meinem Fall bin ich Zusammenführen von df1 mit df2, die nicht dazu führen, dass
1
Antworten
Habe ich versucht für eine Weile, um dieses zu erhalten, wrk und ich kann nicht - ich habe die Dokumentation gelesen und ich muss Missverständnis etwas Habe ich einen Daten-Frame im long-format und ich möchte es breit
3
Antworten
Ich habe einen DataFrame voller schwimmt (positiv und negativ) und einige NaN. Ich würde gerne, Sie zu ersetzen jedes einzelne float-Zahl mit Vorzeichen: if it's NaN -> it remains Nan if positive -> replace with 1 if
2
Antworten
Habe ich Probleme, den übergang zu pandas von R wo dplyr - Paket kann leicht Gruppe durch und führen Sie mehrere Verdichtungen. Bitte helfen Verbesserung meiner bestehenden Python pandas code für mehrere Aggregationen: import pandas as pd
1
Antworten
Lief ich gegen unerwartetes Verhalten in pandas beim Vergleich der beiden Serien. Ich wollte wissen, ob dies beabsichtigt ist oder ein bug. vermute ich: import pandas as pd x = pd.Series([1, 1, 1, 0, 0, 0], index=['a',
2
Antworten
Gibt es eine eingebaute Funktion zum umbenennen eines pandas dataframe, die durch den index? Ich dachte, ich wüsste den Namen meiner Spalte Header, aber es stellt sich heraus, die zweite Spalte hat einige hexadezimal-Zeichen. Ich werde wahrscheinlich
3
Antworten
Ich habe einen dataframe mit mehreren Spalten. Ich möchte, um sich auf eine Spalte und wenn einer der strings in der Spalte enthalten @, ich möchte Sie zu ersetzen mit einem anderen string. Wie würde ich gehen
2
Antworten
Frage ich mich, ob es einen einfachen Weg für die offensichtliche Aufgabe erzeugen Sie ein pandas DataFrame aus einer Liste mit numpy-arrays, wo die Spalten des arrays. Das Standard-Verhalten scheint, lassen Sie die Felder, werden die Zeilen,