Tag: pandas

Pandas ist eine Python-Bibliothek für Panel-Daten-manipulation und-Analyse, z.B. mehrdimensionale Zeitreihen-und Querschnitts-Datensätzen, die üblicherweise in der Statistik, Ergebnisse der experimentellen Wissenschaft, ökonometrie oder finance. WICHTIG: Wenn Sie eine Frage stellen, die dieses tag enthält, Kennzeichnen Sie bitte Ihre Fragen: [python]; [pandas]; [dataframe]/[Reihe]; (optional) [groupby]/[merge]/etc. je nach Ihren spezifischen Anforderungen.

Boxplot stratifiziert nach Spalte in python pandas

Anzahl der Antworten 2 Antworten
Ich möchte zeichnen Sie einen boxplot für folgende pandas dataframe: > p1.head(10) N0_YLDF MAT 0 1.29 13.67 1 2.32 10.67 2 6.24 11.29 3 5.34 21.29 4 6.35 41.67 5 5.35 91.67 6 9.32 21.52 7 6.32

Wie berechnen die gewichtete Summe aller Elemente in einer Zeile in pandas?

Anzahl der Antworten 2 Antworten
Habe ich ein Pandabären-Daten-frame mit mehreren Spalten. Ich will eine neue Spalte erstellen weighted_sum von den Werten in der Zeile und eine weitere Spalte vector-dataframe weight weighted_sum sollte den folgenden Wert haben: row[weighted_sum] = row[col0]*weight[0] + row[col1]*weight[1]

Python pandas groupby-Taste Fehler in der pandas.hashtable.PyObjectHashTable.get_item

Anzahl der Antworten 1 Antworten
Ich mache das, was scheint eine einfache group by in Pandas. Die Spalte ist ein string-Spalte mit keine Nans oder seltsame Zeichenfolgen. Aber ich bekomme immer folgende Fehlermeldung. Weiß jemand, warum diese Mächte geschehen? Ich fühle mich

Return max von null oder einen Wert für ein pandas DataFrame Spalte

Anzahl der Antworten 7 Antworten
Möchte ich ersetzen Sie negative Werte in ein pandas DataFrame Spalte mit null. Gibt es einen kürzeren Weg zum Bau dieser Ausdruck? df['value'][df['value'] < 0] = 0 Wie das aussieht, wie Sie es tun würde, in numpy

Wie map eine Funktion mit mehreren Spalten in pandas?

Anzahl der Antworten 3 Antworten
Habe ich ausgecheckt Karte, anwenden, mapapply, und kombinieren Sie, aber kann nicht scheinen, um herauszufinden, eine einfache Möglichkeit zu tun, die folgenden: Ich habe einen dataframe mit 10 Spalten. Ich brauchen, um passieren drei von Ihnen in

Können Pandas Lesen und ändern einer einzigen Excel-Datei, Arbeitsblatt (Registerkarte) verändern, ohne den rest der Datei?

Anzahl der Antworten 5 Antworten
Viele Tabellen Formeln und Formatierungen, die Python tools zum Lesen und schreiben von Excel-Dateien nicht originalgetreu zu reproduzieren. Das bedeutet, dass jede Datei, die ich erstellen möchten programmgesteuert muss etwas sein, was ich im Grunde erstellen Sie

wie plot beliebigen Marker auf eines pandas-Daten-Serie?

Anzahl der Antworten 2 Antworten
Ich versuche zu platzieren, Markierungen entlang einer Pandabären-Daten-Serie (um zu zeigen, kaufen/verkaufen-events auf einem stock market graph) Ich bin in der Lage, dies auf ein einfaches array, das ich mit pyplot, aber ich kann nicht finden die

Anhängen zwei dataframes mit gleichen Spalten, andere Reihenfolge

Anzahl der Antworten 3 Antworten
Ich habe zwei pandas dataframes. noclickDF = DataFrame([[0,123,321],[0,1543,432]], columns=['click', 'id','location']) clickDF = DataFrame([[1,123,421],[1,1543,436]], columns=['click', 'location','id']) Ich einfach beitreten wollen, so dass die endgültige DF Aussehen wird: click | id | location 0 123 321 0 1543 432

Bau von multi-regression-Modell wirft Fehler: `Pandas-Daten umgewandelt numpy dtype des Objekts. Check input-Daten mit np.asarray(Daten).`

Anzahl der Antworten 2 Antworten
Ich habe pandas dataframe mit einigen kategoriale Prädiktoren (d.h. Variablen) als 0 & 1, und einige numerische Variablen. Wenn ich so fit, dass zu einem stasmodel wie: est = sm.OLS(y, X).fit() Wirft: Pandas data cast to numpy

Pandas dataframe mit multiindex column - merge-Ebenen

Anzahl der Antworten 3 Antworten
Ich habe einen dataframe, grouped mit multiindex Spalten wie folgt: import pandas as pd codes = ["one","two","three"]; colours = ["black", "white"]; textures = ["soft", "hard"]; N= 100 # length of the dataframe df = pd.DataFrame({ 'id' :

Wie konvertieren von string in datetime-format in python pandas?

Anzahl der Antworten 1 Antworten
Ich habe eine Spalte I_DATE vom Typ " string(Objekt) in einem dataframe namens train, wie unten dargestellt. I_DATE 28-03-2012 2:15:00 PM 28-03-2012 2:17:28 PM 28-03-2012 2:50:50 PM Wie konvertiert I_DATE von string zu datatime-format & geben Sie

Reset-Zeit Teil eines pandas timestamp

Anzahl der Antworten 4 Antworten
Wie kann ich die Zeit zurückzusetzen, Teil eines pandas timestamp? Ich will reset-Zeit Teil im Wert von pandas.Timestamp. Ich denke, ich kann es tun, mithilfe der folgenden Vorgehensweise. Schritt 1) Timestamp in datetime-Typ Schritt 2) datetime in

zählen der vorkommen der Anzahl der Spalte in der pandas-Daten-frame

Anzahl der Antworten 2 Antworten
Habe ich ein Pandabären-Daten-frame möchte ich zählen, wie oft erscheint eine Zahl in einer Spalte für jede Spalte a b c d e 0 2 3 1 5 4 1 1 3 2 5 4 2 1

numpy corrcoef - compute correlation matrix, während die fehlenden Daten zu ignorieren

Anzahl der Antworten 3 Antworten
Ich versuche zur Berechnung einer Korrelationsmatrix mehrerer Werte. Diese Werte beinhalten einige 'nan' - Werte. Ich bin mit numpy.corrcoef. Für das element(i,j) des Ausgangs-Korrelationsmatrix, würde ich gerne die Korrelation errechnet, indem alle Werte, die es für die

Graf häufigsten 100 Wörter aus Sätzen, die in Dataframe Pandas

Anzahl der Antworten 2 Antworten
Habe ich text-Bewertungen in einer Spalte in Pandas dataframe, und ich will Sie zählen, die N häufigsten Wörter mit deren Häufigkeit zählt (in ganzer Spalte - NICHT in der einzelnen Zelle). Ein Ansatz ist das Zählen der

Lesen mehrere JSON-Datensätze in ein Pandas dataframe

Anzahl der Antworten 4 Antworten
Ich würde gerne wissen, ob es eine Speicher-effiziente Art des Lesens multi record JSON-Datei ( jede Zeile ist ein JSON-dict) in ein pandas dataframe. Unten ist eine 2-Zeile B. mit der Lösung arbeiten, ich brauche es für

Pandas Dataframe header hinzufügen ohne ersetzen aktuelle header

Anzahl der Antworten 1 Antworten
Wie kann ich einen header hinzufügen, um ein DF ohne Austausch von aktuellen ein? In anderen Worten, ich will einfach nur eine Verschiebung der aktuellen Kopf nach unten und fügen Sie Sie dem dataframe wie ein anderer

Matplotlib ist fill_between funktioniert nicht mit plot_date, alternativen?

Anzahl der Antworten 3 Antworten
Ich erstellen möchten ein Grundstück wie dieses: Code: P.fill_between(DF.start.index, DF.lwr, DF.upr, facecolor='blue', alpha=.2) P.plot(DF.start.index, DF.Rt, '.') aber mit Datumsangaben auf der x-Achse, wie dies (ohne Bänder): code: P.plot_date(DF.start, DF.Rt, '.') das problem ist, dass fill_between schlägt fehl,

Verwendung von loc zu aktualisieren dataframe python pandas

Anzahl der Antworten 2 Antworten
Habe ich ein pandas dataframe (df) mit der Spalten-Struktur : month a b c d dieser dataframe Daten für sagen Jan, Feb, Mar, Apr. A,B,C,D sind numerische Spalten. Für den Monat Februar möchte ich die Neuberechnung Spalte

Die Bestimmung, wenn eine Spalte Wert ändert sich in pandas dataframe

Anzahl der Antworten 1 Antworten
Ich bin auf der Suche an, schreiben Sie eine kurze Skript, das ausgeführt wird durch eine csv-Datei mit zwei Spalten und geben Sie mir die Zeilen, in denen die Werte in Spalte B wechseln Sie von einem

Die Berechnung der paarweisen Korrelationen zwischen allen Spalten

Anzahl der Antworten 3 Antworten
Arbeite ich mit großer Biologischer dataset. Möchte ich berechnen, PCC(Pearson ' s Korrelationskoeffizient) von allen 2-Säulen-Kombinationen in meinem Daten-Tabelle und speichern Sie das Ergebnis als DataFrame oder CSV-Datei. Daten Tabelle ist wie folgt:die Spalten sind die Namen

Pandas vergleichen zwei dataframes und entfernen, was passt in einer Spalte

Anzahl der Antworten 3 Antworten
Habe ich zwei separate pandas dataframes (df1 und df2), die über mehrere Spalten, aber nur eine gemeinsame ('text'). Möchte ich gerne jede Zeile in df2 dass nicht eine übereinstimmung in einer der Zeilen der Spalte, die df2

Logische Operatoren für Boolesche Indexierung Pandas

Anzahl der Antworten 3 Antworten
Arbeite ich mit boolean-index in der Pandas. Die Frage ist, warum die Aussage: a[(a['some_column']==some_number) & (a['some_other_column']==some_other_number)] funktioniert in der Erwägung, dass a[(a['some_column']==some_number) and (a['some_other_column']==some_other_number)] beendet sich mit Fehler? Beispiel: a=pd.DataFrame({'x':[1,1],'y':[10,20]}) In: a[(a['x']==1)&(a['y']==10)] Out: x y 0 1

Wie kann ich das normalisieren der Daten in einer Reihe von Spalten in meine pandas dataframe

Anzahl der Antworten 3 Antworten
Angenommen ich habe eine Pandabären-Daten-frame surveyData: Ich möchte normalisieren die Daten in jeder Spalte durch ausführen: surveyData_norm = (surveyData - surveyData.mean()) / (surveyData.max() - surveyData.min()) Dieser würde funktionieren, wenn meine Daten Tabelle nur enthalten die Spalten, die

Ersetzen Sie ungültige Werte, die mit Keiner in Pandas DataFrame

Anzahl der Antworten 6 Antworten
Gibt es eine Methode, um Werte zu ersetzen mit None im Pandas in Python? Können Sie df.replace('pre', 'post') und ersetzen können Sie einen Wert mit einem anderen, aber dies kann nicht getan werden, wenn Sie ersetzen möchten,

Python Pandas GroupBy-Holen Sie sich eine Liste der Gruppen

Anzahl der Antworten 4 Antworten
Ich habe eine code-Zeile: g = x.groupby('Color') Den Farben Rot, Blau, Grün, Gelb, Lila, Orange und Schwarz. Wie gebe ich diese Liste? Für ähnliche Attribute, die ich x verwenden.Attribut und es funktioniert gut, aber x.Farbe nicht die

pandas gelten multiprocessing

Anzahl der Antworten 5 Antworten
Ich versuche, multiprocessing mit pandas dataframe, ist split der dataframe zu 8 Teile. wendet eine Funktion auf jedes Teil mit apply (mit jedem Teil verarbeitet in verschiedenen Verfahren). BEARBEITEN: Hier ist die Lösung, die ich schließlich gefunden:

Versuchen, drop von NaN indizierten Zeile in dataframe

Anzahl der Antworten 6 Antworten
Ich bin mit python 2.7.3 und Pandas version 0.12.0. Möchte ich drop die Zeile mit der NaN-index, so dass ich nur noch gültig site_id Werte. print df.head() special_name site_id NaN Banana OMG Apple df.drop(df.index[0]) TypeError: 'NoneType' object

Wie führen Sie aufschneiden eines Daten-Rahmens mit datetimes?

Anzahl der Antworten 2 Antworten
Ich habe eine pandas.DataFrame df1, indiziert mit einer pandas.DateRange Objekt. Wenn ich eine d1 und d2 als datetimes, warum df[d1:d2]nicht, und wie bekomme ich diese Scheibe? InformationsquelleAutor saroele | 2012-03-20

Die Vorhersage auf neue Daten mit lokal gewichtete regression (LOESS/LOWESS)

Anzahl der Antworten 2 Antworten
Wie fit eine lokal gewichtete regression in python, so dass es kann verwendet werden, um Vorhersagen auf neuen Daten? Es ist statsmodels.nonparametric.smoothers_lowess.lowess, aber es gibt die Schätzungen nur für die original-Daten-set, so scheint es, nur fit und

Am ehesten entspricht der Faktor-variable in Python Pandas

Anzahl der Antworten 4 Antworten
Was ist die nächste Entsprechung zu R-Faktor-variable in Python pandas? Siehe dieser. Es sieht aus, dass die zusätzlichen pandas.Factor als Faktor Spalten. Aber ich glaube nicht, dass dies streng äquivalent., vor allem bei fehlenden Daten. stackoverflow.com/questions/7813132/... InformationsquelleAutor

Pandas to_csv mit zitieren=3 (QUOTE_NONNUMERIC) funktioniert nicht

Anzahl der Antworten 1 Antworten
Vom die docs über to_csv() und andere: zitieren : int, Steuert, ob die Zitate sollen erkannt werden. Werte aus dem csv-Format.QUOTE_* - Werte. Zulässige Werte sind 0, 1, 2, und 3 für QUOTE_MINIMAL, QUOTE_ALL, QUOTE_NONE, und QUOTE_NONNUMERIC,

Wie konvertiert ein Tupel von Tupeln, die pandas.DataFrame in Python?

Anzahl der Antworten 2 Antworten
Kein vergehen, wenn die Fragen zu einfach. Lassen Sie mich wissen, wenn Sie weitere Informationen benötigen. Ich bin auf der Suche für eine Idee zu konvertieren Quadrat-form-Tupel von Tupeln, die pandas.DataFrame in eine sauber/effizient/pythonic way, also von

Panda get_dummies vs. Sklearn ist OneHotEncoder() :: Was sind die vor-und Nachteile?

Anzahl der Antworten 2 Antworten
Lerne ich verschiedene Methoden zur Umwandlung von kategorischen Variablen zu Numerik für machine-learning Classifier. Ich kam über die pd.get_dummies Methode und sklearn.preprocessing.OneHotEncoder() und ich wollte sehen, wie Sie unterschieden sich in Bezug auf Leistung und Verwendung. Fand

Python Pandas Wählen Sie Index-index ist größer als x

Anzahl der Antworten 2 Antworten
Sagen, ich habe einen DataFrame df mit Datum als index und einige Werte. Wie kann ich die Zeilen, wo das Datum größer ist als einige Wert x? Ich weiß, ich kann konvertieren Sie den index auf einer

Wie zu unterdrücken matplotlib Warnung?

Anzahl der Antworten 4 Antworten
Erhalte ich eine Warnung von matplotlib jedes mal, wenn ich import pandas: /usr/local/lib/python2.7/site-packages/matplotlib/__init__.py:872: UserWarning: axes.color_cycle is deprecated and replaced with axes.prop_cycle; please use the latter. warnings.warn(self.msg_depr % (key, alt_key)) Was ist der beste Weg, es zu unterdrücken?

Grundstück pandas dataframe mit Nebenhandlungen (subplots=True): Ort, Legende und verwenden Sie engen layout

Anzahl der Antworten 1 Antworten
Ich mag pandas zu verarbeiten und zu analysieren große Datenmengen. So weit, ich habe es meist verwendet, matplotlib zum Plotten, aber jetzt verwenden möchten pandas eigenen plot-Funktionalitäten (basierend auf matplotlib), da braucht es weniger code und scheint

Python Pandas Schaffen Neue Bin/Eimer Variable mit pd.qcut

Anzahl der Antworten 2 Antworten
Wie erstellen Sie eine neue Bin/Eimer Variable mit pd.qut in python? Dies mag elementar für erfahrene Benutzer, aber ich war nicht super klar und es war erstaunlich unintuitiv zu suchen, auf stack overflow/google. Einige Gründliche Suche ergab

pandas DataFrame legen Wert auf boolean Maske

Anzahl der Antworten 4 Antworten
Ich versuche mit einer Anzahl von verschiedenen in ein pandas DataFrame alle auf den gleichen Wert. Ich dachte, ich Verstand Boolesche Indexierung für die pandas, aber ich habe nicht gefunden, alle Ressourcen auf diesem speziellen Fehler. import

pandas: wie kann ich kleinere Gitter-Linien auf der x-Achse und pd.DataFrame.plot()

Anzahl der Antworten 3 Antworten
Ist es ein Weg, um grid control format, wenn dabei die pandas.DataFrame.plot()? Ich würde vor allem gerne zeigen, Hilfsrasterlinien für das Plotten einen DataFrame mit einer x-Achse, die hat ein DateTimeIndex. Ist dies möglich durch das DataFrame.plot()?

Python pandas leer Korrelationsmatrix

Anzahl der Antworten 1 Antworten
Ich bin mit Python 2.7.6, pandas 0.13.1. Ich bin nicht in der Lage zur Berechnung der Korrelationsmatrix aus einem DataFrame, und ich bin nicht sicher, warum. Hier ist mein Beispiel DataFrame: In [24]: foo Out[24]: A B

Pandas Dataframe AttributeError: 'DataFrame' - Objekt hat kein Attribut 'design_info'

Anzahl der Antworten 1 Antworten
Ich versuche, mit der predict() Funktion der statsmodels.formula.api OLS Umsetzung. Wenn ich den pass eine neue Daten-frame an die Funktion zu erhalten vorhergesagten Werte für eine out-of-sample-Datensatz result.predict(newdf) gibt die folgende Fehlermeldung zurück: 'DataFrame' object has no

'numpy.ndarray' - Objekt ist nicht aufrufbar-Fehler

Anzahl der Antworten 1 Antworten
Hallo, ich erhalte die folgende Fehlermeldung 'numpy.ndarray' - Objekt ist nicht aufrufbar bei der Durchführung der Berechnung in der folgenden Art und Weise rolling_means = pd.rolling_mean(prices,20,min_periods=20)` rolling_std = pd.rolling_std(prices, 20)` #print rolling_means.head(20) upper_band = rolling_means + (rolling_std)*

Import Pandas gibt Fehler AttributeError: module 'pandas' hat kein Attribut 'Kern' in iPython Notebook

Anzahl der Antworten 14 Antworten
Ich bin mit einem iPython notebook über die Anaconda-Navigator-app (version 1.1.0). Wenn ich importieren möchten pandas es gibt mir eine seltsame Fehlermeldung. Ich dachte, die Anaconda-app enthalten, die pandas Paket? --------------------------------------------------------------------------- AttributeError Traceback (most recent call last)

Wie kann ich "unpivot" bestimmte Spalten aus ein pandas DataFrame?

Anzahl der Antworten 1 Antworten
Habe ich ein pandas DataFrame, zB: x = DataFrame.from_dict({'farm' : ['A','B','A','B'], 'fruit':['apple','apple','pear','pear'], '2014':[10,12,6,8], '2015':[11,13,7,9]}) ie: 2014 2015 farm fruit 0 10 11 A apple 1 12 13 B apple 2 6 7 A pear 3 8 9

Mit Scikit ist LabelEncoder richtig über mehrere Programme

Anzahl der Antworten 3 Antworten
Die grundlegende Aufgabe, die ich zur hand haben, ist a) Lesen Sie einige tab-getrennte Daten. b) führen Sie einige grundlegende Vorverarbeitung c) Für jede kategorische Spalte verwenden LabelEncoder um eine Zuordnung erstellen. Dies ist gar so etwas

python dask DataFrame, Unterstützung für (trivial parallelisierbare) Zeile anwenden?

Anzahl der Antworten 2 Antworten
Vor kurzem fand ich dask Modul zielt darauf ab, dass ein einfach zu bedienendes python-parallel-processing-Modul. Großer Pluspunkt für mich ist, dass es funktioniert mit pandas. Nach der Lektüre ein wenig auf seiner manual-Seite, ich kann nicht einen

Grundstück pandas Termine matplotlib

Anzahl der Antworten 1 Antworten
Habe ich eine fixed-width-Daten-Datei mit den Terminen, aber wenn ich versuche zu Plotten der Daten die Daten werden nicht richtig dargestellt, auf der x-Achse. Meine Dateien sieht wie 2014-07-10 11:49:14.377102 45 2014-07-10 11:50:14.449150 45 2014-07-10 11:51:14.521168 21

Teilen Sie mehrere Spalten durch eine andere Spalte in pandas

Anzahl der Antworten 1 Antworten
Muss ich teilen alle, aber die ersten Spalten in ein DataFrame von der ersten Spalte. Hier ist, was ich Tue, aber ich Frage mich, ob dies nicht die "richtigen" pandas Weg: df = pd.DataFrame(np.random.rand(10,3), columns=list('ABC')) df[['B', 'C']]

Bekommen dot-Produkt von dataframe mit vector und zurück dataframe, in Pandas

Anzahl der Antworten 3 Antworten
Ich bin nicht in der Lage, den Eingang zu finden auf der Methode dot() in der offiziellen Dokumentation. Aber die Methode gibt es und ich kann es benutzen. Warum ist das so? Zu diesem Thema, gibt es