Tag: pandas

Pandas ist eine Python-Bibliothek für Panel-Daten-manipulation und-Analyse, z.B. mehrdimensionale Zeitreihen-und Querschnitts-Datensätzen, die üblicherweise in der Statistik, Ergebnisse der experimentellen Wissenschaft, ökonometrie oder finance. WICHTIG: Wenn Sie eine Frage stellen, die dieses tag enthält, Kennzeichnen Sie bitte Ihre Fragen: [python]; [pandas]; [dataframe]/[Reihe]; (optional) [groupby]/[merge]/etc. je nach Ihren spezifischen Anforderungen.

Pandas: for-Schleife über Spalten

Anzahl der Antworten 2 Antworten
Meiner Daten sieht wie folgt aus: SNP Name ss715583617 ss715592335 ss715591044 ss715598181 4 PI081762 T A A T 5 PI101404A T A A T 6 PI101404B T A A T 7 PI135624 T A A T 8

Wie verwende ich die pandas DataFrame.Stil?

Anzahl der Antworten 1 Antworten
Ich versuche zu formatieren, meine dataframe in HTML mit dem neu aufgenommen 'Stil' in Pandas 0.19. Ich bin versucht zu replizieren, die die gleichen Dinge, die mit der exakt gleichen scripts, aber ich bekomme eine Styler Objekt.

wie zu parallelisieren viele (fuzzy -) string-Vergleiche, die mit gelten Pandas?

Anzahl der Antworten 3 Antworten
Ich habe Folgendes problem Ich habe einen dataframe master enthält Sätze wie master Out[8]: original 0 this is a nice sentence 1 this is another one 2 stackoverflow is nice Für jede Zeile in Master -, I-lookup

umbenennen index ein pandas dataframe

Anzahl der Antworten 2 Antworten
Habe ich ein pandas dataframe, deren Indizes wie folgt Aussehen: df.index ['a_1', 'b_2', 'c_3', ... ] Möchte ich benenne diese Indizes zu: ['a', 'b', 'c', ... ] Wie mache ich das, ohne dass ein Wörterbuch mit eindeutigen

Wie zu lösen/was ist ein KeyError in Python/Pandas?

Anzahl der Antworten 3 Antworten
Habe ich zwei text-Dateien, die ich Wünsche, um die Arbeit mit den Pandas. Die Dateien erstellt wurden, in der exakt gleichen Art und Weise und sind sich sehr ähnlich, außer für einige der Inhalte im inneren. Aber

Heatmap aus Spalten pandas dataframe

Anzahl der Antworten 1 Antworten
Ich versuche zu generieren, die eine heatmap aus ein pandas dataframe von Tagen und Stunden des Tages (X-> Tage -, Y->Stunden). Das Ergebnis sollte so etwas wie dieses: die Datenquelle ist eine Tabelle in der postgres: id

Pandas msgpack vs Gurke

Anzahl der Antworten 1 Antworten
msgpack im Pandas soll es sich um einen Ersatz für pickle. Pro die Pandas docs auf msgpack: Dies ist eine leichte portable Binär-format, ähnlich wie binary JSON, das ist sehr platzsparend und bietet eine gute performance sowohl

Unterschied zwischen df.wo( ) und df [ (df [ ] == ) ] in pandas , python

Anzahl der Antworten 1 Antworten
Kann ich Sie helfen Sie mir erzählen, der Unterschied zwischen diesen beiden Anweisungen in der pandas - python df.where(df['colname'] == value) und df[(df['colname'] == value)] Warum Bin ich immer verschiedene Größen in der Ausgabe-dataframe InformationsquelleAutor D3VLPR |

Erstellen neuer dataframe in pandas mit dynamische Namen auch neue Spalte hinzufügen

Anzahl der Antworten 1 Antworten
Ich habe einen dataframe df df = pd.DataFrame({'A':['-a',1,'a'], 'B':['a',np.nan,'c'], 'ID':[1,2,2], 't':[pd.tslib.Timestamp.now(),pd.tslib.Timestamp.now(), np.nan]}) Hinzugefügt eine neue Spalte df['YearMonth'] = df['t'].map(lambda x: 100*x.year + x.month) Möchte ich nun schreiben Sie eine Funktion oder ein makro, die das Datum comparasion,

wie entfernen Sie Spalten mit zu vielen fehlenden Werten in Python

Anzahl der Antworten 7 Antworten
Arbeite ich auf einer machine-learning-problem, in denen es viele fehlende Werte in den Funktionen. Es gibt 100 von den features, und ich möchte zu löschen, diese Funktionen, die zu viele fehlende Werte (es kann sein, Funktionen mit

Die Anzeige von Daten in pandas dataframe

Anzahl der Antworten 1 Antworten
Dieser code ermöglicht mir die Anzeige panda dataframe Inhalt in Jupyter notebook. import pandas as pd # create a simple dataset of people data = {'Name': ["John", "Anna", "Peter", "Linda"], 'Location' : ["New York", "Paris", "Berlin", "London"],

python pandas wählen Sie beide, Kopf und Schwanz

Anzahl der Antworten 7 Antworten
Für einen DataFrame in Pandas,Wie Sie können wählen Sie die ersten 5 Werte und die letzten 5 Werte? Zum Beispiel In [11]: df Out[11]: A B C 2012-11-29 0 0 0 2012-11-30 1 1 1 2012-12-01 2

Python-Numpy oder Pandas Lineare Interpolation Für die Datetime-bezogene Werte

Anzahl der Antworten 2 Antworten
Ich habe Daten, die wie folgt aussieht, aber ich habe auch die Kontrolle, wie es formatiert ist. Im Grunde genommen, will ich mit Python mit Numpy oder Pandas zu interpolieren, das dataset zu erreichen per Sekunde interpolierten

Groß-und Kleinschreibung pandas dataframe.merge

Anzahl der Antworten 3 Antworten
Ich kämpfen mit der einfachste Weg, um eine groß-und Kleinschreibung merge in pandas. Gibt es einen Weg, es zu tun Recht auf dem Zusammenführen? Brauche ich für die Nutzung (?i) oder eine regex mit ignorecase? In meinem

Python pandas NameError: StringIO ist nicht definiert

Anzahl der Antworten 4 Antworten
Ich bin nicht in der Lage, Daten zu Lesen, in Pandas: Eingang: import pandas as pd data = 'a,b,c\n1,2,3\n4,5,6' pd.read_csv(StringIO(data),skipinitialspace=True) Ausgabe: NameError:name 'StringIO' is not defined Bitte lassen Sie mich wissen, warum der Fehler aufgetreten ist, und

Matplotlib : could not convert string to float

Anzahl der Antworten 1 Antworten
Ich versuche zu zeichnen, Informationen aus dieser DataFrame : sold not_sold success_rate category PriceBucket PriceBucketTitle Papeterie 0 [0, 2] 42401 471886 17.130 1 (2, 3] 28627 360907 17.240 2 (3, 3.5] 46198 434063 18.370 3 (3.5, 4]

Wie zu extrahieren Tupel von Werten in pandas dataframe für den Einsatz von matplotlib?

Anzahl der Antworten 2 Antworten
Habe ich Folgendes dataframe: import numpy as np import pandas as pd import matplotlib.pyplot as plt x = np.arange(10) x = np.concatenate((x,x)) y = for i in range(2): y.append(np.random.random_integers(0,10,20)) d = {'A': [(x[i], y[0][i]) for i

Convert <m8[ns] int

Anzahl der Antworten 1 Antworten
Ich bin mit pandas und einer der Spalte ist vom Typ <m8[ns]. Ich gespeichert 'Tage', wie 5 Tage, 3 Tage, etc. Ich konvertieren wollen diese 'Tage' - Spalte aus <m8[ns] zu float64, wie kann ich das tun?

Effizienteste Weg, um berechnet den Mittelwert einer Gruppe von Spalten in ein pandas DataFrame

Anzahl der Antworten 2 Antworten
Ich habe eine DataFrame mit Spalten wie diese: ["A_1", "A_2", "A_3", "B_1", "B_2", "B_3"] Was ich möchte zu tun ist, um "Zusammenbruch" der verschiedenen A-und B-Spalten in einer einzigen Spalte jeweils mit der Berechnung des Mittelwertes. Kurz

Alle möglichen Kombinationen von Spalten in dataframe ® - pandas/python

Anzahl der Antworten 4 Antworten
Ich versuche, nehmen Sie ein dataframe und erstellen Sie einen anderen, mit allen möglichen Kombinationen der Spalten und die Differenz zwischen den entsprechenden Werten, ich.e am 11-apr-Spalte AB sein sollte (B-A)= 0 etc. e.g, beginnend mit Dt

Pandas Umsetzung innerhalb dataframe

Anzahl der Antworten 1 Antworten
Habe ich diese datasate jetzt: animal age count dogs 1 49 2 134 3 147 4 154 cats 1 189 2 254 3 259 4 261 Ich würde gerne konvertieren Alter Spalte 4 Alter Spalten für jedes

Deaktivieren Pylint kein Mitglied - E1101-Fehler für die spezifische Bibliotheken

Anzahl der Antworten 3 Antworten
Ist es sowieso zu verbergen E1101 Fehler für Objekte, die erstellt werden, von einer bestimmten Bibliothek? Unser großes repository ist übersät mit #pylint: disable=E1101 um verschiedene Objekte erstellt, die von pandas. Beispielsweise pylint werfen wird kein Mitglied-Fehler,

Pandas filtern, Spalten ein DataFrame mit bool

Anzahl der Antworten 2 Antworten
Für einen DataFrame (df) mit mehreren Spalten und Zeilen A B C D 0 1 4 2 6 1 2 5 7 4 2 3 6 5 6 und anderen DataFrame (dfBool) mit "dtype": bool 0 True

Wie konvertiert eine numerische Spalte in pandas in einen string mit Komma-Trennzeichen?

Anzahl der Antworten 1 Antworten
Ich will zu konvertieren, eine Spalte mit Werten wie 1234567.89 zu 1,234,567.89. Kann mir jemand helfen mit diesem. Bitte Lesen Sie Wie Stelle ich eine gute Frage? und aktualisieren Sie Ihre Frage. InformationsquelleAutor Want to try everything

Wie erstellen Sie Mosaik-plot von Pandas dataframe mit Statsmodels Bibliothek?

Anzahl der Antworten 2 Antworten
Mit Python 3.4, Pandas 0,15 und Statsmodels 0.6.0 ich versuchen, erstellen Sie eine Mosaik-plot aus einem dataframe, wie beschrieben in der Statsmodels Dokumentation. Aber ich verstehe einfach nicht, wie die Eingabe formatiert werden, die bereitgestellt wird, um

Text-Datei Lesen Daten pandas DataFrame

Anzahl der Antworten 1 Antworten
Ich habe bestimmte Datei-format von CNC (Arbeitsplatz) Daten. gespeichert wie .txt . Ich möchte diese Tabelle nicht Lesen pandas dataframe aber ich habe nie gesehen, dass dieses format vor. _MASCHINENNUMMER : >0-251-11-0950/51< SACHBEARB.: >BSTWIN32< _PRODUKTSCHLUESSEL : >BST

Pandas: so erstellen Sie ein datetime-Objekt von Woche und Jahr?

Anzahl der Antworten 2 Antworten
Ich habe einen dataframe, die zwei integer-Spalten mit dem Jahr und Woche des Jahres: import pandas as pd import numpy as np L1 = [43,44,51,2,5,12] L2 = [2016,2016,2016,2017,2017,2017] df = pd.DataFrame({"Week":L1,"Year":L2}) df Out[72]: Week Year 0 43

Wie verteilen Sie eine Spalte in einer Pandabären-Daten-frame

Anzahl der Antworten 2 Antworten
Habe ich Folgendes pandas data frame: import pandas as pd import numpy as np df = pd.DataFrame({ 'fc': [100,100,112,1.3,14,125], 'sample_id': ['S1','S1','S1','S2','S2','S2'], 'gene_symbol': ['a', 'b', 'c', 'a', 'b', 'c'], }) df = df[['gene_symbol', 'sample_id', 'fc']] df Produziert diese:

Teilen Sie bestimmte Spalten durch eine andere Spalte in pandas

Anzahl der Antworten 3 Antworten
Frage mich, ob es eine effizientere Möglichkeit der Aufteilung in mehreren Spalten einer bestimmten Spalte. Zum Beispiel sage ich: prev open close volume 20.77 20.87 19.87 962816 19.87 19.89 19.56 668076 19.56 19.96 20.1 578987 20.1 20.4

DataFrame den Wert startswith

Anzahl der Antworten 2 Antworten
Habe ich Folgendes dataframe in pandas: Datum Zeit Event 0 14.11.2016 13:00 Veröffentlichung des 9-Monats-Berichtes 1 14.03.2017 13:00 Telefonkonferenz für Analysten 2 14.03.2017 13:00 Telefonkonferenz für Analysten 3 27.04.2017 14:00 Ordentliche Hauptversammlung 4 03.05.2017 14:00 Dividendenzahlung 5

boolean Maske, in der pandas-panel

Anzahl der Antworten 1 Antworten
ich bin mit einigen Schwierigkeiten Maskierung eine Platte in der gleichen Weise, dass ich würde ein DataFrame. Was ich tun möchte, fühlt sich einfach, aber ich habe nicht gefunden, einen Weg suchen, an die docs und online-Foren.

Konvertieren von numpy-array in dataframe Spalte?

Anzahl der Antworten 3 Antworten
Wie konvertiere ich ein numpy-array in einen dataframe Spalte. Sagen wir, ich habe erstellt eine leere dataframe, df, und ich Schleife durch code zu erstellen 5 numpy-arrays. In jeder iteration von meiner for-Schleife, die ich konvertieren wollen

Konvertieren Objekt zu string in pandas

Anzahl der Antworten 2 Antworten
Ich habe variable in pandas dataframe mit den Werten, wie unten print (df.xx) 1 5679558 2 (714) 254 3 0 4 00000000 5 000000000 6 00000000000 7 000000001 8 000000002 9 000000003 10 000000004 11 000000005 print

Was bedeutet der Begriff "Rundfunk" bedeutet in Pandas Dokumentation?

Anzahl der Antworten 1 Antworten
Bin ich beim Lesen über die Pandas Dokumentation, und der Begriff "Rundfunk" ist ausgiebig, aber nie wirklich definiert oder erklärt. Was bedeutet es? Es ist angenommen von numpy: docs.scipy.org/doc/numpy/user/basics.broadcasting.html. Im Grunde erklärt es das Verhalten beim ausführen

Get group-id zurück in pandas dataframe

Anzahl der Antworten 3 Antworten
Für dataframe In [2]: df = pd.DataFrame({'Name': ['foo', 'bar'] * 3, ...: 'Rank': np.random.randint(0,3,6), ...: 'Val': np.random.rand(6)}) ...: df Out[2]: Name Rank Val 0 foo 0 0.299397 1 bar 0 0.909228 2 foo 0 0.517700 3 bar

Wie konvertieren von bytes an Daten in einem python pandas dataframe?

Anzahl der Antworten 2 Antworten
Ich würde gerne konvertieren 'Byte' Daten in ein Pandas dataframe. Den Daten sieht wie folgt aus (die ersten Zeilen): (b'#Settlement Date,Settlement Period,CCGT,OIL,COAL,NUCLEAR,WIND,PS,NPSHYD,OCGT' b',OTHER,INTFR,INTIRL,INTNED,INTEW,BIOMASS\n2017-01-01,1,7727,0,3815,7404,3' b'923,0,944,0,2123,948,296,856,238,\n2017-01-01,2,8338,0,3815,7403,3658,16,' b'909,0,2124,998,298,874,288,\n2017-01-01,3,7927,0,3801,7408,3925,0,864,0,2' b'122,998,298,816,286,\n2017-01-01,4,6996,0,3803,7407,4393,0,863,0,2122,998' Den Spalten-Header wird oben angezeigt. jede nachfolgende Zeile ist ein Zeitstempel

Python Pandas <pandas.core.groupby.DataFrameGroupBy Objekt an ...>

Anzahl der Antworten 1 Antworten
Ich versuche, zu Gruppe aus und zählen Sie die gleichen Informationen in einer Zeile: #Functions def postal_saude (): global df, lista_solic #List of solicitantes in Postal Saude list_sol = [lista_solic["name1"], lista_solic["name2"]] #filter Postal Saude Solicitantes df =

Umwandlung von Daten zu fehlen pandas

Anzahl der Antworten 1 Antworten
Ich habe eine DataFrame mit einer Mischung von 0 und die anderen zahlen. Ich möchte konvertieren, die 0 zu fehlen. Zum Beispiel, ich bin auf der Suche nach dem Befehl, konvertieren In [618]: a=DataFrame(data=[[1,2],[0,1],[1,2],[0,0]]) In [619]: a

Vergleichen pandas-Serie für die Gleichstellung, wenn Sie enthalten nan?

Anzahl der Antworten 3 Antworten
Meine Anwendung zu vergleichen-Serie Instanzen, die manchmal enthalten nans. Das bewirkt, dass gewöhnliche Vergleich mit == zu scheitern, da nan != nan: import numpy as np from pandas import Series s1 = Series([1,np.nan]) s2 = Series([1,np.nan]) >>>

igraph Graph von numpy oder pandas Nähe matrix

Anzahl der Antworten 2 Antworten
Ich habe ein Nähe-matrix gespeichert, die als pandas.DataFrame: node_names = ['A', 'B', 'C'] a = pd.DataFrame([[1,2,3],[3,1,1],[4,0,2]], index=node_names, columns=node_names) a_numpy = a.as_matrix() Ich möchte eine igraph.Graph entweder aus der pandas oder die numpy Nähe Matrizen. In einer idealen

Strukturierte 2D-Numpy-Array: Einstellung Spalte und Zeile Namen

Anzahl der Antworten 1 Antworten
Ich versuche zu finden ein schöner Weg, um eine 2d-numpy-Arrays und Anhängen, Spalte und Zeile Namen als ein strukturiertes array. Zum Beispiel: import numpy as np column_names = ['a', 'b', 'c'] row_names = ['1', '2', '3'] matrix

Pandas und scikit-learn: KeyError: [...] nicht im index

Anzahl der Antworten 1 Antworten
Verstehe ich nicht, warum erhalte ich die Fehlermeldung KeyError: '[ 1351 1352 1353 ... 13500 13501 13502] not in index' wenn ich diesen code ausführen: cv = KFold(n_splits=10) for train_index, test_index in cv.split(X): f_train_X, f_valid_X = X[train_index],

Immer AttributeError 'Arbeitsmappe' - Objekt hat kein Attribut 'add_worksheet' - beim schreiben der Daten-frame zu excel-Blatt

Anzahl der Antworten 3 Antworten
Ich habe folgenden code und versuche zu schreiben ein Daten-frame in eine "Bestehende" Arbeitsblatt einer Excel-Datei (bezeichnet als hier test.xlsx). Sheet3 ist der gezielte Blatt, wo ich will, um die Daten und ich will nicht ersetzen die

Hinzufügen von berechneten Spalte zu einer Pandabären-pivot-Tabelle

Anzahl der Antworten 1 Antworten
Habe ich einen Pandabären Daten-frame und dann konvertiert es in pivot-Tabelle. Meine pivot-Tabelle sieht wie folgt aus: Operators TotalCB Qd(cb) Autopass(cb) Aircel India 55 11 44 Airtel Ghana 20 17 3 Airtel India 41 9 9 Airtel

pandas DataFrame.umbenennen unexpected keyword argument der "Achse" bei der Verwendung von mapper

Anzahl der Antworten 2 Antworten
Folgenden die pandas-docs ich habe Folgendes versucht (verbatim aus der docs): df = pd.DataFrame({"A": [1, 2, 3], "B": [4, 5, 6]}) df.rename(str.lower, axis='columns') aber ich bin immer der Fehler TypeError: umbenennen() got an unexpected keyword argument der

Wie kann ich die minimale Größe der ausführbaren Datei mit pyinstaller?

Anzahl der Antworten 2 Antworten
Bin ich auf Windows 10, habe ich anaconda installiert, aber ich möchte eine ausführbare Datei erstellen, selbständig in ein neues, sauberes minimal-Umgebung mit python 3.5. So habe ich einige tests: TEST1: Erstellt habe ich ein python-Skript test1.py

'DataFrame' - Objekt hat kein Attribut 'value_counts'

Anzahl der Antworten 1 Antworten
Mein dataset ist ein DataFrame dimension (840,84). Wenn ich den code schreiben: ds[ds.columns[1]].value_counts() Bekomme ich eine korrekte Ausgabe: Out[82]: 0 847 1 5 Name: o_East, dtype: int64 Aber wenn ich Schreibe eine Schleife zum speichern der Werte,

pandas bekommen position eines bestimmten index in DataFrame

Anzahl der Antworten 1 Antworten
Sagen wir, ich habe einen DataFrame, wie diese: df A B 5 0 1 18 2 3 125 4 5 wo 5, 18, 125 sind die index - Ich würde gerne die Zeile vor (oder nach) einem

Überlagern sich mehrere Histogramme mit pandas

Anzahl der Antworten 1 Antworten
Habe ich zwei oder drei csv-Dateien mit dem gleichen header und weisen die Histogramme für jede Spalte überlagern einander auf demselben Grundstück. Folgende code gibt mir zwei getrennte zahlen, die jeweils alle Histogramme für jede der Dateien.

NaNs, wenn die Subtraktion von dataframes pandas

Anzahl der Antworten 1 Antworten
Habe ich zwei dataframes mit nur wenig überlappenden Indizes und Spalten. old = pd.DataFrame(index = ['A', 'B', 'C'], columns = ['k', 'l', 'm'], data = abs(np.floor(np.random.rand(3, 3)*10))) new = pd.DataFrame(index = ['A', 'B', 'C', 'D'], columns =