Tag: pandas

Pandas ist eine Python-Bibliothek für Panel-Daten-manipulation und-Analyse, z.B. mehrdimensionale Zeitreihen-und Querschnitts-Datensätzen, die üblicherweise in der Statistik, Ergebnisse der experimentellen Wissenschaft, ökonometrie oder finance. WICHTIG: Wenn Sie eine Frage stellen, die dieses tag enthält, Kennzeichnen Sie bitte Ihre Fragen: [python]; [pandas]; [dataframe]/[Reihe]; (optional) [groupby]/[merge]/etc. je nach Ihren spezifischen Anforderungen.

Pandas: for-Schleife über Spalten

2 Antworten

Meiner Daten sieht wie folgt aus: SNP Name ss715583617 ss715592335 ss715591044 ss715598181 4 PI081762 T A A T 5 PI101404A T A A T 6 PI101404B T A A T 7 PI135624 T A A T 8

pandas python

Wie verwende ich die pandas DataFrame.Stil?

1 Antworten

Ich versuche zu formatieren, meine dataframe in HTML mit dem neu aufgenommen 'Stil' in Pandas 0.19. Ich bin versucht zu replizieren, die die gleichen Dinge, die mit der exakt gleichen scripts, aber ich bekomme eine Styler Objekt.

pandas python

wie zu parallelisieren viele (fuzzy -) string-Vergleiche, die mit gelten Pandas?

3 Antworten

Ich habe Folgendes problem Ich habe einen dataframe master enthält Sätze wie master Out[8]: original 0 this is a nice sentence 1 this is another one 2 stackoverflow is nice Für jede Zeile in Master -, I-lookup

dask fuzzywuzzy pandas parallel-processing python

umbenennen index ein pandas dataframe

2 Antworten

Habe ich ein pandas dataframe, deren Indizes wie folgt Aussehen: df.index ['a_1', 'b_2', 'c_3', ... ] Möchte ich benenne diese Indizes zu: ['a', 'b', 'c', ... ] Wie mache ich das, ohne dass ein Wörterbuch mit eindeutigen

pandas python

Wie zu lösen/was ist ein KeyError in Python/Pandas?

3 Antworten

Habe ich zwei text-Dateien, die ich Wünsche, um die Arbeit mit den Pandas. Die Dateien erstellt wurden, in der exakt gleichen Art und Weise und sind sich sehr ähnlich, außer für einige der Inhalte im inneren. Aber

pandas python

Heatmap aus Spalten pandas dataframe

1 Antworten

Ich versuche zu generieren, die eine heatmap aus ein pandas dataframe von Tagen und Stunden des Tages (X-> Tage -, Y->Stunden). Das Ergebnis sollte so etwas wie dieses: die Datenquelle ist eine Tabelle in der postgres: id

matplotlib pandas python seaborn

Pandas msgpack vs Gurke

1 Antworten

msgpack im Pandas soll es sich um einen Ersatz für pickle. Pro die Pandas docs auf msgpack: Dies ist eine leichte portable Binär-format, ähnlich wie binary JSON, das ist sehr platzsparend und bietet eine gute performance sowohl

msgpack pandas python

Unterschied zwischen df.wo( ) und df [ (df [ ] == ) ] in pandas , python

1 Antworten

Kann ich Sie helfen Sie mir erzählen, der Unterschied zwischen diesen beiden Anweisungen in der pandas - python df.where(df['colname'] == value) und df[(df['colname'] == value)] Warum Bin ich immer verschiedene Größen in der Ausgabe-dataframe InformationsquelleAutor D3VLPR |

pandas python-3.x

Erstellen neuer dataframe in pandas mit dynamische Namen auch neue Spalte hinzufügen

1 Antworten

Ich habe einen dataframe df df = pd.DataFrame({'A':['-a',1,'a'], 'B':['a',np.nan,'c'], 'ID':[1,2,2], 't':[pd.tslib.Timestamp.now(),pd.tslib.Timestamp.now(), np.nan]}) Hinzugefügt eine neue Spalte df['YearMonth'] = df['t'].map(lambda x: 100*x.year + x.month) Möchte ich nun schreiben Sie eine Funktion oder ein makro, die das Datum comparasion,

numpy pandas python

wie entfernen Sie Spalten mit zu vielen fehlenden Werten in Python

7 Antworten

Arbeite ich auf einer machine-learning-problem, in denen es viele fehlende Werte in den Funktionen. Es gibt 100 von den features, und ich möchte zu löschen, diese Funktionen, die zu viele fehlende Werte (es kann sein, Funktionen mit

dataframe missing-data pandas python scikit-learn

Die Anzeige von Daten in pandas dataframe

1 Antworten

Dieser code ermöglicht mir die Anzeige panda dataframe Inhalt in Jupyter notebook. import pandas as pd # create a simple dataset of people data = {'Name': ["John", "Anna", "Peter", "Linda"], 'Location' : ["New York", "Paris", "Berlin", "London"],

pandas python python-3.x

python pandas wählen Sie beide, Kopf und Schwanz

7 Antworten

Für einen DataFrame in Pandas,Wie Sie können wählen Sie die ersten 5 Werte und die letzten 5 Werte? Zum Beispiel In [11]: df Out[11]: A B C 2012-11-29 0 0 0 2012-11-30 1 1 1 2012-12-01 2

head pandas python slice tail

Python-Numpy oder Pandas Lineare Interpolation Für die Datetime-bezogene Werte

2 Antworten

Ich habe Daten, die wie folgt aussieht, aber ich habe auch die Kontrolle, wie es formatiert ist. Im Grunde genommen, will ich mit Python mit Numpy oder Pandas zu interpolieren, das dataset zu erreichen per Sekunde interpolierten

interpolation numpy pandas python scipy

Groß-und Kleinschreibung pandas dataframe.merge

3 Antworten

Ich kämpfen mit der einfachste Weg, um eine groß-und Kleinschreibung merge in pandas. Gibt es einen Weg, es zu tun Recht auf dem Zusammenführen? Brauche ich für die Nutzung (?i) oder eine regex mit ignorecase? In meinem

csv pandas python

Python pandas NameError: StringIO ist nicht definiert

4 Antworten

Ich bin nicht in der Lage, Daten zu Lesen, in Pandas: Eingang: import pandas as pd data = 'a,b,c\n1,2,3\n4,5,6' pd.read_csv(StringIO(data),skipinitialspace=True) Ausgabe: NameError:name 'StringIO' is not defined Bitte lassen Sie mich wissen, warum der Fehler aufgetreten ist, und

csv pandas python python-3.x stringio

Matplotlib : could not convert string to float

1 Antworten

Ich versuche zu zeichnen, Informationen aus dieser DataFrame : sold not_sold success_rate category PriceBucket PriceBucketTitle Papeterie 0 [0, 2] 42401 471886 17.130 1 (2, 3] 28627 360907 17.240 2 (3, 3.5] 46198 434063 18.370 3 (3.5, 4]

data-visualization matplotlib pandas python python-2.7

Wie zu extrahieren Tupel von Werten in pandas dataframe für den Einsatz von matplotlib?

2 Antworten

Habe ich Folgendes dataframe: import numpy as np import pandas as pd import matplotlib.pyplot as plt x = np.arange(10) x = np.concatenate((x,x)) y = for i in range(2): y.append(np.random.random_integers(0,10,20)) d = {'A': [(x[i], y[0][i]) for i

matplotlib pandas plot python tuples

Convert <m8[ns] int

1 Antworten

Ich bin mit pandas und einer der Spalte ist vom Typ <m8[ns]. Ich gespeichert 'Tage', wie 5 Tage, 3 Tage, etc. Ich konvertieren wollen diese 'Tage' - Spalte aus <m8[ns] zu float64, wie kann ich das tun?

numpy pandas python

Effizienteste Weg, um berechnet den Mittelwert einer Gruppe von Spalten in ein pandas DataFrame

2 Antworten

Ich habe eine DataFrame mit Spalten wie diese: ["A_1", "A_2", "A_3", "B_1", "B_2", "B_3"] Was ich möchte zu tun ist, um "Zusammenbruch" der verschiedenen A-und B-Spalten in einer einzigen Spalte jeweils mit der Berechnung des Mittelwertes. Kurz

pandas python

Alle möglichen Kombinationen von Spalten in dataframe ® - pandas/python

4 Antworten

Ich versuche, nehmen Sie ein dataframe und erstellen Sie einen anderen, mit allen möglichen Kombinationen der Spalten und die Differenz zwischen den entsprechenden Werten, ich.e am 11-apr-Spalte AB sein sollte (B-A)= 0 etc. e.g, beginnend mit Dt

combinations pandas

Pandas Umsetzung innerhalb dataframe

1 Antworten

Habe ich diese datasate jetzt: animal age count dogs 1 49 2 134 3 147 4 154 cats 1 189 2 254 3 259 4 261 Ich würde gerne konvertieren Alter Spalte 4 Alter Spalten für jedes

dataframe pandas python python-2.7 transpose

Deaktivieren Pylint kein Mitglied - E1101-Fehler für die spezifische Bibliotheken

3 Antworten

Ist es sowieso zu verbergen E1101 Fehler für Objekte, die erstellt werden, von einer bestimmten Bibliothek? Unser großes repository ist übersät mit #pylint: disable=E1101 um verschiedene Objekte erstellt, die von pandas. Beispielsweise pylint werfen wird kein Mitglied-Fehler,

pandas pylint

Pandas filtern, Spalten ein DataFrame mit bool

2 Antworten

Für einen DataFrame (df) mit mehreren Spalten und Zeilen A B C D 0 1 4 2 6 1 2 5 7 4 2 3 6 5 6 und anderen DataFrame (dfBool) mit "dtype": bool 0 True

dataframe pandas python

Wie konvertiert eine numerische Spalte in pandas in einen string mit Komma-Trennzeichen?

1 Antworten

Ich will zu konvertieren, eine Spalte mit Werten wie 1234567.89 zu 1,234,567.89. Kann mir jemand helfen mit diesem. Bitte Lesen Sie Wie Stelle ich eine gute Frage? und aktualisieren Sie Ihre Frage. InformationsquelleAutor Want to try everything

formatting pandas python series

Wie erstellen Sie Mosaik-plot von Pandas dataframe mit Statsmodels Bibliothek?

2 Antworten

Mit Python 3.4, Pandas 0,15 und Statsmodels 0.6.0 ich versuchen, erstellen Sie eine Mosaik-plot aus einem dataframe, wie beschrieben in der Statsmodels Dokumentation. Aber ich verstehe einfach nicht, wie die Eingabe formatiert werden, die bereitgestellt wird, um

pandas python statsmodels

Text-Datei Lesen Daten pandas DataFrame

1 Antworten

Ich habe bestimmte Datei-format von CNC (Arbeitsplatz) Daten. gespeichert wie .txt . Ich möchte diese Tabelle nicht Lesen pandas dataframe aber ich habe nie gesehen, dass dieses format vor. _MASCHINENNUMMER : >0-251-11-0950/51< SACHBEARB.: >BSTWIN32< _PRODUKTSCHLUESSEL : >BST

pandas python

Pandas: so erstellen Sie ein datetime-Objekt von Woche und Jahr?

2 Antworten

Ich habe einen dataframe, die zwei integer-Spalten mit dem Jahr und Woche des Jahres: import pandas as pd import numpy as np L1 = [43,44,51,2,5,12] L2 = [2016,2016,2016,2017,2017,2017] df = pd.DataFrame({"Week":L1,"Year":L2}) df Out[72]: Week Year 0 43

datetime numpy pandas python

Wie verteilen Sie eine Spalte in einer Pandabären-Daten-frame

2 Antworten

Habe ich Folgendes pandas data frame: import pandas as pd import numpy as np df = pd.DataFrame({ 'fc': [100,100,112,1.3,14,125], 'sample_id': ['S1','S1','S1','S2','S2','S2'], 'gene_symbol': ['a', 'b', 'c', 'a', 'b', 'c'], }) df = df[['gene_symbol', 'sample_id', 'fc']] df Produziert diese:

dataframe pandas pivot python

Teilen Sie bestimmte Spalten durch eine andere Spalte in pandas

3 Antworten

Frage mich, ob es eine effizientere Möglichkeit der Aufteilung in mehreren Spalten einer bestimmten Spalte. Zum Beispiel sage ich: prev open close volume 20.77 20.87 19.87 962816 19.87 19.89 19.56 668076 19.56 19.96 20.1 578987 20.1 20.4

dataframe pandas python

DataFrame den Wert startswith

2 Antworten

Habe ich Folgendes dataframe in pandas: Datum Zeit Event 0 14.11.2016 13:00 Veröffentlichung des 9-Monats-Berichtes 1 14.03.2017 13:00 Telefonkonferenz für Analysten 2 14.03.2017 13:00 Telefonkonferenz für Analysten 3 27.04.2017 14:00 Ordentliche Hauptversammlung 4 03.05.2017 14:00 Dividendenzahlung 5

dataframe pandas python

boolean Maske, in der pandas-panel

1 Antworten

ich bin mit einigen Schwierigkeiten Maskierung eine Platte in der gleichen Weise, dass ich würde ein DataFrame. Was ich tun möchte, fühlt sich einfach, aber ich habe nicht gefunden, einen Weg suchen, an die docs und online-Foren.

mask pandas panel python

Konvertieren von numpy-array in dataframe Spalte?

3 Antworten

Wie konvertiere ich ein numpy-array in einen dataframe Spalte. Sagen wir, ich habe erstellt eine leere dataframe, df, und ich Schleife durch code zu erstellen 5 numpy-arrays. In jeder iteration von meiner for-Schleife, die ich konvertieren wollen

dataframe numpy pandas python

Konvertieren Objekt zu string in pandas

2 Antworten

Ich habe variable in pandas dataframe mit den Werten, wie unten print (df.xx) 1 5679558 2 (714) 254 3 0 4 00000000 5 000000000 6 00000000000 7 000000001 8 000000002 9 000000003 10 000000004 11 000000005 print

object out-of-memory pandas python tostring

Was bedeutet der Begriff "Rundfunk" bedeutet in Pandas Dokumentation?

1 Antworten

Bin ich beim Lesen über die Pandas Dokumentation, und der Begriff "Rundfunk" ist ausgiebig, aber nie wirklich definiert oder erklärt. Was bedeutet es? Es ist angenommen von numpy: docs.scipy.org/doc/numpy/user/basics.broadcasting.html. Im Grunde erklärt es das Verhalten beim ausführen

numpy pandas python

Get group-id zurück in pandas dataframe

3 Antworten

Für dataframe In [2]: df = pd.DataFrame({'Name': ['foo', 'bar'] * 3, ...: 'Rank': np.random.randint(0,3,6), ...: 'Val': np.random.rand(6)}) ...: df Out[2]: Name Rank Val 0 foo 0 0.299397 1 bar 0 0.909228 2 foo 0 0.517700 3 bar

group-by pandas python

Wie konvertieren von bytes an Daten in einem python pandas dataframe?

2 Antworten

Ich würde gerne konvertieren 'Byte' Daten in ein Pandas dataframe. Den Daten sieht wie folgt aus (die ersten Zeilen): (b'#Settlement Date,Settlement Period,CCGT,OIL,COAL,NUCLEAR,WIND,PS,NPSHYD,OCGT' b',OTHER,INTFR,INTIRL,INTNED,INTEW,BIOMASS\n2017-01-01,1,7727,0,3815,7404,3' b'923,0,944,0,2123,948,296,856,238,\n2017-01-01,2,8338,0,3815,7403,3658,16,' b'909,0,2124,998,298,874,288,\n2017-01-01,3,7927,0,3801,7408,3925,0,864,0,2' b'122,998,298,816,286,\n2017-01-01,4,6996,0,3803,7407,4393,0,863,0,2122,998' Den Spalten-Header wird oben angezeigt. jede nachfolgende Zeile ist ein Zeitstempel

pandas python-3.x

Python Pandas <pandas.core.groupby.DataFrameGroupBy Objekt an ...>

1 Antworten

Ich versuche, zu Gruppe aus und zählen Sie die gleichen Informationen in einer Zeile: #Functions def postal_saude (): global df, lista_solic #List of solicitantes in Postal Saude list_sol = [lista_solic["name1"], lista_solic["name2"]] #filter Postal Saude Solicitantes df =

dataframe pandas

Umwandlung von Daten zu fehlen pandas

1 Antworten

Ich habe eine DataFrame mit einer Mischung von 0 und die anderen zahlen. Ich möchte konvertieren, die 0 zu fehlen. Zum Beispiel, ich bin auf der Suche nach dem Befehl, konvertieren In [618]: a=DataFrame(data=[[1,2],[0,1],[1,2],[0,0]]) In [619]: a

numpy pandas python

Vergleichen pandas-Serie für die Gleichstellung, wenn Sie enthalten nan?

3 Antworten

Meine Anwendung zu vergleichen-Serie Instanzen, die manchmal enthalten nans. Das bewirkt, dass gewöhnliche Vergleich mit == zu scheitern, da nan != nan: import numpy as np from pandas import Series s1 = Series([1,np.nan]) s2 = Series([1,np.nan]) >>>

equality-operator nan numpy pandas python

igraph Graph von numpy oder pandas Nähe matrix

2 Antworten

Ich habe ein Nähe-matrix gespeichert, die als pandas.DataFrame: node_names = ['A', 'B', 'C'] a = pd.DataFrame([[1,2,3],[3,1,1],[4,0,2]], index=node_names, columns=node_names) a_numpy = a.as_matrix() Ich möchte eine igraph.Graph entweder aus der pandas oder die numpy Nähe Matrizen. In einer idealen

igraph numpy pandas python

Strukturierte 2D-Numpy-Array: Einstellung Spalte und Zeile Namen

1 Antworten

Ich versuche zu finden ein schöner Weg, um eine 2d-numpy-Arrays und Anhängen, Spalte und Zeile Namen als ein strukturiertes array. Zum Beispiel: import numpy as np column_names = ['a', 'b', 'c'] row_names = ['1', '2', '3'] matrix

arrays numpy pandas python structured-array

Pandas und scikit-learn: KeyError: [...] nicht im index

1 Antworten

Verstehe ich nicht, warum erhalte ich die Fehlermeldung KeyError: '[ 1351 1352 1353 ... 13500 13501 13502] not in index' wenn ich diesen code ausführen: cv = KFold(n_splits=10) for train_index, test_index in cv.split(X): f_train_X, f_valid_X = X[train_index],

pandas python scikit-learn

Immer AttributeError 'Arbeitsmappe' - Objekt hat kein Attribut 'add_worksheet' - beim schreiben der Daten-frame zu excel-Blatt

3 Antworten

Ich habe folgenden code und versuche zu schreiben ein Daten-frame in eine "Bestehende" Arbeitsblatt einer Excel-Datei (bezeichnet als hier test.xlsx). Sheet3 ist der gezielte Blatt, wo ich will, um die Daten und ich will nicht ersetzen die

excel openpyxl pandas

Hinzufügen von berechneten Spalte zu einer Pandabären-pivot-Tabelle

1 Antworten

Habe ich einen Pandabären Daten-frame und dann konvertiert es in pivot-Tabelle. Meine pivot-Tabelle sieht wie folgt aus: Operators TotalCB Qd(cb) Autopass(cb) Aircel India 55 11 44 Airtel Ghana 20 17 3 Airtel India 41 9 9 Airtel

pandas python

pandas DataFrame.umbenennen unexpected keyword argument der "Achse" bei der Verwendung von mapper

2 Antworten

Folgenden die pandas-docs ich habe Folgendes versucht (verbatim aus der docs): df = pd.DataFrame({"A": [1, 2, 3], "B": [4, 5, 6]}) df.rename(str.lower, axis='columns') aber ich bin immer der Fehler TypeError: umbenennen() got an unexpected keyword argument der

pandas python

Wie kann ich die minimale Größe der ausführbaren Datei mit pyinstaller?

2 Antworten

Bin ich auf Windows 10, habe ich anaconda installiert, aber ich möchte eine ausführbare Datei erstellen, selbständig in ein neues, sauberes minimal-Umgebung mit python 3.5. So habe ich einige tests: TEST1: Erstellt habe ich ein python-Skript test1.py

anaconda pandas pyinstaller python virtualenv

'DataFrame' - Objekt hat kein Attribut 'value_counts'

1 Antworten

Mein dataset ist ein DataFrame dimension (840,84). Wenn ich den code schreiben: ds[ds.columns[1]].value_counts() Bekomme ich eine korrekte Ausgabe: Out[82]: 0 847 1 5 Name: o_East, dtype: int64 Aber wenn ich Schreibe eine Schleife zum speichern der Werte,

dataframe pandas python python-2.7

pandas bekommen position eines bestimmten index in DataFrame

1 Antworten

Sagen wir, ich habe einen DataFrame, wie diese: df A B 5 0 1 18 2 3 125 4 5 wo 5, 18, 125 sind die index - Ich würde gerne die Zeile vor (oder nach) einem

pandas python

Überlagern sich mehrere Histogramme mit pandas

1 Antworten

Habe ich zwei oder drei csv-Dateien mit dem gleichen header und weisen die Histogramme für jede Spalte überlagern einander auf demselben Grundstück. Folgende code gibt mir zwei getrennte zahlen, die jeweils alle Histogramme für jede der Dateien.

matplotlib pandas python statistics

NaNs, wenn die Subtraktion von dataframes pandas

1 Antworten

Habe ich zwei dataframes mit nur wenig überlappenden Indizes und Spalten. old = pd.DataFrame(index = ['A', 'B', 'C'], columns = ['k', 'l', 'm'], data = abs(np.floor(np.random.rand(3, 3)*10))) new = pd.DataFrame(index = ['A', 'B', 'C', 'D'], columns =

dataframe pandas python subtraction