Tag: pandas
Pandas ist eine Python-Bibliothek für Panel-Daten-manipulation und-Analyse, z.B. mehrdimensionale Zeitreihen-und Querschnitts-Datensätzen, die üblicherweise in der Statistik, Ergebnisse der experimentellen Wissenschaft, ökonometrie oder finance. WICHTIG: Wenn Sie eine Frage stellen, die dieses tag enthält, Kennzeichnen Sie bitte Ihre Fragen: [python]; [pandas]; [dataframe]/[Reihe]; (optional) [groupby]/[merge]/etc. je nach Ihren spezifischen Anforderungen.
2
Antworten
Meiner Daten sieht wie folgt aus: SNP Name ss715583617 ss715592335 ss715591044 ss715598181 4 PI081762 T A A T 5 PI101404A T A A T 6 PI101404B T A A T 7 PI135624 T A A T 8
1
Antworten
Ich versuche zu formatieren, meine dataframe in HTML mit dem neu aufgenommen 'Stil' in Pandas 0.19. Ich bin versucht zu replizieren, die die gleichen Dinge, die mit der exakt gleichen scripts, aber ich bekomme eine Styler Objekt.
3
Antworten
Ich habe Folgendes problem Ich habe einen dataframe master enthält Sätze wie master Out[8]: original 0 this is a nice sentence 1 this is another one 2 stackoverflow is nice Für jede Zeile in Master -, I-lookup
2
Antworten
Habe ich ein pandas dataframe, deren Indizes wie folgt Aussehen: df.index ['a_1', 'b_2', 'c_3', ... ] Möchte ich benenne diese Indizes zu: ['a', 'b', 'c', ... ] Wie mache ich das, ohne dass ein Wörterbuch mit eindeutigen
3
Antworten
Habe ich zwei text-Dateien, die ich Wünsche, um die Arbeit mit den Pandas. Die Dateien erstellt wurden, in der exakt gleichen Art und Weise und sind sich sehr ähnlich, außer für einige der Inhalte im inneren. Aber
1
Antworten
Ich versuche zu generieren, die eine heatmap aus ein pandas dataframe von Tagen und Stunden des Tages (X-> Tage -, Y->Stunden). Das Ergebnis sollte so etwas wie dieses: die Datenquelle ist eine Tabelle in der postgres: id
1
Antworten
msgpack im Pandas soll es sich um einen Ersatz für pickle. Pro die Pandas docs auf msgpack: Dies ist eine leichte portable Binär-format, ähnlich wie binary JSON, das ist sehr platzsparend und bietet eine gute performance sowohl
1
Antworten
Kann ich Sie helfen Sie mir erzählen, der Unterschied zwischen diesen beiden Anweisungen in der pandas - python df.where(df['colname'] == value) und df[(df['colname'] == value)] Warum Bin ich immer verschiedene Größen in der Ausgabe-dataframe InformationsquelleAutor D3VLPR |
1
Antworten
Ich habe einen dataframe df df = pd.DataFrame({'A':['-a',1,'a'], 'B':['a',np.nan,'c'], 'ID':[1,2,2], 't':[pd.tslib.Timestamp.now(),pd.tslib.Timestamp.now(), np.nan]}) Hinzugefügt eine neue Spalte df['YearMonth'] = df['t'].map(lambda x: 100*x.year + x.month) Möchte ich nun schreiben Sie eine Funktion oder ein makro, die das Datum comparasion,
7
Antworten
Arbeite ich auf einer machine-learning-problem, in denen es viele fehlende Werte in den Funktionen. Es gibt 100 von den features, und ich möchte zu löschen, diese Funktionen, die zu viele fehlende Werte (es kann sein, Funktionen mit
1
Antworten
Dieser code ermöglicht mir die Anzeige panda dataframe Inhalt in Jupyter notebook. import pandas as pd # create a simple dataset of people data = {'Name': ["John", "Anna", "Peter", "Linda"], 'Location' : ["New York", "Paris", "Berlin", "London"],
7
Antworten
Für einen DataFrame in Pandas,Wie Sie können wählen Sie die ersten 5 Werte und die letzten 5 Werte? Zum Beispiel In [11]: df Out[11]: A B C 2012-11-29 0 0 0 2012-11-30 1 1 1 2012-12-01 2
2
Antworten
Ich habe Daten, die wie folgt aussieht, aber ich habe auch die Kontrolle, wie es formatiert ist. Im Grunde genommen, will ich mit Python mit Numpy oder Pandas zu interpolieren, das dataset zu erreichen per Sekunde interpolierten
3
Antworten
Ich kämpfen mit der einfachste Weg, um eine groß-und Kleinschreibung merge in pandas. Gibt es einen Weg, es zu tun Recht auf dem Zusammenführen? Brauche ich für die Nutzung (?i) oder eine regex mit ignorecase? In meinem
4
Antworten
Ich bin nicht in der Lage, Daten zu Lesen, in Pandas: Eingang: import pandas as pd data = 'a,b,c\n1,2,3\n4,5,6' pd.read_csv(StringIO(data),skipinitialspace=True) Ausgabe: NameError:name 'StringIO' is not defined Bitte lassen Sie mich wissen, warum der Fehler aufgetreten ist, und
1
Antworten
Ich versuche zu zeichnen, Informationen aus dieser DataFrame : sold not_sold success_rate category PriceBucket PriceBucketTitle Papeterie 0 [0, 2] 42401 471886 17.130 1 (2, 3] 28627 360907 17.240 2 (3, 3.5] 46198 434063 18.370 3 (3.5, 4]
2
Antworten
Habe ich Folgendes dataframe: import numpy as np import pandas as pd import matplotlib.pyplot as plt x = np.arange(10) x = np.concatenate((x,x)) y = for i in range(2): y.append(np.random.random_integers(0,10,20)) d = {'A': [(x[i], y[0][i]) for i
1
Antworten
Ich bin mit pandas und einer der Spalte ist vom Typ <m8[ns]. Ich gespeichert 'Tage', wie 5 Tage, 3 Tage, etc. Ich konvertieren wollen diese 'Tage' - Spalte aus <m8[ns] zu float64, wie kann ich das tun?
2
Antworten
Ich habe eine DataFrame mit Spalten wie diese: ["A_1", "A_2", "A_3", "B_1", "B_2", "B_3"] Was ich möchte zu tun ist, um "Zusammenbruch" der verschiedenen A-und B-Spalten in einer einzigen Spalte jeweils mit der Berechnung des Mittelwertes. Kurz
4
Antworten
Ich versuche, nehmen Sie ein dataframe und erstellen Sie einen anderen, mit allen möglichen Kombinationen der Spalten und die Differenz zwischen den entsprechenden Werten, ich.e am 11-apr-Spalte AB sein sollte (B-A)= 0 etc. e.g, beginnend mit Dt
1
Antworten
Habe ich diese datasate jetzt: animal age count dogs 1 49 2 134 3 147 4 154 cats 1 189 2 254 3 259 4 261 Ich würde gerne konvertieren Alter Spalte 4 Alter Spalten für jedes
3
Antworten
Ist es sowieso zu verbergen E1101 Fehler für Objekte, die erstellt werden, von einer bestimmten Bibliothek? Unser großes repository ist übersät mit #pylint: disable=E1101 um verschiedene Objekte erstellt, die von pandas. Beispielsweise pylint werfen wird kein Mitglied-Fehler,
2
Antworten
Für einen DataFrame (df) mit mehreren Spalten und Zeilen A B C D 0 1 4 2 6 1 2 5 7 4 2 3 6 5 6 und anderen DataFrame (dfBool) mit "dtype": bool 0 True
1
Antworten
Ich will zu konvertieren, eine Spalte mit Werten wie 1234567.89 zu 1,234,567.89. Kann mir jemand helfen mit diesem. Bitte Lesen Sie Wie Stelle ich eine gute Frage? und aktualisieren Sie Ihre Frage. InformationsquelleAutor Want to try everything
2
Antworten
Mit Python 3.4, Pandas 0,15 und Statsmodels 0.6.0 ich versuchen, erstellen Sie eine Mosaik-plot aus einem dataframe, wie beschrieben in der Statsmodels Dokumentation. Aber ich verstehe einfach nicht, wie die Eingabe formatiert werden, die bereitgestellt wird, um
1
Antworten
Ich habe bestimmte Datei-format von CNC (Arbeitsplatz) Daten. gespeichert wie .txt . Ich möchte diese Tabelle nicht Lesen pandas dataframe aber ich habe nie gesehen, dass dieses format vor. _MASCHINENNUMMER : >0-251-11-0950/51< SACHBEARB.: >BSTWIN32< _PRODUKTSCHLUESSEL : >BST
2
Antworten
Ich habe einen dataframe, die zwei integer-Spalten mit dem Jahr und Woche des Jahres: import pandas as pd import numpy as np L1 = [43,44,51,2,5,12] L2 = [2016,2016,2016,2017,2017,2017] df = pd.DataFrame({"Week":L1,"Year":L2}) df Out[72]: Week Year 0 43
2
Antworten
Habe ich Folgendes pandas data frame: import pandas as pd import numpy as np df = pd.DataFrame({ 'fc': [100,100,112,1.3,14,125], 'sample_id': ['S1','S1','S1','S2','S2','S2'], 'gene_symbol': ['a', 'b', 'c', 'a', 'b', 'c'], }) df = df[['gene_symbol', 'sample_id', 'fc']] df Produziert diese:
3
Antworten
Frage mich, ob es eine effizientere Möglichkeit der Aufteilung in mehreren Spalten einer bestimmten Spalte. Zum Beispiel sage ich: prev open close volume 20.77 20.87 19.87 962816 19.87 19.89 19.56 668076 19.56 19.96 20.1 578987 20.1 20.4
2
Antworten
Habe ich Folgendes dataframe in pandas: Datum Zeit Event 0 14.11.2016 13:00 Veröffentlichung des 9-Monats-Berichtes 1 14.03.2017 13:00 Telefonkonferenz für Analysten 2 14.03.2017 13:00 Telefonkonferenz für Analysten 3 27.04.2017 14:00 Ordentliche Hauptversammlung 4 03.05.2017 14:00 Dividendenzahlung 5
1
Antworten
ich bin mit einigen Schwierigkeiten Maskierung eine Platte in der gleichen Weise, dass ich würde ein DataFrame. Was ich tun möchte, fühlt sich einfach, aber ich habe nicht gefunden, einen Weg suchen, an die docs und online-Foren.
3
Antworten
Wie konvertiere ich ein numpy-array in einen dataframe Spalte. Sagen wir, ich habe erstellt eine leere dataframe, df, und ich Schleife durch code zu erstellen 5 numpy-arrays. In jeder iteration von meiner for-Schleife, die ich konvertieren wollen
2
Antworten
Ich habe variable in pandas dataframe mit den Werten, wie unten print (df.xx) 1 5679558 2 (714) 254 3 0 4 00000000 5 000000000 6 00000000000 7 000000001 8 000000002 9 000000003 10 000000004 11 000000005 print
1
Antworten
Bin ich beim Lesen über die Pandas Dokumentation, und der Begriff "Rundfunk" ist ausgiebig, aber nie wirklich definiert oder erklärt. Was bedeutet es? Es ist angenommen von numpy: docs.scipy.org/doc/numpy/user/basics.broadcasting.html. Im Grunde erklärt es das Verhalten beim ausführen
3
Antworten
Für dataframe In [2]: df = pd.DataFrame({'Name': ['foo', 'bar'] * 3, ...: 'Rank': np.random.randint(0,3,6), ...: 'Val': np.random.rand(6)}) ...: df Out[2]: Name Rank Val 0 foo 0 0.299397 1 bar 0 0.909228 2 foo 0 0.517700 3 bar
2
Antworten
Ich würde gerne konvertieren 'Byte' Daten in ein Pandas dataframe. Den Daten sieht wie folgt aus (die ersten Zeilen): (b'#Settlement Date,Settlement Period,CCGT,OIL,COAL,NUCLEAR,WIND,PS,NPSHYD,OCGT' b',OTHER,INTFR,INTIRL,INTNED,INTEW,BIOMASS\n2017-01-01,1,7727,0,3815,7404,3' b'923,0,944,0,2123,948,296,856,238,\n2017-01-01,2,8338,0,3815,7403,3658,16,' b'909,0,2124,998,298,874,288,\n2017-01-01,3,7927,0,3801,7408,3925,0,864,0,2' b'122,998,298,816,286,\n2017-01-01,4,6996,0,3803,7407,4393,0,863,0,2122,998' Den Spalten-Header wird oben angezeigt. jede nachfolgende Zeile ist ein Zeitstempel
1
Antworten
Ich versuche, zu Gruppe aus und zählen Sie die gleichen Informationen in einer Zeile: #Functions def postal_saude (): global df, lista_solic #List of solicitantes in Postal Saude list_sol = [lista_solic["name1"], lista_solic["name2"]] #filter Postal Saude Solicitantes df =
1
Antworten
Ich habe eine DataFrame mit einer Mischung von 0 und die anderen zahlen. Ich möchte konvertieren, die 0 zu fehlen. Zum Beispiel, ich bin auf der Suche nach dem Befehl, konvertieren In [618]: a=DataFrame(data=[[1,2],[0,1],[1,2],[0,0]]) In [619]: a
3
Antworten
Meine Anwendung zu vergleichen-Serie Instanzen, die manchmal enthalten nans. Das bewirkt, dass gewöhnliche Vergleich mit == zu scheitern, da nan != nan: import numpy as np from pandas import Series s1 = Series([1,np.nan]) s2 = Series([1,np.nan]) >>>
2
Antworten
Ich habe ein Nähe-matrix gespeichert, die als pandas.DataFrame: node_names = ['A', 'B', 'C'] a = pd.DataFrame([[1,2,3],[3,1,1],[4,0,2]], index=node_names, columns=node_names) a_numpy = a.as_matrix() Ich möchte eine igraph.Graph entweder aus der pandas oder die numpy Nähe Matrizen. In einer idealen
1
Antworten
Ich versuche zu finden ein schöner Weg, um eine 2d-numpy-Arrays und Anhängen, Spalte und Zeile Namen als ein strukturiertes array. Zum Beispiel: import numpy as np column_names = ['a', 'b', 'c'] row_names = ['1', '2', '3'] matrix
1
Antworten
Verstehe ich nicht, warum erhalte ich die Fehlermeldung KeyError: '[ 1351 1352 1353 ... 13500 13501 13502] not in index' wenn ich diesen code ausführen: cv = KFold(n_splits=10) for train_index, test_index in cv.split(X): f_train_X, f_valid_X = X[train_index],
3
Antworten
Ich habe folgenden code und versuche zu schreiben ein Daten-frame in eine "Bestehende" Arbeitsblatt einer Excel-Datei (bezeichnet als hier test.xlsx). Sheet3 ist der gezielte Blatt, wo ich will, um die Daten und ich will nicht ersetzen die
1
Antworten
Habe ich einen Pandabären Daten-frame und dann konvertiert es in pivot-Tabelle. Meine pivot-Tabelle sieht wie folgt aus: Operators TotalCB Qd(cb) Autopass(cb) Aircel India 55 11 44 Airtel Ghana 20 17 3 Airtel India 41 9 9 Airtel
2
Antworten
Folgenden die pandas-docs ich habe Folgendes versucht (verbatim aus der docs): df = pd.DataFrame({"A": [1, 2, 3], "B": [4, 5, 6]}) df.rename(str.lower, axis='columns') aber ich bin immer der Fehler TypeError: umbenennen() got an unexpected keyword argument der
2
Antworten
Bin ich auf Windows 10, habe ich anaconda installiert, aber ich möchte eine ausführbare Datei erstellen, selbständig in ein neues, sauberes minimal-Umgebung mit python 3.5. So habe ich einige tests: TEST1: Erstellt habe ich ein python-Skript test1.py
1
Antworten
Mein dataset ist ein DataFrame dimension (840,84). Wenn ich den code schreiben: ds[ds.columns[1]].value_counts() Bekomme ich eine korrekte Ausgabe: Out[82]: 0 847 1 5 Name: o_East, dtype: int64 Aber wenn ich Schreibe eine Schleife zum speichern der Werte,
1
Antworten
Sagen wir, ich habe einen DataFrame, wie diese: df A B 5 0 1 18 2 3 125 4 5 wo 5, 18, 125 sind die index - Ich würde gerne die Zeile vor (oder nach) einem
1
Antworten
Habe ich zwei oder drei csv-Dateien mit dem gleichen header und weisen die Histogramme für jede Spalte überlagern einander auf demselben Grundstück. Folgende code gibt mir zwei getrennte zahlen, die jeweils alle Histogramme für jede der Dateien.
1
Antworten
Habe ich zwei dataframes mit nur wenig überlappenden Indizes und Spalten. old = pd.DataFrame(index = ['A', 'B', 'C'], columns = ['k', 'l', 'm'], data = abs(np.floor(np.random.rand(3, 3)*10))) new = pd.DataFrame(index = ['A', 'B', 'C', 'D'], columns =