Tag: pandas

Pandas ist eine Python-Bibliothek für Panel-Daten-manipulation und-Analyse, z.B. mehrdimensionale Zeitreihen-und Querschnitts-Datensätzen, die üblicherweise in der Statistik, Ergebnisse der experimentellen Wissenschaft, ökonometrie oder finance. WICHTIG: Wenn Sie eine Frage stellen, die dieses tag enthält, Kennzeichnen Sie bitte Ihre Fragen: [python]; [pandas]; [dataframe]/[Reihe]; (optional) [groupby]/[merge]/etc. je nach Ihren spezifischen Anforderungen.

"Anti-merge" in pandas (Python)

Anzahl der Antworten 1 Antworten
Wie bekomme ich Sie heraus, den Unterschied zwischen den Spalten mit dem gleichen Namen in beiden dataframes? Ich meine, ich habe Ein dataframe mit einer Spalte namens X und dataframe B mit Spalte X, wenn ich pd.merge(A,

finden Sie doppelte Zeilen in ein pandas dataframe

Anzahl der Antworten 1 Antworten
Ich versuche zu finden, Duplikate von Zeilen in ein pandas dataframe. df=pd.DataFrame(data=[[1,2],[3,4],[1,2],[1,4],[1,2]],columns=['col1','col2']) df Out[15]: col1 col2 0 1 2 1 3 4 2 1 2 3 1 4 4 1 2 duplicate_bool = df.duplicated(subset=['col1','col2'], keep='first') duplicate =

Der Zugriff auf 1. element der Pandas DataFrame Spalte mit Listen

Anzahl der Antworten 4 Antworten
Habe ich ein Pandas DataFrame mit einer Spalte, in der Listen-Objekte A 0 [1,2] 1 [3,4] 2 [8,9] 3 [2,6] Wie kann ich Zugriff auf das erste element jeder Liste, und speichern Sie es in eine neue

Wie plot-Alter-Verteilung mit pandas

Anzahl der Antworten 1 Antworten
Habe ich Daten-Frame, der enthält 2 Spalten: Alter und Geschlecht. sex,age 1,30 2,29 1,34 1,27 2,28 2,28 1,40 1,30 1,27 2,31 1,37 1,31 2,28 2,30 2,27 2,27 2,29 2,32 1,28 1,27 1,28 1,28 1,29 1,33 1,32 1,30

Kombinieren Sie Aufeinanderfolgende Zeilen mit Gleichen Spaltenwerten

Anzahl der Antworten 2 Antworten
Habe ich etwas, das so aussieht. Wie komme ich von dieser: 0 d 0 The DT 1 Skoll ORGANIZATION 2 Foundation ORGANIZATION 3 , , 4 based VBN 5 in IN 6 Silicon LOCATION 7 Valley LOCATION

konvertieren pandas dataframe Spalte hex string zu int

Anzahl der Antworten 2 Antworten
Ich habe eine sehr große dataframe, dass würde ich gerne vermeiden, Durchlaufen jede einzelne Zeile und möchten, konvertieren Sie die gesamte Spalte aus hex string zu int. Es nicht verarbeiten den string korrekt mit astype hat aber

Wie für das Lesen zu überspringen leere Dateien mit panda in Python

Anzahl der Antworten 4 Antworten
Ich lese alle Dateien in einem Ordner einzeln in ein DataFrame und dann überprüfe ich Sie für einige Bedingungen. Es gibt einige tausend Dateien, und ich würde Sie gerne pandas eine Ausnahme auslösen, wenn eine Datei leer

Pandas dataframe als input für matplotlib.pyplot.boxplot

Anzahl der Antworten 1 Antworten
Habe ich ein pandas dataframe die wie folgt aussieht: [('1975801_m', 1 0.203244 10 -0.159756 16 -0.172756 19 -0.089756 20 -0.033756 23 -0.011756 24 0.177244 32 0.138244 35 -0.104756 36 0.157244 40 0.108244 41 0.032244 42 0.063244 45

FileNotFoundError beim importieren einer csv-Datei mit pandas in Jupyter notebook

Anzahl der Antworten 3 Antworten
Screenshot der beschriebenen Fehler. import pandas as pd df = pd.read_csv('/home/josepm/Documents/test_ver2.csv') --------------------------------------------------------------------------- FileNotFoundError Traceback (most recent call last) <ipython-input-3-5cd7fd573fb7> in <module>() 1 import pandas as pd ----> 2 df = pd.read_csv('/home/josepm/Documents/test_ver2.csv') Ich versuche zu importieren einer CSV-Datei

Was genau machen die barthaare in pandas' boxplots geben?

Anzahl der Antworten 4 Antworten
In python pandas boxplots mit Standard-Einstellungen, mit dem roten Balken ist die bedeuten median, und die box kennzeichnet das 25-und 75-Quartile, aber was genau tun die schnurrhaare in diesem Fall bedeuten? Wo ist die Dokumentation, um herauszufinden,

Unmelt Pandas DataFrame

Anzahl der Antworten 6 Antworten
Habe ich ein pandas dataframe mit zwei id-Variablen: df = pd.DataFrame({'id': [1,1,1,2,2,3], 'num': [10,10,12,13,14,15], 'q': ['a', 'b', 'd', 'a', 'b', 'z'], 'v': [2,4,6,8,10,12]}) id num q v 0 1 10 a 2 1 1 10 b 4

Keine Abfrage eine lokale variable in pandas 0.14.0

Anzahl der Antworten 2 Antworten
Kann ich der Abfrage einen expliziten Wert: fills.query('Symbol=="BUD US"') Nun möchte ich eine Abfrage variable: In [40]: my_symbol Out[40]: 'BUD US' In pandas 0.13.1, konnte ich einfach nutzen: fills.query('Symbol==my_symbol') Dies ist nicht mehr erlaubt, in pandas 0.14.0

Grundstück pandas dataframe nicht funktioniert

Anzahl der Antworten 1 Antworten
Ich bin mit pandas, zeichnen ein Diagramm. Das folgende ist meine Funktion count_subset.plot(kind='barh', stacked=True) Die Antwort, die ich bekommen, ist <matplotlib.axes.AxesSubplot at 0x111fc4ad0> Kann ich nicht sehen, die Grafik überall. Bin ich etwas fehlt-Bibliothek ? InformationsquelleAutor Vinay

Konvertieren pandas dataframe zu numpy-array mit Header und dtypes

Anzahl der Antworten 1 Antworten
Ich habe versucht, zu konvertieren, ein pandas dataframe in einen numpy-array, tragen über der dtypes und header-Namen für eine einfache Referenz. Ich muss dies tun, da die Verarbeitung auf pandas ist viel zu langsam, numpy ist 10-Fach

So zeigen Sie eine Pandabären-Daten-frame mit PyQt5/PySide2

Anzahl der Antworten 2 Antworten
Ich habe ein problem mit der Zeile unten self.tableView.set??????????(df) soll die Anzeige der Daten-frame in PyQt5. Ich stellen ??? dort, wo ich bin, fehlt der code, den ich brauche. def btn_clk(self): path = self.lineEdit.text() df = pd.read_csv(path)

Wie zum erstellen von sql-alchemy-Verbindung für pandas read_sql mit sqlalchemy+pyodbc und mehrere Datenbanken in MS SQL Server?

Anzahl der Antworten 1 Antworten
Ich versuche, mit 'pandas.read_sql_query' kopieren der Daten aus MS SQL Server in ein pandas DataFrame. Ich brauche mehrere joins in meiner SQL-Abfrage. Die Tabellen, die verbunden werden, sind auf dem gleichen server, aber in verschiedenen Datenbanken. Die

Pandas Summe der Doppelten Parametern

Anzahl der Antworten 1 Antworten
Ich bin mit Pandas zu manipulieren, um eine csv-Datei mit mehreren Zeilen und Spalten, die wie folgt aussieht Fullname Amount Date Zip State ..... John Joe 1 1/10/1900 55555 Confusion Betty White 5 . . Alaska Bruce

Scipy FFT-Frequenz-Analyse von sehr verrauschtes signal

Anzahl der Antworten 6 Antworten
Habe ich laut Daten, für die ich berechnen wollen, Frequenz und amplitude. Die Proben wurden alle 1/100stel Sek. Von trends, ich glaube, die Frequenz auf ~ 0.3 Wenn ich numpy fft Modul, ich am Ende immer sehr

python pandas read_csv quotechar funktioniert nicht

Anzahl der Antworten 2 Antworten
Habe ich gelesen diese, diese und diese Beiträge, aber trotz ich weiß nicht, warum quotechar funktioniert nicht bei pd.read_csv() (Python 3, pandas 0.18.0 und 0.18.1). Und wie konnte ich Lesen einen dataframe, wie diese: "column1","column2", "column3", "column4",

Was ist der beste Weg, um entfernen von Spalten in pandas

Anzahl der Antworten 4 Antworten
Ich Hebe diese Frage für mich selber zu lernen. Soweit ich weiß, folgenden werden die verschiedenen Methoden zum entfernen von Spalten in pandas dataframe. Option - 1: df=pd.DataFrame({'a':[1,2,3,4,5],'b':[6,7,8,9,10],'c':[11,12,13,14,15]}) del df['a'] Option - 2: df=pd.DataFrame({'a':[1,2,3,4,5],'b':[6,7,8,9,10],'c':[11,12,13,14,15]}) df=df.drop('a',1) Option -

TypeError: Cannot compare Typ 'Timestamp' mit Typ 'Datum'

Anzahl der Antworten 2 Antworten
Das problem ist in line 22 : if start_date <= data_entries.iloc[j, 1] <= end_date: wo ich vergleichen wollen start_date und end_date Teil data_entries.iloc[j, 1] ist der Zugriff auf eine Spalte der pandas dataframe. Ich konvertiert die Spalte

Mit Pandas zu Finden, die Minimalen Werte der Gruppierten Zeilen

Anzahl der Antworten 2 Antworten
Das mag eine triviale Frage, aber ich bin immer noch versuchen, herauszufinden, pandas/numpy. So, angenommen ich habe eine Tabelle mit der folgenden Struktur: group_id | col1 | col2 | col3 | "A" | "B" x | 1

Wie man den index-Wert in pandas MultiIndex-Daten-frame?

Anzahl der Antworten 2 Antworten
df = pd.DataFrame({'a':[2,3,5], 'b':[1,2,3], 'c':[12,13,14]}) df.set_index(['a','b'], inplace=True) display(df) s = df.iloc[1] # How to get 'a' and 'b' value from s? Es ist so ärgerlich, dass diejenigen, die Spalten zu den Indizes, die wir nicht einfach df['colname']

Pandas verschieben von Zeilen von 1 DF zu einem anderen DF

Anzahl der Antworten 1 Antworten
Habe ich df1 Lesen von Excel -, dann Erzeuge ich ein leeres df2 mit den gleichen Spalten. Ich will jetzt verschieben Sie einige Zeilen aus df1 matching eine Bedingung df2. Gibt es einen einfachen Weg, dies zu

Pandas: TypeError: sort_values() fehlt 1 erforderliche positionelle argument: "durch"

Anzahl der Antworten 1 Antworten
Ich bin vor TypeError: sort_values() fehlt 1 erforderliche positionelle argument: "durch' for i in range(0,len(data_sims.index)): for j in range(1,len(data_sims.columns)): user = data_sims.index[i] serial = data_sims.columns[j] if dataUser.ix[i][j] == 1: data_sims.ix[i][j] = 0 else: serial_top_names = data_neighbours.ix[serial][1:10] serial_top_sims

Wie mehrere Spalten in pandas DataFrame für eine "Intervall"?

Anzahl der Antworten 1 Antworten
Habe ich Folgendes pandas DataFrame: import pandas as pd df = pd.DataFrame('filename.csv') print(df) order start end value 1 1342 1357 category1 1 1459 1489 category7 1 1572 1601 category23 1 1587 1599 category2 1 1591 1639 category1

So entfernen Sie die aktuellsten Informationen in einer Spalte, halten Sie einfach die Zeit

Anzahl der Antworten 6 Antworten
Ich bin mit pandas dataframe. es gibt eine bestimmte Spalte hat Zeit Informationen. den raw-Daten mag das: 5:15am 5:28am 6:15am so, ich brauche zum konvertieren der Rohdaten in ein datetime-format: format = '%I:%M%p' dataset['TimeStamp'] = pd.to_datetime(dataset['TimeStamp'],format) Allerdings

Legen Sie pandas-Diagramm in eine Excel-Datei mit XlsxWriter

Anzahl der Antworten 1 Antworten
Verwende ich python 3.4, pandas 0.14.1 und XlsxWriter 0.5.6. Ich erstelle ein Diagramm namens 'Diagramm' über pandas-mit den folgenden code graph=data_iter['_DiffPrice'].hist() ergibt sich ein schönes Histogramm. Nun, wie füge ich das Diagramm in eine Excel-Datei mit XlsxWriter?

Was ist die Schnellste Möglichkeit zum hochladen einer großen csv-Datei in die notebook-Arbeit mit python pandas?

Anzahl der Antworten 1 Antworten
Ich versuche zum hochladen einer csv-Datei, die 250MB. Grundsätzlich 4 Millionen Zeilen und 6 Spalten von Zeitreihen-Daten (1min). Das übliche Verfahren ist: location = r'C:\Users\Name\Folder_1\Folder_2\file.csv' df = pd.read_csv(location) Dieser Vorgang dauert etwa 20 Minuten !!!. Sehr vorläufige,

Pandas können nicht importiert werden in IPython

Anzahl der Antworten 2 Antworten
Ich bin mit Windows 7.0 mit Python2.7. Ich installierte pandas vor der Installation ipython0.12.1(stabil). Wenn ich import pandas im IPython.exe bekomme ich die Fehlermeldung: Kein Modul mit dem Namen pandas Wenn ich rufe, IPython aus dem start-Menü,

Aggregation über die Partition - pandas Dataframe

Anzahl der Antworten 1 Antworten
Ich bin auf der Suche nach der beste Weg, um aggregierte Werte, basierend auf einer bestimmten partition , die äquivalente SUM(TotalCost) OVER(PARTITION BY ShopName) Earnings ( SQL server) Ich bin in der Lage, dies zu tun, indem

Pandas-Fehler: nur verwenden Können .str-accessor-mit string-Werte, die np.object_ dtype in pandas

Anzahl der Antworten 1 Antworten
Ich habe Daten in meinem .txt Datei wie folgt: 029070 ***** 190101010600 270 36 OVC ** 0.0 ** ** Ich extrahieren möchten, 190101 aus der Spalte 3, ich bin immer AttributeError: nur verwenden Können .str-accessor-mit string-Werte, die

Datetime-Objekte mit pandas meine Funktion

Anzahl der Antworten 3 Antworten
Ich bin neu in der Programmierung, so dass ich entschuldige mich im Voraus, wenn diese Frage keine sens. Ich habe bemerkt, dass wenn ich versuche zu berechnen, den Mittelwert eines pandas-Daten-frame mit einem date-time-Objekt wie folgt formatiert:

Anwenden, Funktion pandas dataframe Zeile mit den Werten in anderen Zeilen

Anzahl der Antworten 2 Antworten
Ich habe eine situation wo ich einen dataframe Zeile, um Berechnungen mit, und ich brauche Werte verwenden, die im folgenden (potenziell vorhergehenden) Zeilen um diese Berechnungen zu tun (im Grunde eine perfekte Prognose basiert auf der realen

SVERWEIS äquivalente Funktion zum nachschlagen der Wert in pandas DataFrame

Anzahl der Antworten 2 Antworten
Habe ich ein pandas dataframe folgende Struktur: DF_Cell, DF_Site C1,A C2,A C3,B C4,B C5,B Und ich haben eine sehr lange Schleife (100 Millionen Iterationen), in denen ich behandle eins nach dem anderen Zeichenfolgen entsprechen, die für die

Mit predict() auf statsmodels.Formel Daten mit unterschiedlichen Spaltennamen mit Python Pandas

Anzahl der Antworten 2 Antworten
Habe ich einige Regressionen Ergebnisse aus Laufenden statsmodels.formula.api.ols. Hier ist ein Spielzeug-Beispiel: import pandas as pd import numpy as np import statsmodels.formula.api as smf example_df = pd.DataFrame(np.random.randn(10, 3)) example_df.columns = ["a", "b", "c"] fit = smf.ols('a ~

Konvertieren von datetime-Spalten, um eine andere Zeitzone pandas

Anzahl der Antworten 1 Antworten
Habe ich zwei datetime-Spalten, die sind naiv, wenn ich lese Sie in den Speicher, aber die sind in US/Eastern tatsächlich. Ich möchte einfach zu konvertieren, diese beiden Spalten zu US/Central. Fand ich eine Methode, die funktioniert, aber

Wie zu Lesen, Zeit mit Zeitzone in pandas

Anzahl der Antworten 1 Antworten
Ich versuche, erstellen Sie ein dataframe aus dem csv-Format, deren erste Spalte ist wie "2013-08-25T00:00:00-0400"; "2013-08-25T01:00:00-0400"; "2013-08-25T02:00:00-0400"; "2013-08-25T03:00:00-0400"; "2013-08-25T04:00:00-0400"; Es ist Zeit mit Zeitzone ! Ich schon so etwas wie df1 = DataFrame(pd.read_csv(PeriodC, sep=';', parse_dates=[0], index_col=0)) aber

Resampling-trade-Daten in OHLCV mit pandas

Anzahl der Antworten 2 Antworten
Habe ich historische Daten über den Handel in ein pandas DataFrame, mit Preis und Volumen Spalten, indiziert durch eine DateTimeIndex. Beispiel: >>> print df.tail() price volume 2014-01-15 14:29:54+00:00 949.975 0.01 2014-01-15 14:29:59+00:00 941.370 0.01 2014-01-15 14:30:17+00:00 949.975

VAR-Modell mit pandas + statsmodels in Python

Anzahl der Antworten 1 Antworten
Ich bin ein begeisterter Nutzer von R, aber vor kurzem eingeschaltet, um Python für ein paar verschiedenen Gründen. Aber ich bin kämpfen, ein wenig zu laufen, der Vektor AR-Modells in Python von statsmodels. Q#1. Ich erhalte eine

Pandas kumulierte Anzahl

Anzahl der Antworten 4 Antworten
Habe ich einen Daten-frame, wie dies: 0 04:10 obj1 1 04:10 obj1 2 04:11 obj1 3 04:12 obj2 4 04:12 obj2 5 04:12 obj1 6 04:13 obj2 Wollte eine kumulierte Anzahl für alle Objekte dieser: idx time

Pandas boxplot: Farbe und Eigenschaften der box, median, Mittelwert

Anzahl der Antworten 3 Antworten
Ich habe einen DataFrame mit einem MultiIndex: # -*- coding: utf-8 -*- import numpy as np import pandas as pd # dataframe with dates dates = pd.DataFrame() dates['2016'] = pd.date_range(start='2016', periods=4, freq='60Min') dates['2017'] = pd.date_range(start='2017', periods=4, freq='60Min')

pyspark: ValueError: Einige Arten nicht bestimmt werden kann nach der Herleitung

Anzahl der Antworten 5 Antworten
Habe ich ein Pandabären-Daten-frame my_df, und my_df.dtypes uns gibt: ts int64 fieldA object fieldB object fieldC object fieldD object fieldE object dtype: object Dann bin ich versucht zu konvertieren, die pandas data frame my_df zu Funken-Daten-frame-by-doing unter:

So Benennen Sie Mehrere Spalten auf eine Reset-Index mit Pandas

Anzahl der Antworten 1 Antworten
Ich versuche, herauszufinden, ob es eine Möglichkeit zum umbenennen Pandas Spalten wenn Sie versuchen, den index zurücksetzen. Ich sehe in der Dokumentation, die Sie können verwenden Sie die "name" - parameter legen Sie den Namen der Spalte

gewusst wie: umbenennen von Spalten in pandas unter Verwendung einer Liste

Anzahl der Antworten 1 Antworten
Ich habe einen dataframe (df), der hat 44 Spalten, und ich will Sie Spalten umbenennen 2:44. Ich habe eine Liste (namesList) der Länge 42, der die neuen Spaltennamen. Ich versuche dann, meine Spalten umbenennen, indem Sie die

Python Pandas df ist nicht definiert

Anzahl der Antworten 1 Antworten
Ich habe ein problem mit einem Skript, das ich schrieb eine Weile zurück, vor einigen Monaten lief es ohne problem. Aber seitdem die OS aktualisiert wurde. Das Skript funktioniert gut, bis er versucht, erstellen Sie ein dataframe

"TypeError: 'DataFrame' Objekte sind veränderbar, damit Sie sich nicht zerlegt werden" beim Sortieren pandas dataframe index

Anzahl der Antworten 2 Antworten
Ich habe folgende dataframe h: In [24]: h.head() Out[24]: alpha1 alpha2 gamma1 gamma2 chi2min gender age filename F35_HC_532d.dat 0.0000 0.000 NaN 0.00 1.000000e+25 F 35 M48_HC_551d.dat 0.7353 3.943 0.425922 0.15 2.072617e+01 M 48 M24_HC_458d.dat 0.7777 4.754 0.463753

Pandas DataFrame Bar Plot - Plot-Bars In Verschiedenen Farben Aus Bestimmten Farbpalette

Anzahl der Antworten 2 Antworten
Wie Sie zeichnen den bars von ein Balkendiagramm verschiedene Farben nur mit den pandas dataframe plot Methode? Wenn ich in diesem DataFrame: df = pd.DataFrame({'count': {0: 3372, 1: 68855, 2: 17948, 3: 708, 4: 9117}}).reset_index() index count

Wie man ein Balkendiagramm mit nicht-numerischen Daten in pandas

Anzahl der Antworten 2 Antworten
Glaube, ich hatte diese Daten: >>> df = pd.DataFrame(data={"age": [11, 12, 11, 11, 13, 11, 12, 11], "response": ["Yes", "No", "Yes", "Yes", "Yes", "No", "Yes", "Yes"]}) >>> df age response 0 11 Yes 1 12 No 2

Pandas - Schreiben Sie eine excel-Datei mit unicode - IllegalCharacterError

Anzahl der Antworten 5 Antworten
Ich habe den folgenden code: import pandas as pd x = [u'string with some unicode: \x16'] df = pd.DataFrame(x) Wenn ich versuche, das zu schreiben dataframe als excel-Datei: df.to_excel("test.xlsx") Oder, wenn ich versuche, das zu schreiben dataframe