Tag: pandas

Pandas ist eine Python-Bibliothek für Panel-Daten-manipulation und-Analyse, z.B. mehrdimensionale Zeitreihen-und Querschnitts-Datensätzen, die üblicherweise in der Statistik, Ergebnisse der experimentellen Wissenschaft, ökonometrie oder finance. WICHTIG: Wenn Sie eine Frage stellen, die dieses tag enthält, Kennzeichnen Sie bitte Ihre Fragen: [python]; [pandas]; [dataframe]/[Reihe]; (optional) [groupby]/[merge]/etc. je nach Ihren spezifischen Anforderungen.

"Anti-merge" in pandas (Python)

1 Antworten

Wie bekomme ich Sie heraus, den Unterschied zwischen den Spalten mit dem gleichen Namen in beiden dataframes? Ich meine, ich habe Ein dataframe mit einer Spalte namens X und dataframe B mit Spalte X, wenn ich pd.merge(A,

finden Sie doppelte Zeilen in ein pandas dataframe

1 Antworten

Ich versuche zu finden, Duplikate von Zeilen in ein pandas dataframe. df=pd.DataFrame(data=[[1,2],[3,4],[1,2],[1,4],[1,2]],columns=['col1','col2']) df Out[15]: col1 col2 0 1 2 1 3 4 2 1 2 3 1 4 4 1 2 duplicate_bool = df.duplicated(subset=['col1','col2'], keep='first') duplicate =

dataframe duplicates pandas python

Der Zugriff auf 1. element der Pandas DataFrame Spalte mit Listen

4 Antworten

Habe ich ein Pandas DataFrame mit einer Spalte, in der Listen-Objekte A 0 [1,2] 1 [3,4] 2 [8,9] 3 [2,6] Wie kann ich Zugriff auf das erste element jeder Liste, und speichern Sie es in eine neue

dataframe pandas python

Wie plot-Alter-Verteilung mit pandas

1 Antworten

Habe ich Daten-Frame, der enthält 2 Spalten: Alter und Geschlecht. sex,age 1,30 2,29 1,34 1,27 2,28 2,28 1,40 1,30 1,27 2,31 1,37 1,31 2,28 2,30 2,27 2,27 2,29 2,32 1,28 1,27 1,28 1,28 1,29 1,33 1,32 1,30

group-by pandas pandas-groupby python

Kombinieren Sie Aufeinanderfolgende Zeilen mit Gleichen Spaltenwerten

2 Antworten

Habe ich etwas, das so aussieht. Wie komme ich von dieser: 0 d 0 The DT 1 Skoll ORGANIZATION 2 Foundation ORGANIZATION 3 , , 4 based VBN 5 in IN 6 Silicon LOCATION 7 Valley LOCATION

pandas python

konvertieren pandas dataframe Spalte hex string zu int

2 Antworten

Ich habe eine sehr große dataframe, dass würde ich gerne vermeiden, Durchlaufen jede einzelne Zeile und möchten, konvertieren Sie die gesamte Spalte aus hex string zu int. Es nicht verarbeiten den string korrekt mit astype hat aber

dataframe hex pandas python python-3.x

Wie für das Lesen zu überspringen leere Dateien mit panda in Python

4 Antworten

Ich lese alle Dateien in einem Ordner einzeln in ein DataFrame und dann überprüfe ich Sie für einige Bedingungen. Es gibt einige tausend Dateien, und ich würde Sie gerne pandas eine Ausnahme auslösen, wenn eine Datei leer

dataframe pandas python

Pandas dataframe als input für matplotlib.pyplot.boxplot

1 Antworten

Habe ich ein pandas dataframe die wie folgt aussieht: [('1975801_m', 1 0.203244 10 -0.159756 16 -0.172756 19 -0.089756 20 -0.033756 23 -0.011756 24 0.177244 32 0.138244 35 -0.104756 36 0.157244 40 0.108244 41 0.032244 42 0.063244 45

boxplot dataframe pandas python

FileNotFoundError beim importieren einer csv-Datei mit pandas in Jupyter notebook

3 Antworten

Screenshot der beschriebenen Fehler. import pandas as pd df = pd.read_csv('/home/josepm/Documents/test_ver2.csv') --------------------------------------------------------------------------- FileNotFoundError Traceback (most recent call last) <ipython-input-3-5cd7fd573fb7> in <module>() 1 import pandas as pd ----> 2 df = pd.read_csv('/home/josepm/Documents/test_ver2.csv') Ich versuche zu importieren einer CSV-Datei

csv import-csv pandas python

Was genau machen die barthaare in pandas' boxplots geben?

4 Antworten

In python pandas boxplots mit Standard-Einstellungen, mit dem roten Balken ist die bedeuten median, und die box kennzeichnet das 25-und 75-Quartile, aber was genau tun die schnurrhaare in diesem Fall bedeuten? Wo ist die Dokumentation, um herauszufinden,

boxplot pandas

Unmelt Pandas DataFrame

6 Antworten

Habe ich ein pandas dataframe mit zwei id-Variablen: df = pd.DataFrame({'id': [1,1,1,2,2,3], 'num': [10,10,12,13,14,15], 'q': ['a', 'b', 'd', 'a', 'b', 'z'], 'v': [2,4,6,8,10,12]}) id num q v 0 1 10 a 2 1 1 10 b 4

pandas python

Keine Abfrage eine lokale variable in pandas 0.14.0

2 Antworten

Kann ich der Abfrage einen expliziten Wert: fills.query('Symbol=="BUD US"') Nun möchte ich eine Abfrage variable: In [40]: my_symbol Out[40]: 'BUD US' In pandas 0.13.1, konnte ich einfach nutzen: fills.query('Symbol==my_symbol') Dies ist nicht mehr erlaubt, in pandas 0.14.0

pandas python

Grundstück pandas dataframe nicht funktioniert

1 Antworten

Ich bin mit pandas, zeichnen ein Diagramm. Das folgende ist meine Funktion count_subset.plot(kind='barh', stacked=True) Die Antwort, die ich bekommen, ist <matplotlib.axes.AxesSubplot at 0x111fc4ad0> Kann ich nicht sehen, die Grafik überall. Bin ich etwas fehlt-Bibliothek ? InformationsquelleAutor Vinay

pandas

Konvertieren pandas dataframe zu numpy-array mit Header und dtypes

1 Antworten

Ich habe versucht, zu konvertieren, ein pandas dataframe in einen numpy-array, tragen über der dtypes und header-Namen für eine einfache Referenz. Ich muss dies tun, da die Verarbeitung auf pandas ist viel zu langsam, numpy ist 10-Fach

arrays dataframe numpy pandas python

So zeigen Sie eine Pandabären-Daten-frame mit PyQt5/PySide2

2 Antworten

Ich habe ein problem mit der Zeile unten self.tableView.set??????????(df) soll die Anzeige der Daten-frame in PyQt5. Ich stellen ??? dort, wo ich bin, fehlt der code, den ich brauche. def btn_clk(self): path = self.lineEdit.text() df = pd.read_csv(path)

pandas pyqt pyqt5 python qtableview

Wie zum erstellen von sql-alchemy-Verbindung für pandas read_sql mit sqlalchemy+pyodbc und mehrere Datenbanken in MS SQL Server?

1 Antworten

Ich versuche, mit 'pandas.read_sql_query' kopieren der Daten aus MS SQL Server in ein pandas DataFrame. Ich brauche mehrere joins in meiner SQL-Abfrage. Die Tabellen, die verbunden werden, sind auf dem gleichen server, aber in verschiedenen Datenbanken. Die

odbc pandas python sql-server sqlalchemy

Pandas Summe der Doppelten Parametern

1 Antworten

Ich bin mit Pandas zu manipulieren, um eine csv-Datei mit mehreren Zeilen und Spalten, die wie folgt aussieht Fullname Amount Date Zip State ..... John Joe 1 1/10/1900 55555 Confusion Betty White 5 . . Alaska Bruce

csv pandas python

Scipy FFT-Frequenz-Analyse von sehr verrauschtes signal

6 Antworten

Habe ich laut Daten, für die ich berechnen wollen, Frequenz und amplitude. Die Proben wurden alle 1/100stel Sek. Von trends, ich glaube, die Frequenz auf ~ 0.3 Wenn ich numpy fft Modul, ich am Ende immer sehr

fft numpy pandas python

python pandas read_csv quotechar funktioniert nicht

2 Antworten

Habe ich gelesen diese, diese und diese Beiträge, aber trotz ich weiß nicht, warum quotechar funktioniert nicht bei pd.read_csv() (Python 3, pandas 0.18.0 und 0.18.1). Und wie konnte ich Lesen einen dataframe, wie diese: "column1","column2", "column3", "column4",

csv pandas python

Was ist der beste Weg, um entfernen von Spalten in pandas

4 Antworten

Ich Hebe diese Frage für mich selber zu lernen. Soweit ich weiß, folgenden werden die verschiedenen Methoden zum entfernen von Spalten in pandas dataframe. Option - 1: df=pd.DataFrame({'a':[1,2,3,4,5],'b':[6,7,8,9,10],'c':[11,12,13,14,15]}) del df['a'] Option - 2: df=pd.DataFrame({'a':[1,2,3,4,5],'b':[6,7,8,9,10],'c':[11,12,13,14,15]}) df=df.drop('a',1) Option -

dataframe pandas python

TypeError: Cannot compare Typ 'Timestamp' mit Typ 'Datum'

2 Antworten

Das problem ist in line 22 : if start_date <= data_entries.iloc[j, 1] <= end_date: wo ich vergleichen wollen start_date und end_date Teil data_entries.iloc[j, 1] ist der Zugriff auf eine Spalte der pandas dataframe. Ich konvertiert die Spalte

datetime pandas python

Mit Pandas zu Finden, die Minimalen Werte der Gruppierten Zeilen

2 Antworten

Das mag eine triviale Frage, aber ich bin immer noch versuchen, herauszufinden, pandas/numpy. So, angenommen ich habe eine Tabelle mit der folgenden Struktur: group_id | col1 | col2 | col3 | "A" | "B" x | 1

dataframe numpy pandas python

Wie man den index-Wert in pandas MultiIndex-Daten-frame?

2 Antworten

df = pd.DataFrame({'a':[2,3,5], 'b':[1,2,3], 'c':[12,13,14]}) df.set_index(['a','b'], inplace=True) display(df) s = df.iloc[1] # How to get 'a' and 'b' value from s? Es ist so ärgerlich, dass diejenigen, die Spalten zu den Indizes, die wir nicht einfach df['colname']

pandas python

Pandas verschieben von Zeilen von 1 DF zu einem anderen DF

1 Antworten

Habe ich df1 Lesen von Excel -, dann Erzeuge ich ein leeres df2 mit den gleichen Spalten. Ich will jetzt verschieben Sie einige Zeilen aus df1 matching eine Bedingung df2. Gibt es einen einfachen Weg, dies zu

pandas python

Pandas: TypeError: sort_values() fehlt 1 erforderliche positionelle argument: "durch"

1 Antworten

Ich bin vor TypeError: sort_values() fehlt 1 erforderliche positionelle argument: "durch' for i in range(0,len(data_sims.index)): for j in range(1,len(data_sims.columns)): user = data_sims.index[i] serial = data_sims.columns[j] if dataUser.ix[i][j] == 1: data_sims.ix[i][j] = 0 else: serial_top_names = data_neighbours.ix[serial][1:10] serial_top_sims

jupyter pandas python

Wie mehrere Spalten in pandas DataFrame für eine "Intervall"?

1 Antworten

Habe ich Folgendes pandas DataFrame: import pandas as pd df = pd.DataFrame('filename.csv') print(df) order start end value 1 1342 1357 category1 1 1459 1489 category7 1 1572 1601 category23 1 1587 1599 category2 1 1591 1639 category1

dataframe intervals match pandas python

So entfernen Sie die aktuellsten Informationen in einer Spalte, halten Sie einfach die Zeit

6 Antworten

Ich bin mit pandas dataframe. es gibt eine bestimmte Spalte hat Zeit Informationen. den raw-Daten mag das: 5:15am 5:28am 6:15am so, ich brauche zum konvertieren der Rohdaten in ein datetime-format: format = '%I:%M%p' dataset['TimeStamp'] = pd.to_datetime(dataset['TimeStamp'],format) Allerdings

pandas python

Legen Sie pandas-Diagramm in eine Excel-Datei mit XlsxWriter

1 Antworten

Verwende ich python 3.4, pandas 0.14.1 und XlsxWriter 0.5.6. Ich erstelle ein Diagramm namens 'Diagramm' über pandas-mit den folgenden code graph=data_iter['_DiffPrice'].hist() ergibt sich ein schönes Histogramm. Nun, wie füge ich das Diagramm in eine Excel-Datei mit XlsxWriter?

pandas python xlsxwriter

Was ist die Schnellste Möglichkeit zum hochladen einer großen csv-Datei in die notebook-Arbeit mit python pandas?

1 Antworten

Ich versuche zum hochladen einer csv-Datei, die 250MB. Grundsätzlich 4 Millionen Zeilen und 6 Spalten von Zeitreihen-Daten (1min). Das übliche Verfahren ist: location = r'C:\Users\Name\Folder_1\Folder_2\file.csv' df = pd.read_csv(location) Dieser Vorgang dauert etwa 20 Minuten !!!. Sehr vorläufige,

csv dataframe pandas python

Pandas können nicht importiert werden in IPython

2 Antworten

Ich bin mit Windows 7.0 mit Python2.7. Ich installierte pandas vor der Installation ipython0.12.1(stabil). Wenn ich import pandas im IPython.exe bekomme ich die Fehlermeldung: Kein Modul mit dem Namen pandas Wenn ich rufe, IPython aus dem start-Menü,

ipython pandas python python-2.7 windows

Aggregation über die Partition - pandas Dataframe

1 Antworten

Ich bin auf der Suche nach der beste Weg, um aggregierte Werte, basierend auf einer bestimmten partition , die äquivalente SUM(TotalCost) OVER(PARTITION BY ShopName) Earnings ( SQL server) Ich bin in der Lage, dies zu tun, indem

dataframe group-by pandas partition python

Pandas-Fehler: nur verwenden Können .str-accessor-mit string-Werte, die np.object_ dtype in pandas

1 Antworten

Ich habe Daten in meinem .txt Datei wie folgt: 029070 ***** 190101010600 270 36 OVC ** 0.0 ** ** Ich extrahieren möchten, 190101 aus der Spalte 3, ich bin immer AttributeError: nur verwenden Können .str-accessor-mit string-Werte, die

pandas python

Datetime-Objekte mit pandas meine Funktion

3 Antworten

Ich bin neu in der Programmierung, so dass ich entschuldige mich im Voraus, wenn diese Frage keine sens. Ich habe bemerkt, dass wenn ich versuche zu berechnen, den Mittelwert eines pandas-Daten-frame mit einem date-time-Objekt wie folgt formatiert:

datetime mean pandas python

Anwenden, Funktion pandas dataframe Zeile mit den Werten in anderen Zeilen

2 Antworten

Ich habe eine situation wo ich einen dataframe Zeile, um Berechnungen mit, und ich brauche Werte verwenden, die im folgenden (potenziell vorhergehenden) Zeilen um diese Berechnungen zu tun (im Grunde eine perfekte Prognose basiert auf der realen

dataframe lambda pandas python

SVERWEIS äquivalente Funktion zum nachschlagen der Wert in pandas DataFrame

2 Antworten

Habe ich ein pandas dataframe folgende Struktur: DF_Cell, DF_Site C1,A C2,A C3,B C4,B C5,B Und ich haben eine sehr lange Schleife (100 Millionen Iterationen), in denen ich behandle eins nach dem anderen Zeichenfolgen entsprechen, die für die

lookup pandas

Mit predict() auf statsmodels.Formel Daten mit unterschiedlichen Spaltennamen mit Python Pandas

2 Antworten

Habe ich einige Regressionen Ergebnisse aus Laufenden statsmodels.formula.api.ols. Hier ist ein Spielzeug-Beispiel: import pandas as pd import numpy as np import statsmodels.formula.api as smf example_df = pd.DataFrame(np.random.randn(10, 3)) example_df.columns = ["a", "b", "c"] fit = smf.ols('a ~

numpy pandas python statsmodels

Konvertieren von datetime-Spalten, um eine andere Zeitzone pandas

1 Antworten

Habe ich zwei datetime-Spalten, die sind naiv, wenn ich lese Sie in den Speicher, aber die sind in US/Eastern tatsächlich. Ich möchte einfach zu konvertieren, diese beiden Spalten zu US/Central. Fand ich eine Methode, die funktioniert, aber

pandas python

Wie zu Lesen, Zeit mit Zeitzone in pandas

1 Antworten

Ich versuche, erstellen Sie ein dataframe aus dem csv-Format, deren erste Spalte ist wie "2013-08-25T00:00:00-0400"; "2013-08-25T01:00:00-0400"; "2013-08-25T02:00:00-0400"; "2013-08-25T03:00:00-0400"; "2013-08-25T04:00:00-0400"; Es ist Zeit mit Zeitzone ! Ich schon so etwas wie df1 = DataFrame(pd.read_csv(PeriodC, sep=';', parse_dates=[0], index_col=0)) aber

datetime pandas python

Resampling-trade-Daten in OHLCV mit pandas

2 Antworten

Habe ich historische Daten über den Handel in ein pandas DataFrame, mit Preis und Volumen Spalten, indiziert durch eine DateTimeIndex. Beispiel: >>> print df.tail() price volume 2014-01-15 14:29:54+00:00 949.975 0.01 2014-01-15 14:29:59+00:00 941.370 0.01 2014-01-15 14:30:17+00:00 949.975

pandas python

VAR-Modell mit pandas + statsmodels in Python

1 Antworten

Ich bin ein begeisterter Nutzer von R, aber vor kurzem eingeschaltet, um Python für ein paar verschiedenen Gründen. Aber ich bin kämpfen, ein wenig zu laufen, der Vektor AR-Modells in Python von statsmodels. Q#1. Ich erhalte eine

pandas python statsmodels var

Pandas kumulierte Anzahl

4 Antworten

Habe ich einen Daten-frame, wie dies: 0 04:10 obj1 1 04:10 obj1 2 04:11 obj1 3 04:12 obj2 4 04:12 obj2 5 04:12 obj1 6 04:13 obj2 Wollte eine kumulierte Anzahl für alle Objekte dieser: idx time

pandas python

Pandas boxplot: Farbe und Eigenschaften der box, median, Mittelwert

3 Antworten

Ich habe einen DataFrame mit einem MultiIndex: # -*- coding: utf-8 -*- import numpy as np import pandas as pd # dataframe with dates dates = pd.DataFrame() dates['2016'] = pd.date_range(start='2016', periods=4, freq='60Min') dates['2017'] = pd.date_range(start='2017', periods=4, freq='60Min')

matplotlib pandas python

pyspark: ValueError: Einige Arten nicht bestimmt werden kann nach der Herleitung

5 Antworten

Habe ich ein Pandabären-Daten-frame my_df, und my_df.dtypes uns gibt: ts int64 fieldA object fieldB object fieldC object fieldD object fieldE object dtype: object Dann bin ich versucht zu konvertieren, die pandas data frame my_df zu Funken-Daten-frame-by-doing unter:

pandas pyspark python python-2.7 spark-dataframe

So Benennen Sie Mehrere Spalten auf eine Reset-Index mit Pandas

1 Antworten

Ich versuche, herauszufinden, ob es eine Möglichkeit zum umbenennen Pandas Spalten wenn Sie versuchen, den index zurücksetzen. Ich sehe in der Dokumentation, die Sie können verwenden Sie die "name" - parameter legen Sie den Namen der Spalte

multiple-columns pandas python rename

gewusst wie: umbenennen von Spalten in pandas unter Verwendung einer Liste

1 Antworten

Ich habe einen dataframe (df), der hat 44 Spalten, und ich will Sie Spalten umbenennen 2:44. Ich habe eine Liste (namesList) der Länge 42, der die neuen Spaltennamen. Ich versuche dann, meine Spalten umbenennen, indem Sie die

list multiple-columns pandas python rename

Python Pandas df ist nicht definiert

1 Antworten

Ich habe ein problem mit einem Skript, das ich schrieb eine Weile zurück, vor einigen Monaten lief es ohne problem. Aber seitdem die OS aktualisiert wurde. Das Skript funktioniert gut, bis er versucht, erstellen Sie ein dataframe

pandas python

"TypeError: 'DataFrame' Objekte sind veränderbar, damit Sie sich nicht zerlegt werden" beim Sortieren pandas dataframe index

2 Antworten

Ich habe folgende dataframe h: In [24]: h.head() Out[24]: alpha1 alpha2 gamma1 gamma2 chi2min gender age filename F35_HC_532d.dat 0.0000 0.000 NaN 0.00 1.000000e+25 F 35 M48_HC_551d.dat 0.7353 3.943 0.425922 0.15 2.072617e+01 M 48 M24_HC_458d.dat 0.7777 4.754 0.463753

dataframe pandas python python-3.x sorting

Pandas DataFrame Bar Plot - Plot-Bars In Verschiedenen Farben Aus Bestimmten Farbpalette

2 Antworten

Wie Sie zeichnen den bars von ein Balkendiagramm verschiedene Farben nur mit den pandas dataframe plot Methode? Wenn ich in diesem DataFrame: df = pd.DataFrame({'count': {0: 3372, 1: 68855, 2: 17948, 3: 708, 4: 9117}}).reset_index() index count

matplotlib pandas plot python

Wie man ein Balkendiagramm mit nicht-numerischen Daten in pandas

2 Antworten

Glaube, ich hatte diese Daten: >>> df = pd.DataFrame(data={"age": [11, 12, 11, 11, 13, 11, 12, 11], "response": ["Yes", "No", "Yes", "Yes", "Yes", "No", "Yes", "Yes"]}) >>> df age response 0 11 Yes 1 12 No 2

matplotlib pandas python seaborn

Pandas - Schreiben Sie eine excel-Datei mit unicode - IllegalCharacterError

5 Antworten

Ich habe den folgenden code: import pandas as pd x = [u'string with some unicode: \x16'] df = pd.DataFrame(x) Wenn ich versuche, das zu schreiben dataframe als excel-Datei: df.to_excel("test.xlsx") Oder, wenn ich versuche, das zu schreiben dataframe

export-to-excel pandas python unicode