Tag: pandas
Pandas ist eine Python-Bibliothek für Panel-Daten-manipulation und-Analyse, z.B. mehrdimensionale Zeitreihen-und Querschnitts-Datensätzen, die üblicherweise in der Statistik, Ergebnisse der experimentellen Wissenschaft, ökonometrie oder finance. WICHTIG: Wenn Sie eine Frage stellen, die dieses tag enthält, Kennzeichnen Sie bitte Ihre Fragen: [python]; [pandas]; [dataframe]/[Reihe]; (optional) [groupby]/[merge]/etc. je nach Ihren spezifischen Anforderungen.
1
Antworten
Wie bekomme ich Sie heraus, den Unterschied zwischen den Spalten mit dem gleichen Namen in beiden dataframes? Ich meine, ich habe Ein dataframe mit einer Spalte namens X und dataframe B mit Spalte X, wenn ich pd.merge(A,
1
Antworten
Ich versuche zu finden, Duplikate von Zeilen in ein pandas dataframe. df=pd.DataFrame(data=[[1,2],[3,4],[1,2],[1,4],[1,2]],columns=['col1','col2']) df Out[15]: col1 col2 0 1 2 1 3 4 2 1 2 3 1 4 4 1 2 duplicate_bool = df.duplicated(subset=['col1','col2'], keep='first') duplicate =
4
Antworten
Habe ich ein Pandas DataFrame mit einer Spalte, in der Listen-Objekte A 0 [1,2] 1 [3,4] 2 [8,9] 3 [2,6] Wie kann ich Zugriff auf das erste element jeder Liste, und speichern Sie es in eine neue
1
Antworten
Habe ich Daten-Frame, der enthält 2 Spalten: Alter und Geschlecht. sex,age 1,30 2,29 1,34 1,27 2,28 2,28 1,40 1,30 1,27 2,31 1,37 1,31 2,28 2,30 2,27 2,27 2,29 2,32 1,28 1,27 1,28 1,28 1,29 1,33 1,32 1,30
2
Antworten
Habe ich etwas, das so aussieht. Wie komme ich von dieser: 0 d 0 The DT 1 Skoll ORGANIZATION 2 Foundation ORGANIZATION 3 , , 4 based VBN 5 in IN 6 Silicon LOCATION 7 Valley LOCATION
2
Antworten
Ich habe eine sehr große dataframe, dass würde ich gerne vermeiden, Durchlaufen jede einzelne Zeile und möchten, konvertieren Sie die gesamte Spalte aus hex string zu int. Es nicht verarbeiten den string korrekt mit astype hat aber
4
Antworten
Ich lese alle Dateien in einem Ordner einzeln in ein DataFrame und dann überprüfe ich Sie für einige Bedingungen. Es gibt einige tausend Dateien, und ich würde Sie gerne pandas eine Ausnahme auslösen, wenn eine Datei leer
1
Antworten
Habe ich ein pandas dataframe die wie folgt aussieht: [('1975801_m', 1 0.203244 10 -0.159756 16 -0.172756 19 -0.089756 20 -0.033756 23 -0.011756 24 0.177244 32 0.138244 35 -0.104756 36 0.157244 40 0.108244 41 0.032244 42 0.063244 45
3
Antworten
Screenshot der beschriebenen Fehler. import pandas as pd df = pd.read_csv('/home/josepm/Documents/test_ver2.csv') --------------------------------------------------------------------------- FileNotFoundError Traceback (most recent call last) <ipython-input-3-5cd7fd573fb7> in <module>() 1 import pandas as pd ----> 2 df = pd.read_csv('/home/josepm/Documents/test_ver2.csv') Ich versuche zu importieren einer CSV-Datei
4
Antworten
In python pandas boxplots mit Standard-Einstellungen, mit dem roten Balken ist die bedeuten median, und die box kennzeichnet das 25-und 75-Quartile, aber was genau tun die schnurrhaare in diesem Fall bedeuten? Wo ist die Dokumentation, um herauszufinden,
6
Antworten
Habe ich ein pandas dataframe mit zwei id-Variablen: df = pd.DataFrame({'id': [1,1,1,2,2,3], 'num': [10,10,12,13,14,15], 'q': ['a', 'b', 'd', 'a', 'b', 'z'], 'v': [2,4,6,8,10,12]}) id num q v 0 1 10 a 2 1 1 10 b 4
2
Antworten
Kann ich der Abfrage einen expliziten Wert: fills.query('Symbol=="BUD US"') Nun möchte ich eine Abfrage variable: In [40]: my_symbol Out[40]: 'BUD US' In pandas 0.13.1, konnte ich einfach nutzen: fills.query('Symbol==my_symbol') Dies ist nicht mehr erlaubt, in pandas 0.14.0
1
Antworten
Ich bin mit pandas, zeichnen ein Diagramm. Das folgende ist meine Funktion count_subset.plot(kind='barh', stacked=True) Die Antwort, die ich bekommen, ist <matplotlib.axes.AxesSubplot at 0x111fc4ad0> Kann ich nicht sehen, die Grafik überall. Bin ich etwas fehlt-Bibliothek ? InformationsquelleAutor Vinay
1
Antworten
Ich habe versucht, zu konvertieren, ein pandas dataframe in einen numpy-array, tragen über der dtypes und header-Namen für eine einfache Referenz. Ich muss dies tun, da die Verarbeitung auf pandas ist viel zu langsam, numpy ist 10-Fach
2
Antworten
Ich habe ein problem mit der Zeile unten self.tableView.set??????????(df) soll die Anzeige der Daten-frame in PyQt5. Ich stellen ??? dort, wo ich bin, fehlt der code, den ich brauche. def btn_clk(self): path = self.lineEdit.text() df = pd.read_csv(path)
1
Antworten
Ich versuche, mit 'pandas.read_sql_query' kopieren der Daten aus MS SQL Server in ein pandas DataFrame. Ich brauche mehrere joins in meiner SQL-Abfrage. Die Tabellen, die verbunden werden, sind auf dem gleichen server, aber in verschiedenen Datenbanken. Die
1
Antworten
Ich bin mit Pandas zu manipulieren, um eine csv-Datei mit mehreren Zeilen und Spalten, die wie folgt aussieht Fullname Amount Date Zip State ..... John Joe 1 1/10/1900 55555 Confusion Betty White 5 . . Alaska Bruce
6
Antworten
Habe ich laut Daten, für die ich berechnen wollen, Frequenz und amplitude. Die Proben wurden alle 1/100stel Sek. Von trends, ich glaube, die Frequenz auf ~ 0.3 Wenn ich numpy fft Modul, ich am Ende immer sehr
2
Antworten
Habe ich gelesen diese, diese und diese Beiträge, aber trotz ich weiß nicht, warum quotechar funktioniert nicht bei pd.read_csv() (Python 3, pandas 0.18.0 und 0.18.1). Und wie konnte ich Lesen einen dataframe, wie diese: "column1","column2", "column3", "column4",
4
Antworten
Ich Hebe diese Frage für mich selber zu lernen. Soweit ich weiß, folgenden werden die verschiedenen Methoden zum entfernen von Spalten in pandas dataframe. Option - 1: df=pd.DataFrame({'a':[1,2,3,4,5],'b':[6,7,8,9,10],'c':[11,12,13,14,15]}) del df['a'] Option - 2: df=pd.DataFrame({'a':[1,2,3,4,5],'b':[6,7,8,9,10],'c':[11,12,13,14,15]}) df=df.drop('a',1) Option -
2
Antworten
Das problem ist in line 22 : if start_date <= data_entries.iloc[j, 1] <= end_date: wo ich vergleichen wollen start_date und end_date Teil data_entries.iloc[j, 1] ist der Zugriff auf eine Spalte der pandas dataframe. Ich konvertiert die Spalte
2
Antworten
Das mag eine triviale Frage, aber ich bin immer noch versuchen, herauszufinden, pandas/numpy. So, angenommen ich habe eine Tabelle mit der folgenden Struktur: group_id | col1 | col2 | col3 | "A" | "B" x | 1
2
Antworten
df = pd.DataFrame({'a':[2,3,5], 'b':[1,2,3], 'c':[12,13,14]}) df.set_index(['a','b'], inplace=True) display(df) s = df.iloc[1] # How to get 'a' and 'b' value from s? Es ist so ärgerlich, dass diejenigen, die Spalten zu den Indizes, die wir nicht einfach df['colname']
1
Antworten
Habe ich df1 Lesen von Excel -, dann Erzeuge ich ein leeres df2 mit den gleichen Spalten. Ich will jetzt verschieben Sie einige Zeilen aus df1 matching eine Bedingung df2. Gibt es einen einfachen Weg, dies zu
1
Antworten
Ich bin vor TypeError: sort_values() fehlt 1 erforderliche positionelle argument: "durch' for i in range(0,len(data_sims.index)): for j in range(1,len(data_sims.columns)): user = data_sims.index[i] serial = data_sims.columns[j] if dataUser.ix[i][j] == 1: data_sims.ix[i][j] = 0 else: serial_top_names = data_neighbours.ix[serial][1:10] serial_top_sims
1
Antworten
Habe ich Folgendes pandas DataFrame: import pandas as pd df = pd.DataFrame('filename.csv') print(df) order start end value 1 1342 1357 category1 1 1459 1489 category7 1 1572 1601 category23 1 1587 1599 category2 1 1591 1639 category1
6
Antworten
Ich bin mit pandas dataframe. es gibt eine bestimmte Spalte hat Zeit Informationen. den raw-Daten mag das: 5:15am 5:28am 6:15am so, ich brauche zum konvertieren der Rohdaten in ein datetime-format: format = '%I:%M%p' dataset['TimeStamp'] = pd.to_datetime(dataset['TimeStamp'],format) Allerdings
1
Antworten
Verwende ich python 3.4, pandas 0.14.1 und XlsxWriter 0.5.6. Ich erstelle ein Diagramm namens 'Diagramm' über pandas-mit den folgenden code graph=data_iter['_DiffPrice'].hist() ergibt sich ein schönes Histogramm. Nun, wie füge ich das Diagramm in eine Excel-Datei mit XlsxWriter?
1
Antworten
Ich versuche zum hochladen einer csv-Datei, die 250MB. Grundsätzlich 4 Millionen Zeilen und 6 Spalten von Zeitreihen-Daten (1min). Das übliche Verfahren ist: location = r'C:\Users\Name\Folder_1\Folder_2\file.csv' df = pd.read_csv(location) Dieser Vorgang dauert etwa 20 Minuten !!!. Sehr vorläufige,
2
Antworten
Ich bin mit Windows 7.0 mit Python2.7. Ich installierte pandas vor der Installation ipython0.12.1(stabil). Wenn ich import pandas im IPython.exe bekomme ich die Fehlermeldung: Kein Modul mit dem Namen pandas Wenn ich rufe, IPython aus dem start-Menü,
1
Antworten
Ich bin auf der Suche nach der beste Weg, um aggregierte Werte, basierend auf einer bestimmten partition , die äquivalente SUM(TotalCost) OVER(PARTITION BY ShopName) Earnings ( SQL server) Ich bin in der Lage, dies zu tun, indem
1
Antworten
Ich habe Daten in meinem .txt Datei wie folgt: 029070 ***** 190101010600 270 36 OVC ** 0.0 ** ** Ich extrahieren möchten, 190101 aus der Spalte 3, ich bin immer AttributeError: nur verwenden Können .str-accessor-mit string-Werte, die
3
Antworten
Ich bin neu in der Programmierung, so dass ich entschuldige mich im Voraus, wenn diese Frage keine sens. Ich habe bemerkt, dass wenn ich versuche zu berechnen, den Mittelwert eines pandas-Daten-frame mit einem date-time-Objekt wie folgt formatiert:
2
Antworten
Ich habe eine situation wo ich einen dataframe Zeile, um Berechnungen mit, und ich brauche Werte verwenden, die im folgenden (potenziell vorhergehenden) Zeilen um diese Berechnungen zu tun (im Grunde eine perfekte Prognose basiert auf der realen
2
Antworten
Habe ich ein pandas dataframe folgende Struktur: DF_Cell, DF_Site C1,A C2,A C3,B C4,B C5,B Und ich haben eine sehr lange Schleife (100 Millionen Iterationen), in denen ich behandle eins nach dem anderen Zeichenfolgen entsprechen, die für die
2
Antworten
Habe ich einige Regressionen Ergebnisse aus Laufenden statsmodels.formula.api.ols. Hier ist ein Spielzeug-Beispiel: import pandas as pd import numpy as np import statsmodels.formula.api as smf example_df = pd.DataFrame(np.random.randn(10, 3)) example_df.columns = ["a", "b", "c"] fit = smf.ols('a ~
1
Antworten
Habe ich zwei datetime-Spalten, die sind naiv, wenn ich lese Sie in den Speicher, aber die sind in US/Eastern tatsächlich. Ich möchte einfach zu konvertieren, diese beiden Spalten zu US/Central. Fand ich eine Methode, die funktioniert, aber
1
Antworten
Ich versuche, erstellen Sie ein dataframe aus dem csv-Format, deren erste Spalte ist wie "2013-08-25T00:00:00-0400"; "2013-08-25T01:00:00-0400"; "2013-08-25T02:00:00-0400"; "2013-08-25T03:00:00-0400"; "2013-08-25T04:00:00-0400"; Es ist Zeit mit Zeitzone ! Ich schon so etwas wie df1 = DataFrame(pd.read_csv(PeriodC, sep=';', parse_dates=[0], index_col=0)) aber
2
Antworten
Habe ich historische Daten über den Handel in ein pandas DataFrame, mit Preis und Volumen Spalten, indiziert durch eine DateTimeIndex. Beispiel: >>> print df.tail() price volume 2014-01-15 14:29:54+00:00 949.975 0.01 2014-01-15 14:29:59+00:00 941.370 0.01 2014-01-15 14:30:17+00:00 949.975
1
Antworten
Ich bin ein begeisterter Nutzer von R, aber vor kurzem eingeschaltet, um Python für ein paar verschiedenen Gründen. Aber ich bin kämpfen, ein wenig zu laufen, der Vektor AR-Modells in Python von statsmodels. Q#1. Ich erhalte eine
4
Antworten
Habe ich einen Daten-frame, wie dies: 0 04:10 obj1 1 04:10 obj1 2 04:11 obj1 3 04:12 obj2 4 04:12 obj2 5 04:12 obj1 6 04:13 obj2 Wollte eine kumulierte Anzahl für alle Objekte dieser: idx time
3
Antworten
Ich habe einen DataFrame mit einem MultiIndex: # -*- coding: utf-8 -*- import numpy as np import pandas as pd # dataframe with dates dates = pd.DataFrame() dates['2016'] = pd.date_range(start='2016', periods=4, freq='60Min') dates['2017'] = pd.date_range(start='2017', periods=4, freq='60Min')
5
Antworten
Habe ich ein Pandabären-Daten-frame my_df, und my_df.dtypes uns gibt: ts int64 fieldA object fieldB object fieldC object fieldD object fieldE object dtype: object Dann bin ich versucht zu konvertieren, die pandas data frame my_df zu Funken-Daten-frame-by-doing unter:
1
Antworten
Ich versuche, herauszufinden, ob es eine Möglichkeit zum umbenennen Pandas Spalten wenn Sie versuchen, den index zurücksetzen. Ich sehe in der Dokumentation, die Sie können verwenden Sie die "name" - parameter legen Sie den Namen der Spalte
1
Antworten
Ich habe einen dataframe (df), der hat 44 Spalten, und ich will Sie Spalten umbenennen 2:44. Ich habe eine Liste (namesList) der Länge 42, der die neuen Spaltennamen. Ich versuche dann, meine Spalten umbenennen, indem Sie die
1
Antworten
Ich habe ein problem mit einem Skript, das ich schrieb eine Weile zurück, vor einigen Monaten lief es ohne problem. Aber seitdem die OS aktualisiert wurde. Das Skript funktioniert gut, bis er versucht, erstellen Sie ein dataframe
2
Antworten
Ich habe folgende dataframe h: In [24]: h.head() Out[24]: alpha1 alpha2 gamma1 gamma2 chi2min gender age filename F35_HC_532d.dat 0.0000 0.000 NaN 0.00 1.000000e+25 F 35 M48_HC_551d.dat 0.7353 3.943 0.425922 0.15 2.072617e+01 M 48 M24_HC_458d.dat 0.7777 4.754 0.463753
2
Antworten
Wie Sie zeichnen den bars von ein Balkendiagramm verschiedene Farben nur mit den pandas dataframe plot Methode? Wenn ich in diesem DataFrame: df = pd.DataFrame({'count': {0: 3372, 1: 68855, 2: 17948, 3: 708, 4: 9117}}).reset_index() index count
2
Antworten
Glaube, ich hatte diese Daten: >>> df = pd.DataFrame(data={"age": [11, 12, 11, 11, 13, 11, 12, 11], "response": ["Yes", "No", "Yes", "Yes", "Yes", "No", "Yes", "Yes"]}) >>> df age response 0 11 Yes 1 12 No 2
5
Antworten
Ich habe den folgenden code: import pandas as pd x = [u'string with some unicode: \x16'] df = pd.DataFrame(x) Wenn ich versuche, das zu schreiben dataframe als excel-Datei: df.to_excel("test.xlsx") Oder, wenn ich versuche, das zu schreiben dataframe