Tag: dataframe

Ein data frame ist eine tabellarische Datenstruktur. In der Regel enthält es Daten, in denen Zeilen sind Beobachtungen und die Spalten sind Variablen der verschiedenen Typen. Während „data frame“ oder „dataframe“ ist der Begriff für dieses Konzept in mehreren Sprachen (R, Apache Spark, deedle, Ahorn, die pandas-Bibliothek in Python und die DataFrames library in Julia), „Tabelle“ ist der Begriff in MATLAB und SQL.

Pandas filtern, Spalten ein DataFrame mit bool

Anzahl der Antworten 2 Antworten
Für einen DataFrame (df) mit mehreren Spalten und Zeilen A B C D 0 1 4 2 6 1 2 5 7 4 2 3 6 5 6 und anderen DataFrame (dfBool) mit "dtype": bool 0 True

Wie diese zu interpretieren Fehlermeldung: (list) Objekt kann nicht sein, gezwungen zu Typ 'double'

Anzahl der Antworten 1 Antworten
Ich habe eine Tabelle: numTable, die wie folgt aussieht: Nun will ich finden outiers für jede dieser Spalten. Bitte Lesen Sie meine folgenden code: for (i in names(numTable)) { #calculate mean and std for each column meanValue

Wie verteilen Sie eine Spalte in einer Pandabären-Daten-frame

Anzahl der Antworten 2 Antworten
Habe ich Folgendes pandas data frame: import pandas as pd import numpy as np df = pd.DataFrame({ 'fc': [100,100,112,1.3,14,125], 'sample_id': ['S1','S1','S1','S2','S2','S2'], 'gene_symbol': ['a', 'b', 'c', 'a', 'b', 'c'], }) df = df[['gene_symbol', 'sample_id', 'fc']] df Produziert diese:

Berechnen von Daten.frame-Spalte Durchschnittswerte nach Datum

Anzahl der Antworten 2 Antworten
Ich habe einen Daten.frame in R, wo eine Spalte ist eine Liste von Terminen (viele Duplikate), während die andere Spalte ist eine Temperatur aufgezeichnet, auf dass Datum. Die Spalten in Frage, die wie folgt Aussehen (aber mehrere

Konvertiert unix timestamp-Spalte nach Tag der Woche in R

Anzahl der Antworten 1 Antworten
Arbeite ich mit einem Daten-frame in R mit der Bezeichnung "mydata". Die erste Spalte, labled "ts" enthält die unix-timestamp-Felder. Ich würde gerne konvertieren Sie diese Felder, um die Tage der Woche. Ich habe versucht, mit strptime und

konvertieren Sie mehrere Textzeilen in einem data frame

Anzahl der Antworten 4 Antworten
Ich versuche einen Weg zu finden, zu konvertieren Sie mehrere Textzeilen in einem Daten-frame. Ich bin mir nicht sicher, ob es einen Weg gibt, wo Sie verwenden können read.delim() zu Lesen in mehrere Zeilen von text und

Teilen Sie bestimmte Spalten durch eine andere Spalte in pandas

Anzahl der Antworten 3 Antworten
Frage mich, ob es eine effizientere Möglichkeit der Aufteilung in mehreren Spalten einer bestimmten Spalte. Zum Beispiel sage ich: prev open close volume 20.77 20.87 19.87 962816 19.87 19.89 19.56 668076 19.56 19.96 20.1 578987 20.1 20.4

DataFrame den Wert startswith

Anzahl der Antworten 2 Antworten
Habe ich Folgendes dataframe in pandas: Datum Zeit Event 0 14.11.2016 13:00 Veröffentlichung des 9-Monats-Berichtes 1 14.03.2017 13:00 Telefonkonferenz für Analysten 2 14.03.2017 13:00 Telefonkonferenz für Analysten 3 27.04.2017 14:00 Ordentliche Hauptversammlung 4 03.05.2017 14:00 Dividendenzahlung 5

konvertieren einer Reihe von in einem Daten-frame zu einem einfachen Vektor in R

Anzahl der Antworten 3 Antworten
Ich habe ein riesiges data frame, aus denen ich nur wählen Sie ein paar Zeilen. Dann habe ich entfernen Sie einige der Spalten basierend auf einer Bedingung. lassen Sie uns sagen, dass ich wählen Sie die Zeile

Konvertieren von numpy-array in dataframe Spalte?

Anzahl der Antworten 3 Antworten
Wie konvertiere ich ein numpy-array in einen dataframe Spalte. Sagen wir, ich habe erstellt eine leere dataframe, df, und ich Schleife durch code zu erstellen 5 numpy-arrays. In jeder iteration von meiner for-Schleife, die ich konvertieren wollen

Python Pandas <pandas.core.groupby.DataFrameGroupBy Objekt an ...>

Anzahl der Antworten 1 Antworten
Ich versuche, zu Gruppe aus und zählen Sie die gleichen Informationen in einer Zeile: #Functions def postal_saude (): global df, lista_solic #List of solicitantes in Postal Saude list_sol = [lista_solic["name1"], lista_solic["name2"]] #filter Postal Saude Solicitantes df =

R gelten error: 'X' muss benannt dimnames

Anzahl der Antworten 2 Antworten
Den "anwenden" - Dokumentation erwähnt, dass, "Wo" X " genannt hat, dimnames, es kann eine Zeichen-Vektor-Auswahl der dimension der Namen." Ich würde gerne verwenden, gelten die Daten.frame nur für bestimmte Spalten. Kann ich mit der Funktion dimnames,

Wie Teilmenge von Daten in R ohne NA-Zeilen?

Anzahl der Antworten 2 Antworten
Habe ich einige Daten, die ich auf der Suche bin in der R. Eine bestimmte Spalte mit der überschrift "Höhe", enthält ein paar Zeilen von NA. Ich bin auf der Suche auf Teilmenge meine Daten-Rahmen, so dass

R-Liste(structure(list ())), um Daten-Frames

Anzahl der Antworten 1 Antworten
Habe ich eine JSON-Datenquelle, die eine Liste von hashes: [ { "a": "foo", "b": "sdfshk" }, { "a": "foo", "b": "ihlkyhul" } ] Benutze ich fromJSON() im rjson - Paket zu konvertieren, dass zu einem R-Daten-Struktur. Es

'DataFrame' - Objekt hat kein Attribut 'value_counts'

Anzahl der Antworten 1 Antworten
Mein dataset ist ein DataFrame dimension (840,84). Wenn ich den code schreiben: ds[ds.columns[1]].value_counts() Bekomme ich eine korrekte Ausgabe: Out[82]: 0 847 1 5 Name: o_East, dtype: int64 Aber wenn ich Schreibe eine Schleife zum speichern der Werte,

R konvertieren von Daten.frame-Liste durch Spalte

Anzahl der Antworten 1 Antworten
Ich würde gerne konvertieren von Daten.frame in einer Liste von Daten.Rahmen mit Säule mit Basis R-Funktionen und die Abhaltung der ersten Spalte konstant. Zum Beispiel würde ich gerne die split-DF in einer Liste von drei Daten.Bildern, von

NaNs, wenn die Subtraktion von dataframes pandas

Anzahl der Antworten 1 Antworten
Habe ich zwei dataframes mit nur wenig überlappenden Indizes und Spalten. old = pd.DataFrame(index = ['A', 'B', 'C'], columns = ['k', 'l', 'm'], data = abs(np.floor(np.random.rand(3, 3)*10))) new = pd.DataFrame(index = ['A', 'B', 'C', 'D'], columns =

überprüfen Sie, ob dataframe ist vom Typ boolean pandas

Anzahl der Antworten 1 Antworten
Habe ich ein pandas DataFrame wie folgt: In [108]: df1 Out[108]: v t 2014-02-21 10:30:43 False 2014-02-21 10:31:34 False 2014-02-21 10:32:25 False 2014-02-21 10:33:17 False 2014-02-21 10:34:09 False 2014-02-21 10:35:00 False 2014-02-21 10:35:51 False Ich brauche, um

Das entfernen von Duplikaten aus Pandas dataFrame mit Voraussetzung für die Beibehaltung der ursprünglichen

Anzahl der Antworten 3 Antworten
Vorausgesetzt, ich habe Folgendes DataFrame: A | B 1 | Ms 1 | PhD 2 | Ms 2 | Bs Ich möchten entfernen Sie die doppelten Zeilen mit Bezug auf Spalte A und ich möchte Sie behalten

R Fehler: erwartet einen einzelnen Wert, was bedeutet es?

Anzahl der Antworten 1 Antworten
Ich bin dabei eine einfache Bedienung mit dplyr in R und hab 'erwartet einzelner Wert' Fehler test <- data.frame(a=rep("item",3),b=c("step1","step2","step3")) test%>%group_by(a)%>%(summarize(seq=paste0(b)) Ich habe gesehen, ähnliche threads, aber diese use cases wurden immer komplexer, und ich konnte nicht herausfinden,

aufrufende Funktion mit dataframe Daten Fehler gibt (nicht in der Serie zu <class 'float'>)

Anzahl der Antworten 2 Antworten
Habe ich eine option-pricing-Modell (sehr einfache Black-Scholes -) das funktioniert auch mit Daten, die in dieser Weise: In [18]: BS2(100.,100.,1.,.001,.3) Out[18]: 11.96762435837207 die Funktion ist hier: Black Sholes Function def BS2(S,X,T,r,v): d1 = (log(S/X)+(.001+v*v/2)*T)/(v*sqrt(T)) d2 = d1-v*sqrt(T)

So benennen Sie die Spalten, die in DataFrame mit pandas in Python

Anzahl der Antworten 2 Antworten
Habe ich fünf Aktienportfolios, die habe ich importiert aus Yahoo! Finanz-und müssen, erstellen Sie einen DataFrame mit den schlusskursen für 2016 aller Aktien. Jedoch bin ich kämpfen, um Sie zu beschriften Sie die Spalten mit den entsprechenden

Verwenden, wenn andere auf einen dataframe über mehrere Spalten

Anzahl der Antworten 6 Antworten
Ich habe einen großen Datensatz der Proben mit Deskriptoren, ob die Probe durchführbar ist - es sieht (Art), wie diesem hier, wo 'desc', ist die Spalte "Beschreibung" und "leer" zeigt die Stichprobe ist nicht sinnvoll: desc x

erstellen von neuen Spalten in der von der Funktion zu dataframe in R

Anzahl der Antworten 2 Antworten
Habe ich eine Reihe von dataframes, die wie folgt Aussehen (Sie haben die gleichen Spalten, nicht die gleiche Menge an Zeilen): df1 <- data.frame(v = c("banana", "apple", "orange", "grape", "kiwi fruit", "pear"), x = rnorm(6, 0.06, 0.01))

Wie machen Sie eine R-Funktion zurückgeben, die mehrere Spalten und fügen Sie diese in einen Daten-frame?

Anzahl der Antworten 3 Antworten
Beginnend mit diesem data frame myDF = structure(list(Value = c(-2, -1, 0, 1, 2)), .Names = "Value", row.names = c(NA, 5L), class = "data.frame") Angenommen, ich möchte zum ausführen dieser Funktion auf jede Zeile von myDF$Wert getNumberInfo

Wie man Schlüssel und Werte aus MapType Spalte in SparkSQL DataFrame

Anzahl der Antworten 2 Antworten
Ich habe Daten in einer Parkett-Datei, die hat 2 Felder: object_id: String und alpha: Map<>. Einlesen in einen Daten-frame in sparkSQL und das schema sieht wie folgt aus: scala> alphaDF.printSchema() root |-- object_id: string (nullable = true)

Plotten von Daten.frame in R

Anzahl der Antworten 3 Antworten
ich bin neu in R, und ich muss raten, in zeichnen einen dataframe in R, die wie folgt aussieht: V1 V2 V3 V4 1 Mazda Toyota Peugeot Car1.txt 0,507778837 0,19834711 0,146892655 Car2.txt 0,908717802 0,64214047 0,396508728 ich möchte

Pandas drop_duplicates - TypeError: object-Typ-argument nach dem * muss ein nacheinander, nicht anzeigen

Anzahl der Antworten 1 Antworten
Habe ich aktualisiert meine Frage, um ein klareres Beispiel. Ist es möglich, die drop_duplicates Methode in Pandas entfernen Sie doppelte Zeilen basierend auf einer Spalte id, wo die Werte enthalten eine Liste. Betrachten Sie die Spalte 'drei',

Extrahieren Sie den ersten Tag des Monats, der einen datetime-Typ-Spalte in pandas

Anzahl der Antworten 7 Antworten
Habe ich Folgendes dataframe: user_id purchase_date 1 2015-01-23 14:05:21 2 2015-02-05 05:07:30 3 2015-02-18 17:08:51 4 2015-03-21 17:07:30 5 2015-03-11 18:32:56 6 2015-03-03 11:02:30 sowie purchase_date ist ein datetime64[ns] Spalte. Muss ich eine neue Spalte hinzufügen df[month]

wie Ersetze ich numerischen codes mit wertelabels aus einer lookup-Tabelle?

Anzahl der Antworten 3 Antworten
Diese Frage ist in Bezug auf diese Frage, aber nicht ganz das gleiche. Sagen, dass ich diese Daten-frame, df <- data.frame( id = c(1:6), profession = c(1, 5, 4, NA, 0, 5)) und einen string mit lesbaren

Gibt es eine Abfrage-Methode oder ähnliches für pandas-Serie (pandas.Serie.query())?

Anzahl der Antworten 3 Antworten
Den pandas.DataFrame.query() Methode ist der große Verwendung für (pre/post)-filtern von Daten beim laden oder der Darstellung. Es kommt besonders nützlich für die Verkettung von Methoden. Ich finde mich oft zu wollen, gilt die gleiche Logik auf eine

Mit df.query() zum extrahieren von Zeilen aus einem DataFrame

Anzahl der Antworten 1 Antworten
Ich habe einen DataFrame df, die enthält drei Spalten: ['mid','2014_amt','2015_amt'] Ich zu extrahierenden Zeilen von einem bestimmten Händler. Betrachten Sie beispielsweise meine Daten: df['mid'] = ['as','fsd','qww','fd'] df['2014_amt] = [144,232,45,121] df['2015_amt] = [676,455,455,335] Möchte ich extrahieren Sie die

Daten Zusammenführen.frames verursachen match.Namen Fehler

Anzahl der Antworten 1 Antworten
Ich Zusammenführen müssen viele Daten.frames. Unterhalb der sample-code zu reproduzieren, ist ein Fehler. Es sieht aus wie ein bug. Dieser code funktioniert auch: df1 <- data.frame(v=1:10, v2=rev(1:10)) df2 <- data.frame(vv=1:8, v2=rev(5:12)) df12 <- merge(x=df1, y=df2, by.x=1, by.y=1,

wie um zu überprüfen, ob ein Wert vorhanden ist, in einen dataframe

Anzahl der Antworten 1 Antworten
Hallo ich versuche den Namen der Spalte ein dataframe enthält ein bestimmtes Wort, zB: ich habe einen dataframe, NA good employee Not available best employer not required well manager not eligible super reportee my_word=["well"] wie um zu

Wie zu Schicht mehrere Zeilen in ein pandas DataFrame?

Anzahl der Antworten 1 Antworten
Habe ich Folgendes pandas Dataframe: import pandas as pd data = {'one' : pd.Series([1.], index=['a']), 'two' : pd.Series([1., 2.], index=['a', 'b']), 'three' : pd.Series([1., 2., 3., 4.], index=['a', 'b', 'c', 'd'])} df = pd.DataFrame(data) df = df[["one",

Wählen Sie Letzte Wert in einer Zeile, nach Zeile

Anzahl der Antworten 3 Antworten
Habe ich einen Daten-frame, wo jede Zeile ist ein Vektor, der die Werte von unterschiedlicher Länge. Ich würde gern ein Vektor, der die letzten wahren Wert in jeder Zeile. Hier ist ein Beispiel des Daten-Frames: df <-

Konvertieren Einer Spalte in Python Dataframe Liste

Anzahl der Antworten 1 Antworten
Habe ich ein pandas dataframe, bestehend aus nur einer Spalte von Daten. Ich möchte konvertieren Sie die Spalte der Daten in eine Liste. Die Spalte hat float-Datentyp. Beispiel: ColA 341321432 132184900 173840143 1432473928 Gewünscht: 341321432, 132184900, 173840143,

zählen von Zeilen des dataframe mit Bedingung in spark

Anzahl der Antworten 2 Antworten
Ich versuche dieses: df=dfFromJson: {"class":"name 1","stream":"science"} {"class":"name 1","stream":"arts"} {"class":"name 1","stream":"science"} {"class":"name 1","stream":"law"} {"class":"name 1","stream":"law"} {"class":"name 2","stream":"science"} {"class":"name 2","stream":"arts"} {"class":"name 2","stream":"law"} {"class":"name 2","stream":"science"} {"class":"name 2","stream":"arts"} {"class":"name 2","stream":"law"} df.groupBy("class").agg(count(col("stream")==="science") as "stream_science", count(col("stream")==="arts") as "stream_arts", count(col("stream")==="law") as "stream_law") Diese nicht

Das unterteilen einer Daten-frame, wenn die Werte in zwei Spalten übereinstimmen, die in einem zweiten Daten-frame

Anzahl der Antworten 1 Antworten
Habe ich zwei große Daten-frames. df1 hat zwei Spalten, die von Interesse sind (unter anderem), diese sind eine Liste von Arten, die Namen in A1 und eine Liste der 3-letter-Regionen in A2. Jede Zeile ist ein Unabhängiger

Erstellen einer neuen Spalte, basierend auf der Bedingung mit Werten aus einer anderen Spalte in python

Anzahl der Antworten 1 Antworten
Ich habe einen Dataframe und würde gerne eine neue Spalte erstellen, die basierend auf der Bedingung, dass in dieser neuen Spalte, wenn eine bestimmte Bedingung erfüllt ist, dann wird der Wert aus einer anderen Spalte andernfalls muss

So löschen Sie eine Zeile in einen Daten-frame, indem Sie den Namen in R

Anzahl der Antworten 1 Antworten
Ich versuche zu löschen, eine Zeile aus einem data-frame, in dem jede Zeile einen Namen hat. Ich kann keine Indizes verwenden, um löschen Sie die Zeilen, nur Ihren Namen. Ich habe das dataframe: DF<- data.frame('2014' = c(30,20,4,

Pandas neue Spalten hinzuzufügen, basiert auf der Spaltung einer anderen Spalte

Anzahl der Antworten 3 Antworten
Habe ich ein pandas dataframe, wie die folgenden: A B US,65,AMAZON 2016 US,65,EBAY 2016 Mein Ziel ist es, zu schauen, wie diese: A B country code com US.65.AMAZON 2016 US 65 AMAZON US.65.AMAZON 2016 US 65 EBAY

Anzahl der Zeilen des Ergebnis nicht ein Vielfaches von Vektor-Länge (arg 2) in R

Anzahl der Antworten 1 Antworten
Habe ich neue Frage im Zusammenhang mit diesem meinem Thema löschen Ausreißer in r mit Berücksichtigung der Nenn-var. In neuen Fall-Variablen x und x1 unterschiedliche Länge x <- c(-10, 1:6, 50) x1<- c(-20, 1:5, 60) z<- c(1,2,3,4,5,6,7,8)

TypeError: '- Serie,' Objekt ist nicht aufrufbar, wenn der Zugriff auf dtypes von einem dataframe

Anzahl der Antworten 1 Antworten
Was zur Hölle? Ich wusste nicht, ändern Sie das Schlüsselwort, um das Lesen der text Datei habe ich auf meinem Verzeichnis. Doch ich kann nicht überprüfen, die dtype der einzelnen Spalten durch die zwei Methoden, die ich

Lesen Sie mehrere csv-Dateien verketten Liste von Dateinamen, die Sie in einer einzigen DataFrame

Anzahl der Antworten 1 Antworten
Ich habe mehrere csv-Dateien in das Verzeichnis und ich würde mich über eine loop-thru zu csv-Dateien finden Sie eine Liste der Dateien, die Namen und Lesen sich gegenseitig in und verketten Sie in einem einzelnen Daten-frame. Im

Aufbauend text einer bestimmten Spalte in der R-data frame

Anzahl der Antworten 1 Antworten
Ich habe eine Datei, die wie folgt aussieht: GO:2000974 7,8 negative_regulation_of_pro-B_cell_differentiation Notch1 ISS GO:2000974 7,8 negative_regulation_of_pro-B_cell_differentiation Q9W737 IEA GO:0001768 4 establishment_of_T_cell_polarity Ccl19 IEA GO:0001768 4 establishment_of_T_cell_polarity Ccl19 ISS GO:0001768 4 establishment_of_T_cell_polarity Ccl21 IEA Was ich tun möchte,

Pandas: die Auswahl DataFrame Zeilen zwischen zwei Datumsangaben (Datetime-Index)

Anzahl der Antworten 2 Antworten
Habe ich ein Pandas DataFrame mit einem DatetimeIndex und eine Spalte MSE Loss der index ist wie folgt formatiert: DatetimeIndex(['2015-07-16 07:14:41', '2015-07-16 07:14:48', '2015-07-16 07:14:54', '2015-07-16 07:15:01', '2015-07-16 07:15:07', '2015-07-16 07:15:14',...] Es umfasst mehrere Tage. Möchte ich

Mit Zeilen in ein Pandas dataframe zu einem anderen basiert auf drei Säulen

Anzahl der Antworten 2 Antworten
Ich habe zwei Pandas dataframes, einem ziemlich großen (30000+ Zeilen) und eine viel kleinere (100+ Zeilen). Der dfA sieht so etwas wie: X Y ONSET_TIME COLOUR 0 104 78 1083 6 1 172 78 1083 16 2

Print data frame mit den Spalten zentriert ausgerichtet

Anzahl der Antworten 2 Antworten
Möchte ich zum drucken einen Daten-frame, wo die Spalten werden zentriert ausgerichtet. Unten ist das, was ich habe, habe ich versucht, ich dachte, das drucken der Daten-frame test1, würde das Ergebnis in den Spalten ausgerichtet in der

Normalisieren Sie die Daten in R-Daten.frame-Spalte

Anzahl der Antworten 1 Antworten
Angenommen ich habe die folgenden Daten: a <- data.frame(var1=letters,var2=runif(26)) Angenommen, ich möchte skaliert jeden Wert in var2 so dass die Summe der var2 Spalte gleich 1 ist (im Grunde drehen Sie den var2 Spalte in einer Wahrscheinlichkeitsverteilung)