Tag: dataframe

Ein data frame ist eine tabellarische Datenstruktur. In der Regel enthält es Daten, in denen Zeilen sind Beobachtungen und die Spalten sind Variablen der verschiedenen Typen. Während „data frame“ oder „dataframe“ ist der Begriff für dieses Konzept in mehreren Sprachen (R, Apache Spark, deedle, Ahorn, die pandas-Bibliothek in Python und die DataFrames library in Julia), „Tabelle“ ist der Begriff in MATLAB und SQL.

Pandas filtern, Spalten ein DataFrame mit bool

2 Antworten

Für einen DataFrame (df) mit mehreren Spalten und Zeilen A B C D 0 1 4 2 6 1 2 5 7 4 2 3 6 5 6 und anderen DataFrame (dfBool) mit "dtype": bool 0 True

Wie diese zu interpretieren Fehlermeldung: (list) Objekt kann nicht sein, gezwungen zu Typ 'double'

1 Antworten

Ich habe eine Tabelle: numTable, die wie folgt aussieht: Nun will ich finden outiers für jede dieser Spalten. Bitte Lesen Sie meine folgenden code: for (i in names(numTable)) { #calculate mean and std for each column meanValue

dataframe dplyr r

Wie verteilen Sie eine Spalte in einer Pandabären-Daten-frame

2 Antworten

Habe ich Folgendes pandas data frame: import pandas as pd import numpy as np df = pd.DataFrame({ 'fc': [100,100,112,1.3,14,125], 'sample_id': ['S1','S1','S1','S2','S2','S2'], 'gene_symbol': ['a', 'b', 'c', 'a', 'b', 'c'], }) df = df[['gene_symbol', 'sample_id', 'fc']] df Produziert diese:

dataframe pandas pivot python

Berechnen von Daten.frame-Spalte Durchschnittswerte nach Datum

2 Antworten

Ich habe einen Daten.frame in R, wo eine Spalte ist eine Liste von Terminen (viele Duplikate), während die andere Spalte ist eine Temperatur aufgezeichnet, auf dass Datum. Die Spalten in Frage, die wie folgt Aussehen (aber mehrere

average dataframe for-loop loops r

Konvertiert unix timestamp-Spalte nach Tag der Woche in R

1 Antworten

Arbeite ich mit einem Daten-frame in R mit der Bezeichnung "mydata". Die erste Spalte, labled "ts" enthält die unix-timestamp-Felder. Ich würde gerne konvertieren Sie diese Felder, um die Tage der Woche. Ich habe versucht, mit strptime und

dataframe datetime r timestamp unix-timestamp

konvertieren Sie mehrere Textzeilen in einem data frame

4 Antworten

Ich versuche einen Weg zu finden, zu konvertieren Sie mehrere Textzeilen in einem Daten-frame. Ich bin mir nicht sicher, ob es einen Weg gibt, wo Sie verwenden können read.delim() zu Lesen in mehrere Zeilen von text und

dataframe r

Teilen Sie bestimmte Spalten durch eine andere Spalte in pandas

3 Antworten

Frage mich, ob es eine effizientere Möglichkeit der Aufteilung in mehreren Spalten einer bestimmten Spalte. Zum Beispiel sage ich: prev open close volume 20.77 20.87 19.87 962816 19.87 19.89 19.56 668076 19.56 19.96 20.1 578987 20.1 20.4

dataframe pandas python

DataFrame den Wert startswith

2 Antworten

Habe ich Folgendes dataframe in pandas: Datum Zeit Event 0 14.11.2016 13:00 Veröffentlichung des 9-Monats-Berichtes 1 14.03.2017 13:00 Telefonkonferenz für Analysten 2 14.03.2017 13:00 Telefonkonferenz für Analysten 3 27.04.2017 14:00 Ordentliche Hauptversammlung 4 03.05.2017 14:00 Dividendenzahlung 5

dataframe pandas python

konvertieren einer Reihe von in einem Daten-frame zu einem einfachen Vektor in R

3 Antworten

Ich habe ein riesiges data frame, aus denen ich nur wählen Sie ein paar Zeilen. Dann habe ich entfernen Sie einige der Spalten basierend auf einer Bedingung. lassen Sie uns sagen, dass ich wählen Sie die Zeile

dataframe list matrix r

Konvertieren von numpy-array in dataframe Spalte?

3 Antworten

Wie konvertiere ich ein numpy-array in einen dataframe Spalte. Sagen wir, ich habe erstellt eine leere dataframe, df, und ich Schleife durch code zu erstellen 5 numpy-arrays. In jeder iteration von meiner for-Schleife, die ich konvertieren wollen

dataframe numpy pandas python

Python Pandas <pandas.core.groupby.DataFrameGroupBy Objekt an ...>

1 Antworten

Ich versuche, zu Gruppe aus und zählen Sie die gleichen Informationen in einer Zeile: #Functions def postal_saude (): global df, lista_solic #List of solicitantes in Postal Saude list_sol = [lista_solic["name1"], lista_solic["name2"]] #filter Postal Saude Solicitantes df =

dataframe pandas

R gelten error: 'X' muss benannt dimnames

2 Antworten

Den "anwenden" - Dokumentation erwähnt, dass, "Wo" X " genannt hat, dimnames, es kann eine Zeichen-Vektor-Auswahl der dimension der Namen." Ich würde gerne verwenden, gelten die Daten.frame nur für bestimmte Spalten. Kann ich mit der Funktion dimnames,

dataframe r

Wie Teilmenge von Daten in R ohne NA-Zeilen?

2 Antworten

Habe ich einige Daten, die ich auf der Suche bin in der R. Eine bestimmte Spalte mit der überschrift "Höhe", enthält ein paar Zeilen von NA. Ich bin auf der Suche auf Teilmenge meine Daten-Rahmen, so dass

dataframe na r subset

R-Liste(structure(list ())), um Daten-Frames

1 Antworten

Habe ich eine JSON-Datenquelle, die eine Liste von hashes: [ { "a": "foo", "b": "sdfshk" }, { "a": "foo", "b": "ihlkyhul" } ] Benutze ich fromJSON() im rjson - Paket zu konvertieren, dass zu einem R-Daten-Struktur. Es

dataframe json r type-conversion

'DataFrame' - Objekt hat kein Attribut 'value_counts'

1 Antworten

Mein dataset ist ein DataFrame dimension (840,84). Wenn ich den code schreiben: ds[ds.columns[1]].value_counts() Bekomme ich eine korrekte Ausgabe: Out[82]: 0 847 1 5 Name: o_East, dtype: int64 Aber wenn ich Schreibe eine Schleife zum speichern der Werte,

dataframe pandas python python-2.7

R konvertieren von Daten.frame-Liste durch Spalte

1 Antworten

Ich würde gerne konvertieren von Daten.frame in einer Liste von Daten.Rahmen mit Säule mit Basis R-Funktionen und die Abhaltung der ersten Spalte konstant. Zum Beispiel würde ich gerne die split-DF in einer Liste von drei Daten.Bildern, von

dataframe list r

NaNs, wenn die Subtraktion von dataframes pandas

1 Antworten

Habe ich zwei dataframes mit nur wenig überlappenden Indizes und Spalten. old = pd.DataFrame(index = ['A', 'B', 'C'], columns = ['k', 'l', 'm'], data = abs(np.floor(np.random.rand(3, 3)*10))) new = pd.DataFrame(index = ['A', 'B', 'C', 'D'], columns =

dataframe pandas python subtraction

überprüfen Sie, ob dataframe ist vom Typ boolean pandas

1 Antworten

Habe ich ein pandas DataFrame wie folgt: In [108]: df1 Out[108]: v t 2014-02-21 10:30:43 False 2014-02-21 10:31:34 False 2014-02-21 10:32:25 False 2014-02-21 10:33:17 False 2014-02-21 10:34:09 False 2014-02-21 10:35:00 False 2014-02-21 10:35:51 False Ich brauche, um

dataframe pandas python

Das entfernen von Duplikaten aus Pandas dataFrame mit Voraussetzung für die Beibehaltung der ursprünglichen

3 Antworten

Vorausgesetzt, ich habe Folgendes DataFrame: A | B 1 | Ms 1 | PhD 2 | Ms 2 | Bs Ich möchten entfernen Sie die doppelten Zeilen mit Bezug auf Spalte A und ich möchte Sie behalten

dataframe pandas python

R Fehler: erwartet einen einzelnen Wert, was bedeutet es?

1 Antworten

Ich bin dabei eine einfache Bedienung mit dplyr in R und hab 'erwartet einzelner Wert' Fehler test <- data.frame(a=rep("item",3),b=c("step1","step2","step3")) test%>%group_by(a)%>%(summarize(seq=paste0(b)) Ich habe gesehen, ähnliche threads, aber diese use cases wurden immer komplexer, und ich konnte nicht herausfinden,

dataframe dplyr r summarization

aufrufende Funktion mit dataframe Daten Fehler gibt (nicht in der Serie zu <class 'float'>)

2 Antworten

Habe ich eine option-pricing-Modell (sehr einfache Black-Scholes -) das funktioniert auch mit Daten, die in dieser Weise: In [18]: BS2(100.,100.,1.,.001,.3) Out[18]: 11.96762435837207 die Funktion ist hier: Black Sholes Function def BS2(S,X,T,r,v): d1 = (log(S/X)+(.001+v*v/2)*T)/(v*sqrt(T)) d2 = d1-v*sqrt(T)

dataframe pandas python

So benennen Sie die Spalten, die in DataFrame mit pandas in Python

2 Antworten

Habe ich fünf Aktienportfolios, die habe ich importiert aus Yahoo! Finanz-und müssen, erstellen Sie einen DataFrame mit den schlusskursen für 2016 aller Aktien. Jedoch bin ich kämpfen, um Sie zu beschriften Sie die Spalten mit den entsprechenden

dataframe pandas python yahoo

Verwenden, wenn andere auf einen dataframe über mehrere Spalten

6 Antworten

Ich habe einen großen Datensatz der Proben mit Deskriptoren, ob die Probe durchführbar ist - es sieht (Art), wie diesem hier, wo 'desc', ist die Spalte "Beschreibung" und "leer" zeigt die Stichprobe ist nicht sinnvoll: desc x

dataframe for-loop if-statement r

erstellen von neuen Spalten in der von der Funktion zu dataframe in R

2 Antworten

Habe ich eine Reihe von dataframes, die wie folgt Aussehen (Sie haben die gleichen Spalten, nicht die gleiche Menge an Zeilen): df1 <- data.frame(v = c("banana", "apple", "orange", "grape", "kiwi fruit", "pear"), x = rnorm(6, 0.06, 0.01))

dataframe function lapply r

Wie machen Sie eine R-Funktion zurückgeben, die mehrere Spalten und fügen Sie diese in einen Daten-frame?

3 Antworten

Beginnend mit diesem data frame myDF = structure(list(Value = c(-2, -1, 0, 1, 2)), .Names = "Value", row.names = c(NA, 5L), class = "data.frame") Angenommen, ich möchte zum ausführen dieser Funktion auf jede Zeile von myDF$Wert getNumberInfo

append dataframe function r

Wie man Schlüssel und Werte aus MapType Spalte in SparkSQL DataFrame

2 Antworten

Ich habe Daten in einer Parkett-Datei, die hat 2 Felder: object_id: String und alpha: Map<>. Einlesen in einen Daten-frame in sparkSQL und das schema sieht wie folgt aus: scala> alphaDF.printSchema() root |-- object_id: string (nullable = true)

apache-spark apache-spark-dataset apache-spark-sql dataframe scala

Plotten von Daten.frame in R

3 Antworten

ich bin neu in R, und ich muss raten, in zeichnen einen dataframe in R, die wie folgt aussieht: V1 V2 V3 V4 1 Mazda Toyota Peugeot Car1.txt 0,507778837 0,19834711 0,146892655 Car2.txt 0,908717802 0,64214047 0,396508728 ich möchte

dataframe plot r

Pandas drop_duplicates - TypeError: object-Typ-argument nach dem * muss ein nacheinander, nicht anzeigen

1 Antworten

Habe ich aktualisiert meine Frage, um ein klareres Beispiel. Ist es möglich, die drop_duplicates Methode in Pandas entfernen Sie doppelte Zeilen basierend auf einer Spalte id, wo die Werte enthalten eine Liste. Betrachten Sie die Spalte 'drei',

dataframe pandas python

Extrahieren Sie den ersten Tag des Monats, der einen datetime-Typ-Spalte in pandas

7 Antworten

Habe ich Folgendes dataframe: user_id purchase_date 1 2015-01-23 14:05:21 2 2015-02-05 05:07:30 3 2015-02-18 17:08:51 4 2015-03-21 17:07:30 5 2015-03-11 18:32:56 6 2015-03-03 11:02:30 sowie purchase_date ist ein datetime64[ns] Spalte. Muss ich eine neue Spalte hinzufügen df[month]

dataframe datetime64 pandas python

wie Ersetze ich numerischen codes mit wertelabels aus einer lookup-Tabelle?

3 Antworten

Diese Frage ist in Bezug auf diese Frage, aber nicht ganz das gleiche. Sagen, dass ich diese Daten-frame, df <- data.frame( id = c(1:6), profession = c(1, 5, 4, NA, 0, 5)) und einen string mit lesbaren

dataframe r rename replace variable-assignment

Gibt es eine Abfrage-Methode oder ähnliches für pandas-Serie (pandas.Serie.query())?

3 Antworten

Den pandas.DataFrame.query() Methode ist der große Verwendung für (pre/post)-filtern von Daten beim laden oder der Darstellung. Es kommt besonders nützlich für die Verkettung von Methoden. Ich finde mich oft zu wollen, gilt die gleiche Logik auf eine

dataframe method-chaining pandas python series

Mit df.query() zum extrahieren von Zeilen aus einem DataFrame

1 Antworten

Ich habe einen DataFrame df, die enthält drei Spalten: ['mid','2014_amt','2015_amt'] Ich zu extrahierenden Zeilen von einem bestimmten Händler. Betrachten Sie beispielsweise meine Daten: df['mid'] = ['as','fsd','qww','fd'] df['2014_amt] = [144,232,45,121] df['2015_amt] = [676,455,455,335] Möchte ich extrahieren Sie die

dataframe pandas python

Daten Zusammenführen.frames verursachen match.Namen Fehler

1 Antworten

Ich Zusammenführen müssen viele Daten.frames. Unterhalb der sample-code zu reproduzieren, ist ein Fehler. Es sieht aus wie ein bug. Dieser code funktioniert auch: df1 <- data.frame(v=1:10, v2=rev(1:10)) df2 <- data.frame(vv=1:8, v2=rev(5:12)) df12 <- merge(x=df1, y=df2, by.x=1, by.y=1,

dataframe merge r

wie um zu überprüfen, ob ein Wert vorhanden ist, in einen dataframe

1 Antworten

Hallo ich versuche den Namen der Spalte ein dataframe enthält ein bestimmtes Wort, zB: ich habe einen dataframe, NA good employee Not available best employer not required well manager not eligible super reportee my_word=["well"] wie um zu

data-analysis dataframe pandas python

Wie zu Schicht mehrere Zeilen in ein pandas DataFrame?

1 Antworten

Habe ich Folgendes pandas Dataframe: import pandas as pd data = {'one' : pd.Series([1.], index=['a']), 'two' : pd.Series([1., 2.], index=['a', 'b']), 'three' : pd.Series([1., 2., 3., 4.], index=['a', 'b', 'c', 'd'])} df = pd.DataFrame(data) df = df[["one",

dataframe pandas python shift

Wählen Sie Letzte Wert in einer Zeile, nach Zeile

3 Antworten

Habe ich einen Daten-frame, wo jede Zeile ist ein Vektor, der die Werte von unterschiedlicher Länge. Ich würde gern ein Vektor, der die letzten wahren Wert in jeder Zeile. Hier ist ein Beispiel des Daten-Frames: df <-

dataframe r

Konvertieren Einer Spalte in Python Dataframe Liste

1 Antworten

Habe ich ein pandas dataframe, bestehend aus nur einer Spalte von Daten. Ich möchte konvertieren Sie die Spalte der Daten in eine Liste. Die Spalte hat float-Datentyp. Beispiel: ColA 341321432 132184900 173840143 1432473928 Gewünscht: 341321432, 132184900, 173840143,

dataframe list python

zählen von Zeilen des dataframe mit Bedingung in spark

2 Antworten

Ich versuche dieses: df=dfFromJson: {"class":"name 1","stream":"science"} {"class":"name 1","stream":"arts"} {"class":"name 1","stream":"science"} {"class":"name 1","stream":"law"} {"class":"name 1","stream":"law"} {"class":"name 2","stream":"science"} {"class":"name 2","stream":"arts"} {"class":"name 2","stream":"law"} {"class":"name 2","stream":"science"} {"class":"name 2","stream":"arts"} {"class":"name 2","stream":"law"} df.groupBy("class").agg(count(col("stream")==="science") as "stream_science", count(col("stream")==="arts") as "stream_arts", count(col("stream")==="law") as "stream_law") Diese nicht

apache-spark apache-spark-sql dataframe json scala

Das unterteilen einer Daten-frame, wenn die Werte in zwei Spalten übereinstimmen, die in einem zweiten Daten-frame

1 Antworten

Habe ich zwei große Daten-frames. df1 hat zwei Spalten, die von Interesse sind (unter anderem), diese sind eine Liste von Arten, die Namen in A1 und eine Liste der 3-letter-Regionen in A2. Jede Zeile ist ein Unabhängiger

dataframe multiple-columns r subset

Erstellen einer neuen Spalte, basierend auf der Bedingung mit Werten aus einer anderen Spalte in python

1 Antworten

Ich habe einen Dataframe und würde gerne eine neue Spalte erstellen, die basierend auf der Bedingung, dass in dieser neuen Spalte, wenn eine bestimmte Bedingung erfüllt ist, dann wird der Wert aus einer anderen Spalte andernfalls muss

dataframe if-statement pandas python

So löschen Sie eine Zeile in einen Daten-frame, indem Sie den Namen in R

1 Antworten

Ich versuche zu löschen, eine Zeile aus einem data-frame, in dem jede Zeile einen Namen hat. Ich kann keine Indizes verwenden, um löschen Sie die Zeilen, nur Ihren Namen. Ich habe das dataframe: DF<- data.frame('2014' = c(30,20,4,

dataframe r

Pandas neue Spalten hinzuzufügen, basiert auf der Spaltung einer anderen Spalte

3 Antworten

Habe ich ein pandas dataframe, wie die folgenden: A B US,65,AMAZON 2016 US,65,EBAY 2016 Mein Ziel ist es, zu schauen, wie diese: A B country code com US.65.AMAZON 2016 US 65 AMAZON US.65.AMAZON 2016 US 65 EBAY

dataframe multiple-columns pandas python split

Anzahl der Zeilen des Ergebnis nicht ein Vielfaches von Vektor-Länge (arg 2) in R

1 Antworten

Habe ich neue Frage im Zusammenhang mit diesem meinem Thema löschen Ausreißer in r mit Berücksichtigung der Nenn-var. In neuen Fall-Variablen x und x1 unterschiedliche Länge x <- c(-10, 1:6, 50) x1<- c(-20, 1:5, 60) z<- c(1,2,3,4,5,6,7,8)

dataframe dplyr mean outliers r

TypeError: '- Serie,' Objekt ist nicht aufrufbar, wenn der Zugriff auf dtypes von einem dataframe

1 Antworten

Was zur Hölle? Ich wusste nicht, ändern Sie das Schlüsselwort, um das Lesen der text Datei habe ich auf meinem Verzeichnis. Doch ich kann nicht überprüfen, die dtype der einzelnen Spalten durch die zwei Methoden, die ich

dataframe pandas python typeerror

Lesen Sie mehrere csv-Dateien verketten Liste von Dateinamen, die Sie in einer einzigen DataFrame

1 Antworten

Ich habe mehrere csv-Dateien in das Verzeichnis und ich würde mich über eine loop-thru zu csv-Dateien finden Sie eine Liste der Dateien, die Namen und Lesen sich gegenseitig in und verketten Sie in einem einzelnen Daten-frame. Im

csv dataframe pandas python

Aufbauend text einer bestimmten Spalte in der R-data frame

1 Antworten

Ich habe eine Datei, die wie folgt aussieht: GO:2000974 7,8 negative_regulation_of_pro-B_cell_differentiation Notch1 ISS GO:2000974 7,8 negative_regulation_of_pro-B_cell_differentiation Q9W737 IEA GO:0001768 4 establishment_of_T_cell_polarity Ccl19 IEA GO:0001768 4 establishment_of_T_cell_polarity Ccl19 ISS GO:0001768 4 establishment_of_T_cell_polarity Ccl21 IEA Was ich tun möchte,

dataframe r

Pandas: die Auswahl DataFrame Zeilen zwischen zwei Datumsangaben (Datetime-Index)

2 Antworten

Habe ich ein Pandas DataFrame mit einem DatetimeIndex und eine Spalte MSE Loss der index ist wie folgt formatiert: DatetimeIndex(['2015-07-16 07:14:41', '2015-07-16 07:14:48', '2015-07-16 07:14:54', '2015-07-16 07:15:01', '2015-07-16 07:15:07', '2015-07-16 07:15:14',...] Es umfasst mehrere Tage. Möchte ich

dataframe datetime indexing pandas python

Mit Zeilen in ein Pandas dataframe zu einem anderen basiert auf drei Säulen

2 Antworten

Ich habe zwei Pandas dataframes, einem ziemlich großen (30000+ Zeilen) und eine viel kleinere (100+ Zeilen). Der dfA sieht so etwas wie: X Y ONSET_TIME COLOUR 0 104 78 1083 6 1 172 78 1083 16 2

dataframe pandas python

Print data frame mit den Spalten zentriert ausgerichtet

2 Antworten

Möchte ich zum drucken einen Daten-frame, wo die Spalten werden zentriert ausgerichtet. Unten ist das, was ich habe, habe ich versucht, ich dachte, das drucken der Daten-frame test1, würde das Ergebnis in den Spalten ausgerichtet in der

center-align dataframe formatting printing r

Normalisieren Sie die Daten in R-Daten.frame-Spalte

1 Antworten

Angenommen ich habe die folgenden Daten: a <- data.frame(var1=letters,var2=runif(26)) Angenommen, ich möchte skaliert jeden Wert in var2 so dass die Summe der var2 Spalte gleich 1 ist (im Grunde drehen Sie den var2 Spalte in einer Wahrscheinlichkeitsverteilung)

dataframe distribution probability r rescale