Tag: dataframe
Ein data frame ist eine tabellarische Datenstruktur. In der Regel enthält es Daten, in denen Zeilen sind Beobachtungen und die Spalten sind Variablen der verschiedenen Typen. Während „data frame“ oder „dataframe“ ist der Begriff für dieses Konzept in mehreren Sprachen (R, Apache Spark, deedle, Ahorn, die pandas-Bibliothek in Python und die DataFrames library in Julia), „Tabelle“ ist der Begriff in MATLAB und SQL.
2
Antworten
Für einen DataFrame (df) mit mehreren Spalten und Zeilen A B C D 0 1 4 2 6 1 2 5 7 4 2 3 6 5 6 und anderen DataFrame (dfBool) mit "dtype": bool 0 True
1
Antworten
Ich habe eine Tabelle: numTable, die wie folgt aussieht: Nun will ich finden outiers für jede dieser Spalten. Bitte Lesen Sie meine folgenden code: for (i in names(numTable)) { #calculate mean and std for each column meanValue
2
Antworten
Habe ich Folgendes pandas data frame: import pandas as pd import numpy as np df = pd.DataFrame({ 'fc': [100,100,112,1.3,14,125], 'sample_id': ['S1','S1','S1','S2','S2','S2'], 'gene_symbol': ['a', 'b', 'c', 'a', 'b', 'c'], }) df = df[['gene_symbol', 'sample_id', 'fc']] df Produziert diese:
2
Antworten
Ich habe einen Daten.frame in R, wo eine Spalte ist eine Liste von Terminen (viele Duplikate), während die andere Spalte ist eine Temperatur aufgezeichnet, auf dass Datum. Die Spalten in Frage, die wie folgt Aussehen (aber mehrere
1
Antworten
Arbeite ich mit einem Daten-frame in R mit der Bezeichnung "mydata". Die erste Spalte, labled "ts" enthält die unix-timestamp-Felder. Ich würde gerne konvertieren Sie diese Felder, um die Tage der Woche. Ich habe versucht, mit strptime und
4
Antworten
Ich versuche einen Weg zu finden, zu konvertieren Sie mehrere Textzeilen in einem Daten-frame. Ich bin mir nicht sicher, ob es einen Weg gibt, wo Sie verwenden können read.delim() zu Lesen in mehrere Zeilen von text und
3
Antworten
Frage mich, ob es eine effizientere Möglichkeit der Aufteilung in mehreren Spalten einer bestimmten Spalte. Zum Beispiel sage ich: prev open close volume 20.77 20.87 19.87 962816 19.87 19.89 19.56 668076 19.56 19.96 20.1 578987 20.1 20.4
2
Antworten
Habe ich Folgendes dataframe in pandas: Datum Zeit Event 0 14.11.2016 13:00 Veröffentlichung des 9-Monats-Berichtes 1 14.03.2017 13:00 Telefonkonferenz für Analysten 2 14.03.2017 13:00 Telefonkonferenz für Analysten 3 27.04.2017 14:00 Ordentliche Hauptversammlung 4 03.05.2017 14:00 Dividendenzahlung 5
3
Antworten
Ich habe ein riesiges data frame, aus denen ich nur wählen Sie ein paar Zeilen. Dann habe ich entfernen Sie einige der Spalten basierend auf einer Bedingung. lassen Sie uns sagen, dass ich wählen Sie die Zeile
3
Antworten
Wie konvertiere ich ein numpy-array in einen dataframe Spalte. Sagen wir, ich habe erstellt eine leere dataframe, df, und ich Schleife durch code zu erstellen 5 numpy-arrays. In jeder iteration von meiner for-Schleife, die ich konvertieren wollen
1
Antworten
Ich versuche, zu Gruppe aus und zählen Sie die gleichen Informationen in einer Zeile: #Functions def postal_saude (): global df, lista_solic #List of solicitantes in Postal Saude list_sol = [lista_solic["name1"], lista_solic["name2"]] #filter Postal Saude Solicitantes df =
2
Antworten
Den "anwenden" - Dokumentation erwähnt, dass, "Wo" X " genannt hat, dimnames, es kann eine Zeichen-Vektor-Auswahl der dimension der Namen." Ich würde gerne verwenden, gelten die Daten.frame nur für bestimmte Spalten. Kann ich mit der Funktion dimnames,
2
Antworten
Habe ich einige Daten, die ich auf der Suche bin in der R. Eine bestimmte Spalte mit der überschrift "Höhe", enthält ein paar Zeilen von NA. Ich bin auf der Suche auf Teilmenge meine Daten-Rahmen, so dass
1
Antworten
Habe ich eine JSON-Datenquelle, die eine Liste von hashes: [ { "a": "foo", "b": "sdfshk" }, { "a": "foo", "b": "ihlkyhul" } ] Benutze ich fromJSON() im rjson - Paket zu konvertieren, dass zu einem R-Daten-Struktur. Es
1
Antworten
Mein dataset ist ein DataFrame dimension (840,84). Wenn ich den code schreiben: ds[ds.columns[1]].value_counts() Bekomme ich eine korrekte Ausgabe: Out[82]: 0 847 1 5 Name: o_East, dtype: int64 Aber wenn ich Schreibe eine Schleife zum speichern der Werte,
1
Antworten
Ich würde gerne konvertieren von Daten.frame in einer Liste von Daten.Rahmen mit Säule mit Basis R-Funktionen und die Abhaltung der ersten Spalte konstant. Zum Beispiel würde ich gerne die split-DF in einer Liste von drei Daten.Bildern, von
1
Antworten
Habe ich zwei dataframes mit nur wenig überlappenden Indizes und Spalten. old = pd.DataFrame(index = ['A', 'B', 'C'], columns = ['k', 'l', 'm'], data = abs(np.floor(np.random.rand(3, 3)*10))) new = pd.DataFrame(index = ['A', 'B', 'C', 'D'], columns =
1
Antworten
Habe ich ein pandas DataFrame wie folgt: In [108]: df1 Out[108]: v t 2014-02-21 10:30:43 False 2014-02-21 10:31:34 False 2014-02-21 10:32:25 False 2014-02-21 10:33:17 False 2014-02-21 10:34:09 False 2014-02-21 10:35:00 False 2014-02-21 10:35:51 False Ich brauche, um
3
Antworten
Vorausgesetzt, ich habe Folgendes DataFrame: A | B 1 | Ms 1 | PhD 2 | Ms 2 | Bs Ich möchten entfernen Sie die doppelten Zeilen mit Bezug auf Spalte A und ich möchte Sie behalten
1
Antworten
Ich bin dabei eine einfache Bedienung mit dplyr in R und hab 'erwartet einzelner Wert' Fehler test <- data.frame(a=rep("item",3),b=c("step1","step2","step3")) test%>%group_by(a)%>%(summarize(seq=paste0(b)) Ich habe gesehen, ähnliche threads, aber diese use cases wurden immer komplexer, und ich konnte nicht herausfinden,
2
Antworten
Habe ich eine option-pricing-Modell (sehr einfache Black-Scholes -) das funktioniert auch mit Daten, die in dieser Weise: In [18]: BS2(100.,100.,1.,.001,.3) Out[18]: 11.96762435837207 die Funktion ist hier: Black Sholes Function def BS2(S,X,T,r,v): d1 = (log(S/X)+(.001+v*v/2)*T)/(v*sqrt(T)) d2 = d1-v*sqrt(T)
2
Antworten
Habe ich fünf Aktienportfolios, die habe ich importiert aus Yahoo! Finanz-und müssen, erstellen Sie einen DataFrame mit den schlusskursen für 2016 aller Aktien. Jedoch bin ich kämpfen, um Sie zu beschriften Sie die Spalten mit den entsprechenden
6
Antworten
Ich habe einen großen Datensatz der Proben mit Deskriptoren, ob die Probe durchführbar ist - es sieht (Art), wie diesem hier, wo 'desc', ist die Spalte "Beschreibung" und "leer" zeigt die Stichprobe ist nicht sinnvoll: desc x
2
Antworten
Habe ich eine Reihe von dataframes, die wie folgt Aussehen (Sie haben die gleichen Spalten, nicht die gleiche Menge an Zeilen): df1 <- data.frame(v = c("banana", "apple", "orange", "grape", "kiwi fruit", "pear"), x = rnorm(6, 0.06, 0.01))
3
Antworten
Beginnend mit diesem data frame myDF = structure(list(Value = c(-2, -1, 0, 1, 2)), .Names = "Value", row.names = c(NA, 5L), class = "data.frame") Angenommen, ich möchte zum ausführen dieser Funktion auf jede Zeile von myDF$Wert getNumberInfo
2
Antworten
Ich habe Daten in einer Parkett-Datei, die hat 2 Felder: object_id: String und alpha: Map<>. Einlesen in einen Daten-frame in sparkSQL und das schema sieht wie folgt aus: scala> alphaDF.printSchema() root |-- object_id: string (nullable = true)
3
Antworten
ich bin neu in R, und ich muss raten, in zeichnen einen dataframe in R, die wie folgt aussieht: V1 V2 V3 V4 1 Mazda Toyota Peugeot Car1.txt 0,507778837 0,19834711 0,146892655 Car2.txt 0,908717802 0,64214047 0,396508728 ich möchte
1
Antworten
Habe ich aktualisiert meine Frage, um ein klareres Beispiel. Ist es möglich, die drop_duplicates Methode in Pandas entfernen Sie doppelte Zeilen basierend auf einer Spalte id, wo die Werte enthalten eine Liste. Betrachten Sie die Spalte 'drei',
7
Antworten
Habe ich Folgendes dataframe: user_id purchase_date 1 2015-01-23 14:05:21 2 2015-02-05 05:07:30 3 2015-02-18 17:08:51 4 2015-03-21 17:07:30 5 2015-03-11 18:32:56 6 2015-03-03 11:02:30 sowie purchase_date ist ein datetime64[ns] Spalte. Muss ich eine neue Spalte hinzufügen df[month]
3
Antworten
Diese Frage ist in Bezug auf diese Frage, aber nicht ganz das gleiche. Sagen, dass ich diese Daten-frame, df <- data.frame( id = c(1:6), profession = c(1, 5, 4, NA, 0, 5)) und einen string mit lesbaren
3
Antworten
Den pandas.DataFrame.query() Methode ist der große Verwendung für (pre/post)-filtern von Daten beim laden oder der Darstellung. Es kommt besonders nützlich für die Verkettung von Methoden. Ich finde mich oft zu wollen, gilt die gleiche Logik auf eine
1
Antworten
Ich habe einen DataFrame df, die enthält drei Spalten: ['mid','2014_amt','2015_amt'] Ich zu extrahierenden Zeilen von einem bestimmten Händler. Betrachten Sie beispielsweise meine Daten: df['mid'] = ['as','fsd','qww','fd'] df['2014_amt] = [144,232,45,121] df['2015_amt] = [676,455,455,335] Möchte ich extrahieren Sie die
1
Antworten
Ich Zusammenführen müssen viele Daten.frames. Unterhalb der sample-code zu reproduzieren, ist ein Fehler. Es sieht aus wie ein bug. Dieser code funktioniert auch: df1 <- data.frame(v=1:10, v2=rev(1:10)) df2 <- data.frame(vv=1:8, v2=rev(5:12)) df12 <- merge(x=df1, y=df2, by.x=1, by.y=1,
1
Antworten
Hallo ich versuche den Namen der Spalte ein dataframe enthält ein bestimmtes Wort, zB: ich habe einen dataframe, NA good employee Not available best employer not required well manager not eligible super reportee my_word=["well"] wie um zu
1
Antworten
Habe ich Folgendes pandas Dataframe: import pandas as pd data = {'one' : pd.Series([1.], index=['a']), 'two' : pd.Series([1., 2.], index=['a', 'b']), 'three' : pd.Series([1., 2., 3., 4.], index=['a', 'b', 'c', 'd'])} df = pd.DataFrame(data) df = df[["one",
3
Antworten
Habe ich einen Daten-frame, wo jede Zeile ist ein Vektor, der die Werte von unterschiedlicher Länge. Ich würde gern ein Vektor, der die letzten wahren Wert in jeder Zeile. Hier ist ein Beispiel des Daten-Frames: df <-
1
Antworten
Habe ich ein pandas dataframe, bestehend aus nur einer Spalte von Daten. Ich möchte konvertieren Sie die Spalte der Daten in eine Liste. Die Spalte hat float-Datentyp. Beispiel: ColA 341321432 132184900 173840143 1432473928 Gewünscht: 341321432, 132184900, 173840143,
2
Antworten
Ich versuche dieses: df=dfFromJson: {"class":"name 1","stream":"science"} {"class":"name 1","stream":"arts"} {"class":"name 1","stream":"science"} {"class":"name 1","stream":"law"} {"class":"name 1","stream":"law"} {"class":"name 2","stream":"science"} {"class":"name 2","stream":"arts"} {"class":"name 2","stream":"law"} {"class":"name 2","stream":"science"} {"class":"name 2","stream":"arts"} {"class":"name 2","stream":"law"} df.groupBy("class").agg(count(col("stream")==="science") as "stream_science", count(col("stream")==="arts") as "stream_arts", count(col("stream")==="law") as "stream_law") Diese nicht
1
Antworten
Habe ich zwei große Daten-frames. df1 hat zwei Spalten, die von Interesse sind (unter anderem), diese sind eine Liste von Arten, die Namen in A1 und eine Liste der 3-letter-Regionen in A2. Jede Zeile ist ein Unabhängiger
1
Antworten
Ich habe einen Dataframe und würde gerne eine neue Spalte erstellen, die basierend auf der Bedingung, dass in dieser neuen Spalte, wenn eine bestimmte Bedingung erfüllt ist, dann wird der Wert aus einer anderen Spalte andernfalls muss
1
Antworten
Ich versuche zu löschen, eine Zeile aus einem data-frame, in dem jede Zeile einen Namen hat. Ich kann keine Indizes verwenden, um löschen Sie die Zeilen, nur Ihren Namen. Ich habe das dataframe: DF<- data.frame('2014' = c(30,20,4,
3
Antworten
Habe ich ein pandas dataframe, wie die folgenden: A B US,65,AMAZON 2016 US,65,EBAY 2016 Mein Ziel ist es, zu schauen, wie diese: A B country code com US.65.AMAZON 2016 US 65 AMAZON US.65.AMAZON 2016 US 65 EBAY
1
Antworten
Habe ich neue Frage im Zusammenhang mit diesem meinem Thema löschen Ausreißer in r mit Berücksichtigung der Nenn-var. In neuen Fall-Variablen x und x1 unterschiedliche Länge x <- c(-10, 1:6, 50) x1<- c(-20, 1:5, 60) z<- c(1,2,3,4,5,6,7,8)
1
Antworten
Was zur Hölle? Ich wusste nicht, ändern Sie das Schlüsselwort, um das Lesen der text Datei habe ich auf meinem Verzeichnis. Doch ich kann nicht überprüfen, die dtype der einzelnen Spalten durch die zwei Methoden, die ich
1
Antworten
Ich habe mehrere csv-Dateien in das Verzeichnis und ich würde mich über eine loop-thru zu csv-Dateien finden Sie eine Liste der Dateien, die Namen und Lesen sich gegenseitig in und verketten Sie in einem einzelnen Daten-frame. Im
1
Antworten
Ich habe eine Datei, die wie folgt aussieht: GO:2000974 7,8 negative_regulation_of_pro-B_cell_differentiation Notch1 ISS GO:2000974 7,8 negative_regulation_of_pro-B_cell_differentiation Q9W737 IEA GO:0001768 4 establishment_of_T_cell_polarity Ccl19 IEA GO:0001768 4 establishment_of_T_cell_polarity Ccl19 ISS GO:0001768 4 establishment_of_T_cell_polarity Ccl21 IEA Was ich tun möchte,
2
Antworten
Habe ich ein Pandas DataFrame mit einem DatetimeIndex und eine Spalte MSE Loss der index ist wie folgt formatiert: DatetimeIndex(['2015-07-16 07:14:41', '2015-07-16 07:14:48', '2015-07-16 07:14:54', '2015-07-16 07:15:01', '2015-07-16 07:15:07', '2015-07-16 07:15:14',...] Es umfasst mehrere Tage. Möchte ich
2
Antworten
Ich habe zwei Pandas dataframes, einem ziemlich großen (30000+ Zeilen) und eine viel kleinere (100+ Zeilen). Der dfA sieht so etwas wie: X Y ONSET_TIME COLOUR 0 104 78 1083 6 1 172 78 1083 16 2
2
Antworten
Möchte ich zum drucken einen Daten-frame, wo die Spalten werden zentriert ausgerichtet. Unten ist das, was ich habe, habe ich versucht, ich dachte, das drucken der Daten-frame test1, würde das Ergebnis in den Spalten ausgerichtet in der
1
Antworten
Angenommen ich habe die folgenden Daten: a <- data.frame(var1=letters,var2=runif(26)) Angenommen, ich möchte skaliert jeden Wert in var2 so dass die Summe der var2 Spalte gleich 1 ist (im Grunde drehen Sie den var2 Spalte in einer Wahrscheinlichkeitsverteilung)