Tag: dataframe

Ein data frame ist eine tabellarische Datenstruktur. In der Regel enthält es Daten, in denen Zeilen sind Beobachtungen und die Spalten sind Variablen der verschiedenen Typen. Während „data frame“ oder „dataframe“ ist der Begriff für dieses Konzept in mehreren Sprachen (R, Apache Spark, deedle, Ahorn, die pandas-Bibliothek in Python und die DataFrames library in Julia), „Tabelle“ ist der Begriff in MATLAB und SQL.

Umbenennen von Spalten in mehrere dataframes, R

Anzahl der Antworten 3 Antworten
Ich versuche zu Spalten umbenennen von mehreren data.frames. Um ein Beispiel zu geben, sagen wir, ich habe eine Liste von data.frames dfA, dfB und dfC. Ich schrieb eine Funktion changeNames Namen entsprechend und dann lapply wie folgt:

Problem der Umwandlung eine Matrix, Data Frame in R (R denkt, dass alle numerischen Typen sind Faktoren)

Anzahl der Antworten 2 Antworten
Ich bin die Weitergabe der Daten von C# an R über eine COM-Schnittstelle. Wenn der Empfang der Daten in R es ist untergebracht in einer 'Matrix'. Einige der Funktionen, die ich verwenden, erfordern, dass die Daten in

"TypeError: 'DataFrame' Objekte sind veränderbar, damit Sie sich nicht zerlegt werden" beim Sortieren pandas dataframe index

Anzahl der Antworten 2 Antworten
Ich habe folgende dataframe h: In [24]: h.head() Out[24]: alpha1 alpha2 gamma1 gamma2 chi2min gender age filename F35_HC_532d.dat 0.0000 0.000 NaN 0.00 1.000000e+25 F 35 M48_HC_551d.dat 0.7353 3.943 0.425922 0.15 2.072617e+01 M 48 M24_HC_458d.dat 0.7777 4.754 0.463753

pct_change für die Spalte Wert

Anzahl der Antworten 2 Antworten
Mit Pandas Dokumentation http://pandas.pydata.org/pandas-docs/version/0.13.1/generated/pandas.DataFrame.pct_change.html Ich versuche zu erstellen, diese Funktion zu berechnen percentage_change . Ich übergebe zwei Parameter, um es def PCT(df,n): d = df['Close'].pct_change(n) Sogar das umschreiben der gleiche code in verschiedenen Art und Weise geben

Finden und ersetzen Sie fehlende Werte mit der Zeile bedeuten

Anzahl der Antworten 5 Antworten
Habe ich einen Daten-frame mit NAs und ich möchte Sie ersetzen die NAs mit der Zeile bedeutet c1 = c(1,2,3,NA) c2 = c(3,1,NA,3) c3 = c(2,1,3,1) df = data.frame(c1,c2,c3) > df c1 c2 c3 1 1 3

Wie zu Lesen mehrerer xlsx-Datei in R mit Schleife bestimmte Zeilen und Spalten

Anzahl der Antworten 3 Antworten
Habe ich zum Lesen mehrerer xlsx-Datei mit zufälligem Namen in den single-dataframe. Struktur jeder Datei ist die gleiche. Ich habe zum importieren von bestimmten Spalten nur. Habe ich versucht, dieses: dat <- read.xlsx("FILE.xlsx", sheetIndex=1, sheetName=NULL, startRow=5, endRow=NULL,

Die geteilten Daten.frame-by-value

Anzahl der Antworten 2 Antworten
wie kann ich Spalten die folgenden Daten.Rahmen df <- data.frame(var1 = c("a", 1, 2, 3, "a", 1, 2, 3, 4, 5, 6, "a", 1, 2), var2 = 1:14) in Listen /Gruppen a 1 1 2 2 3

So schalten Sie die pandas dataframe Zeile in ordereddict schnell

Anzahl der Antworten 2 Antworten
Suche nach einer schnellen Weg, um eine Zeile in ein pandas dataframe in einen bestellt dict-out-Liste". Liste sind in Ordnung, aber mit großen Datensätzen dauert zu lange. Ich bin mit fiona-GIS-Leser, und die Zeilen werden ordereddicts mit

Pandas-Filterung für mehrere Teilstrings in Serie

Anzahl der Antworten 3 Antworten
Brauche ich zum filtern von Zeilen in einer pandas dataframe, so dass eine bestimmte Zeichenfolge-Spalte enthält mindestens eine aus einer Liste von Teilstrings zur Verfügung gestellt. Die Zeichenketten können ungewöhnliche /regex-Zeichen. Der Vergleich sollte nicht mit regex

Sind dataframe[ ,-1] und dataframe[-1] gleich?

Anzahl der Antworten 3 Antworten
Sorry das scheint wie eine wirklich dumme Frage, aber sind dataframe[ ,-1] und dataframe[-1] die gleiche, und funktioniert das für alle Daten-Typen? ... Und warum sind Sie die gleiche Zusätzlich zu den Antworten unten, dieses Thema ist

pandas dataframe index-match

Anzahl der Antworten 3 Antworten
Frage ich mich, ob es eine effizientere Art und Weise zu tun, die eine "index & match" type-Funktion, die beliebt in excel. Zum Beispiel - zwei pandas DataFrames, aktualisieren Sie die df_1 mit Informationen, die in df_2:

Programmgesteuert generieren, die das schema UND die Daten für einen dataframe in Apache Spark

Anzahl der Antworten 1 Antworten
Möchte ich dynamisch generieren Sie einen dataframe mit einem Kopf-Datensatz für einen Bericht so erstellen Sie einen dataframe aus dem Wert die Zeichenfolge unten: val headerDescs : String = "Name,Age,Location" val headerSchema = StructType(headerDescs.split(",").map(fieldName => StructField(fieldName, StringType,

Pandas - Zusammenführen von zwei DataFrames mit Identischen Spaltennamen

Anzahl der Antworten 3 Antworten
Habe ich zwei Daten-Frames mit identischen Spaltennamen und identische IDs in der ersten Spalte. Mit Ausnahme der ID-Spalte, die für jede Zelle, die einen Wert enthält, der in einem DataFrame enthält NaN in der anderen. Hier ist

Summe Betrieb auf PySpark DataFrame geben TypeError, wenn der Typ in Ordnung ist

Anzahl der Antworten 1 Antworten
Habe ich solche DataFrame in PySpark (dies ist das Ergebnis eines nehmen(3) das dataframe ist sehr groß): sc = SparkContext() df = [Row(owner=u'u1', a_d=0.1), Row(owner=u'u2', a_d=0.0), Row(owner=u'u1', a_d=0.3)] den gleichen Besitzer mehr Zeilen. Was ich tun müssen,

Entfernen von Zeilen aus dataframe basierend auf Bedingung

Anzahl der Antworten 3 Antworten
Ich weiß, das muss angesprochen werden, bevor, aber ich kann nicht scheinen, eine Antwort zu finden, die funktioniert Habe ich die Spalten, die ich testen will, die Bedingung gegen und ich möchten, entfernen Sie alle Zeilen aus,

Pandas konvertieren, Spalten-Typ aus der Liste um np.array

Anzahl der Antworten 1 Antworten
Ich bin versucht, eine Funktion in ein pandas dataframe, eine solche Funktion benötigt zwei np.array als Eingabe und passen Sie Sie mit einem gut definierten Modell. Der Punkt ist, dass ich nicht in der Lage, um die

Wie Sie die for-Schleife die Ausgabe als Daten.frame in R?

Anzahl der Antworten 1 Antworten
Ich würde gerne wissen, wie ich speichern kann die Ausgabe eines for loop als data.frame? lassen Sie uns sagen, mit der mtcars dataset ich habe Folgendes for loop Skript: for (i in seq_len(nrow(mtcars))) { if (i <=

ersetzen Zeichenfolge in pandas dataframe

Anzahl der Antworten 3 Antworten
Ich habe einen dataframe mit mehreren Spalten. Ich möchte, um sich auf eine Spalte und wenn einer der strings in der Spalte enthalten @, ich möchte Sie zu ersetzen mit einem anderen string. Wie würde ich gehen

Bauen pandas-Daten-frame aus der Liste der numpy-arrays

Anzahl der Antworten 2 Antworten
Frage ich mich, ob es einen einfachen Weg für die offensichtliche Aufgabe erzeugen Sie ein pandas DataFrame aus einer Liste mit numpy-arrays, wo die Spalten des arrays. Das Standard-Verhalten scheint, lassen Sie die Felder, werden die Zeilen,

konvertieren Korpus in Daten.frame in R

Anzahl der Antworten 2 Antworten
Ich bin mit dem tm-Paket anwenden Wortstamm, und ich brauche zum konvertieren der resultierenden Daten in einem Daten-frame. Eine Lösung für diese finden Sie hier R tm Paket vcorpus: Fehler in der Konvertierung von Text zu Daten-frame,

wie entfernen Sie Spalten mit zu vielen fehlenden Werten in Python

Anzahl der Antworten 7 Antworten
Arbeite ich auf einer machine-learning-problem, in denen es viele fehlende Werte in den Funktionen. Es gibt 100 von den features, und ich möchte zu löschen, diese Funktionen, die zu viele fehlende Werte (es kann sein, Funktionen mit

Die Berechnung der Kosinus-ähnlichkeit zwischen allen Zeilen des dataframe in pyspark

Anzahl der Antworten 1 Antworten
Ich habe einen Datensatz mit Arbeiter mit Ihrer demographischen Daten wie Alter, Geschlecht,Anschrift usw.-und Ihrem Arbeitsort. Ich habe eine RDD aus dem dataset-Objekt und konvertiert es in ein DataFrame. Gibt es mehrere Einträge für jede ID. Also,

R - beschreiben() ausgegeben, um einen Daten-frame

Anzahl der Antworten 3 Antworten
Erstellen Sie ein Daten-frame mit describe () - Funktion. Dataset unter Berücksichtigung iris. Der Daten-frame sollte dann so Aussehen: Variable n missing unique Info Mean 0.05 0.1 0.25 0.5 0.75 0.9 0.95 Sepal.Length 150 0 35 1

Konvertieren-Liste, um Daten-Frames, während list-element-Namen

Anzahl der Antworten 4 Antworten
Ich haben Liste, wo die elementnames sind ID-tags und enthält ein Vektor mit numerischen Werten. Diese sind von ungleichen(!) Länge. Möchte ich, um es zu transformieren, um einen Daten-frame, wo ich die ID in einer Spalte und

Sortieren Sie ein dataframe Spalte von der Häufigkeit des Auftretens

Anzahl der Antworten 3 Antworten
Ich habe einen dataframe in df genannt, gibt es drei Spalten können sagen, Region ID Salary 1 A1 100 1 A2 1001 1 A3 2000 1 A4 2431 1 A5 1001 .............. .............. 2 A6 1002 2

Pandas Umsetzung innerhalb dataframe

Anzahl der Antworten 1 Antworten
Habe ich diese datasate jetzt: animal age count dogs 1 49 2 134 3 147 4 154 cats 1 189 2 254 3 259 4 261 Ich würde gerne konvertieren Alter Spalte 4 Alter Spalten für jedes

Pandas filtern, Spalten ein DataFrame mit bool

Anzahl der Antworten 2 Antworten
Für einen DataFrame (df) mit mehreren Spalten und Zeilen A B C D 0 1 4 2 6 1 2 5 7 4 2 3 6 5 6 und anderen DataFrame (dfBool) mit "dtype": bool 0 True

Wie diese zu interpretieren Fehlermeldung: (list) Objekt kann nicht sein, gezwungen zu Typ 'double'

Anzahl der Antworten 1 Antworten
Ich habe eine Tabelle: numTable, die wie folgt aussieht: Nun will ich finden outiers für jede dieser Spalten. Bitte Lesen Sie meine folgenden code: for (i in names(numTable)) { #calculate mean and std for each column meanValue

Wie verteilen Sie eine Spalte in einer Pandabären-Daten-frame

Anzahl der Antworten 2 Antworten
Habe ich Folgendes pandas data frame: import pandas as pd import numpy as np df = pd.DataFrame({ 'fc': [100,100,112,1.3,14,125], 'sample_id': ['S1','S1','S1','S2','S2','S2'], 'gene_symbol': ['a', 'b', 'c', 'a', 'b', 'c'], }) df = df[['gene_symbol', 'sample_id', 'fc']] df Produziert diese:

Berechnen von Daten.frame-Spalte Durchschnittswerte nach Datum

Anzahl der Antworten 2 Antworten
Ich habe einen Daten.frame in R, wo eine Spalte ist eine Liste von Terminen (viele Duplikate), während die andere Spalte ist eine Temperatur aufgezeichnet, auf dass Datum. Die Spalten in Frage, die wie folgt Aussehen (aber mehrere

Konvertiert unix timestamp-Spalte nach Tag der Woche in R

Anzahl der Antworten 1 Antworten
Arbeite ich mit einem Daten-frame in R mit der Bezeichnung "mydata". Die erste Spalte, labled "ts" enthält die unix-timestamp-Felder. Ich würde gerne konvertieren Sie diese Felder, um die Tage der Woche. Ich habe versucht, mit strptime und

konvertieren Sie mehrere Textzeilen in einem data frame

Anzahl der Antworten 4 Antworten
Ich versuche einen Weg zu finden, zu konvertieren Sie mehrere Textzeilen in einem Daten-frame. Ich bin mir nicht sicher, ob es einen Weg gibt, wo Sie verwenden können read.delim() zu Lesen in mehrere Zeilen von text und

Teilen Sie bestimmte Spalten durch eine andere Spalte in pandas

Anzahl der Antworten 3 Antworten
Frage mich, ob es eine effizientere Möglichkeit der Aufteilung in mehreren Spalten einer bestimmten Spalte. Zum Beispiel sage ich: prev open close volume 20.77 20.87 19.87 962816 19.87 19.89 19.56 668076 19.56 19.96 20.1 578987 20.1 20.4

DataFrame den Wert startswith

Anzahl der Antworten 2 Antworten
Habe ich Folgendes dataframe in pandas: Datum Zeit Event 0 14.11.2016 13:00 Veröffentlichung des 9-Monats-Berichtes 1 14.03.2017 13:00 Telefonkonferenz für Analysten 2 14.03.2017 13:00 Telefonkonferenz für Analysten 3 27.04.2017 14:00 Ordentliche Hauptversammlung 4 03.05.2017 14:00 Dividendenzahlung 5

konvertieren einer Reihe von in einem Daten-frame zu einem einfachen Vektor in R

Anzahl der Antworten 3 Antworten
Ich habe ein riesiges data frame, aus denen ich nur wählen Sie ein paar Zeilen. Dann habe ich entfernen Sie einige der Spalten basierend auf einer Bedingung. lassen Sie uns sagen, dass ich wählen Sie die Zeile

Konvertieren von numpy-array in dataframe Spalte?

Anzahl der Antworten 3 Antworten
Wie konvertiere ich ein numpy-array in einen dataframe Spalte. Sagen wir, ich habe erstellt eine leere dataframe, df, und ich Schleife durch code zu erstellen 5 numpy-arrays. In jeder iteration von meiner for-Schleife, die ich konvertieren wollen

Python Pandas <pandas.core.groupby.DataFrameGroupBy Objekt an ...>

Anzahl der Antworten 1 Antworten
Ich versuche, zu Gruppe aus und zählen Sie die gleichen Informationen in einer Zeile: #Functions def postal_saude (): global df, lista_solic #List of solicitantes in Postal Saude list_sol = [lista_solic["name1"], lista_solic["name2"]] #filter Postal Saude Solicitantes df =

R gelten error: 'X' muss benannt dimnames

Anzahl der Antworten 2 Antworten
Den "anwenden" - Dokumentation erwähnt, dass, "Wo" X " genannt hat, dimnames, es kann eine Zeichen-Vektor-Auswahl der dimension der Namen." Ich würde gerne verwenden, gelten die Daten.frame nur für bestimmte Spalten. Kann ich mit der Funktion dimnames,

Wie Teilmenge von Daten in R ohne NA-Zeilen?

Anzahl der Antworten 2 Antworten
Habe ich einige Daten, die ich auf der Suche bin in der R. Eine bestimmte Spalte mit der überschrift "Höhe", enthält ein paar Zeilen von NA. Ich bin auf der Suche auf Teilmenge meine Daten-Rahmen, so dass

R-Liste(structure(list ())), um Daten-Frames

Anzahl der Antworten 1 Antworten
Habe ich eine JSON-Datenquelle, die eine Liste von hashes: [ { "a": "foo", "b": "sdfshk" }, { "a": "foo", "b": "ihlkyhul" } ] Benutze ich fromJSON() im rjson - Paket zu konvertieren, dass zu einem R-Daten-Struktur. Es

'DataFrame' - Objekt hat kein Attribut 'value_counts'

Anzahl der Antworten 1 Antworten
Mein dataset ist ein DataFrame dimension (840,84). Wenn ich den code schreiben: ds[ds.columns[1]].value_counts() Bekomme ich eine korrekte Ausgabe: Out[82]: 0 847 1 5 Name: o_East, dtype: int64 Aber wenn ich Schreibe eine Schleife zum speichern der Werte,

R konvertieren von Daten.frame-Liste durch Spalte

Anzahl der Antworten 1 Antworten
Ich würde gerne konvertieren von Daten.frame in einer Liste von Daten.Rahmen mit Säule mit Basis R-Funktionen und die Abhaltung der ersten Spalte konstant. Zum Beispiel würde ich gerne die split-DF in einer Liste von drei Daten.Bildern, von

NaNs, wenn die Subtraktion von dataframes pandas

Anzahl der Antworten 1 Antworten
Habe ich zwei dataframes mit nur wenig überlappenden Indizes und Spalten. old = pd.DataFrame(index = ['A', 'B', 'C'], columns = ['k', 'l', 'm'], data = abs(np.floor(np.random.rand(3, 3)*10))) new = pd.DataFrame(index = ['A', 'B', 'C', 'D'], columns =

überprüfen Sie, ob dataframe ist vom Typ boolean pandas

Anzahl der Antworten 1 Antworten
Habe ich ein pandas DataFrame wie folgt: In [108]: df1 Out[108]: v t 2014-02-21 10:30:43 False 2014-02-21 10:31:34 False 2014-02-21 10:32:25 False 2014-02-21 10:33:17 False 2014-02-21 10:34:09 False 2014-02-21 10:35:00 False 2014-02-21 10:35:51 False Ich brauche, um

Das entfernen von Duplikaten aus Pandas dataFrame mit Voraussetzung für die Beibehaltung der ursprünglichen

Anzahl der Antworten 3 Antworten
Vorausgesetzt, ich habe Folgendes DataFrame: A | B 1 | Ms 1 | PhD 2 | Ms 2 | Bs Ich möchten entfernen Sie die doppelten Zeilen mit Bezug auf Spalte A und ich möchte Sie behalten

R Fehler: erwartet einen einzelnen Wert, was bedeutet es?

Anzahl der Antworten 1 Antworten
Ich bin dabei eine einfache Bedienung mit dplyr in R und hab 'erwartet einzelner Wert' Fehler test <- data.frame(a=rep("item",3),b=c("step1","step2","step3")) test%>%group_by(a)%>%(summarize(seq=paste0(b)) Ich habe gesehen, ähnliche threads, aber diese use cases wurden immer komplexer, und ich konnte nicht herausfinden,

aufrufende Funktion mit dataframe Daten Fehler gibt (nicht in der Serie zu <class 'float'>)

Anzahl der Antworten 2 Antworten
Habe ich eine option-pricing-Modell (sehr einfache Black-Scholes -) das funktioniert auch mit Daten, die in dieser Weise: In [18]: BS2(100.,100.,1.,.001,.3) Out[18]: 11.96762435837207 die Funktion ist hier: Black Sholes Function def BS2(S,X,T,r,v): d1 = (log(S/X)+(.001+v*v/2)*T)/(v*sqrt(T)) d2 = d1-v*sqrt(T)

So benennen Sie die Spalten, die in DataFrame mit pandas in Python

Anzahl der Antworten 2 Antworten
Habe ich fünf Aktienportfolios, die habe ich importiert aus Yahoo! Finanz-und müssen, erstellen Sie einen DataFrame mit den schlusskursen für 2016 aller Aktien. Jedoch bin ich kämpfen, um Sie zu beschriften Sie die Spalten mit den entsprechenden

Verwenden, wenn andere auf einen dataframe über mehrere Spalten

Anzahl der Antworten 6 Antworten
Ich habe einen großen Datensatz der Proben mit Deskriptoren, ob die Probe durchführbar ist - es sieht (Art), wie diesem hier, wo 'desc', ist die Spalte "Beschreibung" und "leer" zeigt die Stichprobe ist nicht sinnvoll: desc x

erstellen von neuen Spalten in der von der Funktion zu dataframe in R

Anzahl der Antworten 2 Antworten
Habe ich eine Reihe von dataframes, die wie folgt Aussehen (Sie haben die gleichen Spalten, nicht die gleiche Menge an Zeilen): df1 <- data.frame(v = c("banana", "apple", "orange", "grape", "kiwi fruit", "pear"), x = rnorm(6, 0.06, 0.01))