Tag: dataframe

Ein data frame ist eine tabellarische Datenstruktur. In der Regel enthält es Daten, in denen Zeilen sind Beobachtungen und die Spalten sind Variablen der verschiedenen Typen. Während „data frame“ oder „dataframe“ ist der Begriff für dieses Konzept in mehreren Sprachen (R, Apache Spark, deedle, Ahorn, die pandas-Bibliothek in Python und die DataFrames library in Julia), „Tabelle“ ist der Begriff in MATLAB und SQL.

Verwandle Pandas Multi-Index in eine Spalte

Anzahl der Antworten 2 Antworten
Ich habe einen dataframe mit 2 index-Ebenen: value Trial measurement 1 0 13 1 3 2 4 2 0 NaN 1 12 3 0 34 Welche ich möchte in diese: Trial measurement value 1 0 13 1

In R, wie kann ich prozentuale Statistiken für eine Spalte in einem Datenrahmen berechnen? (Tabellenfunktion um Prozent erweitert)

Anzahl der Antworten 4 Antworten
Dies ist eine einfache Frage, aber ich konnte nicht herausfinden, wie zu verwenden prop.Tabelle für dieses und ich brauche diese Funktion sehr, sehr oft. Habe ich Daten wie diese > library(ggplot2) > #sample data > head(tips,3) total_bill

Entfernen Sie eine vollständige Spalte aus einem data.frame in R

Anzahl der Antworten 5 Antworten
Weiß jemand, wie man entfernen Sie eine ganze Spalte aus einer Datenbank.frame in R? Zum Beispiel, wenn ich diese Daten.Rahmen: > head(data) chr genome region 1 chr1 hg19_refGene CDS 2 chr1 hg19_refGene exon 3 chr1 hg19_refGene CDS

Wie man über Zeilen in einem DataFrame in Pandas iteriert?

Anzahl der Antworten 12 Antworten
Ich habe eine DataFrames von pandas: import pandas as pd inp = [{'c1':10, 'c2':100}, {'c1':11,'c2':110}, {'c1':12,'c2':120}] df = pd.DataFrame(inp) print df Ausgabe: c1 c2 0 10 100 1 11 110 2 12 120 Möchte ich nun iteriert

Nicht definierte Spalten werden ausgewählt, wenn der Datenrahmen untergeordnet wird

Anzahl der Antworten 1 Antworten
Habe ich einen Daten-frame, str(data) zu zeigen, mehr über meine Daten-frame das Ergebnis ist die folgende: > str(data) 'data.frame': 153 obs. of 6 variables: $ Ozone : int 41 36 12 18 NA 28 23 19 8

Wie kombiniere ich zwei Datenrahmen basierend auf zwei Spalten?

Anzahl der Antworten 2 Antworten
Ich weiß, ich kann die plyr und seine Freunde kombinieren, dataframes, und merge als gut, aber so weit ich weiß nicht, wie zum Zusammenführen von zwei dataframes mit mehreren Spalten basierend auf 2 Spalten? Kommentar zu dem

Verketten Spalten in Apache Spark Dataframe

Anzahl der Antworten 10 Antworten
Wie wir concat 2 Spalten in ein dataframe? Gibt es irgendeine Funktion in spark sql, die wir verwenden können, um die concat-2 Spalten in einer df-Tabelle. Kommentar zu dem Problem Sie haben hier einige Antworten nur Fragen,

Verschiebe die Spalte nach Namen in Pandas vor die Tabelle

Anzahl der Antworten 3 Antworten
Hier ist mein df: Net Upper Lower Mid Zsore Answer option More than once a day 0% 0.22% -0.12% 2 65 Once a day 0% 0.32% -0.19% 3 45 Several times a week 2% 2.45% 1.10% 4

Verwenden von grep, um die Unterteilung eines Datenrahmens in R zu unterstützen

Anzahl der Antworten 1 Antworten
Ich habe Probleme beim subsetting meine Daten. Ich möchte die Daten subsetted auf Spalte x, wo die ersten 3 Zeichen beginnen, G45. Meine Daten Rahmen: x <- c("G448", "G459", "G479", "G406") y <- c(1:4) My.Data <- data.frame

Python Pandas flattern einen Datenrahmen zu einer Liste

Anzahl der Antworten 3 Antworten
Ich habe ein df-etwa so: import pandas a=[['1/2/2014', 'a', '6', 'z1'], ['1/2/2014', 'a', '3', 'z1'], ['1/3/2014', 'c', '1', 'x3'], ] df = pandas.DataFrame.from_records(a[1:],columns=a[0]) Möchte ich zum glätten der df, so ist es eine fortlaufende Liste in etwa

Speichern Sie Dataframe in CSV direkt in s3 Python

Anzahl der Antworten 5 Antworten
Habe ich ein pandas DataFrame, dass ich Sie hochladen möchten, zu einem neuen CVS-Datei. Das problem ist, dass ich nicht wollen, speichern Sie die Datei lokal vor der übertragung auf s3. Gibt es eine Methode wie to_csv

Python Pandas Dataframe: Anzahl der Spalten abrufen

Anzahl der Antworten 3 Antworten
Wie Sie programmgesteuert abrufen der Anzahl von Spalten in ein pandas dataframe? Ich hatte gehofft, für etwas wie: df.num_columns Kommentar zu dem Problem nicht für mich arbeiten. Kommentarautor: Ihor B. InformationsquelleAutor der Frage user1802143 | 2013-11-30

Fügen Sie eine neue Spalte in Pandas DataFrame Python hinzu

Anzahl der Antworten 1 Antworten
Habe ich dataframe in Pandas zum Beispiel: Col1 Col2 A 1 B 2 C 3 Nun, wenn ich möchte hinzufügen, eine weitere Spalte mit dem Namen Col3 und der Wert basiert auf Col2. In der Formel, wenn

Ändern Sie die Indexnummer eines Datenrahmens

Anzahl der Antworten 3 Antworten
Nachdem ich fertig bin mit einigen Manipulationen im Dataframe, bekam ich ein Ergebnis dataframe. Aber der index nicht ordnungsgemäß aufgelistet, wie unten beschrieben. MsgType/Cxr NoOfMsgs AvgElpsdTime(ms) 161 AM 86 30.13 171 CM 1 104 18 CO 27

datetime dtypes in Pandas read_csv

Anzahl der Antworten 4 Antworten
Bin ich beim Lesen in eine csv-Datei mit mehreren datetime-Spalten. Ich würde den Datentypen, die beim Lesen in der Datei, aber datetimes scheinen ein problem zu sein. Zum Beispiel: headers = ['col1', 'col2', 'col3', 'col4'] dtypes =

Drucken Sie eine Spalte des Datenrahmens mit Zeilennamen

Anzahl der Antworten 1 Antworten
Überlegen, einen Daten-frame mit custom-Zeile Namen: > data <- data.frame(a=1:3,b=2:4,c=3:5,row.names=c("x","y","z")) > data a b c x 1 2 3 y 2 3 4 z 3 4 5 Wenn ich " mehr als eine Spalte, R druckt Sie

Listenausgabe abgeschnitten - So erweitern Sie die aufgelisteten Variablen mit str () in R

Anzahl der Antworten 2 Antworten
Ich habe einen Daten.Rahmen df mit 600+ Variablen. Ich Schreibe eine Funktion, die automatisiert die Erstellung von Spalten und benötigen, um visuell überprüfen Sie Sie einmal. Den str - Funktion bietet eine gute Zusammenfassung: str(df) 'data.frame': 29

Können Pandas automatisch Daten erkennen?

Anzahl der Antworten 6 Antworten
Heute war ich positiv überrascht von der Tatsache, dass beim Lesen der Daten aus einer Daten-Datei (zum Beispiel) pandas ist in der Lage zu erkennen, Arten von Werten: df = pandas.read_csv('test.dat', delimiter=r"\s+", names=['col1','col2','col3']) Beispielsweise kann überprüft werden,

Wie berechnet man die Anzahl des Auftretens eines bestimmten Zeichens in jeder Zeile einer String-Spalte?

Anzahl der Antworten 8 Antworten
Ich habe einen Daten.Rahmen, in dem bestimmte Variablen enthalten einen text-string. Ich möchte die Anzahl der vorkommen eines bestimmten Zeichens in jeder einzelnen saite. Beispiel: q.data<-data.frame(number=1:3, string=c("greatgreat", "magic", "not")) Ich möchte erstellen Sie eine neue Spalte für

R- Warum werden Xs zu den Namen der Variablen in meinem Datenrahmen hinzugefügt?

Anzahl der Antworten 3 Antworten
Wenn ich den read.csv() Funktion in R um Daten zu laden, finde ich oft, dass ein X Hinzugefügt wurde, um Variablen-Namen. Ich denke, dass ich fast immer sehen, dass es es in der ersten Variablen, aber ich

Konstruieren Sie Pandas DataFrame aus Elementen im verschachtelten Wörterbuch

Anzahl der Antworten 2 Antworten
Angenommen ich habe ein verschachteltes dictionary 'user_dict' mit der Struktur: Ebene 1: Benutzer-Id (Long Integer) Ebene 2: Kategorie (String) Ebene 3: Verschiedene Attribute (floats, ints, usw..) Beispielsweise ein Eintrag in diesem Wörterbuch werden: user_dict[12] = { "Category

Pandas read_csv low_memory und dtype Optionen

Anzahl der Antworten 5 Antworten
Beim Aufruf df = pd.read_csv('somefile.csv') Bekomme ich: /Users/josh/anaconda/envs/py27/lib/python2.7/site-packages/pandas/io/Parser.py:1130: DtypeWarning: Spalten (4,5,7,16) mit gemischten Typen. Geben Sie "dtype" option für den import oder set low_memory=False. Warum ist die dtype option im Zusammenhang mit low_memory, und warum macht es

Extrahiere Spalte aus data.frame als Vektor

Anzahl der Antworten 1 Antworten
Ich bin neu in R. Ich habe Daten.Rahmen mit einer Spalte mit der Bezeichnung "Symbol". Symbol 1 "IDEA" 2 "PFC" 3 "RPL" 4 "SOBHA" Brauche ich zum speichern der Werte als Vektor(x = c("IDEA","PFC","RPL","SOBHA")). Was ist die

Wie kann ich XTS zu data.frame ändern und Index in R behalten?

Anzahl der Antworten 5 Antworten
Ich habe eine XTS-timeseries in R das folgende format, und versuche zu tun, einige Bearbeitung, Untergruppen und neu arrangieren, bevor der Export als CSV für die Arbeit in einem anderen Programm. head(master_1) S_1 2010-03-03 00:00:00 2.8520 2010-03-03

Wie man Datenrahmen ohne Index druckt

Anzahl der Antworten 3 Antworten
Will ich drucken Sie das ganze dataframe, aber ich don ' T wollen drucken Sie den index Außerdem eine Spalte ist datetime-Typ, ich will nur drucken, nicht Datum. Den dataframe aussieht: User ID Enter Time Activity Number

Spark DataFrames: registerTempTable vs nicht

Anzahl der Antworten 2 Antworten
Ich habe gerade angefangen mit DataFrame gestern und bin wirklich zu mögen es so weit. Ich verstehe nicht, eine Sache, aber... (Bezogen auf das Beispiel unter "Programmgesteuert Festlegen das Schema" hier: https://spark.apache.org/docs/latest/sql-programming-guide.html#programmatically-specifying-the-schema) In diesem Beispiel ist der

Verwenden von str.contains () in Pandas mit Datenrahmen

Anzahl der Antworten 1 Antworten
Frage ich mich, ob es eine effizientere Art und Weise zu benutzen, die str.contains () - Funktion in der Pandas, um die Suche für die zwei Teil-strings auf einmal. Ich möchte die Suche nach einer bestimmten Spalte

Ändern Sie den Datentyp von Spalten in Pandas

Anzahl der Antworten 5 Antworten
Will ich konvertieren einer Tabelle, dargestellt als Liste von Listen, in ein Pandas DataFrame. Als ein extrem Vereinfachtes Beispiel: a = [['a', '1.2', '4.2'], ['b', '70', '0.03'], ['x', '5', '0']] df = pd.DataFrame(a) Was ist der beste

Pandas Dataframe: Drop Spalten, deren Name eine bestimmte Zeichenfolge enthält

Anzahl der Antworten 4 Antworten
Habe ich ein pandas dataframe mit den folgenden Spaltennamen: Ergebnis1, Test1, Ergebnis2, "Test2", Result3, "Test3", etc... Möchte ich drop alle Spalten, deren name das Wort enthält "Test". Die Zahl der Spalten ist nicht statisch, sondern hängt von

Wie erstelle ich Test- und Trainingsbeispiele aus einem Datenrahmen mit Pandas?

Anzahl der Antworten 15 Antworten
Ich habe einen ziemlich großen Datensatz in form eines dataframe und ich Frage mich, wie ich in der Lage wäre die Spaltung des dataframe in zwei Stichproben (80% und 20%) für die Ausbildung und Prüfung. Dank! InformationsquelleAutor

Wie summiere ich Werte in einer Spalte, die einer bestimmten Bedingung mit Pandas entsprechen?

Anzahl der Antworten 1 Antworten
Angenommen ich habe eine Spalte in etwa so: a b 1 5 1 7 2 3 1 3 2 5 Möchte ich die Summe der Werte für b wo a = 1 zum Beispiel. Dies würde mir

Wie fügt man einen einfachen data.frame an einen SpatialPolygonDataFrame in R an?

Anzahl der Antworten 5 Antworten
Habe ich (mal wieder) ein problem mit der Kombination von Daten-frames in R. Aber dieses mal, ist man ein SpatialPolygonDataFrame (SPDF) und der andere ist üblichen Daten.Rahmen (DF). Die SPDF hat etwa 1000 Zeilen die DF nur

Berechnen Sie zusammenfassende Statistiken von Spalten im Datenrahmen

Anzahl der Antworten 3 Antworten
Ich habe einen dataframe der folgenden form (Beispiel) shopper_num,is_martian,number_of_items,count_pineapples,birth_country,tranpsortation_method 1,FALSE,0,0,MX, 2,FALSE,1,0,MX, 3,FALSE,0,0,MX, 4,FALSE,22,0,MX, 5,FALSE,0,0,MX, 6,FALSE,0,0,MX, 7,FALSE,5,0,MX, 8,FALSE,0,0,MX, 9,FALSE,4,0,MX, 10,FALSE,2,0,MX, 11,FALSE,0,0,MX, 12,FALSE,13,0,MX, 13,FALSE,0,0,CA, 14,FALSE,0,0,US, Wie kann ich mit Pandas zu berechnen zusammenfassende Statistiken jeder Spalte (Spalte-Daten-Arten sind variabel,

Ordnen Sie Datenrahmenzeilen nach Vektor mit spezifischer Reihenfolge an

Anzahl der Antworten 3 Antworten
Gibt es ein einfacher Weg, um sicherzustellen, dass ein Daten-frame die Zeilen sind sortiert nach einem "target" - Vektor als die, die ich umgesetzt in das kurze Beispiel unten? df <- data.frame(name = letters[1:4], value = c(rep(TRUE,

Konvertieren von Zeilennamen in die erste Spalte

Anzahl der Antworten 4 Antworten
Habe ich einen Daten-frame, wie dies: df VALUE ABS_CALL DETECTION P-VALUE 1007_s_at "957.729231881542" "P" "0.00486279317241156" 1053_at "320.632701283368" "P" "0.0313356324173416" 117_at "429.842323161046" "P" "0.0170004527476119" 121_at "2395.7364289242" "P" "0.0114473584876183" 1255_g_at "116.493632746934" "A" "0.39799368200131" 1294_at "739.927122116896" "A" "0.0668649772942343" Ich möchten,

Python Pandas: Wie bekomme ich die Zeilennamen vom Index eines Datenrahmens?

Anzahl der Antworten 4 Antworten
So an ich habe ein dataframe mit rownames, dass nicht eine Spalte Ihrer eigenen per se, wie die folgenden: X Y Row 1 0 5 Row 2 8 1 Row 3 3 0 Wie würde ich diese

Einen Datenrahmen transponieren, wobei die erste Spalte als Überschrift beibehalten wird

Anzahl der Antworten 3 Antworten
Ich habe eine große dataframe, aber ein kleines Beispiel würde wie folgt Aussehen: mydf <- data.frame(A = c(letters[1:10]), M1 = c(11:20), M2 = c(31:40), M3 = c(41:50)) Ich soll zur Umsetzung des dataframe und pflegen Sie die

Aktualisieren Sie einen Datenrahmen in Pandas, während Sie Zeile für Zeile wiederholen

Anzahl der Antworten 6 Antworten
Habe ich ein Pandabären-Daten-frame, das aussieht wie dieses (eine ziemlich große) date exer exp ifor mat 1092 2014-03-17 American M 528.205 2014-04-19 1093 2014-03-17 American M 528.205 2014-04-19 1094 2014-03-17 American M 528.205 2014-04-19 1095 2014-03-17 American

Entfernen Sie Spalten aus dem Datenframe, wenn ALLE Werte NA sind

Anzahl der Antworten 6 Antworten
Ich habe Probleme mit einem Daten-frame und konnte nicht wirklich beheben, das Problem selbst: Die dataframe beliebig Eigenschaften als Spalten und jede Zeile für eine Daten. Die Frage ist: Wie auf entfernen von Spalten, in denen für