Tag: dataframe

Ein data frame ist eine tabellarische Datenstruktur. In der Regel enthält es Daten, in denen Zeilen sind Beobachtungen und die Spalten sind Variablen der verschiedenen Typen. Während „data frame“ oder „dataframe“ ist der Begriff für dieses Konzept in mehreren Sprachen (R, Apache Spark, deedle, Ahorn, die pandas-Bibliothek in Python und die DataFrames library in Julia), „Tabelle“ ist der Begriff in MATLAB und SQL.

Verwandle Pandas Multi-Index in eine Spalte

2 Antworten

Ich habe einen dataframe mit 2 index-Ebenen: value Trial measurement 1 0 13 1 3 2 4 2 0 NaN 1 12 3 0 34 Welche ich möchte in diese: Trial measurement value 1 0 13 1

In R, wie kann ich prozentuale Statistiken für eine Spalte in einem Datenrahmen berechnen? (Tabellenfunktion um Prozent erweitert)

4 Antworten

Dies ist eine einfache Frage, aber ich konnte nicht herausfinden, wie zu verwenden prop.Tabelle für dieses und ich brauche diese Funktion sehr, sehr oft. Habe ich Daten wie diese > library(ggplot2) > #sample data > head(tips,3) total_bill

dataframe r

Entfernen Sie eine vollständige Spalte aus einem data.frame in R

5 Antworten

Weiß jemand, wie man entfernen Sie eine ganze Spalte aus einer Datenbank.frame in R? Zum Beispiel, wenn ich diese Daten.Rahmen: > head(data) chr genome region 1 chr1 hg19_refGene CDS 2 chr1 hg19_refGene exon 3 chr1 hg19_refGene CDS

dataframe r

Wie man über Zeilen in einem DataFrame in Pandas iteriert?

12 Antworten

Ich habe eine DataFrames von pandas: import pandas as pd inp = [{'c1':10, 'c2':100}, {'c1':11,'c2':110}, {'c1':12,'c2':120}] df = pd.DataFrame(inp) print df Ausgabe: c1 c2 0 10 100 1 11 110 2 12 120 Möchte ich nun iteriert

dataframe pandas python rows

Nicht definierte Spalten werden ausgewählt, wenn der Datenrahmen untergeordnet wird

1 Antworten

Habe ich einen Daten-frame, str(data) zu zeigen, mehr über meine Daten-frame das Ergebnis ist die folgende: > str(data) 'data.frame': 153 obs. of 6 variables: $ Ozone : int 41 36 12 18 NA 28 23 19 8

dataframe r subset

Wie kombiniere ich zwei Datenrahmen basierend auf zwei Spalten?

2 Antworten

Ich weiß, ich kann die plyr und seine Freunde kombinieren, dataframes, und merge als gut, aber so weit ich weiß nicht, wie zum Zusammenführen von zwei dataframes mit mehreren Spalten basierend auf 2 Spalten? Kommentar zu dem

dataframe merge r

Verketten Spalten in Apache Spark Dataframe

10 Antworten

Wie wir concat 2 Spalten in ein dataframe? Gibt es irgendeine Funktion in spark sql, die wir verwenden können, um die concat-2 Spalten in einer df-Tabelle. Kommentar zu dem Problem Sie haben hier einige Antworten nur Fragen,

apache-spark dataframe spark-dataframe

Verschiebe die Spalte nach Namen in Pandas vor die Tabelle

3 Antworten

Hier ist mein df: Net Upper Lower Mid Zsore Answer option More than once a day 0% 0.22% -0.12% 2 65 Once a day 0% 0.32% -0.19% 3 45 Several times a week 2% 2.45% 1.10% 4

dataframe move pandas python shift

Verwenden von grep, um die Unterteilung eines Datenrahmens in R zu unterstützen

1 Antworten

Ich habe Probleme beim subsetting meine Daten. Ich möchte die Daten subsetted auf Spalte x, wo die ersten 3 Zeichen beginnen, G45. Meine Daten Rahmen: x <- c("G448", "G459", "G479", "G406") y <- c(1:4) My.Data <- data.frame

dataframe grep r subset

Python Pandas flattern einen Datenrahmen zu einer Liste

3 Antworten

Ich habe ein df-etwa so: import pandas a=[['1/2/2014', 'a', '6', 'z1'], ['1/2/2014', 'a', '3', 'z1'], ['1/3/2014', 'c', '1', 'x3'], ] df = pandas.DataFrame.from_records(a[1:],columns=a[0]) Möchte ich zum glätten der df, so ist es eine fortlaufende Liste in etwa

dataframe list numpy pandas python

Speichern Sie Dataframe in CSV direkt in s3 Python

5 Antworten

Habe ich ein pandas DataFrame, dass ich Sie hochladen möchten, zu einem neuen CVS-Datei. Das problem ist, dass ich nicht wollen, speichern Sie die Datei lokal vor der übertragung auf s3. Gibt es eine Methode wie to_csv

amazon-s3 boto3 csv dataframe python

Python Pandas Dataframe: Anzahl der Spalten abrufen

3 Antworten

Wie Sie programmgesteuert abrufen der Anzahl von Spalten in ein pandas dataframe? Ich hatte gehofft, für etwas wie: df.num_columns Kommentar zu dem Problem nicht für mich arbeiten. Kommentarautor: Ihor B. InformationsquelleAutor der Frage user1802143 | 2013-11-30

dataframe pandas python

Fügen Sie eine neue Spalte in Pandas DataFrame Python hinzu

1 Antworten

Habe ich dataframe in Pandas zum Beispiel: Col1 Col2 A 1 B 2 C 3 Nun, wenn ich möchte hinzufügen, eine weitere Spalte mit dem Namen Col3 und der Wert basiert auf Col2. In der Formel, wenn

dataframe pandas python

Ändern Sie die Indexnummer eines Datenrahmens

3 Antworten

Nachdem ich fertig bin mit einigen Manipulationen im Dataframe, bekam ich ein Ergebnis dataframe. Aber der index nicht ordnungsgemäß aufgelistet, wie unten beschrieben. MsgType/Cxr NoOfMsgs AvgElpsdTime(ms) 161 AM 86 30.13 171 CM 1 104 18 CO 27

dataframe r

datetime dtypes in Pandas read_csv

4 Antworten

Bin ich beim Lesen in eine csv-Datei mit mehreren datetime-Spalten. Ich würde den Datentypen, die beim Lesen in der Datei, aber datetimes scheinen ein problem zu sein. Zum Beispiel: headers = ['col1', 'col2', 'col3', 'col4'] dtypes =

csv dataframe datetime pandas python

Drucken Sie eine Spalte des Datenrahmens mit Zeilennamen

1 Antworten

Überlegen, einen Daten-frame mit custom-Zeile Namen: > data <- data.frame(a=1:3,b=2:4,c=3:5,row.names=c("x","y","z")) > data a b c x 1 2 3 y 2 3 4 z 3 4 5 Wenn ich " mehr als eine Spalte, R druckt Sie

dataframe r

Listenausgabe abgeschnitten - So erweitern Sie die aufgelisteten Variablen mit str () in R

2 Antworten

Ich habe einen Daten.Rahmen df mit 600+ Variablen. Ich Schreibe eine Funktion, die automatisiert die Erstellung von Spalten und benötigen, um visuell überprüfen Sie Sie einmal. Den str - Funktion bietet eine gute Zusammenfassung: str(df) 'data.frame': 29

dataframe output r truncated

Können Pandas automatisch Daten erkennen?

6 Antworten

Heute war ich positiv überrascht von der Tatsache, dass beim Lesen der Daten aus einer Daten-Datei (zum Beispiel) pandas ist in der Lage zu erkennen, Arten von Werten: df = pandas.read_csv('test.dat', delimiter=r"\s+", names=['col1','col2','col3']) Beispielsweise kann überprüft werden,

dataframe date pandas python types

Wie berechnet man die Anzahl des Auftretens eines bestimmten Zeichens in jeder Zeile einer String-Spalte?

8 Antworten

Ich habe einen Daten.Rahmen, in dem bestimmte Variablen enthalten einen text-string. Ich möchte die Anzahl der vorkommen eines bestimmten Zeichens in jeder einzelnen saite. Beispiel: q.data<-data.frame(number=1:3, string=c("greatgreat", "magic", "not")) Ich möchte erstellen Sie eine neue Spalte für

dataframe r regex

R- Warum werden Xs zu den Namen der Variablen in meinem Datenrahmen hinzugefügt?

3 Antworten

Wenn ich den read.csv() Funktion in R um Daten zu laden, finde ich oft, dass ein X Hinzugefügt wurde, um Variablen-Namen. Ich denke, dass ich fast immer sehen, dass es es in der ersten Variablen, aber ich

dataframe r

Konstruieren Sie Pandas DataFrame aus Elementen im verschachtelten Wörterbuch

2 Antworten

Angenommen ich habe ein verschachteltes dictionary 'user_dict' mit der Struktur: Ebene 1: Benutzer-Id (Long Integer) Ebene 2: Kategorie (String) Ebene 3: Verschiedene Attribute (floats, ints, usw..) Beispielsweise ein Eintrag in diesem Wörterbuch werden: user_dict[12] = { "Category

dataframe pandas python

Pandas read_csv low_memory und dtype Optionen

5 Antworten

Beim Aufruf df = pd.read_csv('somefile.csv') Bekomme ich: /Users/josh/anaconda/envs/py27/lib/python2.7/site-packages/pandas/io/Parser.py:1130: DtypeWarning: Spalten (4,5,7,16) mit gemischten Typen. Geben Sie "dtype" option für den import oder set low_memory=False. Warum ist die dtype option im Zusammenhang mit low_memory, und warum macht es

dataframe numpy pandas parsing python

Extrahiere Spalte aus data.frame als Vektor

1 Antworten

Ich bin neu in R. Ich habe Daten.Rahmen mit einer Spalte mit der Bezeichnung "Symbol". Symbol 1 "IDEA" 2 "PFC" 3 "RPL" 4 "SOBHA" Brauche ich zum speichern der Werte als Vektor(x = c("IDEA","PFC","RPL","SOBHA")). Was ist die

dataframe r vector

Wie kann ich XTS zu data.frame ändern und Index in R behalten?

5 Antworten

Ich habe eine XTS-timeseries in R das folgende format, und versuche zu tun, einige Bearbeitung, Untergruppen und neu arrangieren, bevor der Export als CSV für die Arbeit in einem anderen Programm. head(master_1) S_1 2010-03-03 00:00:00 2.8520 2010-03-03

dataframe r time xts

Wie man Datenrahmen ohne Index druckt

3 Antworten

Will ich drucken Sie das ganze dataframe, aber ich don ' T wollen drucken Sie den index Außerdem eine Spalte ist datetime-Typ, ich will nur drucken, nicht Datum. Den dataframe aussieht: User ID Enter Time Activity Number

dataframe datetime pandas python

Spark DataFrames: registerTempTable vs nicht

2 Antworten

Ich habe gerade angefangen mit DataFrame gestern und bin wirklich zu mögen es so weit. Ich verstehe nicht, eine Sache, aber... (Bezogen auf das Beispiel unter "Programmgesteuert Festlegen das Schema" hier: https://spark.apache.org/docs/latest/sql-programming-guide.html#programmatically-specifying-the-schema) In diesem Beispiel ist der

apache-spark dataframe

Verwenden von str.contains () in Pandas mit Datenrahmen

1 Antworten

Frage ich mich, ob es eine effizientere Art und Weise zu benutzen, die str.contains () - Funktion in der Pandas, um die Suche für die zwei Teil-strings auf einmal. Ich möchte die Suche nach einer bestimmten Spalte

dataframe pandas performance python string

Ändern Sie den Datentyp von Spalten in Pandas

5 Antworten

Will ich konvertieren einer Tabelle, dargestellt als Liste von Listen, in ein Pandas DataFrame. Als ein extrem Vereinfachtes Beispiel: a = [['a', '1.2', '4.2'], ['b', '70', '0.03'], ['x', '5', '0']] df = pd.DataFrame(a) Was ist der beste

casting dataframe pandas python types

Pandas Dataframe: Drop Spalten, deren Name eine bestimmte Zeichenfolge enthält

4 Antworten

Habe ich ein pandas dataframe mit den folgenden Spaltennamen: Ergebnis1, Test1, Ergebnis2, "Test2", Result3, "Test3", etc... Möchte ich drop alle Spalten, deren name das Wort enthält "Test". Die Zahl der Spalten ist nicht statisch, sondern hängt von

dataframe pandas python

Wie erstelle ich Test- und Trainingsbeispiele aus einem Datenrahmen mit Pandas?

15 Antworten

Ich habe einen ziemlich großen Datensatz in form eines dataframe und ich Frage mich, wie ich in der Lage wäre die Spaltung des dataframe in zwei Stichproben (80% und 20%) für die Ausbildung und Prüfung. Dank! InformationsquelleAutor

dataframe pandas python python-2.7

Wie summiere ich Werte in einer Spalte, die einer bestimmten Bedingung mit Pandas entsprechen?

1 Antworten

Angenommen ich habe eine Spalte in etwa so: a b 1 5 1 7 2 3 1 3 2 5 Möchte ich die Summe der Werte für b wo a = 1 zum Beispiel. Dies würde mir

data-analysis dataframe pandas python

Wie fügt man einen einfachen data.frame an einen SpatialPolygonDataFrame in R an?

5 Antworten

Habe ich (mal wieder) ein problem mit der Kombination von Daten-frames in R. Aber dieses mal, ist man ein SpatialPolygonDataFrame (SPDF) und der andere ist üblichen Daten.Rahmen (DF). Die SPDF hat etwa 1000 Zeilen die DF nur

dataframe merge polygon r spatial

Berechnen Sie zusammenfassende Statistiken von Spalten im Datenrahmen

3 Antworten

Ich habe einen dataframe der folgenden form (Beispiel) shopper_num,is_martian,number_of_items,count_pineapples,birth_country,tranpsortation_method 1,FALSE,0,0,MX, 2,FALSE,1,0,MX, 3,FALSE,0,0,MX, 4,FALSE,22,0,MX, 5,FALSE,0,0,MX, 6,FALSE,0,0,MX, 7,FALSE,5,0,MX, 8,FALSE,0,0,MX, 9,FALSE,4,0,MX, 10,FALSE,2,0,MX, 11,FALSE,0,0,MX, 12,FALSE,13,0,MX, 13,FALSE,0,0,CA, 14,FALSE,0,0,US, Wie kann ich mit Pandas zu berechnen zusammenfassende Statistiken jeder Spalte (Spalte-Daten-Arten sind variabel,

csv dataframe pandas python

Ordnen Sie Datenrahmenzeilen nach Vektor mit spezifischer Reihenfolge an

3 Antworten

Gibt es ein einfacher Weg, um sicherzustellen, dass ein Daten-frame die Zeilen sind sortiert nach einem "target" - Vektor als die, die ich umgesetzt in das kurze Beispiel unten? df <- data.frame(name = letters[1:4], value = c(rep(TRUE,

dataframe order r sorting

Konvertieren von Zeilennamen in die erste Spalte

4 Antworten

Habe ich einen Daten-frame, wie dies: df VALUE ABS_CALL DETECTION P-VALUE 1007_s_at "957.729231881542" "P" "0.00486279317241156" 1053_at "320.632701283368" "P" "0.0313356324173416" 117_at "429.842323161046" "P" "0.0170004527476119" 121_at "2395.7364289242" "P" "0.0114473584876183" 1255_g_at "116.493632746934" "A" "0.39799368200131" 1294_at "739.927122116896" "A" "0.0668649772942343" Ich möchten,

col dataframe r rowname

Python Pandas: Wie bekomme ich die Zeilennamen vom Index eines Datenrahmens?

4 Antworten

So an ich habe ein dataframe mit rownames, dass nicht eine Spalte Ihrer eigenen per se, wie die folgenden: X Y Row 1 0 5 Row 2 8 1 Row 3 3 0 Wie würde ich diese

dataframe pandas python

Einen Datenrahmen transponieren, wobei die erste Spalte als Überschrift beibehalten wird

3 Antworten

Ich habe eine große dataframe, aber ein kleines Beispiel würde wie folgt Aussehen: mydf <- data.frame(A = c(letters[1:10]), M1 = c(11:20), M2 = c(31:40), M3 = c(41:50)) Ich soll zur Umsetzung des dataframe und pflegen Sie die

dataframe r transpose

Aktualisieren Sie einen Datenrahmen in Pandas, während Sie Zeile für Zeile wiederholen

6 Antworten

Habe ich ein Pandabären-Daten-frame, das aussieht wie dieses (eine ziemlich große) date exer exp ifor mat 1092 2014-03-17 American M 528.205 2014-04-19 1093 2014-03-17 American M 528.205 2014-04-19 1094 2014-03-17 American M 528.205 2014-04-19 1095 2014-03-17 American

dataframe pandas python updates

Entfernen Sie Spalten aus dem Datenframe, wenn ALLE Werte NA sind

6 Antworten

Ich habe Probleme mit einem Daten-frame und konnte nicht wirklich beheben, das Problem selbst: Die dataframe beliebig Eigenschaften als Spalten und jede Zeile für eine Daten. Die Frage ist: Wie auf entfernen von Spalten, in denen für

apply dataframe r