Tag: aggregate
Aggregat bezieht sich auf den Prozess der Verdichtung von gruppierten Daten, die Häufig in der Statistik verwendet wird.
2
Antworten
Habe ich einen Daten-frame ModelDF mit Spalten mit numerischen als auch die Charakter-Werte wie: Quantity Type Mode Company 1 Shoe hello Nike 1 Shoe hello Nike 2 Jeans hello Levis 3 Shoe hello Nike 1 Jeans hello
2
Antworten
Ich würde gerne wählen Sie nur die Zeilen, wo die Anzahl größer als 1 ist (in anderen Worten, die Duplikate) jetzt von ein paar tausend Schallplatten, die ich am meisten sehen, 1s mit ein paar 2s und
4
Antworten
Ich habe ein Linq-Sammlung von Things, wo Thing hat eine Amount (dezimal) - Eigenschaft. Ich versuche zu tun, ein Aggregat auf dieser für eine gewisse Teilmenge der Dinge: var total = myThings.Sum(t => t.Amount); ... und das
3
Antworten
Ich versuche zu verstehen sagen, und mittlerweile habe ich eine bestimmte Art und Weise denken Sie - aber ich bin nicht sicher, ob ich die Idee richtig. Daher würde ich mag zu erarbeiten und andere haben, sagen
2
Antworten
Tabelle wie ID | Name | City 1 | X | Y 2 | Z | Y 3 | W | K Will ich ein Ergebnis wie ID | Description 1 | Y (X, Z) 3 |
1
Antworten
Kontext und den aktuellen Stand Sind wir die Migration unserer cluster von Cassandra zu einem vollen ElasticSearch-cluster. Wir sind der Indizierung von Dokumenten auf durchschnittlich ~250-300 docs pro Sekunden. In ElasticSearch 1.2.0 stellt es ~8Go pro Tag.
3
Antworten
Ich habe folgende Tabelle in access: entity ratingA ratingB ratingC XYZ 0-100 0-100 0-100 ABC 0-100 0-100 0-100 Ich brauche, um eine Abfrage zu tun, einige einfache Aggregatfunktionen (SUM, MAX, AVE) von 3 Spalten für jede Entität
4
Antworten
Habe ich schon versucht zu aggregieren (etwas unregelmäßig) tägliche Daten. Ich bin eigentlich der Arbeit mit csv-Daten, aber wenn ich es neu - es würde in etwa so Aussehen: library(zoo) dates <- c("20100505", "20100505", "20100506", "20100507") val1
1
Antworten
Habe ich einen Daten-frame, das aussieht wie dieses: Chr start stop ref alt Hom/het ID chr1 5179574 5183384 ref Del Het 719 chr1 5179574 5184738 ref Del Het 915 chr1 5179574 5184738 ref Del Het 951 chr1
4
Antworten
Ich habe Daten aus zwei Spalten. In einer Spalte Datum und in einer anderen Spalte es fließen Daten. War ich in der Lage, die Daten zu Lesen wie Sie Datum und flow-Daten. Ich verwendete den folgenden code:
5
Antworten
Ich habe eine Tabelle die in etwa folgende Struktur Beispiel: DateTime V1 V2 V3 V4 10/10/10 12:10:00 71 24 33 40 10/10/10 12:00:00 75 22 44 12 10/10/10 12:30:00 44 21 44 33 10/10/10 12:20:00 80 11
1
Antworten
Habe ich einen Daten-frame, die ich brauche, um pivot-aber der Daten-frame hat doppelte IDS, so spread Funktion gibt einen Fehler Error: Duplicate identifiers for rows (5, 6) Dimension = c("A","A","B","B","A","A") Date = c("Mon","Tue","Mon","Wed","Fri","Fri") Metric = c(23,25,7,9,7,8) df
2
Antworten
Davon ausgehen, eine timeseries ts-Frequenz(ts) = 52: Time Series: Start = c(2010, 34) End = c(2013, 25) Frequency = 52 ... Ich will Aggregat ts, so dass die Frequenz(ts) = 12. Wenn die neue Frequenz teilt die
1
Antworten
Ich habe einige Daten wie unten - id, fn, ln, logdate 1, Rob, Hep, 01-04-2010 2, Rob, Hep, 09-04-2010 3, Rob, Hep, 10-10-2012 4, Rob, Hep, 01-12-2009 5, Peter, Cheng, 02-10-2010 6, bob, Pen, 05-10-2009 7, Peter,
1
Antworten
Ich Probleme mit dem Auffüllen auf die "Haupt" - Sammlung, Gruppierung funktioniert ziemlich gut, aber ich weiß wirklich nicht, wie zu Auffüllen oder sogar .nach der Aggregation. Ich glaube, ich bin ein Model-casting hier oder so: Main.aggregate([
2
Antworten
Ich hoffe mir kann jemand helfen, meine syntax hier. Ich habe zwei Tabellen ansicache..encounters und ansicache..x_refclaim_Table Den encounters Tisch hat eine encounter Spalte, entspricht die patacctnumber Spalte in der x_refclaim_table. Manchmal wird jedoch der patacctnumber zeigen können,
4
Antworten
Habe ich eine lange Reihe von täglichen Daten und 101 Spalten. Jeden Monat möchte ich die Berechnung der cov von jedem der ersten 100 Spalten mit der 101st Spalte. Dies würde die Generierung eines monatlichen Kovarianz mit
2
Antworten
Ich habe einen dataframe, der wie folgt aussieht: >>> df[['data','category']] Out[47]: data category 0 4610 2 15 4610 2 22 5307 7 23 5307 7 25 5307 7 ... ... ... Daten und Kategorie sind numerisch, so
2
Antworten
Ich war die Fehlersuche ein paar langsame SQL-Abfragen heute und verstehe nicht ganz den Unterschied in der Leistung unten: Beim extrahieren der max(timestamp) aus einer Daten-Tabelle, basierend auf einer Bedingung, mit MAX() ist langsamer als ORDER BY
3
Antworten
Habe ich mehrere SQL-Abfragen geschrieben, dass ich konvertieren möchten, relationale algebra. Jedoch, einige der Abfragen verwenden, Aggregat-Operatoren, und ich weiß nicht, wie Sie zu bekehren. Insbesondere verwenden Sie COUNT und GROUP BY.. MIT-Betreiber. Hier ist das schema:
2
Antworten
Habe ich das folgende Beispiel data.table: dtb <- data.table(a=sample(1:100,100), b=sample(1:100,100), id=rep(1:10,10)) Möchte ich Aggregatfunktionen alle Spalten (a und b, obwohl Sie getrennt werden sollten) von id mit colSums zum Beispiel. Was ist der richtige Weg, dies zu
3
Antworten
Ich bin mit PostgreSQL 9.1 und ich habe diese Daten Struktur: A B ------- 1 a 1 a 1 b 1 c 1 c 1 c 1 d 2 e 2 e Brauche ich eine Abfrage, führt
5
Antworten
Habe ich geerbt den folgenden DB-design. Tabellen sind: customers --------- customerid customernumber invoices -------- invoiceid amount invoicepayments --------------- invoicepaymentid invoiceid paymentid payments -------- paymentid customerid amount Meine Abfrage zurückgeben muss, invoiceid, ist der Rechnungsbetrag (in der Tabelle
4
Antworten
Habe ich einen Daten-frame, das aussieht wie: df<-data.frame(id=c("xx33","xx33","xx22","xx11","xx11","xx00"),amount=c(10,15,100,20,10,15),date=c("01/02/2013","01/02/2013","02/02/2013","03/03/2013","03/03/2013","04/04/2013")) id amount date 1 xx33 10 01/02/2013 2 xx33 15 01/02/2013 3 xx22 100 02/02/2013 4 xx11 20 03/03/2013 5 xx11 10 03/03/2013 6 xx00 15 04/04/2013 Will ich
5
Antworten
Gibt es eine Möglichkeit, dies zu tun mit linq-ohne Aufzählung der fooCollection zweimal? var fooCollection = //get foo var selectedIds = new List<int>(); var aggregateContent = String.Empty; foreach (var f in foo) { selectedIds.Add(foo.Id); aggregateContent += foo.Content
4
Antworten
Ich weiß, es ist ein einfacher Weg, dies zu tun...aber, ich kann ' T es herausfinden. Ich habe einen dataframe in mein R-Skript, das ungefähr so aussieht: A B C 1.2 4 8 2.3 4 9 2.3
2
Antworten
Beim gruppieren, ng-raster erstellt gruppenzeile(s), die Aussehen und Verhalten sich anders als normale Zeilen. Insbesondere, Gruppe Zeilen werden nicht angezeigt, regelmäßigen Spalten, aber die Anzeige einer einzigen zusammengeführten Zeile, definiert durch den aggregateTemplate. Was ich versuche zu
4
Antworten
Also ich habe einen Daten-frame, der hat eine Spalte Datum, eine Stunde, Spalte und eine Reihe von anderen numerischen Spalten. Jede Zeile in der Daten-frame ist 1 Stunde 1 Tag für ein ganzes Jahr. Den Daten-frame sieht
1
Antworten
Ich bin ein Anfänger in C#. Ich habe ein Wörterbuch wie dieses : { {"tom", "student"}, {"rob", "teacher"}, {"david", "lawyer"} } Möchte ich, um diese Zeile : tom = student, rob = teacher, david = lawyer Will
2
Antworten
Ich aggregierten meine Pandas dataframe: data. Speziell, ich will den Durchschnitt und die Summe amounts durch Tupel von [origin und type]. Für die Mittelung und Summierung versuchte ich die numpy-Funktionen im folgenden: import numpy as np import
4
Antworten
Ich kann nicht herausfinden, wie dies zu tun. Ich habe einen Daten.frame in R. sieht Es so aus: Scores <- read.table(text = " ID Test1 Test2 Test3 Final 1 Student1 20 23 21 48 2 Student2 16
3
Antworten
Schaute ich mir die Hilfe-Seite für die aggregate Funktion in R. hatte ich nie benutzt, diese Komfort-Funktion aber ich habe einen Prozess sollte es mir helfen, zu beschleunigen. Ich habe allerdings absolut nicht in der Lage, zu
5
Antworten
Ich habe frequentiert genutzt pandas' agg() - Funktion, die Zusammenfassung der Statistiken über jeder Spalte mit Daten.frame. Zum Beispiel, hier ist, wie Sie produzieren würde, der Mittelwert und die Standardabweichung: df = pd.DataFrame({'A': ['group1', 'group1', 'group2', 'group2',
7
Antworten
Dies ist die Antwort auf eine Frage an die r-help mailing Liste. Hier sind viel Beispiele , wie zu finden top-Werte von der Gruppe mit sql, so Stelle ich mir es ist leicht zu konvertieren, dass das
1
Antworten
Möchte ich zählen und Summe(sum) eine Spalte in einer data.table, und konnte nicht finden, dass der effizienteste Weg, dies zu tun. Dies scheint nahe zu sein, was ich will R Zusammenfassung mehrere Spalten mit Daten.Tabelle. Meine Daten:
4
Antworten
Ich habe eine Liste, in der jeder Wert ist eine Liste von Tupeln. zum Beispiel ist dies der Wert, den ich extrahieren, die für einen Schlüssel : [('1998-01-20',8) , ('1998-01-22',4) , ('1998-06-18',8 ) , ('1999-07-15' , 7),
5
Antworten
Habe ich Folgendes dataframe (df1): ID someText PSM OtherValues ABC c 2 qwe CCC v 3 wer DDD b 56 ert EEE m 78 yu FFF sw 1 io GGG e 90 gv CCC r 34 scf
1
Antworten
Hallo und danke im Voraus für Eure Hilfe, (BITTE Beachten Sie die Kommentare Abschnitt für zusätzliche Einblicke: d.h. die Kosten-Spalte im Beispiel unten wurde Hinzugefügt, um diese Frage; Simon, bietet eine große Antwort, aber die Kosten-Spalte selbst
7
Antworten
Ich bin versucht zu haben, einen Laufenden Durchschnitt der Spalte in der SELECT-Anweisung basiert auf eine Spalte aus den n vorherigen Zeilen in der gleichen SELECT-Anweisung. Die Durchschnitt ich brauche, ist auf der Grundlage der n vorherigen
3
Antworten
Habe ich einen Daten-frame, wie dies: id no age 1 1 7 23 2 1 2 23 3 2 1 25 4 2 4 25 5 3 6 23 6 3 1 23 und ich hoffe, dass
3
Antworten
Ich bin auf der Suche nach einem Toten einfaches Beispiel zur Verwendung aggregate und berechnen bedeutet in R. Sagen, ich habe die folgenden Daten Rahmen: A B 100 85 200 95 300 110 400 105 Und ich
1
Antworten
Habe ich folgende Daten eingestellt: > str(e.2015.1990) 'data.frame': 4813807 obs. of 42 variables: $ GAME.ID : Factor w/ 60464 levels "ANA201504100",..: 1 1 1 1 1 1 1 1 1 1 ... $ INNING : num 1
4
Antworten
Ich versuche zu tun, einige Aggregationen auf eines pandas-Daten-frame. Hier ist ein Beispiel-code: import pandas as pd df = pd.DataFrame({"User": ["user1", "user2", "user2", "user3", "user2", "user1"], "Amount": [10.0, 5.0, 8.0, 10.5, 7.5, 8.0]}) df.groupby(["User"]).agg({"Amount": {"Sum": "sum", "Count":
2
Antworten
Derzeit arbeite ich viel mit DDD und ich bin vor ein problem beim laden/Betrieb auf die gesamtwirtschaftliche Wurzeln aus anderen Aggregat Wurzeln. Für jede Aggregat-Wurzel in meinem Modell, ich habe auch ein repository. Das repository ist verantwortlich
1
Antworten
Ich würde gerne die äquivalent zu der folgenden, aber mit Daten.Tabelle "durch": dt <- data.table(V1=rnorm(100), V2=rnorm(100), V3=rnorm(100), ... group=rbinom(100,2,.5)) dt.agg <- aggregate(dt, by=list(dt$group), FUN=mean) Ich weiß, dass ich dies tun könnte: dt.agg <- dt[, list(V1=mean(V1), V2=mean(V2), V3=mean(V3)),
9
Antworten
Sagen, dass ich eine data.frame Objekt: df <- data.frame(name=c('black','black','black','red','red'), type=c('chair','chair','sofa','sofa','plate'), num=c(4,5,12,4,3)) Nun möchte ich die Anzahl der Beobachtungen für jede Kombination von name und type. Diese kann getan werden, etwa so: table(df[ , c("name","type")]) bzw. evtl. auch
4
Antworten
Möchte ich (1) - Gruppe-Daten von einer variable (State), (2) innerhalb jeder Gruppe finden, die die Reihe von minimum-Wert der anderen variable (Employees), und (3) extrahieren Sie die gesamte Zeile. (1) und (2) sind einfache Einzeiler, und
4
Antworten
Ich versuche zu aggregieren, ein 'STRING' - Feld im SQL Server. Ich würde gerne die gleiche Funktion LISTAGG wie in Oracle . Wissen Sie, wie Sie tun, die gleiche Funktion oder eine andere Methode? Beispielsweise Field A
3
Antworten
ich habe einige Abfragen, die Datensätze gruppieren und zählen Sie Sie auf, z.B. SELECT COUNT(*) FROM `table` GROUP BY `column` nun habe ich die Anzahl der Zeilen, für die column ist die gleiche, so weit so gut.
1
Antworten
Bekam ich einen Transaktions-Datenbank, die wie folgt aussieht: AccountID PaymentDate PaymentAmount 8 13 2020-02-09 1.00 9 13 2020-01-25 4.20 10 14 2020-01-01 30.68 11 14 2020-02-01 30.68 PaymentDate ist im posix-format. Mit der Transaktion die Daten, die