Fehler in den Daten.Rahmen , unbenutzt argument
Habe ich in diesem dataframe :
> head(merged.tables)
Store DayOfWeek Date Sales Customers Open Promo StateHoliday SchoolHoliday StoreType
1 1 5 2015-07-31 5263 555 1 1 0 1 c
2 1 6 2013-01-12 4952 646 1 0 0 0 c
3 1 5 2014-01-03 4190 552 1 0 0 1 c
4 1 3 2014-12-03 6454 695 1 1 0 0 c
5 1 3 2013-11-13 3310 464 1 0 0 0 c
6 1 7 2013-10-27 0 0 0 0 0 0 c
Assortment CompetitionDistance CompetitionOpenSinceMonth CompetitionOpenSinceYear Promo2
1 a 1270 9 2008 0
2 a 1270 9 2008 0
3 a 1270 9 2008 0
4 a 1270 9 2008 0
5 a 1270 9 2008 0
6 a 1270 9 2008 0
Promo2SinceWeek Promo2SinceYear PromoInterval
1 NA NA
2 NA NA
3 NA NA
4 NA NA
5 NA NA
6 NA NA
Dann möchte ich zu extrahieren ein dataframe zeigt der Durchschnittliche Umsatz Vektor, wenn Öffnen gleich 1 und durch Speichertyp.
Ich verwendet diesen Befehl, weil es die fatest ich denke:
merged.tables[StateHoliday==1,mean(na.omit(Sales)),by=StoreType]
Aber bekam ich diese Fehlermeldung:
Fehler in [.Daten.Rahmen(zusammengeführt.Tabellen, StateHoliday == 0,
mean(na.weglassen(Vertriebs -)), : unused argument (von = StoreType)
Ich Suche, aber ich habe nicht bekommen, eine Antwort zu diesem Fehler. Vielen Dank für Ihre Hilfe!
- Sie sind mit der syntax von
[.data.table
. Es scheint, dassmerged.tables
ist nicht Daten.Tabelle-Objekt. VerwendensetDT()
- Sie sehr viel!! ja, ich sollte die verwandeln es zu Daten.Tabelle!
- können Sie
dput
uns zu ermöglichen, erstellen Sie Ihre Daten?
Du musst angemeldet sein, um einen Kommentar abzugeben.
Übersicht
Gibt es viele Möglichkeiten der Anwendung einer Funktion auf eine Gruppe von Werten in Ihren Daten-frame. Ich präsentiere zwei:
dplyr
Paket organisieren Sie Ihre Daten in einer Weise, dass Ihre Frage beantwortet.tapply()
, die führt eine Funktion über eine Gruppe von Werten.Reproduzierbare Beispiel
In jedem laden geben, ich will der Durchschnittliche Umsatz für jene Läden, deren
Open
Wert gleich 1 ist.Präsentiere ich die dplyr - Methode zuerst, gefolgt von tapply.
Hinweis: Die folgenden Daten-frame dauert nur ein paar Spalten, die von denen geschrieben, die in den OP.
Ressourcen
Sollten Sie weitere Bedingungen für später auf, ich ermutige Sie, zu prüfen, andere relevante Beiträge SO, wie die How um mehrere Bedingungen zu kombinieren, um eine Teilmenge von Daten-Frames mit "ODER"? und Warum ist
[
besser alsUntermenge
?.