Wie prep Transaktion Daten in Korb für arules
Ok, also ich suchte eine Menge und ausführen möchten arules auf sales-Daten. Ich brauche nur zu korrekt um die Daten im richtigen format und mit der richtigen "Faktoren" oder "Variablen" und in den Korb bilden.
Nun habe ich die Umsatzzahlen mit der Reihenfolge# und dann die Elemente, die darin enthalten ist. Jede Bestellung ist einzigartig (jeder neue Auftrag, eine neue # wird angelegt und umfasst den Teil#), aber die gleichen Elemente natürlich in vielen Bestellungen.
Derzeit, meine Daten sind wie folgt eingerichtet:
Um# Teil# PartDescription
1 A PartA 1 B PartB 1 G PartG Dar 2 R PartR 3 A PartA 3 B PartB 4 E PartE 5 Y-Partei 6 A PartA 6 B PartB 6 F PartF 6 V PartV
So, R, mag es nicht in dieser form, und ich habe, um es in der form, dass arules und Daten-Analyse, akzeptieren.
Ja, ich speichern Sie es als text-Datei und versucht haben, ein .csv-Datei, aber wenn ich Schritt für Schritt Anweisungen, wie Sie zu prep es oder zu manipulieren, es in RStudio, dass wäre toll.
Habe ich gelesen, dass es wohl in einen Korb form wie..
1 (A, B, G)
2 (f)
3 (A, B)
4 (E)
5 (Y)
6 (A, B, F, V)
Wenn das nicht genau, bitte korrigieren Sie mich. Ich bekomme zwar die Idee, aber ich muss einfach Schritt für Schritt Anleitung, die ich kann nicht scheinen, finden überall. Ich habe versucht, mit dplyr und tidyr. Ich habe ein gutes Verständnis von Daten-Analyse, brauchen aber mehr direkte Hilfe auf RStudio, also wenn ich könnte nur noch, dass Schritt für Schritt werde ich das verstehen weiter.
- Ich habe auch die data mining-plugin für Excel, so dass, wenn ich tun kann, jede Vorbereitung in die es mich wissen lassen. Danke.
- Ich nehme an, Sie haben zumindest die geladenen Daten in r als data.Rahmen? Wenn nicht, versuchen Sie
data <- read.csv("myfile.csv", comment.char="")
- Ich habe einfach geklickt "Import Dataset" - und die Antwort unten so weit ist, dass meine Daten in der richtigen Korb-format. Muss ich laden, die es in r als data.Rahmen um zukünftige Probleme zu vermeiden? Was genau sollte ich laden Sie es in r? Es ist eine text-Datei aus Excel, sollte es sein .csv? Mein Vater wird in die richtigen Spalten/Zeilen. Was import-Einstellungen sollte ich wählen? Danke!!!
- wenn der folgende code ausgeführt wird, ist es ein
data.frame
. Wenn Sie importieren Sie Ihre Daten mit rstudio import, den Befehl zu wiederholen, es dreht sich in der Konsole - es sollte etwas sein, das ähnlich zu dem, was ich hatte oben. - Beim Einlesen mit rstudio importieren, wird der Befehl zeigt ist.. > Sales <- read.csv("Umsatz.csv")
- Getestet habe ich einen kleinen Teil meiner Verkaufsdaten sowohl als .csv-Datei, um den code zu laden, es als Daten.Rahmen, sowie die Daten in eine txt-Datei aus Excel und mit dem Datensatz in R und beide arbeiten mit der code-gepostet von jeremycg. Also ich kann bestätigen, es funktioniert entweder als text-oder csv-Datei. Dabei die volle Umsatz-dataset entweder Weg, gibt mir einen Fehler, legt es in einen Korb (siehe jeremycg unten). Danke.
Du musst angemeldet sein, um einen Kommentar abzugeben.
Werfen Sie einen Blick auf die Hilfe-Seite für die "Transaktionen" Daten-Typ für Beispiele auf, wie Sie Ihre Daten in:
Für Ihre Art, Sie wollen
split
durch, Um, verwenden Sie dannas
um es in eine Transaktionen-Liste:data <- unique(data[ , 1:2 ] )
ersten entfernen der doubles. Wenn das nicht beheben, Fragen Sie eine andere Frage - die Kommentare sind;t einen guten Platz für die Fehlersuche ein anderes problem.Habe ich eine Menge ärger mit Zwang (z.B., 'als(Daten-name, "Transaktionen",..).
Ich glaube, dies ist aufgrund der Tatsache, dass ich doppelte Datensätze (d.h., den gleichen Artikel gekauft, der mehr als einmal in der gleichen transation, wenn die Daten in "single" - format).
Dies ist, was schließlich für mich gearbeitet:
(tx-id in Spalte 7, Element-Namen in Spalte 9)