Tag: binning
binning ist der Prozess der Gruppierung von Daten in „bins“ in den Statistiken und Daten Analyse
3
Antworten
Ich bin auf der Suche für eine schnelle Formulierung zu tun, eine numerische Klasseneinteilung der 2D-numpy array. Durch binning ich meine, berechnen submatrix Durchschnitte oder kumulierte Werte. Für die ex. x = numpy.arange(16).reshape(4, 4) gewesen wäre, aufgeteilt
0
Antworten
Mit python habe ich erstellt nach Daten-frame enthält ähnlichkeit Werte: cosinFcolor cosinEdge cosinTexture histoFcolor histoEdge histoTexture jaccard 1 0.770 0.489 0.388 0.57500000 0.5845137 0.3920000 0.00000000 2 0.067 0.496 0.912 0.13865546 0.6147309 0.6984127 0.00000000 3 0.514 0.426 0.692
3
Antworten
Habe ich festgelegt der Wert in float (immer kleiner als 0). Denen will ich bin in einem Histogramm, i,e. jeder Balken im Histogramm enthalten Wertebereich [0,0.150) Den Daten die ich habe sieht wie folgt aus: 0.000 0.005
1
Antworten
Gibt es eine Möglichkeit, etwas zu tun, wie ein cut() Funktion binning für numerische Werte in einer dplyr Tabelle? Ich arbeite an einer großen postgres-Tabelle und kann derzeit entweder schreiben Sie eine case-Anweisung in der sql-am Anfang
8
Antworten
Mit python habe ich erstellt nach Daten-frame enthält ähnlichkeit Werte: cosinFcolor cosinEdge cosinTexture histoFcolor histoEdge histoTexture jaccard 1 0.770 0.489 0.388 0.57500000 0.5845137 0.3920000 0.00000000 2 0.067 0.496 0.912 0.13865546 0.6147309 0.6984127 0.00000000 3 0.514 0.426 0.692
2
Antworten
Wenn ich ein set von Daten die Y-und eine Reihe von Ablagen zentriert bei X, ich kann mit dem HIST-Befehl, um herauszufinden, wie viele von jeder Y sind in jedem bin. N = hist(Y,X) Was ich gerne
1
Antworten
Möchte ich Eimer/group/bin data : C1 C2 C3 49488.01172 0.0512 54000 268221.1563 0.0128 34399 34775.96094 0.0128 54444 13046.98047 0.07241 61000 2121699.75 0.00453 78921 71155.09375 0.0181 13794 1369809.875 0.00453 12312 750 0.2048 43451 44943.82813 0.0362 49871 85585.04688 0.0362
3
Antworten
Ich habe einen Vektor mit rund 4000 Werte. Ich würde nur brauchen, um bin es in 60 gleich große Intervalle, für die würde ich dann berechnen Sie den median (für jeden Behälter). v<-c(1:4000) V ist eigentlich nur
4
Antworten
Ich versuche zu kategorisieren Alter in der Gruppe, so dass es nicht kontinuierlich sein. Ich habe diesen code: data$agegrp(data$age>=40 & data$age<=49) <- 3 data$agegrp(data$age>=30 & data$age<=39) <- 2 data$agegrp(data$age>=20 & data$age<=29) <- 1 der obige code funktioniert
3
Antworten
Ich habe einen Vektor X enthält positive zahlen will ich bin/diskretisieren. Für diesen Vektor möchte ich die zahlen [0, 10) zu zeigen, so wie es diese in den vector, aber zahlen [10,∞) auf 10+. Ich bin mit:
2
Antworten
Was ist ein guter Weg, um bin numerische Werte in einem bestimmten Bereich? Zum Beispiel, angenommen ich habe eine Liste mit Werten und möchte ich bin in N bins, die durch Ihre Reichweite. Jetzt habe ich etwas
4
Antworten
Ich versuche zu implementieren in python eine IDL-Funktion: http://star.pst.qub.ac.uk/idl/REBIN.html welche verkleinert, die durch einen ganzzahligen Faktor ein 2d-array durch Mittelwertbildung. Beispiel: >>> a=np.arange(24).reshape((4,6)) >>> a array([[ 0, 1, 2, 3, 4, 5], [ 6, 7, 8, 9,
9
Antworten
Ich weiß, wie man ein Histogramm (nur "mit Boxen") in gnuplot wenn mein .dat-Datei bereits richtig klassifizierten Daten. Gibt es eine Möglichkeit, eine Liste von zahlen und gnuplot bieten ein Histogramm basierend auf den Bereichen und bin
1
Antworten
Habe ich einen Daten-frame und filtern möchten, oder bin durch einen Bereich von Werten, und dann bekommen Sie die Anzahl der Werte in jeder Klasse. Aktuell, ich bin dabei: x = 5 y = 17 z =
10
Antworten
Gibt es eine Möglichkeit, um anzugeben, bin Größen in MySQL? Gerade jetzt, ich versuche die folgende SQL-Abfrage: select total, count(total) from faults GROUP BY total; Den Daten, die erzeugt wird, ist genug gut, aber es sind einfach