Wie verbessern Sie den Aspekt von ggplot Histogramme der log-Skalen und diskreten Werten

Ich versuche, um die übersichtlichkeit zu verbessern und Aspekt ein Histogramm von diskreten Werten, die ich brauche, um zu repräsentieren, mit einer log-Skala.

Bitte beachten Sie die folgenden MWE

set.seed(99)
data <- data.frame(dist = as.integer(rlnorm(1000, sdlog = 2)))
class(data$dist)
ggplot(data, aes(x=dist)) + geom_histogram()

produziert

dann

ggplot(data, aes(x=dist)) + geom_line() + scale_x_log10(breaks=c(1,2,3,4,5,10,100))

was wahrscheinlich noch schlimmer ist

Wie verbessern Sie den Aspekt von ggplot Histogramme der log-Skalen und diskreten Werten

da es nun den Eindruck, dass etwas fehlt zwischen "1" und "2", und auch ist nicht völlig klar, welche bar hat den Wert "1" (bar auf die Recht der Zecke) und die bar hat den Wert "2" (bar auf die Links der Zecke).

Ich verstehen, dass technisch ggplot bietet mit dem "richtigen" visual Antwort für eine log-Skala. Aber als Beobachter habe ich einige Probleme beim Verständnis haben.

Ist es möglich, etwas zu verbessern?

EDIT:

Diese was passiert, wenn ich angewendet, Jaap Lösung zu meinem realen Daten

Wie verbessern Sie den Aspekt von ggplot Histogramme der log-Skalen und diskreten Werten

Wo sind die dips zwischen x=0 und x=1 ist, und zwischen x=1 und x=2 gekommen? Meine Wert sind diskrete, aber warum dann auch die Story mapping x=1.5 und x=2.5?

Dies mag trivial sein, aber versuchen Abnehmender Anzahl der Plätze ??
Das macht nicht wirklich helfen, meiner Meinung nach. Siehe das Beispiel in meiner Antwort.

InformationsquelleAutor CptNemo | 2014-07-09

ggplot2 r

10

Die erste Sache, die kommt sich zu kümmern, ist das spielen mit den binwidth. Aber das bedeutet nicht, geben eine ausgezeichnete Lösung, entweder:
```
ggplot(data, aes(x=dist)) +
  geom_histogram(binwidth=10) +
  scale_x_continuous(expand=c(0,0)) +
  scale_y_continuous(expand=c(0.015,0)) +
  theme_bw()
```
gibt:

In diesem Fall ist es wahrscheinlich besser, verwenden Sie einen density-plot. Jedoch, wenn Sie scale_x_log10 erhalten Sie eine Warnmeldung (Removed 524 rows containing non-finite values (stat_density)). Dies kann gelöst werden, indem Sie eine log plus eine transformation.

Folgenden code:
```
library(ggplot2)
library(scales)

ggplot(data, aes(x=dist)) +
  stat_density(aes(y=..count..), color="black", fill="blue", alpha=0.3) +
  scale_x_continuous(breaks=c(0,1,2,3,4,5,10,30,100,300,1000), trans="log1p", expand=c(0,0)) +
  scale_y_continuous(breaks=c(0,125,250,375,500,625,750), expand=c(0,0)) +
  theme_bw()
```
geben dieses Ergebnis:
- Aus irgendeinem seltsamen Grund, die mit Ihrer Lösung auf meine realen Daten habe ich einer Senke zwischen x=0 und x=1 ist, und zwischen x=1 und x=2, Warum? Es gibt keinen Wert für die anzeigen zwischen 0 und 1, da in der MWE meine Werte sind diskrete. (Bild Hinzugefügt)
- Wie die sample-Daten, die Sie zur Verfügung gestellt sind, auch diskret, das ist wohl nicht das problem sein. Blick auf das Grundstück, es könnte etwas zu tun mit der definition der y-Achse. Die Zecken sind wirklich unübersichtlich zusammen an der Unterseite der y-Achse, die ist seltsam. Kannst du uns den genauen code und eine dput der Daten (oder eine ausreichend große Stichprobe von Daten) benutzt Ihr? Ohne, dass es ziemlich schwer zu sagen, was die genaue Ursache für dieses Verhalten ist.
- log1p, nett, nicht zu wissen, dass!
InformationsquelleAutor Jaap
2

Frage ich mich, was wäre, wenn die y-Achse ist skaliert anstatt der x-Achse. Es werden Ergebnisse in wenigen Warnungen, wo die Werte sind "0", kann aber dienen Ihrem Zweck.
```
set.seed(99)
data <- data.frame(dist = as.integer(rlnorm(1000, sdlog = 2)))
class(data$dist)
ggplot(data, aes(x=dist)) + geom_histogram() + scale_y_log10()
```
Außerdem können Sie anzeigen lassen möchten Frequenzen als Datenbeschriftungen, da vielleicht die Leute ignorieren die y-Skala und es dauert einige Zeit, zu erkennen, dass die y-Skala ist logarithmisch.
```
ggplot(data, aes(x=dist)) + geom_histogram(fill = 'skyblue', color = 'grey30') + scale_y_log10() +
  stat_bin(geom="text", size=3.5, aes(label=..count.., y=0.8*(..count..)))
```
InformationsquelleAutor Gaurav Singhal
0

Eine Lösung könnte sein, konvertieren Sie Ihre Daten auf einem Faktor:
```
library(ggplot2)
set.seed(99)
data <- data.frame(dist = as.integer(rlnorm(1000, sdlog = 2)))
ggplot(data, aes(x=factor(dist))) + 
    geom_histogram() + 
    theme(axis.text.x = element_text(angle = 90, hjust = 1))
```
Resultieren in:
- Sie brauchen nicht zu tun, im Voraus, können Sie auch die Umrechnung auf eine Faktor-variable innerhalb der ggplot Funktion: ggplot(data, aes(x=factor(dist))) + geom_histogram()
InformationsquelleAutor ROLO

Schreibe einen Kommentar

Du musst angemeldet sein, um einen Kommentar abzugeben.