Erstellung von plots in R mit 3 Variablen

Hatte ich nach der Analyse-Schritte in die Das kleine Buch der R. Es ist ein großartiges tutorial, aber für Dinge zu arbeiten, und viele andere tutorials müssen die Daten organisiert auf eine bestimmte Weise.

Meine Daten sind wie folgt aufgebaut (eine sehr kleine, kleine Stichprobe)ein:

Phylum Confidence Time Seq_ID Environment Dataset
Acidobacteria 0.801 5 >3134898 Marine 4440037.3
Bacteroidetes 0.812 6 >3066473 Marine 4440037.3
Acidobacteria 0.828 5 >3085551 Gut 4440038.3
Firmicutes    0.830 4 >3087676 Coral 4440036.3

Ich möchte ein guter Weg, um

a) Plot der Zeit durch Bakterien-Stamm für jede Umgebung. Ich merke, dass dies bedeutet, ich brauche einen plot für jeden Stamm. (siehe Grundstücke)

b. Plot die Zeit, die durch die Umgebung der zwei verschiedene Stämme, die werde ich dann Farbe code durch die Umwelt. (siehe Grundstücke)

Ich weiß, ich kann erstellen Sie ein neues dataframe basiert auf einem Umwelt und Bakterien, aber ich habe nicht in der Lage gewesen, um es richtig in einem plot, verwendet eine Dritte variable (die Zeit).

new_df = myDF[(myDF$Environment=='Marine') & (myDF$Phylum=='Acidobacteria'),]

Habe ich versucht mehrere Dinge...

p <- ggplot(myDF, aes(Environment, Time))
p + geom_boxplot(aes(fill = Environment))

Schafft es eine Handlung, aber diese nicht berücksichtigen, das phylum (z.B. ich möchte eine getrennte Darstellung für jedes phylum).

Oder diese...

 for (i in environment) #this is a list I created
 {
     for (j in phyla) #this is a list I created
     {
        #stats_df = myDF[(myDF$Environment==i) & (myDF$Phylum==j),]
        plot(myDF[[j]], myDF[[i]], xlab=NULL, ylab='Time')
      }
 }

Dafür bekommt man Fehler

Warning in min(x) : no non-missing arguments to min; returning Inf
Warning in max(x) : no non-missing arguments to max; returning -Inf
Warning in min(x) : no non-missing arguments to min; returning Inf
Warning in max(x) : no non-missing arguments to max; returning -Inf
Error in plot.window(...) : need finite 'xlim' values
Calls: plot -> plot.default -> localWindow -> plot.window
Execution halted

shell returned 1

Aber selbst wenn es Tat, Handlung, es ist noch gar nicht berücksichtigt, die Zeit-variable. Was ich bin wirklich versucht, herauszufinden, wie die Verwendung von drei Variablen in einem plot.

  • Können Sie bitte klären Sie die Struktur Ihrer Daten-sets und die plots, die Sie wünschen zu produzieren. In der zweiten Grundstück, was scheint zu sein, die Namen der Stämme (sensu der zweite Datensatz) erscheinen als numerische Variablen. Die erste variable, die in dem ersten Daten Satz (Phylum) hat Werte, die so aussieht wie die 'Umgebung' - variable in der zweiten Daten-set.
  • Sicher Henrik. Ich räumte die post.
  • Können Sie bitte zeigen Sie uns die plotting-code, den Sie versucht haben. Fragen, Fragen, für code umfassen sollte, Lösungsversuche, warum Sie nicht arbeiten, und die erwarteten Ergebnisse. Danke.
  • Yeppers Henrik.
InformationsquelleAutor cer | 2013-10-12
Schreibe einen Kommentar