Tag: pca
Principal component analysis (PCA) ist ein statistisches Verfahren zur dimensionsreduktion oft in Cluster-oder Faktorenanalyse. Gegeben eine beliebige Anzahl von erklärenden oder kausale Variablen, PCA Ränge der Variablen durch Ihre Fähigkeit, zu erklären, größte variation in den Daten. Es ist diese Eigenschaft, die erlaubt, dass die PCA verwendet werden zur dimensionsreduktion, d.h. identifizieren Sie die wichtigsten Variablen, die unter einem großen Satz möglichen Einflüssen.
1
Antworten
Ich versuche, herauszufinden, wie man die PCA auf decorrelate ein RGB-Bild in python. Ich bin mit dem code, der sich in der O ' Reilly Computer vision Buch: from PIL import Image from numpy import * def
2
Antworten
Ich wurden unter Verwendung von PCA-umgesetzt in scikit-learn. Ich möchte jedoch finden Sie die Eigenwerte und Eigenvektoren das Ergebnis, nachdem wir passen die Trainings-dataset. Es gibt keine Erwähnung der beiden in der Dokumentation. Zweitens können diese Eigenwerte
2
Antworten
Ich habe eine sehr große Trainings-set (~2Gb) in eine CSV-Datei. Die Datei ist zu groß zu Lesen direkt in den Speicher (read.csv() bringt den computer zum Stillstand) und ich möchte, um die Größe des Daten-Datei mithilfe der
1
Antworten
Ich arbeite mit einem Datensatz von 10000 Datenpunkten und 100 Variablen in R. Leider sind die Variablen, die ich nicht beschreiben die Daten, die in einem guten Weg. Ich führte eine PCA-Analyse mit prcomp() und die ersten
2
Antworten
Ich bin mit input-Daten aus hier (siehe Abschnitt 3.1). Ich versuche zu reproduzieren Ihre Kovarianz-matrix, Eigenwerte und Eigenvektoren mit scikit-learn. Allerdings bin ich nicht in der Lage zu reproduzieren die Ergebnisse, wie Sie in der Datenquelle. Ich
1
Antworten
Ich versuche zu tun, eine einfache Hauptkomponentenanalyse mit matplotlib.mlab.PCA-aber mit den Attributen der Klasse die ich nicht bekommen kann eine saubere Lösung zu meinem problem. Hier ist ein Beispiel: Bekommen einige dummy-Daten in 2D-und start-PCA: from matplotlib.mlab
5
Antworten
Ich versuche zu implementieren ZCA whitening und fand einige Artikel zu tun, aber Sie sind ein bisschen unübersichtlich.. kann jemand Licht für mich? Jeden Tipp oder Hilfe dankbar! Hier ist der Artikel, den ich gelesen : http://courses.media.mit.edu/2010fall/mas622j/whiten.pdf
3
Antworten
Ich will, dass die Korrelationen zwischen einzelnen Variablen und die wichtigsten Komponenten in python. Ich bin mit PCA in sklearn. Ich verstehe nicht, wie kann ich erreichen das laden der matrix, nachdem ich zerlegte meine Daten? Mein
1
Antworten
Zum Beispiel habe ich 9 Variablen und 362 Fällen. Ich habe die PCA-Berechnung, und fand heraus, dass die ersten 3 PCA-Koordinaten sind genug für mich. Nun, ich habe neue Punkt in meinem 9-dimensionale Struktur, und ich will-Projekt
2
Antworten
Ich will das "princomp" - Funktion von Matlab, aber diese Funktion gibt die Eigenwerte in einem sortierten array. Auf diese Weise kann ich nicht herausfinden, um welche Spalte entspricht dem Eigenwert. Für Matlab, m = [1,2,3;4,5,6;7,8,9]; [pc,score,latent]
4
Antworten
Wie kann ich die Visualisierung der SVM Klassifizierung sobald ich durchführen SVM-training in Matlab? Bisher habe ich nur trainiert die SVM mit: % Labels are -1 or 1 groundTruth = Ytrain; d = xtrain; model = svmtrain(groundTruth,
3
Antworten
Ich bin mit R-software (R-commander), um cluster-meine Daten. Ich habe eine kleinere Teilmenge der meine Daten enthält 200 Zeilen und etwa 800 Säulen. Ich erhalte die folgende Fehlermeldung, wenn Sie versuchen kmeans-cluster und Plotten Sie in einem
1
Antworten
Habe ich versucht zu übernehmen PCA auf meine Daten und dann anwenden, RandomForest, um die transformierten Daten. Allerdings PCA.transform(Daten) gab mir einen DataFrame, aber ich brauche eine mllib LabeledPoints zu ernähren, meine RandomForest. Wie kann ich das
1
Antworten
Ich versuche, die Handlung einer principal component-Analyse mit prcomp und ggbiplot. Ich bin immer Daten Werte, die außerhalb des Einheitskreises, und nicht in der Lage, zu skalieren die Daten vor dem Aufruf prcomp so, dass ich beschränken
1
Antworten
Habe ich getestet, wie gut PCA und LDA arbeitet für die Klassifizierung von 3 verschiedenen Arten von image-tags möchte ich automatisch zu identifizieren. In meinem code, X ist meine Daten-matrix, wo jede Zeile werden die Pixel aus
3
Antworten
Bin ich der Analyse von Daten über reed-Felder. Variablen, die ich gemessen habe sind Wasser, Tiefe, Höhe reed, reed-Dichte, etc. Einige der Variablen sind abhängig, ich führte eine PCA, um diese zu reduzieren, Variablen zu 2 PCA-Achsen
3
Antworten
Ich lese ein Papier, auf Sparse PCA, die ist: http://stats.stanford.edu/~imj/WEBLIST/AsYetUnpub/spärlich.pdf Ist und besagt, dass, wenn Sie n Daten Punkte, jeweils vertreten mit p Funktionen, dann ist die Komplexität des PCA ist O(min(p^3,n^3)). Kann mir bitte jemand erklären,
2
Antworten
Kann ich durchführen PCA in scikit durch folgenden code: X_train hat 279180 Zeilen und 104 Spalten. from sklearn.decomposition import PCA pca = PCA(n_components=30) X_train_pca = pca.fit_transform(X_train) Nun, wenn ich das Projekt wollen die Eigenvektoren auf feature-Raum muss
2
Antworten
Im Lesen Abdi & Williams (2010) "Principal Component Analysis", und ich bin versucht, wiederherstellen der SVD zu erreichen, Werte für weitere PCA. Der Artikel besagt, dass nach SVD: X = P D Q^t Lade ich meine Daten
1
Antworten
Ich bin Implementierung von PCA mittels Eigenwert-ZERLEGUNG für dünnbesetzte Daten. Ich kenne matlab hat PCA durchgeführt, aber es hilft mir zu verstehen, all die Technik, wenn ich code schreiben. Ich habe nach der Anleitung von hier, aber
1
Antworten
Ich habe einen Datensatz, der wie folgt aussieht: India China Brasil Russia SAfrica Kenya States Indonesia States Argentina Chile Netherlands HongKong 0.0854026763 0.1389383234 0.1244184371 0.0525460881 0.2945586244 0.0404562539 0.0491597968 0 0 0.0618342901 0.0174891774 0.0634064181 0 0.0519483159 0.0573851759 0.0756806292
5
Antworten
Frage ich mich, ob es möglich ist, zu plot pca-biplot Ergebnisse mit ggplot2. Nehme an, wenn ich will, um das folgende biplot Ergebnisse mit ggplot2 fit <- princomp(USArrests, cor=TRUE) summary(fit) biplot(fit) Jede Hilfe wird sehr geschätzt werden.
2
Antworten
VERSCHOBEN: Bewegt diese Frage math.stackexchange.com und schließen Sie es. Ich bin das lernen über die Mathematik invovled in PCA. Für meine Zwecke hier, ich versuche nur zu verstehen, eine 90° - rotation matrix. Ich bekomme das Konzept
1
Antworten
mein Projekt ist "feature based face detection and recognition" mir komplett die Erkennung Teil (erkennen, das Gesicht aus einem Bild auf der Grundlage der Hautfarbe).jetzt will ich applyy code für die Erkennung mittels PCA, erkannte Gesicht mir
2
Antworten
Möchte ich sagen, dass ich bin ein Neuling der R-und vor allem von dieser website, so dass, wenn es notwendig ist, ich kläre hier nichts, bitte lassen Sie mich wissen! Ich verstehe nicht ganz, alles noch, also
2
Antworten
Ich versuche zu tun, PCA-Analyse mit princomp Funktion in R. Im folgenden wird der Beispiel-code: mydf <- data.frame ( A = c("NA", rnorm(10, 4, 5)), B = c("NA", rnorm(9, 4, 5), "NA"), C = c("NA", "NA", rnorm(8,
2
Antworten
Mithilfe der prcomp Funktion, wie kann ich unbeaufsichtigt wichtigsten Komponenten abgeleitet aus einem dataset an das gleiche dataset in split testen und trainieren? train <- sample(1:nrow(auto), 60000) x <- as.matrix(auto[,-1]) ##Covariates y <- auto[,1] ##Response pc <-
1
Antworten
Ich mache PCA und ich möchte plot ersten principal component vs. zweite in R: pca<-princomp(~.,data=data, na.action=na.omit plot(pca$scores[,1],pca$scores[,2]) oder vielleicht mehrere Hauptkomponenten: pairs(pca$scores[,1:4]) aber die Punkte sind schwarz. Wie kann ich angemessen fügen Sie Farbe, um die Graphen?
3
Antworten
Bin ich immer Probleme auftreten PCA und Eigenfaces arbeiten mit den neuesten C++ - syntax mit dem Mat-und PCA-Klassen. Die alte C-syntax nahm ein array von IplImage* als parameter, um die Verarbeitung und den aktuellen API-dauert nur
3
Antworten
Arbeite ich mit Python und ich habe realisiert das PCA Main Event mit dieses tutorial. Alles Super funktioniert, ich bekam die Kovarianz habe ich eine erfolgreiche Transformation, brachte es auf die ursprünglichen Abmessungen kein problem. Aber wie
1
Antworten
Sagen wir, ich habe einen data-matrix-d pc = prcomp(d) # pc1 and pc2 are the principal components pc1 = pc$rotation[,1] pc2 = pc$rotation[,2] Dann sollte das passen der linearen regression Modell richtig? r = lm(y ~ pc1+pc2)
1
Antworten
Sci-Kit lernen Kmeans und PCA dimensionsreduktion Ich habe einen Datensatz, 2M Zeilen und 7 Spalten, wobei verschiedene Messungen von zu Hause den Stromverbrauch mit einem Datum für jede Messung. Datum, Global_active_power, Global_reactive_power, Spannung, Global_intensity, Sub_metering_1, Sub_metering_2, Sub_metering_3
6
Antworten
code : import numpy from matplotlib.mlab import PCA file_name = "store1_pca_matrix.txt" ori_data = numpy.loadtxt(file_name,dtype='float', comments='#', delimiter=None, converters=None, skiprows=0, usecols=None, unpack=False, ndmin=0) result = PCA(ori_data) dies ist mein code. obwohl mein input-matrix ist frei von nan und inf,
1
Antworten
Habe ich eine Reihe von Beobachtungen mit 23 Variablen vor. Wenn ich prcomp und biplot, um eine Darstellung der Ergebnisse, die ich laufen in einige Probleme: den eigentlichen plot belegt nur die Hälfte der Frames (x <
5
Antworten
Ich brauche Implementierung des PCA in Java. Ich bin daran interessiert, etwas, das gut dokumentiert ist, praktisch und einfach zu bedienen. Irgendwelche Empfehlungen? InformationsquelleAutor Trup | 2012-05-15
4
Antworten
Ist es möglich zu testen, die Bedeutung von Clusterbildung zwischen 2 bekannten Gruppen auf einem PCA-plot? Um zu testen, wie nah Sie sind oder die Höhe der Streuung (Varianz) und den Betrag der überlappung zwischen den Clustern
2
Antworten
Guru, Bei der Wahl der Anzahl der Hauptkomponenten (k) wählen wir k der kleinste Wert, so dass zum Beispiel 99% der Varianz, beibehalten wird. Jedoch in der Python-Scikit lernen, ich bin mir nicht 100% sicher, dass die
4
Antworten
Was ist der Unterschied zwischen "Principal Component Analysis" (PCA) und die Funktionsauswahl in Machine Learning? Ist PCA ein Mittel der feature-Auswahl? InformationsquelleAutor AbhinavChoudhury | 2013-04-27
4
Antworten
Gibt es eine Möglichkeit in R zu wählen, viele nicht-konsekutiven, d.h. gerade oder ungerade Zeilen/Spalten? Bin ich Plotten die Belastungen für meine Prinzipal-Komponenten-Analyse. Ich habe 84 Reihen geordneten Daten wie diese: x_1 y_1 x_2..... x_42 y_42 Und
2
Antworten
Habe ich einen großen Datenbestand von multidimensionalen Daten(132 Abmessungen). Ich bin ein Anfänger bei der Durchführung von Daten-mining -, und ich möchte Prinzipal-Komponenten-Analyse unter Verwendung von Matlab. Allerdings habe ich gesehen, dass es eine Menge von Funktionen
1
Antworten
Wie kann ich die eigen Werte und eigen Vektoren der PCA-Anwendung? from sklearn.decomposition import PCA clf=PCA(0.98,whiten=True) #converse 98% variance X_train=clf.fit_transform(X_train) X_test=clf.transform(X_test) Ich kann es nicht finden in docs. 1.Ich bin "nicht" in der Lage zu verstehen, die
5
Antworten
Frage ich mich, ob es möglich ist, zu plot pca-biplot Ergebnisse mit ggplot2. Nehme an, wenn ich will, um das folgende biplot Ergebnisse mit ggplot2 fit <- princomp(USArrests, cor=TRUE) summary(fit) biplot(fit) Jede Hilfe wird sehr geschätzt werden.
2
Antworten
Wenn dabei die regression oder Klassifizierung, was ist der richtige (oder bessere) Weg zum Vorverarbeiten der Daten? Normalisieren der Daten -> PCA -> Ausbildung PCA -> normalisieren PCA-Ausgang -> Ausbildung Normalisieren der Daten -> PCA -> normalisieren
2
Antworten
Ich bin mit der Funktion prcomp zur Berechnung der ersten zwei Hauptkomponenten. Jedoch, meine Daten hat einige NA-Werte und damit die Funktion wirft einen Fehler. Die na.Aktion definiert ist, scheint nicht zu funktionieren, obwohl es erwähnt wird
3
Antworten
Ich versuche zu laufen, eine Zone die PCA auf eine matrix der Dimensionen m x n, wobei m die Anzahl der features und n die Anzahl der samples. Angenommen, ich möchte die Erhaltung der nf Funktionen mit
2
Antworten
Ich habe Probleme beim hinzufügen von Gruppierung variable Ellipsen auf einer einzelnen Website PCA-Faktor-plot der auch PCA variable Faktor Pfeile. Mein code: prin_comp<-rda(data[,2:9], scale=TRUE) pca_scores<-scores(prin_comp) #sites=individual site PC1 & PC2 scores, Waterbody=Row Grouping Variable. #site scores in
1
Antworten
Wie kann ich berechnen, Prinzipal-Komponenten-Analyse von Daten in ein pandas dataframe? InformationsquelleAutor der Frage user3362813 | 2014-04-25
4
Antworten
Ich versuche, mich zu erholen von eine PCA durchgeführt mit scikit-learn, die Funktionen ausgewählt werden, da relevanten. Einem klassischen Beispiel mit den IRIS-Datensatz. import pandas as pd import pylab as pl from sklearn import datasets from sklearn.decomposition
10
Antworten
Ich möchte die principal component analysis (PCA) zur dimensionsreduktion. Tut numpy oder scipy bereits haben, oder muss ich die Rolle meiner eigenen mit numpy.linalg.eigh? Ich will nicht nur die Verwendung der singular-Wert-ZERLEGUNG (SVD), weil meine eingegebenen Daten
1
Antworten
Ich muss an pca zu identifizieren, die Dimensionen mit der höchsten Varianz eines bestimmten Satz von Daten. Ich bin mit scikit-learn ist die pca, um es zu tun, aber ich kann nicht erkennen, von der Ausgabe der