Korrelation (PCA) < Statistik/Hypothesen < Stochastik < Oberstufe < Schule < Mathe < Vorhilfe
|
Status: |
(Frage) beantwortet | Datum: | 17:56 Di 14.06.2016 | Autor: | magics |
Aufgabe | Die Grafik zeigt eine Punktwolke mit eingezeichneten Hauptkomponenten in Rot und Türkis.
[Dateianhang nicht öffentlich] |
Verstehe ich es richtig, dass man die Hauptkomponenten deshalb orhtogonal zueinander wählt, weil man auf diese Weise die besten Chancen hat, dass die neuen Werte unkorreliert sind?
Gemäß dieses Bildes von Wikipedia, das verschiedene Korrelationskoeffizienten zeigt, hätten orhtogonal zueinanderstehende Messreihen den Korrelationskoeffizienten 0:
[Externes Bild http:///upload.wikimedia.org/wikipedia/commons/thumb/0/02/Correlation_examples.png/660px-Correlation_examples.png]
Grüße
Dateianhänge: Anhang Nr. 1 (Typ: png) [nicht öffentlich]
|
|
|
|
Ich bin kein Mathematiker, daher kann ich nur eine Vermutung anstellen.
Ich vermute, dass die Achsen darum orthogonal sind, damit man ein kartesisches KOS bekommt und man die Werte auf klassische, bekannte Art darstellen kann.
Man soll sich bei der PCA auch immer die Projektion 2./3. Achse ansehen, denn da kann es auch noch Interessantes geben.
|
|
|
|
|
Status: |
(Frage) beantwortet | Datum: | 19:52 Di 14.06.2016 | Autor: | magics |
Das kann ich mit ruhigem Gewissen ausschließen, da es ja bei der PCA nicht darum geht die Daten wieder in der gleichen Dimension darzustellen sondern in ihrer Dimensionalität zu reduzieren.
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 20:12 Di 14.06.2016 | Autor: | magics |
Zitat aus Wikipedia:
> Die erste Achse soll so durch die Punktwolke gelegt werden, dass die Varianz der Daten in dieser Richtung maximal wird.
> Die zweite Achse steht auf der ersten Achse senkrecht. In ihrer Richtung ist die Varianz am zweitgrößten usw.
Wieso muss das so sein, das die Varianz in einer orthogonalen Achse (zur. 1. Achse) am zweitgrößten ist?
|
|
|
|
|
Bei der PCA hast du Daten in vielen Dimensionen.
Diese n-dimensionale Datenwolke wird auf die 2D-Ebene projiziert.
Die erste Achse legst du so, dass sie die größtmögliche Separation der Daten ergibt.
Wie willst du nun die zweite Achse legen? Irgendwie schief?
Wie willst du das darstellen?
Sinnvoll, anschaulich (was ja Sinn der PCA ist) ist nur ein rechtwinkliges KOS.
|
|
|
|
|
Status: |
(Frage) überfällig | Datum: | 21:05 Di 14.06.2016 | Autor: | magics |
Okay, ich hab dich jetzt besser verstanden. Ja macht Sinn. Bezogen auf meine ursprüngliche Frage, möchte ich nochmal nachhaken:
Die erste Hauptkomponente bildet ja die Korrelation der Werte ab. Vergrößert man x, vergrößert sich auch y.
Die zweite Achse, die man dann orthogonal zur ersten reinlegt - wenn man dort den x-Wert vergrößert, verkleinert sich y anstatt größer zu werden.
Wie ist das im Bezug auf die Korrelation zu interpretieren?
Denn: Auch so ein 'antiproportionales' Verhalten stellt ja eine gewisse Korrelation dar. Doch laut Vorgehensweise bei PCA korrelieren die Dimensionen der Hauptkomponenten eben nicht miteinaner.
|
|
|
|
|
Status: |
(Mitteilung) Reaktion unnötig | Datum: | 21:20 Do 16.06.2016 | Autor: | matux |
$MATUXTEXT(ueberfaellige_frage)
|
|
|
|