www.vorhilfe.de
Vorhilfe

Kostenlose Kommunikationsplattform für gegenseitige Hilfestellungen.
Hallo Gast!einloggen | registrieren ]
Startseite · Forum · Wissen · Kurse · Mitglieder · Team · Impressum
Navigation
 Startseite...
 Neuerdings beta neu
 Forum...
 vorwissen...
 vorkurse...
 Werkzeuge...
 Nachhilfevermittlung beta...
 Online-Spiele beta
 Suchen
 Verein...
 Impressum
Das Projekt
Server und Internetanbindung werden durch Spenden finanziert.
Organisiert wird das Projekt von unserem Koordinatorenteam.
Hunderte Mitglieder helfen ehrenamtlich in unseren moderierten Foren.
Anbieter der Seite ist der gemeinnützige Verein "Vorhilfe.de e.V.".
Partnerseiten
Weitere Fächer:

Open Source FunktionenplotterFunkyPlot: Kostenloser und quelloffener Funktionenplotter für Linux und andere Betriebssysteme
Forum "Statistik (Anwendungen)" - Statistik Regression
Statistik Regression < Statistik (Anwend.) < Stochastik < Hochschule < Mathe < Vorhilfe
Ansicht: [ geschachtelt ] | ^ Forum "Statistik (Anwendungen)"  | ^^ Alle Foren  | ^ Forenbaum  | Materialien

Statistik Regression: Fehler der Regressionsparamete
Status: (Frage) reagiert/warte auf Reaktion Status 
Datum: 00:05 Do 30.10.2008
Autor: pete-yo

Hallo zusammen,

ich komme bei der Berechnung von linearen Regressionsparametern bzw. deren Fehler nicht weiter. Problem: Nicht nur die Y- sondern auch die X-Werte sind fehlerbehaftet, deren Fehler soll anschließend fortgepflanzt werden. Frage: Wie errechne ich für eine lineare Regression y = ax + b den Fehler von a und b unter Berücksichtigung der Fehler beider Parameter X und Y?

Hach, was wär das schön!

Vielen lieben Dank im Vorraus,
Peter

Ich habe diese Frage in keinem Forum auf anderen Internetseiten gestellt.

        
Bezug
Statistik Regression: Mitteilung
Status: (Mitteilung) Reaktion unnötig Status 
Datum: 09:18 Do 30.10.2008
Autor: Al-Chwarizmi


> Hallo zusammen,
>  
> ich komme bei der Berechnung von linearen
> Regressionsparametern bzw. deren Fehler nicht weiter.
> Problem: Nicht nur die Y- sondern auch die X-Werte sind
> fehlerbehaftet, deren Fehler soll anschließend
> fortgepflanzt werden. Frage: Wie errechne ich für eine
> lineare Regression y = ax + b den Fehler von a und b unter
> Berücksichtigung der Fehler beider Parameter X und Y?


hallo Peter,

damit man besser verstehen kann, was genau gefragt
ist, wäre es wohl sinnvoll, dass du das Problem etwas
konkreter schilderst.
Um welche Grössen handelt es sich bei X und Y ?
Was weisst du über die Verteilungen, insbesondere
über die Fehler (Streuungen) von X und Y ?

LG

Bezug
                
Bezug
Statistik Regression: Frage (beantwortet)
Status: (Frage) beantwortet Status 
Datum: 19:05 Sa 08.11.2008
Autor: pete-yo

Hallo Al-Chwarizmi und ggf Andere,


sorry für's späte reagieren, bin neu hier und habe noch nie im Forum geschrieben. Hätte gedacht, es gäbe eine Infomail, das jemand reagiert hat. Habe jetzt einfach so mal reingschaut...

Also denn: In der Regression sind Areosolkonzentrationen (Y) über Niederschlagsraten (X) von 10 Jahren an verschiedenen Standorten angegeben. Die Schwankung der Aerosolkonzentration zeigt also eine Abhängigkeit von der Geographie des Messstandortes. Die Schwankungen sind nun in den mittleren Jahreskonzentrationen einen Standortes zu finden, ebenso schwanken die jährlichen Niederschlagsraten der einzelnen Jahre an einem Standort. Die Schwankungen der Jahresparameter je Ort sind dabei relativ hoch.

Hilft das erstmal weiter?


Vielen Dank nocmal für die Hilfe,
Peter

Bezug
                        
Bezug
Statistik Regression: Antwort
Status: (Antwort) fertig Status 
Datum: 00:18 So 09.11.2008
Autor: Al-Chwarizmi


> Also denn: In der Regression sind Areosolkonzentrationen
> (Y) über Niederschlagsraten (X) von 10 Jahren an
> verschiedenen Standorten angegeben. Die Schwankung der
> Aerosolkonzentration zeigt also eine Abhängigkeit von der
> Geographie des Messstandortes. Die Schwankungen sind nun in
> den mittleren Jahreskonzentrationen eines Standortes zu
> finden, ebenso schwanken die jährlichen Niederschlagsraten
> der einzelnen Jahre an einem Standort. Die Schwankungen der
> Jahresparameter je Ort sind dabei relativ hoch.
>  
>  Peter


Hallo Peter,

wie ich sehe, geht es also um 3 Variablen:

1.) Niederschlagsmengen
2.) Aerosolkonzentrationen
3.) verschiedene Standorte (nummerierbar von 1 bis n)

Es wird wohl sinnvoll sein, zunächst für jeden einzelnen
Standort eine adäquate Statistik zu erstellen. Für einen
einzelnen Standort könnte man z.B. folgenden Fragen
statistisch nachgehen:

- haben die Niederschläge signifikant zu- oder abgenommen
  oder ist kein deutlicher Trend feststellbar ?
- ebenso für die Aerosolkonzentrationen
- gibt es einen Zusammenhang zwischen Niederschlag und
  Aerosolkonzentrationen ?

Falls sich an den verschiedenen Messstandorten deutliche
Unterschiede ergeben sollten, kann man der Frage nach-
gehen, ob es dafür irgendwelche ersichtlichen Gründe
geben könnte.
Allerdings ist dazu zu sagen, dass wohl erst mit sehr
reichhaltigem Datenmaterial und mit sehr professioneller
Analyse gültige Schlüsse über den komplexen Sachverhalt
gezogen werden könnten.

LG  


Bezug
                                
Bezug
Statistik Regression: Frage (beantwortet)
Status: (Frage) beantwortet Status 
Datum: 14:28 Mo 10.11.2008
Autor: pete-yo

Hallo Al-Chwarizmi und ggf Andere,


vielen Dank schonmal für's Kopfzerbrechen! Dein Hinweis ist richtig, ich bin den Einzelauswertungen natürlich nachgegangen. Er hilft mir also leider nicht weiter.

Mein Problem: Ich brauche einen methodisch/statistischen Ansatz, um den Fehler einer linearen Regression zu berechnen unter Berücksichtigung der Schwankungen in X UND Y. Nicht ausschließlich für Y. Ich habe mal was gehört von wegen erst für Y berechnen, dann mit tangens irgendwie auf eine andere Achse projezieren und weiter rechnen. Kann mir irgendwer weiterhelfen?

Vielen Dank,
Peter

Bezug
                                        
Bezug
Statistik Regression: Mitteilung
Status: (Mitteilung) Reaktion unnötig Status 
Datum: 09:40 Fr 14.11.2008
Autor: pete-yo

Es wäre schön, wenn die Frage weiterhin unter "offene Fragen" erscheinen würde... Ist das möglich?

Einen schönen Gruß,
Peter

Bezug
                                                
Bezug
Statistik Regression: Mitteilung
Status: (Mitteilung) Reaktion unnötig Status 
Datum: 09:45 Fr 14.11.2008
Autor: Teufel

Hallo!

Gesagt, getan.
Habe den Fälligkeitszeitung auch ca. um einen Tag verlängert. Kann auch gerne mehr machen, wenn du willst.

Außerdem:
"eMail-Benachrichtigungen unserer Foren-Artikel sind für unbestimmte Zeit deaktiviert.
(Wegen Neu-Programmierung.)"

Kann also nur eine Frage der Zeit sein, bis du das (wieder) einstellen kannst. :)

[anon] Teufel

Bezug
                                        
Bezug
Statistik Regression: Zweischritt-Verfahren (neu!)
Status: (Antwort) fertig Status 
Datum: 15:24 Fr 14.11.2008
Autor: Al-Chwarizmi


> Hallo Al-Chwarizmi und ggf Andere,
>  
>
> vielen Dank schonmal für's Kopfzerbrechen! Dein Hinweis ist
> richtig, ich bin den Einzelauswertungen natürlich
> nachgegangen. Er hilft mir also leider nicht weiter.
>  
> Mein Problem: Ich brauche einen methodisch/statistischen
> Ansatz, um den Fehler einer linearen Regression zu
> berechnen unter Berücksichtigung der Schwankungen in X UND
> Y. Nicht ausschließlich für Y. Ich habe mal was gehört von
> wegen erst für Y berechnen, dann mit tangens irgendwie auf
> eine andere Achse projezieren und weiter rechnen. Kann mir
> irgendwer weiterhelfen?
>  
> Vielen Dank,
>  Peter

Hallo Peter,

ich glaube, jetzt verstanden zu haben, was du
meinst. Du möchtest durch eine "Punktwolke"
diejenige Gerade g legen, für welche die
Quadratsumme

        [mm] Q=\summe_{i=1}^{n}{d_i}^2 [/mm]

der Abstände der Punkte [mm] P_i [/mm] von g minimal ist.
Dabei sollen die Abstände [mm] d_i [/mm] nicht senkrecht zur
x-Achse gemessen werden, sondern senkrecht zu g.

Daran habe ich schon bei meiner ersten Antwort
gedacht, dann aber nachgefragt, um welche Art von
Grössen es sich bei X und Y handelt.

Die Lösung mit der Minimierung der obigen Summe Q
macht nämlich nur dann Sinn, wenn es sich bei X und Y
um gleichartige Grössen handelt, wie z.B. die zwei
Koordinaten von Punkten in der x-y-Ebene, die
Niederschlagsraten an zwei Standorten A und B, etc.

Handelt es sich aber bei X und Y  z.B. um eine
Aerosolkonzentration und eine Niederschlagsmenge,
dann wird es zumindest problematisch, weil X und Y
eigentlich "inkommensurabel" sind. Vielleicht kann
man dann noch etwas einigermassen sinnvolles
machen, wenn man die Standardabweichungen
(Messtoleranzen)  $\ [mm] \Delta_X [/mm] $ und $\ [mm] \Delta_Y [/mm] $ bei der Messung
der X- und Y-Werte kennt (wenigstens annäherungsweise).
und dann vor der Regressionsrechnung die X- und
Y-Achsen so mit Skalen belegt, dass $\ [mm] \Delta_X [/mm] $ und $\ [mm] \Delta_Y [/mm] $
gleich gross erscheinen.




Gehen wir nach diesen Vorbemerkungen nun doch
zur beabsichtigten Rechnung über.

Als Ansatz für die Geradengleichung nehmen wir

     $\ [mm] g:\quad [/mm]   y=m*x+b$

Um die Abstände der Punkte [mm] P_i [/mm] von g leicht ausdrücken
zu können, bringen wir die Gleichung auf Hesse-Form:

     $\ [mm] g:\quad [/mm] m*x-1*y+b=0 $       [mm] $\vec{n}=\vektor{m\\-1}$ [/mm]    $\ [mm] |\vec{n}|=\wurzel{m^2+1}$ [/mm]

     $\ [mm] g_{_{HNF}}:\quad \bruch{m*x-y+b}{\wurzel(m^2+1)}=0$ [/mm]

Damit wird

     [mm] Abstand(P_i,g)=d_i=\left|\bruch{m*x_i-y_i+b}{\wurzel(m^2+1)}\right| [/mm]

und
     [mm] Q=\summe_{i=1}^{n}{d_i}^2=\summe_{i=1}^{n}{\left|\bruch{m*x_i-y_i+b}{\wurzel(m^2+1)}\right|}^2=\summe_{i=1}^{n}{\bruch{(m*x_i-y_i+b)^2}{m^2+1}} [/mm]


So, und um  Q(m,b)  zu minimieren, müsste man
nun die partiellen Ableitungen [mm] \bruch{\partial{Q}}{\partial{b}} [/mm] und [mm] \bruch{\partial{Q}}{\partial{m}} [/mm]
berechnen (das geht noch so) und gleich Null setzen.
Das entstehende Gleichungssystem ist aber dann
doch recht komplex. Möglicherweise wird es einfacher,
wenn man von einer anderen Form der Geradengleichung ausgeht.

Daher kommt wohl der Tipp, den du noch erhalten
hast, dass man zuerst eine provisorische (gewöhnliche)
Regression machen kann, um provisorische Werte
für m und b zu erhalten, um dann in einem zweiten
Schritt eine Korrektur anzubringen.

(wenn ich Zeit habe, komme ich noch darauf zurück)




Gut, hier bin ich nochmal.
Ich denke, dieses Verfahren könnte so gehen:

1.)  Man führt mit den Datenpaaren [mm] (x_i,y_i) [/mm] ein
     erstes lineares Regressionsverfahren durch und
     bestimmt die Gleichung  [mm] y=m_1*x+b_1 [/mm] der
     Regressionsgeraden [mm] g_1. [/mm]
     Dabei sollte man zu Anfang darauf achten, dass
     man die Achsen derart bezeichnet, dass [mm] |m_1|<1 [/mm] wird.
     Die anderen Vorbereitungen betr. Skalierung der
     Achsen habe ich schon weiter oben genannt.

2.)  Man berechnet den Steigungswinkel  [mm] \alpha=arctan(m_1) [/mm]
     der Geraden [mm] g_1. [/mm]
     Nun unterwirft man alle n Datenpunkte [mm] P_i(x_i/y_i) [/mm]
     einer Drehung um den Nullpunkt O(0/0) mit dem
     Drehwinkel  [mm] -\alpha [/mm] . Also:

             [mm] $\overline{x}_i=\ [/mm] \ [mm] x_i*cos(\alpha)+y_i*sin(\alpha)$ [/mm]
             [mm] $\overline{y}_i=-x_i*sin(\alpha)+y_i*cos(\alpha)$ [/mm]

3.)  Mit den neuen Datenpaaren [mm] (\overline{x}_i,\overline{y}_i) [/mm] führt
     man nochmals ein lineares Regressionsverfahren
     durch und bestimmt die Gleichung der neuen
     Regressionsgeraden  [mm] g_2. [/mm]

4.)  Diese Gerade [mm] g_2 [/mm] muss man nun um den Ursprung
     O(0/0) zurückdrehen, also der Drehung um O mit
     dem Drehwinkel  [mm] \alpha [/mm]  unterwerfen. Damit erhält
     man als Ergebnis eine Gerade  [mm] g_3 [/mm] , welche der
     eigentlich gesuchten Geraden g (für welche Q minimal
     wird) sehr nahe kommt.

Um g exakter zu bestimmen, müsste man entweder
das oben erwähnte komplizierte Gleichungssystem
lösen oder aber z.B. das Näherungsverfahren mit
den Drehungen durch weitere Schritte ergänzen.


Nun kann ich nur hoffen, dass der Aufwand nicht allzu
gross und damit dem gegebenen (vielleicht doch eher
grobkörnigen) Datenmaterial unangemessen wird.
        

Gruß    Al-Chwarizmi

Bezug
                                                
Bezug
Statistik Regression: fehlerermittlung
Status: (Frage) reagiert/warte auf Reaktion Status 
Datum: 13:00 Di 18.11.2008
Autor: pete-yo

Hallo Al-Chwarizmi,

danke, das ist genau das was ich brauchte. Ich habe darüber keine Literatur finden können. Kannst du mir evtl. einen Literaturhinweis geben? Oder einen link? Ich müsste jetzt noch den Fehler der Regressionskoeffizienten berechnen, hast du da evtl. auch einen guten Tip?

Vielen Dank,
Peter

Bezug
                                                        
Bezug
Statistik Regression: Mitteilung
Status: (Mitteilung) Reaktion unnötig Status 
Datum: 14:09 Di 18.11.2008
Autor: Al-Chwarizmi


> Hallo Al-Chwarizmi,
>  
> danke, das ist genau das was ich brauchte. Ich habe darüber
> keine Literatur finden können. Kannst du mir evtl. einen
> Literaturhinweis geben? Oder einen link?

      Nein; hab mir das auf deinen Wink ("irgendwie auf
      eine andere Achse projizieren") hin selber überlegt.
      Hauptsache ist ja, dass die Abstände der Datenpunkte
      von der Geraden nicht in y-Richtung, sondern normal
      zur Geraden gemessen sollen.
      Ob sie exakt normal dazu oder nur ungefähr
      [mm] ($\pm$ [/mm] wenige Grad) normal dazu stehen, ist aber
      unerheblich, da cos(kleiner [mm] Winkel)$\approx [/mm] 1$ .
      Also machen wir eine provisorische Regressions-
      gerade [mm] g_1, [/mm] die schon ungefähr die richtige Richtung
      hat, drehen das Koordinatensystem (oder die Daten-
      punkte) so, dass diese Gerade [mm] g_1 [/mm] horizontal wird.
      Im zweiten Schritt werden Abstände normal zu [mm] g_1 [/mm]
      betrachtet und eine neue Gerade [mm] g_2 [/mm] bestimmt.
      Diese wird sich im Allgemeinen zwar von [mm] g_1 [/mm] unter-
      scheiden, aber (ausser vielleicht in gesuchten
      Gegenbeispielen oder in solchen Fällen, wo lineare
      Regression ohnehin kaum sinnvoll ist) nicht mehr
      sehr stark. Auch [mm] g_2 [/mm] wird im allgemeinen Fall noch
      nicht die "exakte" Regressionsgerade sein; um
      diese noch genauer zu bestimmen, könnte man das
      Verfahren ad libitum wiederholen. In einem Umfeld,
      wo man es aber ohnehin mit Messfehlern etc. zu tun
      hat, dürfte dies aber kaum Sinn machen.
            

> Ich müsste jetzt
> noch den Fehler der Regressionskoeffizienten berechnen,
> hast du da evtl. auch einen guten Tip?

      Das müsste ich mir noch überlegen, aber ich denke,
      dazu kann man wohl auf Standardmethoden zurück-
      greifen und sich noch überlegen, was der Koordinaten-
      transformation wegen daran allenfalls geändert werden
      muss.


Gruß    al-Chw.

Bezug
Ansicht: [ geschachtelt ] | ^ Forum "Statistik (Anwendungen)"  | ^^ Alle Foren  | ^ Forenbaum  | Materialien


^ Seitenanfang ^
www.mathebank.de
[ Startseite | Forum | Wissen | Kurse | Mitglieder | Team | Impressum ]