Bestimmung der Regressionsgeraden
Transcrição
Bestimmung der Regressionsgeraden
Lineare Regression – Anleitung zur Bestimmung einer Regressionsgeraden 1. Gerade nach Augemaß è Formuliere Erwartungen ohne das Datenmaterial. è Nutze die Daten zur Beantwortung der Frage (Punktdiagramm zeichnen!). è Lege eine Ausgleichsgerade durch die Punktwolke, durch die der von Dir festgestellte Trend deutlich wird. wichtig: Eine Regression muss nicht unbedingt linear (Annäherung durch eine Gerade) erfolgen. Grundsätzlich kann man beliebige Funktionstypen eine Regression auswählen, wenn man dies begründen kann. Im vorliegenden Beispiel könnte man sich zum Beispiel auch überlegen, eine exponentielle Ausgleichsfunktion zu wählen. Wir beschränken uns an dieser Stelle aber auf eine lineare Regression, da sie am einfachsten zu berechnen ist und für den betrachteten Zeitausschnitt durchaus der Realität nahe kommt. è Hast Du eine Ausgleichsgerade „nach Augenmaß“ durch die Punktwolke gelegt, überlege Dir, wie Du die Regression verbessern kannst, d. h. wie Du die Lage der Geraden verändern musst, damit sie möglichst gut den Trend der vorliegenden Daten widerspiegelt. Im Folgenden wird erläutert, wie man eine Regressionsgerade direkt aus den Daten mit der gängigen „Methode der kleinsten Quadrate“ (kQ) bestimmt. 2. Idee der Bestimmung der Geraden mit der Methode der kleinsten Quadrate (kQ) è Bestimme die Geradengleichung Deiner Ausgleichsgeraden „nach Augenmaß“ aus der Zeichnung. Einführung f: (xi, yi): f(xi): von im Folgenden verwendeten Bezeichnungen: zur Geraden nach Augenmaß gehörige Funktion nummerierte Datenpunkte für i=1,…,8 zu xi gehöriger Modellwert è Zeichne die Lote von den Datenpunkten auf die Gerade in Dein Diagramm ein, d. h. zeichne jeweils die Verbindungen der Punkte (xi, yi) und (xi, f(xi)) ein. Bei der kQ-Methode fordert man, dass die Differenzen yi – f(xi) insgesamt möglichst klein sein sollen. An dieser Stelle sind auch andere Möglichkeiten denkbar. Der Grund für die Wahl dieses Kriteriums besteht darin, dass man die yi möglichst gut aus den xi vorherbestimmen möchte (geringe Abweichung). Nahe liegend wäre es an dieser Stelle eine möglichst gute Regression zu bestimmen, indem man versucht, die durchschnittlichen absoluten Abweichungen zu minimieren. Wie bei der Streuung (Varianz, Standardabweichung!) verwendet man für die Bestimmung der Regressionsgeraden mit der kQ-Methode jedoch quadratische Abweichungen (daher auch der Name der Methode). Man möchte also eine Gerade bestimmen, so dass die Summe 2 2 2 2 2 1 8 [( y1 - f (x1 )) + (y 2 - f (x 2 )) + (y 3 - f (x3 )) + (y 4 - f (x 4 )) + (y 5 - f (x 5 )) +(y 6 - f (x 6 ))2 + (y 7 - f (x 7 ))2 + (y 8 - f (x8 ))2 ] minimal ist. Der Vorteil dieses Weges ist, dass man auf jeden Fall eine eindeutige Gerade bekommt, was im nicht quadratischen Fall nicht sein muss. Führt man diesen Weg fort, erhält man ein Verfahren, mit dem man eine Regressionsgerade direkt aus den Daten bestimmen kann. Dies soll an dieser Stelle nicht erläutert werden, ist aber vor allem für zukünftige LK-ler interessant. (Für entsprechendes Material sprecht mich bitte an!) 3. Bestimmung der Geraden mit der kQ-Methode Man kann zeigen, dass der Schwerpunkt der Punktwolke S (x , y ) auf einer so bestimmten Regressionsgeraden liegt. Die Gerade selbst hat die Gleichung y = m × (x - x ) + y . Die Steigung m ergibt sich mit der kQ-Methode wie folgt: S m = xy mit Sxy = 81 [(x1 - x ) × (y1 - y ) + ... + (x8 - x ) × (y 8 - y )] und Sxx Sxx = 81 [(x1 - x )2 + ... + (x8 - x )2 ] . Für die praktische Berechnung bedient man sich am besten einer Tabelle: i xi yi (xi - x ) (xi - x )2 ( yi - y ) (xi - x ) ( yi - y ) 1 2 3 4 5 6 7 8 x = y = Sxx = Sxy = è Berechne die Regressionsgerade nach der kQ-Methode, zeichne sie in Dein Diagramm ein und vergleiche Sie mit Deiner Geraden „nach Augenmaß“.