Zum Inhalt springen

Mehrdimensionale lineare Regression/Schätzfunktion - eindimensional

Aus Wikiversity

Einleitung

[Bearbeiten]

Diese Lerneinheit behandelt mit dem Thema zur eindimensionalen Schätzfunktion die Parameterschätzung für die Steigung und das y-Achsenabschnitt der Regressionsgerade im im Kontext der linearen Regression[1]. Die Lernresource kann als Wiki2Reveal Folien angezeigt werden. Einzelne Abschnitte werden als Folien betrachtet und Änderungen an den Folien wirken sich sofort auf den Inhalt der Folien aus. Dabei werden die folgenden Teilaspekte im Detail behandelt:

  • (1) Wie kann man die Steigung aus den Datenpunkten schätzen?
  • (2) Wie kann man mit berechneter Steigung den y-Achsenabschnitt der Regressiongerade bestimmen?

Zielsetzung

[Bearbeiten]

Diese Lernressource zu eindimensionalen Schätzfunktion für Steigung und y-Achsenabschniit für hat das Ziel, den mehrdimensionale Fall einer affinen Abbildung mit , und vorzubereiten.

Lernvoraussetzungen

[Bearbeiten]

Die Lernressource zum Thema eindimensionalen Schätzfunktion bei der linearen Regression hat die folgenden Lernvoraussetzungen, die zum Verständnis der nachfolgenden Ausführungen hilfreich bzw. notwendig sind.

Daten der linearen Regression

[Bearbeiten]

Gegeben Sie Datenpaare der Form mit:

Funktionsparameter - Steigung und y-Achsenabschnitt

[Bearbeiten]

Gesucht sind bei einer linearen Regression die Steigung und der y-Achsenabschnitt für eine Funktion mit .

Ideale Fall der Regression - Interpolation

[Bearbeiten]

Betrachtet man eine ideale Approximation der Daten , dann interpoliert die Funktion alle Daten aus und es gilt für alle .

Fehler in der Approximation der Daten

[Bearbeiten]

Die folgenden Abbildung zeigt Datenpunkte in rot und eine blaue Regressionsgerade, die die Datenpunkte nicht interpoliert. Die Approximation der Daten mit einer Funktion zeigt für die einzelnen Datenpunkte Fehler.

Methode der kleinsten Quadrate

Residuum als Abweichung von einem Sollwert

[Bearbeiten]

Ein Residuum bezeichnet dabei die Differenz zwischen der empirischen Beobachtung an der Stelle und der geschätzten Funktionswert der Regressionsfunktion an der Stelle .

Beispiel - Abweichung von einem Sollwert

[Bearbeiten]

Ist und der Datenpunkt gegeben, dann wird das Residuum für wie folgt berechnet:

Das Residuum besagt nun, dass der beobachtet Wert um 2 Einheiten über dem geschätzte Funktionswert liegt.

Fehlerminimierung für die Methode der Kleinsten-Quadrate

[Bearbeiten]

Für die gegeben Datenpaare der Form betrachtet man die quadratischen Einzelfehler der Form

Diese Einfehler aggregiert man nun über alles Datenpaare aus und erhält als quadratischen Gesamtfehler:

.

Dieser quadratische Fehler der lineare Regression soll nun minimiert werden.

Schätzfunktionen der Kleinste-Quadrate-Schätzer

[Bearbeiten]

Aus der Regressionsgleichung lassen sich die Schätzfunktionen für und für ableiten.

Arithmetisches Mittel der Rohdaten

[Bearbeiten]

Mit den Rohdaten kann man das arithmetische Mittel der -Werte und -Werte bilden:

Schätzer für die Steigung der Regressiongerade

[Bearbeiten]

Betrachtet man die Vektoren und aus den Rohdaten , so wird die Schätzfunktion für die Steigung von wie folgt definiert:

Schätzer für y-Achsenabschnitt der Regressiongerade

[Bearbeiten]

Die Regressionsgerade läuft durch den , dessen Komponenten über das arithmetische Mittel der -Werte arithmetische Mittel der -Werte gebildet wird. Die Funktionsgleichung liefert dann über

Linearität

[Bearbeiten]

Die Formeln zeigen auch, dass die Schätzfunktionen und der Regressionsparameter und linear von abhängen.

Normalverteilung der Residuuen

[Bearbeiten]

Unter der Annahme der Normalverteilung der Residuen oder wenn die Beobachtungsdaten den zentralen Grenzwertsatz erfüllen, folgt, dass auch die Schätzfunktionen der Regressionsparameter und für die Daten zumindest approximativ normalverteilt sind:

und .

Aufgaben für Lernende / Studierende

[Bearbeiten]
  • Berechnen Sie für die obigen 4 Datenpunkte in der Abbildung die Steigung und den y-Achsenabschnitt der Regressionsgerade!
  • Berechnen Sie die Regressionsgerade mit Datenpunkten Ihrer Wahl mit GNU R!
  • Zeigen Sie die Linearität der Schätzfunktionen und in der zweiten Komponenten !

Literatur/Quellennachweise

[Bearbeiten]
  1. Groß, J. (2012). Linear regression (Vol. 175). Springer Science & Business Media.


Siehe auch

[Bearbeiten]

Seiteninformation

[Bearbeiten]

Diese Lernresource können Sie als Wiki2Reveal-Foliensatz darstellen.

Wiki2Reveal

[Bearbeiten]

Dieser Wiki2Reveal Foliensatz wurde für den Lerneinheit Mehrdimensionale lineare Regression' erstellt der Link für die Wiki2Reveal-Folien wurde mit dem Wiki2Reveal-Linkgenerator erstellt.