Mehrdimensionale lineare Regression/Komponentenfunktionen
Einleitung
[Bearbeiten]Diese Seite zum Thema Mehrdimensionale lineare Regression/Komponentenfunktionen kann als Wiki2Reveal Folien angezeigt werden. Einzelne Abschnitte werden als Folien betrachtet und Änderungen an den Folien wirken sich sofort auf den Inhalt der Folien aus. Dabei werden die folgenden Teilaspekte im Detail behandelt:
- (1 Zerlegung einer linearen Funktion in lineare Komponentenfunktionen
- (2) Durchführung der linearen Regression für die Komponentenfunktion.
- (3) Nutzung der Regression bzgl. der Komponentenfunktion für die Funktion mit darstellender -Matrix .
Zielsetzung
[Bearbeiten]Diese Lernressource zu den Komponentenfunktionen eine mehrdimensionalen lineare Abbildung hat das Ziel, die lineare Regression einer mehrdimensionalen Funktion auf eine einfachere lineare Regression der Komponentenfunktionen als Skalarprodukt zu vereinfachen und dann diese lineare Regression mit einem eindimensionalen Wertebereich durchzuführen.
Lernvoraussetzungen
[Bearbeiten]Die Lernressource zum Thema Mehrdimensionale lineare Regression/Komponentenfunktionen hat die folgenden Lernvoraussetzungen, die zum Verständnis der nachfolgenden Ausführungen hilfreich bzw. notwendig sind.
- Grundkenntnisse über lineare Abbildungen und Gradient des Fehlers eines linearen Funktionals
- Grundkenntnisse über die Implementation von Funktionen in GNU R.
Ziel der linearen Regression - Dimension 1
[Bearbeiten]Ist der Wertebereich der linearen Abbildung eindimensional ist und Daten sucht man einen geeigneten Vektor , sodass der absolute aggregierte quadratische Fehler über alle Daten aus möglichst klein wird.
Fehler für Datenpunkte
[Bearbeiten]Für einen einzelnen Datenpunkt kann man mit jeweils den Fehler wie folgt angeben:
Definition der Fehlerfunktion
[Bearbeiten]Nun kann man die Fehlerfunktion der linearen Regression mit eindimensionalen Wertebereich definieren:
Implemenation der Fehlerfunktion in R
[Bearbeiten]In der folgenden Implementation bezeichnet p
immer Variablen, die als Parameter der Funktion übergeben.
e_LR <- function (px,pa,py) {
## pa : Vektor - n-dimensional a
## px : Vektor - n-dimensional x
## py : Zahl - Messwert y
return <- sum(pa * px) - py
## Rückgabewert: Fehler für (pa,px,py)
return
}
Aufruf der Fehlerfunktion in R
[Bearbeiten]Mit der obigen Definition steht nun die Funktion zur Verfügung und man kann den Fehler für gegebene Vektoren und dem Messwert berechnen.
## Aufruf der Funktion für den Vektor x
a <- c(1,3,4)
x <- c(4,2,1)
sum(a*x) ## Ergebnis <a,x> = 14
y <- 14.4
e_LR(a,x,y) ## Ergebnis -0,4
Quadratische Fehler für Datenpunkte
[Bearbeiten]Der quadratische Fehler ergibt aus dem Quadrat der euklidischen Länge (Norm) des Fehlervektors mit
Dabei ist die euklidische Norm wie folgt definiert:
Implementation - Quadratischer Fehler in R
[Bearbeiten]Die Norm ist in R bereits definiert und kann wie folgt berechnet werden.
e <- c(3, 4) ## Fehlervektor mit zwei Komponenten
norm(e,"2") ## liefert als Länge von e den Wert 5=sqrt(3^2+4^4)=sqrt(25)
Normquadrat - Summe der Komponentenquadrate
[Bearbeiten]Da die Norm im obigen Beispiel quadriert wird, ist der absolute (quadratische) Fehler allgemein die Summe der Quadrate, d.h
Implementation des quadratischen Fehlers in R
[Bearbeiten]Damit lässt der quadratische Fehler wie folgt berechnen:
error2 <- function (px) {
return <- sum(px^2)
## Rückgabewert: quaderror - quadratischer Fehler
return
}
## quadratischen Fehler berechnen von v
v <- c(3,4)
error2(v) ## liefert den Wert 25 als quadratischen Fehler
## quadratischen Fehler der affinen Abbildung f
e <- f(x) - y
error2(e)
Bemerkung - Dimension des Vektors als Parameter px
[Bearbeiten]Die Funktion error2(px)
erlaubt das einsetzen von Spaltenvektoren error2(v)
mit beliebiger Anzahl von numerischen Komponenten.
Fehlerfunktion der Linearen Regression in R
[Bearbeiten] E_LR <- function (pa,px_D,py_D) {
## pa : darstellender Vektor von f_a
## px_D : Dataframe - Liste von x-Vektoren
## py_D : Dataframe - Liste von y-Werten
## Fehler pro Datenpunkt berechnen
datenanzahl <- nrow(px_D) ## Anzahl Reihen px_D
e_D <- rep(0,datenanzahl)
## Fehler für alle Datenpunkte berechnen
for (i in 1:datenanzahl) {
## quadratische Einfehler mit Funktion e
e_D[i] <- (sum(pa*px_D[i, ]) - py_D[i, ])^2
}
## Rückgabewert: aufsummierte Einzelfehler aus e_D
return <- sum(e_D)
## Rückgabewert: return Gesamtfehler quadratisch
return
}
Daten für Fehlerfunktion in R definieren
[Bearbeiten]## Datenspalten festlegen
x1 <- c(1,2,7,7) # Datenspalte für x1
x2 <- c(2,3,0,6) # Datenspalte für x2
x3 <- c(3,1,4,5) # Datenspalte für x3
y1 <- c(16.1,22.1,25.9,56.6) # Datenspalte für y1
## Daten für x aus IR^3
x_D <- data.frame(x1,x2,x3)
## Daten für y aus IR^3
y_D <- data.frame(y1)
Fehlerfunktion in R aufrufen
[Bearbeiten]## a für f_a(x)=<a,x> definieren
a <- c(2,3,2)
## Fehler für a berechnen
E_LR(a,x_D,y_D)
## a verändern für f_a(x)=<a,x>
a <- c(3,5,2)
## Fehler für a erneut berechnen
E_LR(a,x_D,y_D)
Gradient der Fehlerfunktion in R
[Bearbeiten] GradE_LR <- function (pa,px_D,py_D) {
## px_D : Dataframe - Liste von x-Vektoren
## py_D : Dataframe - Liste von y-Werten
## pa : darstellender Vektor von f_a
## Fehler pro Datenpunkt
datenanzahl <- nrow(px_D)
grad <- rep(0,length(pa))
e_D <- rep(0,datenanzahl)
## Fehler für alle Datenpunkte berechnen
for (i in 1:datenanzahl) {
## quadratische Einfehler mit Funktion e
grad <- grad + (sum(pa*px_D[i, ]) - py_D[i, ]) * px_D[i, ]
}
## grad (dataframe) als Vektor umwandeln
return <- as.vector(unlist(grad))
## Rückgabewert: Gradient der Fehlerfunktion in pa
return
}
Gradient für Vektor berechnen
[Bearbeiten]Für die oben angegebenen und in R definierten Daten und wird nun der Gradient der Fehlerfunktion
für den Vektor berechnet.
a <- c(5,2,19)
g <- GradE_LR(a,x_D,y_D)
g ## Gradient ausgeben
Siehe auch
[Bearbeiten]- lineare Regression in R
- Kurs:Numerik I
- Gradient (Mathematik)
- Gradientenabstiegsverfahren
- Laden und Speichern von CSV-Dateien in R
- Kurs:Mehrdimensionale lineare Regression
- Open Source Software
- Open Community Approach
- Wikibuch R
Seiteninformation
[Bearbeiten]Diese Lernresource können Sie als Wiki2Reveal-Foliensatz darstellen.
Wiki2Reveal
[Bearbeiten]Dieser Wiki2Reveal Foliensatz wurde für den Lerneinheit Mehrdimensionale lineare Regression' erstellt der Link für die Wiki2Reveal-Folien wurde mit dem Wiki2Reveal-Linkgenerator erstellt.
- Die Seite wurde als Dokumententyp PanDocElectron-SLIDE erstellt.
- Link zur Quelle in Wikiversity: https://de.wikiversity.org/wiki/Mehrdimensionale%20lineare%20Regression/Komponentenfunktionen
- siehe auch weitere Informationen zu Wiki2Reveal und unter Wiki2Reveal-Linkgenerator.