Kurs:Numerik I/Normen und Fehlerabschätzungen

Einführung[Bearbeiten]

Diese Seite kann als Wiki2Reveal Folien angezeigt werden. Einzelne Abschnitte werden als Folien betrachtet und Änderungen an den Folien wirken sich sofort auf den Inhalt der Folien aus.

Ziel[Bearbeiten]

In diesem Kapitel werden die Begriffe einer Vektor- und Matrixnorm bereit gestellt und wird in Vorbereitung auf die numerische Lösung linearer Gleichungssysteme der Einfluss von Störungen der Matrix $A\in \mathbb {R} ^{n\times n}$ und des Vektors $b\in \mathbb {R} ^{n}$ auf die Lösung des linearen Gleichungssystems $Ax=b$ untersucht. Im Hinblick auf weitere Anwendungen werden wir dabei zunächst Vektoren aus $\mathbb {K} ^{n}$ und Matrizen aus $\mathbb {K} ^{n\times n}$ zulassen, wobei $\mathbb {K} :=\mathbb {R}$ oder $\mathbb {K} :=\mathbb {C}$ ist.

Fehlerabschätzung in reellen Zahlen[Bearbeiten]

Sei $x\in \mathbb {R}$ ein exakter Wert (Sollwert) (z.B. $x:={\sqrt {2}}$ ) und ${\tilde {x}}\in \mathbb {R}$ ( ${\tilde {x}}=1,41$ ) ein Näherungswert des exakten Wertes, so dass ${\tilde {x}}\approx x$

Absoluter Fehler[Bearbeiten]

$\Delta x={\tilde {x}}-x$ heißt absoluter Fehler (im Beispiel: $\Delta x=1,41-{\sqrt {2}}$ ).^[1]. Der absolute Fehler $\Delta x=1,41-{\sqrt {2}}$ besitzt im Beispiel ein negatives Vorzeichen. Das bedeutet, dass der Näherungswert zu klein ist im Vergleich zum Sollwert.

Relativer Fehler[Bearbeiten]

\delta _{x}={\frac {\Delta x}{x}}

heißt im Falle

x\neq 0

relativer Fehler.

Fehlerschranke[Bearbeiten]

Wenn $|\Delta x|\leq \epsilon$ ist, so heißt $\epsilon$ absolute Fehlerschranke.
Wenn ${\frac {\epsilon }{\mid x\mid }}\leq \rho$ gilt, so heißt $\rho$ relative Fehlerschranke.

Abschätzung der Fehlerschranke[Bearbeiten]

Für die relative Fehlerschranke gilt folgende Abschätzung:

{\frac {|\Delta x|}{\mid x\mid }}\leq {\frac {\epsilon }{\mid x\mid }}\leq \rho

Absolu

Fehlerabschätzung in normierten Räumen[Bearbeiten]

Analog kann man die Fehlerabschätzung auf normierte Räume übertragen. Die Norm dient dazu, um die Abweichung von Sollwert und Näherungswert zu messen.

Beispiel[Bearbeiten]

Sei $x\in V$ die exakte vektorielle Darstellung (Sollvektor). Als Beispiel wird der Vektor $x:=({\sqrt {2}},\pi )\in \mathbb {R} ^{2}=V$ verwendet. Wenn man ${\tilde {x}}\in V$ als näherungsweise Darstellung von $x$ in Berechnungen verwendet, so kann man z.B. ${\tilde {x}}=(1.41,3.14)$ als den Vektor, der näherungsweise den exakten Vektor $x$ darstellt (d.h. ${\tilde {x}}\approx x$ ).

Fehler[Bearbeiten]

Analog zu den reellen Zahlen versucht man nun die Fehler als Abstand zwischen dem Sollvektor und der näherungsweisen Darstellung mathematisch zu beschreiben. Die Norm berechnet dabei die Länge von Vektoren und $\|{\tilde {x}}-x\|$ liefert damit ein Maß für den Fehler. Gilt $\|{\tilde {x}}-x\|=0$ , so ist die Darstellung exakt.

Normen - Fehlerabschätzung 1[Bearbeiten]

Im Folgenden sei $V$ ein beliebiger Vektorraum über $\mathbb {K}$ . Mit der Definition von Normen hat man ein Messinstrument in dem Vektorraum zur Verfügung, mit dem Abstände zwischen Vektoren $x$ und $y$ über die Metrik $d(x,y):=\|x-y\|$ Längen $\|x\|$ von einem Vektor $x$ über die Norm messen kann.

Normen - Fehlerabschätzung 2[Bearbeiten]

Die über die Abbildung $\|\cdot \|:V\to \mathbb {R} _{0}^{+}$ Norm ist dabei verträglich mit den Vektorraumoperationen. Repräsentiert der Vektor $x$ einen Fehler:

(N1) $\|x\|=0\Leftrightarrow x=0,\quad x\in V,$ - Fehlervektor $0_{V}$ - Nullvektor
(N2) $\|\alpha \cdot x\|=|\alpha |\cdot \|x\|,\quad x\in V,\alpha \in \mathbb {K}$ - Streckung/Stauchung von Fehlervektoren,
(N3) $\|x+y\|\leq \|x\|+\|y\|,\quad x,y\in V$ - Dreiecksungleichung zur Fehlerabschätzung.

Vektornorm - Matrixnorm[Bearbeiten]

Eine Norm $\|\cdot \|:\mathbb {K} ^{n}\to \mathbb {R} _{0}^{+}$ wird auch Vektornorm und entsprechend eine Norm $\|\cdot \|:\mathbb {K} ^{n\times n}\to \mathbb {R} _{+}$ auch Matrixnorm genannt.

Fehler in Summen[Bearbeiten]

Seien $x_{o},y_{o}\in V$ die exakten Vektoren und $x,y\in V$ die numerische Näherung von $x_{o}$ bzw. $y_{o}$ . Mit der Dreiecksungleichung zur Fehlerabschätzung kann man den Summenfehler wie folgt nach oben abschätzen:

\|(x+y)-(x_{o}+y_{o})\|=\|(x-x_{o})+(y-y_{o})\|\leq \|x-x_{o}\|+\|y-y_{o}\|,

Fehler bei skalaren Vielfachen eine Vektor[Bearbeiten]

Sei $x_{o}\in V$ der exakte Vektor und $x\in V$ die numerische Näherung von $x_{o}$ . Mit der Homogenität der Norm kann man den Fehler des skalierten Vektorswie folgt nach oben berechnen:

\|\alpha \cdot (x-x_{o})\|=|\alpha |\cdot \|x-x_{o}\|,\quad \alpha \in \mathbb {K}

.

Der Fehler vervielfacht somit um $|\alpha |$ bei der Multiplikation mit Skalaren.

Fehlerschranken in normierten Räumen[Bearbeiten]

Sei $(V,\|\cdot \|)$ ein normierter Raum und dann kann man mit der Norm die Länge des Fehlervektors $\Delta x:={\tilde {x}}-x$ bestimmen.

Wenn $\|\Delta x\|\leq \epsilon$ ist, so heißt $\epsilon$ absolute Fehlerschranke für den Fehlervektor $\Delta x\in V$ .
Wenn ${\frac {\epsilon }{\|x\|}}\leq \rho$ gilt, so heißt $\rho$ relative Fehlerschranke.

Abschätzung der Fehlerschranke in normierten Räumen[Bearbeiten]

Für die relative Fehlerschranke gilt in einem normierten Raum $(V,\|\cdot \|)$ folgende Abschätzung:

{\frac {\|\Delta _{x}\|}{\|x\|}}\leq {\frac {\epsilon }{\|x\|}}\leq \rho

Lemma - umgekehrte Dreiecksungleichung[Bearbeiten]

Für eine Norm $\|\cdot \|:{\mathcal {V}}\to \mathbb {R} _{+}$ gilt die umgekehrte Dreiecksungleichung

{\big |}\|x\|-\|y\|{\big |}\leq \|x-y\|,\quad x,y\in {\mathcal {V}}.

Beweis - umgekehrte Dreiecksungleichung[Bearbeiten]

Es seien $x,y\in {\mathcal {V}}$ . Dann gilt

\|x\|=\|x-y+y\|\leq \|x-y\|+\|y\|

Beweis 1[Bearbeiten]

Damit erhält man durch Umformung

(UDG1) $\|x\|-\|y\|\leq \|x-y\|$

Nun betrachten wir

(UDG1) $\|x-y\|=|-1|\cdot \|y-x\|=\|y-x\|$

Beweis 2[Bearbeiten]

Das Vertauschen von $x$ und $y$ liefert analog folgende Abschätzung

(UDG2)

\|y\|-\|x\|\leq \|x-y\|

Die Ungleichungen (UDG1) und (UDG2) zusammen liefern die Behauptung.

q.e.d.

Fehler bei Differenzen[Bearbeiten]

Seien $x_{o},y_{o}\in V$ die exakten Vektoren und $x,y\in V$ die numerische Näherung von $x_{o}$ bzw. $y_{o}$ . Mit der obigen Fehlerabschätzung kann man den Summenfehler wie folgt nach oben abschätzen:

{\begin{array}{rcl}|\,\|x-x_{o}\|-\|y-y_{o}\|\,|&\leq &\|(x-x_{o})-(y-y_{o})\|\\&=&\|(x-y)-(x_{o}-y_{o})\|\\\end{array}}

Man kann also den Betrag der Differenz der Einzelfehler nach oben gegen Norm des Subtraktionsfehlers abschätzen.

Fehler bei Differenzen - Abschätzung nach oben[Bearbeiten]

Den Fehler der Differenz kann man oben gegen die Summe der Einzelfehler abschätzen und nicht gegen die Differenz der Einzelfehler.

{\begin{array}{rcl}|\,\|x-x_{o}\|-\|y-y_{o}\|\,|&\leq &\|(x-x_{o})-(y-y_{o})\|\\&=&\|(x-y)-(x_{o}-y_{o})\|\\&\leq &\|x-y\|+\|x_{o}-y_{o})\|\\\end{array}}

Vektorraum - Norm - Fehlermaße[Bearbeiten]

Einen Vektorraum ${\mathcal {V}}$ , auf dem eine Norm $\|\cdot \|$ definiert ist, bezeichnet man als einen normierten Vektorraum. Man kennzeichnet ihn auch durch $({\mathcal {V}},\|\cdot \|)$ . Auf endlich dimensionalen Vektorräumen sind die Normen äquivalent bzgl. Konvergenz, allerdings kommt es in der Numerik bei der Fehlerabschätzung auf Fehlerschranken an und diese hängen von der konkreten Wahl der Norm ab.

Konvergenz im normierten Raum[Bearbeiten]

Mit numerischen Interationsverfahren versucht man beispielsweise einen Fehler zu minimieren bzw. die Ausgabe einer funktionalen Darstellung $f_{t}$ zum Zeitpunkt $t$ an Sollwerte mit wachsendem Zeitindex/Interationindex anzupassen. Der mit einer Norm gemessene Abstand zwischen Soll- und Ist-Wert bestimmt dabei den Fehler des Verfahrens zum Zeitpunkt. Für eine solche Mathematisierung benötigt man den Konvergenzbegriff auf normierten Räumen.

Definition - Konvergenz im normierten Raum[Bearbeiten]

Es sei $({\mathcal {V}},\|\cdot \|)$ ein normierter Vektorraum. Eine Folge $(x_{n})$ von Elementen $x_{n}\in {\mathcal {V}}$ konvergiert gegen $x_{0}\in {\mathcal {V}}$ , kurz

\lim _{n\to \infty }x_{n}=x_{0},

wenn gilt:

\lim _{n\to \infty }\|x_{n}-x_{0}\|=0.

Korollar - Stetigkeit der Normabbildung[Bearbeiten]

Eine Norm $\|\cdot \|:{\mathcal {V}}\to \mathbb {R} _{+}$ ist stetig, d. h., es gilt

x_{0},x_{n}\in {\mathcal {V}},\quad \lim _{n\to \infty }x_{n}=x\Rightarrow \lim _{n\to \infty }\|x_{n}\|=\|x\|.

Beispiele von Normen[Bearbeiten]

Es sei $x\in \mathbb {K} ^{n}$ . Beispiele für Vektornomen sind

(1) $\|x\|_{2}:=\left(\sum _{j=1}^{n}|x_{j}|^{2}\right)^{1/2}$ (Euklidische oder $l_{2}$ -Norm),
(2) $\|x\|_{1}:=\sum _{j=1}^{n}|x_{j}|$ (Summen- oder $l_{1}$ -Norm),
(3) $\|x\|_{\infty }:=\max _{j=1,\ldots ,n}|x_{j}|$ (Maximum- oder $l_{\infty }$ -Norm).

Aufgaben - Normeigenschaften[Bearbeiten]

Beweisen Sie, dass die Maximumnormen tatsächlich die Normeigenschaften erfüllen.
Beweisen Sie, dass die Summennormen tatsächlich die Normeigenschaften erfüllen.

Beweis 1 - Euklidische Norm[Bearbeiten]

Für die Euklidische Norm folgt die Dreiecksungleichung mit der Cauchy-Schwarzschen Ungleichung. Und zwar schließt man mit

\|x\|_{2}^{2}=\langle x,x\rangle =\sum _{j=1}^{n}{\overline {x}}_{j}x_{j}={\overline {x}}^{T}x=x^{H}x

für $x^{H}:={\overline {x}}^{T}$

Beweis 2 - Euklidische Norm[Bearbeiten]

Damit erhält man folgende Abschätzung:

{\begin{array}{rcl}\|x+y\|_{2}^{2}&=&\langle x+y,x+y\rangle \\&=&\underbrace {\langle x,x\rangle } _{=\|x\|_{2}^{2}}+\underbrace {2\operatorname {Re} (\langle x,y\rangle )} _{\leq 2\|x\|_{2}\|y\|_{2}}+\underbrace {\langle y,y\rangle } _{=\|y\|_{2}^{2}}\\&\leq &(\|x\|_{2}+\|y\|_{2})^{2}\\\end{array}}

für alle $x,y\in \mathbb {K} ^{n}$ gilt, wobei $\operatorname {Re} (x)$ den Realteil von $x$ bezeichnet.

Dreicksungleichung für l_p-Normen[Bearbeiten]

Allgemeiner ist, wie man zeigen kann, für jedes $1\leq p<\infty$ durch

\|x\|_{p}:=\left(\sum _{j=1}^{n}|x_{j}|^{p}\right)^{1/p}

(

l_{p}

-Norm)

eine Norm definiert,

l_p-Normen und Maximumsnorm[Bearbeiten]

Es gilt folgende Konvergenzaussage:

\lim _{p\to \infty }\|x\|_{p}=\|x\|_{\infty }.

Normenäquivalenzsatz[Bearbeiten]

Man kann mit dem Normenäquivalenzsatz zeigen, dass je zwei auf einem endlich-dimensionalen Vektorraum ${\mathcal {V}}$ definierte Normen $\|\cdot \|_{a}$ und $\|\cdot \|_{b}$ äquivalent sind, d. h., dass es Konstanten $c_{1},c_{2}>0$ gibt, so dass gilt:

c_{1}\|x\|_{a}\leq \|x\|_{b}\leq c_{2}\|x\|_{a},\quad x\in {\mathcal {V}}.

Fehlerschranken[Bearbeiten]

Wenn man in einem konkreten Problem Fehlerschranken hat, die nicht überschritten werden dürfen, muss man bei dem Übergang von einer Norm zu einem äquivalenten Norm die Fehlerschranken anpassen. Dies ist leicht erkennbar, wenn man eine Norm $\|\cdot \|$ durch eine äquivalente Norm $\|\cdot \|_{a}:=a\cdot \|\cdot \|$ ersetzt.

Abschätzungen der Normen[Bearbeiten]

Bei den oben genannten Beispielnormen auf ${\mathcal {V}}:=\mathbb {K} ^{n}$ gelten die folgenden Abschätzungen:

(A1) $\|x\|_{\infty }\leq \|x\|_{2}\leq {\sqrt {n}}\|x\|_{\infty },\quad x\in \mathbb {K} ^{n},$
(A2) $\|x\|_{\infty }\leq \|x\|_{1}\leq n\|x\|_{\infty },\quad x\in \mathbb {K} ^{n},$
(A3) $\|x\|_{2}\leq \|x\|_{1}\leq {\sqrt {n}}\|x\|_{2},\quad x\in \mathbb {K} ^{n}.$

Aufgaben[Bearbeiten]

Beweisen Sie die beiden ersten Abschätzungen (A1) und (A2) als Übung.

Nachweis der Abschätzung (A3)[Bearbeiten]

Die erste Abschätzung in (A3) folgt aus

\sum _{j=1}^{n}|x_{j}|^{2}\leq \left(\sum _{j=1}^{n}|x_{j}|\right)^{2},

Die zweite mit der Cauchy-Schwarzschen Ungleichung aus

\sum _{j=1}^{n}1\cdot |x_{j}|=\langle e,x\rangle \leq \|e\|_{2}\|x\|_{2}={\sqrt {n}}\|x\|_{2},

wobei $e\in \mathbb {K} ^{n}$ der Vektor ist, der in jeder Komponenten $e_{j}:=1$ ist.

Bemerkung - Abschätzung (A3)[Bearbeiten]

Für große $n\in \mathbb {N}$ sind allerdings die jeweils zweiten Abschätzungen in (A3) aufgrund der Größe der auftretenden Konstanten numerisch bedeutungslos.

Beispiele - Matrixnormen[Bearbeiten]

Die folgenden Normen sind Matrixnormen für Matrizen $A:=(a_{kj})\in \mathbb {K} ^{n\times n}$ :

(M1) $\|A\|:=\left(\sum _{k=1}^{n}\sum _{j=1}^{n}|a_{kj}|^{2}\right)^{1/2}$ (Frobenius-Norm),
(M2) $\|A\|_{z}:=\max _{k=1,\ldots ,n}\sum _{j=1}^{n}|a_{kj}|$ (Zeilensummennorm),
(M3) $\|A\|_{s}:=\max _{j=1,\ldots ,n}\sum _{k=1}^{n}|a_{kj}|$ (Spaltensummennorm).

Aufgabe - Normeigenschaften[Bearbeiten]

Beweisen Sie, dass die Zeilen- und Spaltensummennorm tatsächlich die Normeigenschaften erfüllen,

Identifikation Matrizen mit Vektoren[Bearbeiten]

Jede Matrix $A\in \mathbb {K} ^{n\times n}$ lässt sich als Vektor der Länge $n^{2}$ auffassen und die Frobenius-Norm fällt dann mit der Euklidischen Vektornorm zusammen. Somit genügt die Frobenius-Norm auch den Normeigenschaften.

Definition - Submultiplikativität[Bearbeiten]

Eine Matrixnorm $\|\cdot \|:\mathbb {K} ^{n\times n}\to \mathbb {R} _{0}^{+}$ nennt man submultiplikativ, falls

\|A\cdot B\|\leq \|A\|\cdot \|B\|,\quad A,B\in \mathbb {K} ^{n\times n},

Definition - Verträglichkeit Matrixnorm Vektorrnorm[Bearbeiten]

Eine Matrixnorm $\|\cdot \|:\mathbb {K} ^{n\times n}\to \mathbb {R} _{0}^{+}$ nennt man mit einer gegebenen Vektornorm $\|\cdot \|_{v}:\mathbb {K} ^{n}\to \mathbb {R} _{0}^{+}$ verträglich, falls folgende Abschätzung gilt:

\|Ax\|_{v}\leq \|A\|\cdot \|x\|_{v},\quad A\in \mathbb {K} ^{n\times n},\quad x\in \mathbb {K} ^{n}.

Zusammenhang Stetigkeitssatz für lineare Abbildungen[Bearbeiten]

Man kann eine quadratische Matrix $\mathbb {K} ^{n\times n}$ als lineare Abbildung von dem $\mathbb {K} ^{n}$ auffassen. Die obige Abschätzung $\|Ax\|_{v}\leq \|A\|\|x\|_{v}$ hängt mit dem Stetigkeitssatz für lineare Abbildungen zusammen, da stetige lineare Operatoren eine endliche Operatornorm besitzen.

Definition - Induzierte Matrixnorm[Bearbeiten]

Sei $\|\cdot \|_{v}:\mathbb {K} ^{n}\to \mathbb {R} _{+}$ eine Vektornorm. Dann heißt die durch

\|A\|:=\max _{x\in \mathbb {K} ^{n}\setminus \{0\}}{\frac {\|Ax\|_{v}}{\|x\|_{v}}}=\max _{\|x\|_{v}=1}\|Ax\|_{v},A\in \mathbb {K} ^{n\times n}

definierte Norm die durch die Vektornorm $\|\cdot \|$ induzierte Matrixnorm (oder auch Operatornorm von $A$ ).

Bemerkung[Bearbeiten]

Man beachte, dass wegen der Kompaktheit der Menge $\{x\in \mathbb {K} ^{n}|\|x\|_{v}=1\}$ und der Stetigkeit der Vektornorm das Maximum in der Definition von $\|A\|$ tatsächlich angenommen wird. Offenbar gilt für die Indentität (Einheitsmatrix) $\|I\|=1$ .

Satz - Induzierten Matrixnorm[Bearbeiten]

Die durch eine Vektornorm induzierte Matrixnorm

(IM1) beistzt die in Normeigenschaften (N1), (N2), (N3) angegebenen Normeigenschaften,
(IM2) bezüglich der zugrunde liegenden Vektornorm verträglich und
(IM3) submultiplikativ

Beweis - Induzierten Matrixnorm[Bearbeiten]

Es seien $\|\cdot \|_{v}:\mathbb {K} ^{n}\to \mathbb {R} _{0}^{+}$ die Vektornorm und $\|\cdot \|:\mathbb {K} ^{n\times n}\to \mathbb {R} _{0}^{+}$ die induzierte Matrixnorm.

(IM1) Normeigenschaften[Bearbeiten]

Die Normeigenschaften der Vektornorm $\|\cdot \|_{v}$ liefern die Normeigenschaften der induzierten Matrixnorm $\|\cdot \|$ unmittelbar.

(IM2) Verträglichkeit[Bearbeiten]

Ihre Verträglichkeit mit der Vektornorm folgt aus

\|Ax\|_{v}={\frac {\|Ax\|_{v}}{\|x\|_{v}}}\|x\|_{v}\leq \left(\max _{x\in \mathbb {K} ^{n}\setminus \{0\}}{\frac {\|Ax\|_{v}}{\|x\|_{v}}}\right)\|x\|_{v}=\|A\|\|x\|_{v}

für $x\neq 0$ .

(IM3) Submultiplikativität - 1[Bearbeiten]

Weiter gilt für $A,B\in \mathbb {K} ^{n\times n}$ und $x\in \mathbb {K} ^{n}$ mit $Bx\neq 0$

{\begin{array}{rcl}\|ABx\|_{v}&=&{\frac {\|A(Bx)\|_{v}}{\|Bx\|_{v}}}{\frac {\|Bx\|_{v}}{\|x\|_{v}}}\cdot \|x\|_{v}\\&\leq &\|A\|\cdot \|B\|\cdot \|x\|_{v}\\\end{array}}

(IM4) Submultiplikativität - 2[Bearbeiten]

Im Fall $x\neq 0_{V}$ gilt dann

0\leq {\frac {\|A\cdot B\cdot x\|_{v}}{\|x\|_{v}}}\leq \|A\|\cdot \|B\|.

Somit folgt auch die Submultiplikativität der induzierten Matrixnorm.