Kurs:Numerik I/Konvergenzraten

Aus Wikiversity

Einleitung - Konvergenzraten[Bearbeiten]

Die Verfahren, die wir bisher im Zusammenhang mit der Lösung linearer Gleichungssysteme und Ausgleichsprobleme vorgestellt haben, bestimmen in endlich vielen Schritten eine Lösung, welche, wenn man exakt rechnen könnte, immer die exakte Lösung des Problems wäre. In der Praxis lassen sich aber viele mathematische Probleme nur mittels eines Iterationsverfahrens näherungsweise lösen.

Iterationsverfahren[Bearbeiten]

d. h. mittels wiederholter Anwendung derselben Rechenvorschriften, wobei in der -ten Iteration („Wiederholung“), ausgehend von einer Näherung , eine neue und möglichst genauere Näherung für eine gesuchte Lösung des Problems berechnet wird. Für den Start eines solchen Verfahrens muss man folglich eine Startnäherung vorgeben.

Iterationsverfahren würden im allgemeinen, wenn sie nicht nach endlich vielen Schritten abgebrochen würden, eine unendliche Folge von Iterierten generieren. Aufgabe des Numerikers ist es zu zeigen, dass jede konvergente Teilfolge oder die ganze vom Verfahren erzeugte Folge für jeden Startpunkt aus einer gewissen Menge gegen eine (ja a priori unbekannte!) Lösung des gegebenen Problems konvergiert. In diesem Zusammenhang spricht man von globaler Konvergenz eines Verfahrens, wenn diese Konvergenz für jede Wahl des Startpunktes aus einer wohlbestimmten Menge (z. B. dem ganzen ) gegeben ist, und von lokaler Konvergenz, wenn dies nur für Startpunkte aus einer (im Allgemeinen nicht spezifizierbaren) Umgebung einer Lösung der Fall ist. In der Praxis wird ein Iterationsverfahren natürlich nach einer endlichen Anzahl von Iterationen gestoppt und zwar dann, wenn zum ersten Mal ein Abbruchkriterium erfüllt ist, welches ausreichende Genauigkeit der aktuellen Näherung im Hinblick auf eine Lösung des Problems sicherstellt. Die Angabe eines sinnvollen Abbruchkriteriums kann dabei durchaus ein schwieriges Unterfangen sein.

Für ein gegebenes Verfahren ist neben dem rechnerischen Aufwand, der pro Iteration zu leisten ist, naturgemäß von Interesse, wie schnell es, wenn es nicht abgebrochen würde, gegen eine gesuchte Lösung konvergieren würde und damit, ob im Schnitt nur wenige oder viele Iterationen durchlaufen werden müssen, bis ein gegebenes Abbruchkriterium erfüllt ist. Wir wollen daher als nächstes den Begriff der Konvergenzgeschwindigkeit eines Verfahrens genauer fassen.

Definition 5.1[Bearbeiten]

Sei eine Norm auf dem und eine Folge in mit .
(i) Die Folge konvergiert von (mindestens) der Ordnung (gegen ), wenn mit einem und einem
(5.1)
gilt, wobei für sei. Im Fall spricht man auch von linearer und im Fall von quadratischer Konvergenz.
(ii) Die Folge konvergiert superlinear (gegen ), wenn für ein gilt sowie
(5.2)

Die drei wichtigsten Konvergenzraten bei Algorithmen sind lineare, superlineare und quadratische Konvergenz, so dass wir uns im Folgenden nur auf sie beziehen werden.

Die (praktisch irrelevante) Voraussetzung „ für ein “ bei der Definition der superlinearen Konvergenz kann man vermeiden, indem man diese mit einer Folge von Zahlen mit durch

(5.3)

für ein definiert. Für kann man superlineare Konvergenz der Folge auch durch die Beziehung

ausdrücken und quadratische Konvergenz durch

Beispiel 5.2[Bearbeiten]

Die Folgen und mit

konvergieren für gegen . Man errechnet

Also konvergiert linear, superlinear und quadratisch gegen 1. Die folgende Tabelle demonstriert, was die unterschiedlichen Konvergenzraten praktisch bedeuten.

Quadratische Konvergenz impliziert superlineare Konvergenz und diese wiederum lineare Konvergenz. Denn im Fall quadratischer Konvergenz hat man mit einem und einem

was wegen die Bedingung (5.3) impliziert. Ist andererseits (5.2) gegeben, dann existiert zu jedem ein , so dass gilt:

(5.4)

Letztere Beziehung drückt gerade die lineare Konvergenz aus.

Im Fall der superlinearen Konvergenz gilt ja (5.4), d. h. lineare Konvergenz mit einem , so dass man bei der Definition der linearen und superlinearen Konvergenz auf die Voraussetzung verzichten könnte. Denn die Ungleichung (5.1) impliziert im Fall der linearen Konvergenz

und damit wegen auch die Konvergenz . Bei der Definition einer Konvergenzordnung muss man aber, da dort nicht gefordert ist, die Konvergenz der Folge explizit voraussetzen.

Man beachte, dass lineare Konvergenz mit einer Konstanten sehr langsame Konvergenz bedeuten kann.

Beispiel 5.3[Bearbeiten]

Für die gegen 1 konvergierende Folge mit gilt

Die langsame Konvergenz sei mit der Berechnung einiger Folgenglieder gezeigt:

Man hofft also, dass die Konstante in der Praxis im Fall der linearen Konvergenz ist und im Fall der quadratischen Konvergenz nicht allzu groß wird. In letzterem Fall besagt die Ungleichung (5.1) für , dass sich für einen Fehler die Anzahl der korrekten Stellen hinter dem Dezimalpunkt von bezüglich gegenüber der von ungefähr verdoppelt. Denn dann ist

so dass man bei einer Genauigkeit von Stellen hinter dem Dezimalpunkt für bezüglich der Norm im -ten Schritt einen Fehler hat und somit im -ten Schritt einen Fehler

Quadratische Konvergenz ist demnach eine für die Praxis sehr gute Eigenschaft eines Verfahrens und meist die schnellste Konvergenz, die man mit vernünftigen Mitteln erreichen kann.

Es sei jedoch darauf hingewiesen, dass eine gute Konvergenzrate eines Verfahrens alleine nicht dessen Effizienz garantiert. Von einem gegebenen Verfahren ausgehend, kann man ja immer ein noch schnelleres Verfahren erzeugen, indem man mehrere Iterationen des ersten Verfahrens zu einer einzigen zusammenfasst. Neben der Konvergenzgeschwindigkeit eines Verfahrens hat man also bei der Beurteilung eines Verfahrens den numerischen Aufwand pro Iteration und natürlich auch seine Stabilität zu berücksichtigen.

Wir bemerken ferner, dass die Eigenschaften der superlinearen und quadratischen Konvergenz einer Folge gegen einen Punkt im aufgrund der Äquivalenz aller Normen im unabhängig von der gewählten Norm sind. Denn die Äquivalenz zweier Normen und auf dem besagt, dass mit zwei Konstanten und

gilt, so dass z. B. die Beziehung in (5.3) bezogen auf die Norm

impliziert und damit für die Nullfolge mit auch

Ähnlich garantiert quadratische Konvergenz bezüglich der Norm auch die quadratische Konvergenz

bezüglich einer Norm , wobei die Konstante von der Norm abhängt. Dagegen muss lineare Konvergenz einer Folge im bezüglich einer Norm nicht notwendig die lineare Konvergenz hinsichtlich einer anderen Norm auf dem zur Folge haben. Zwar gilt beispielsweise für jede linear bezüglich konvergente Folge auch

mit einer Konstanten für eine Norm , jedoch nicht notwendig . Sprechen wir also von linearer Konvergenz, so müssen wir klarstellen, bezüglich welcher Norm wir dies tun. Wenn nichts Anderes gesagt wird, beziehen wir uns immer auf Konvergenz im Sinne der Euklidischen Norm .

Die hier eingeführten Begriffe der linearen, superlinearen und quadratischen Konvergenz werden gelegentlich auch als -lineare, -superlineare bzw. -quadratische Konvergenz bezeichnet, im Unterschied zur -linearen, -superlinearen bzw. -quadratischen Konvergenz (siehe z. B. das Buch von Ortega und Rheinboldt aus dem Jahre 1970). Das „“ steht dabei für „Quotient“, da die Konvergenzrate in allen Fällen mittels des Quotienten ausgedrückt werden kann (während „“ für engl. „Root“, also „Wurzel“ steht).

Siehe auch[Bearbeiten]

Seiteninformation[Bearbeiten]

Diese Lernresource können Sie als Wiki2Reveal-Foliensatz darstellen.

Wiki2Reveal[Bearbeiten]

Dieser Wiki2Reveal Foliensatz wurde für den Lerneinheit Kurs:Numerik I' erstellt der Link für die Wiki2Reveal-Folien wurde mit dem Wiki2Reveal-Linkgenerator erstellt.