Kurs:Numerik I/Interpolation

Aus Wikiversity

Interpolationsproblem[Bearbeiten]

Das Problem der Interpolation besteht allgemein darin, für gegebene Stützpunkte bzw. Daten ein Funktion eines gegebenen endlich-dimensionalen Funktionenraums zu bestimmen, so dass

gilt. Dabei können die von einer gegebenen, in den definierten Funktion herrühren, d. h. kann

gelten.

Zielsetzung[Bearbeiten]

Ähnlich wie bei der Ausgleichsrechnung geht es also darum, eine große Zahl von Daten durch eine Funktion zu ersetzen bzw. eine Funktion , die möglicherweise durch eine komplizierte und numerisch aufwendig auszuwertende Vorschrift definiert ist, durch eine Funktion mit einer einfacheren Vorschrift anzunähern, die ebenfalls die Daten interpoliert.

Unterschied zur Ausgleichsrechnung[Bearbeiten]

Bei bei der Interpolation wird im Unterschied zur Ausgleichsrechnung gefordert, dass der Graph der gesuchten Funktion genau durch die Punkte verläuft und nicht nur mit einem möglichst geringen Fehler annähert.

Beispiel - Lineare Regression[Bearbeiten]

Bei der linearen Regression versucht man eine Ausgleichsgerade zu finden, dessen Abstand zu den Daten minimiert. Das aus den Daten entstehende Gleichungssystem ist überbestimmt und daher im Allgemeinen nicht eindeutig lösbar. Eine Interpolation von mehr als zwei Datenpunkten mit einem Polynom 1. Grades ist daher im Allgemeinen nicht möglich.

Ansatzraumes[Bearbeiten]

Für die Wahl des Ansatzraumes gibt es nun wie bei der Ausgleichsrechnung oder anderen Arten der Approximation viele Möglichkeiten. Hier wollen wir nur auf die wichtigste Art der Interpolation eingehen, die Polynominterpolation, bei der

der Funktionenraum aller Polynome vom Höchstgrad , also mit ist.

Polynominterpolation[Bearbeiten]

Wir betrachten also jetzt das folgende Problem (IP) der Interpolation durch ein Polynom:

(IP) Für gegebene Stützpunkte
(6.1)
mit Stützstellen
(6.2)
bestimme ein Interpolationspolynom mit
(6.3)

Die Bedingung (6.2) könnte man an einigen Stellen in diesem Kapitel fortlassen. Sie ist aber sinnvoll und wird insbesondere zum Beweis der Eindeutigkeit des Interpolationspolynoms im nächsten Satz benötigt.

Satz - Eindeutigkeitssatz - Interpolationsproblem[Bearbeiten]

Das Interpolationsproblem (IP) hat eine eindeutige Lösung .

Beweis.[Bearbeiten]

Sei in der Form

gegeben. Dann lauten die Gleichungen (6.3)

(6.4)

Dies sind Gleichungen in den Unbekannten . Die zu diesen Gleichungen gehörende Systemmatrix ist die bereits aus Abschnitt 4.2 bekannte Vandermonde-Matrix

Ihre Determinante, die Vandermonde-Determinante, ist durch

gegeben (siehe R. Zurmühl: Matrizen und ihre technischen Anwendungen, Springer, Berlin, 1965). Wegen (6.2) ist und alles gezeigt.

q.e.d.

Der Beweis des letzten Satzes macht deutlich, dass man das Interpolationspolynom bestimmen kann, indem man das System (6.4) löst. Leider ist die zugehörige Systemmatrix, die Vandermonde-Matrix, sehr schlecht konditioniert, wie wir bereits in Abschnitt 4.2 festgestellt hatten. Daher ist von diesem Weg zur Lösung des Interpolationsproblems abzuraten. Wir geben im Folgenden andere Möglichkeiten der Bestimmung an, die aber alle auch Vor- und Nachteile haben.

6.2 Die Lagrangesche Darstellung des Interpolationspolynoms[Bearbeiten]

Wir führen zunächst spezielle Polynome ein:

Definition 6.2[Bearbeiten]

Zu Stützstellen mit für sind die Langrangeschen Basispolynome definiert durch

Offenbar hat das Lagrangesche Basispolynom die Nullstellen und genügt es den Bedingungen

(6.5)

Da ein Polynom vom Höchstgrad ist und somit, wenn es nicht das Nullpolynom ist, maximal Nullstellen hat, folgt:

(6.6)

Das heißt, die sind linear unabhängig und es ist somit

Wegen

folgt damit

Die Funktionen bilden also eine Basis des Polynomraumes , so dass sich jedes Polynom vom Höchstgrad und damit auch das eindeutig bestimmte Interpolationspolynom als Linearkombination der darstellen lässt. Für die nach Satz 6.1 eindeutige Lösung des Interpolationsproblems (IP) ist diese Darstellung wegen (6.5) besonders einfach. Denn macht man für den Ansatz

so folgt mit (6.3) und (6.5)

und damit die Lagrangesche Darstellung des Interpolationspolynoms

(6.7)

Sie hat den Vorteil, dass man an ihr die Stützwerte für die Stützpunkte und damit die Interpolationsbedingungen (6.3) sofort ablesen kann.

Beispiel 6.3[Bearbeiten]

Zu den Stützpunkten

lauten die Langrangeschen Basispolynome

Das Interpolationspolynom zu diesen Stützpunkten ist somit gegeben durch

Zum Beispiel für berechnet man

Man beachte, dass die Abbildung

die für vorgegebene, paarweise verschiedene jeder Menge von Stützwerten das eindeutige Interpolationspolynom zuordnet, linear ist.

Leider ist aber auch die Lagrangesche Darstellung des Interpolationspolynoms für praktische Rechnungen mit großem weniger geeignet. Denn die Berechnung von in einem Punkt für ein verlangt insgesamt Produkte und 1 Division, so dass für die Auswertung des Interpolationspolynoms an einer Stelle insgesamt , also wesentliche arithmetische Operationen benötigt werden. Außerdem erfordert die Lagrangesche Darstellung des Interpolationspolynomes im Fall der Hinzunahme eines Stützpunktes oder mehrerer Stützpunkte zu der ursprünglichen Stützpunktmenge die Neuberechnung aller und damit des gesamten Interpolationspolynoms.

6.3 Das Neville-Schema[Bearbeiten]

Die Lösung für das Problem (IP), d. h. das Interpolationspolynom, kann auch schrittweise aus den Interpolationspolynomen für Stützpunkte berechnet werden. Um dies zu zeigen, benötigen wir:

Definition 6.4[Bearbeiten]

Zu Stützpunkten wie in (6.1) und (6.2) bezeichne das (eindeutig bestimmte) Polynom vom Grad mit
(6.8)
wobei und seien.

Damit können wir die Lösung des Problems (IP) auch in der Form

schreiben. Weiter können wir in diesem Zusammenhang beweisen:

Satz 6.5[Bearbeiten]

Für gilt die Rekursionsformel
(6.9)
(6.10) , falls .

Beweis.[Bearbeiten]

Die Identität (6.9) ist wegen und richtig. Nun bezeichne die rechte Seite von (6.10), so dass zu zeigen ist.

Es gilt und und demnach . Weiter gilt

und für hat man

Wegen der Eindeutigkeit des Interpolationspolynoms (vgl. Satz 6.1) folgt .

q.e.d.

Die Formel (6.10) ist eine Rekursionsformel, die es ermöglicht, das Polynom vom Grad aus den beiden Polynomen und vom Grad zu bestimmen. Sie führt auf das Neville-Schema, bei dem sich die Einträge spaltenweise berechnen lassen:

Mit diesem Schema lässt sich das Interpolationspolynom an einzelnen Stellen auswerten. Dazu werden jeweils

Multiplikationen und Divisionen benötigt.

Beispiel 6.6[Bearbeiten]

Wir betrachten wieder die Stützpunkte aus Beispiel 6.3:

Für berechnet man

Demnach sieht das Neville-Schema hier wie folgt aus:

Bei Aufnahme eines neuen Stützpunktes oder mehrerer neuer Stützpunkte und Auswertung des Interpolationspolynoms an derselben Stelle wie zuvor, muss das Neville-Schema, anders als es eine Auswertung über die Lagrangesche Darstellung erfordern würde, nicht vollständig neu aufgestellt werden, sondern müssen nur entsprechende Zeilen am Ende des Schemas hinzugefügt werden. Falls ein Interpolationspolynom jedoch an mehreren Stellen zu bestimmen ist, sind trotzdem andere Methoden vorzuziehen. Eine davon wird im folgenden Abschnitt vorgestellt.

6.4 Die Newtonsche Darstellung des Interpolationspolynoms[Bearbeiten]

Wir definieren zunächst:

Definition 6.7[Bearbeiten]

Zu gegebenen Stützstellen sind die Newtonschen Basispolynome definiert durch

Man beachte dabei, dass das leere Produkt als 1 definiert, also ist. Ähnlich wie für die Lagrangeschen Basispolynome in (6.6) schließt man, dass die Newtonschen Basispolynome linear unabhängig sind und

ist. Jedes Polynom vom Höchstgrad lässt sich also auch nach Newtonschen Basispolynomen entwickeln. Insbesondere soll nun eine solche Entwicklung

(6.11)

d. h., sollen nun zugehörige Koeffizienten für das Interpolationspolynom bestimmt werden.

Die Koeffizienten in (6.11) lassen sich nacheinander aus den Gleichungen

gewinnen. Zur Berechnung der Koeffizienten des Interpolationspolynoms wären bei dieser Vorgehensweise

Multiplikationen und Divisionen und insgesamt arithmetische Operationen erforderlich. Eine Vorgehensweise, die dafür nur Divisionen und nur insgesamt arithmetische Operationen verlangt, soll im Folgenden vorgestellt werden.

Definition 6.8[Bearbeiten]

Für Stützpunkte wie in (6.1) und (6.2) heißen die Zahlen
(6.12)
dividierte Differenzen, wobei und seien.

Man beachte, dass die dividierte Differenz von den Stützstellen und den Stützwerten abhängt. Die genauen Abhängigkeiten zwischen den einzelnen dividierten Differenzen können dem folgenden Tableau entnommen werden.

Zum Beispiel gilt

Zur Berechnung aller dividierten Differenzen für Stützpunkte werden insgesamt nur

Divisionen benötigt. Ferner gilt folgender Satz:

Satz 6.9[Bearbeiten]

Für die Lösung des Interpolationsproblems (IP) hat man die Darstellung (6.11) mit
(6.13)

Beweis.[Bearbeiten]

Der Beweis wird per vollständiger Induktion über geführt. Die Behauptung ist sicher für richtig. Es sei nun angenommen, dass sie für beliebiges und beliebige Stützpunkte mit für richtig sei.

Seien nun Stützpunkte mit für gegeben und das zugehörige Interpolationspolynom. Mit den in Definition 6.4 definierten Polynomen gilt dann

und daher mit einer Konstanten ( ist möglich)

bzw.

(6.14)

Nach Induktionsvoraussetzung gilt nun so dass noch

zu zeigen bleibt.

Nach Satz 6.5 gilt

(6.15)

so dass die Behauptung per Koeffizientenvergleich folgt: wegen (6.14) muss a der Hauptkoeffizient von , d. h. muss

für ein gewisses Polynom sein. Weiter ist nach Induktionsvoraussetzung bekannt, dass und die Hauptkoeffizienten und haben und damit den folgenden Hauptkoeffizienten hat:

Somit ist alles gezeigt.

q.e.d.

Die Darstellung (6.13) nennt man die Newtonsche Darstellung des Interpolationspolynoms. Nimmt man einen weiteren Stützpunkt zu den ursprünglich Stützpunkten zusätzlich mit auf, so ändern sich offenbar die ersten Koeffizienten des Interpolationspolynoms in dieser Darstellung nicht und kann man den Koeffizienten berechnen, indem man im Schema der dividierten Differenzen unten eine zusätzliche Zeile für diesen Punkt berechnet.

Sind schließlich die Koeffizienten der Newtonschen Darstellung (6.11) des Interpolationspolynoms bekannt, so kann dieses für jedes effizient mit dem Horner-Schema

ausgewertet werden, wobei die Operationen von links nach rechts auszuführen sind.

Zum Abschluss zeigen wir die Vorgehensweise wieder an unserem Standardbeispiel.

Beispiel 6.10[Bearbeiten]

Gegeben seien die Stützpunkte

Dazu stellen wir das Schema der dividierten Differenzen auf:

Das Interpolationspolynom zu diesen Stützpunkten lautet somit in der Newtonschen Darstellung:

(6.16)

Nimmt man beispielsweise den Punkt mit hinzu, so muss man nur das obige Schema um eine Zeile erweitern:

Das Interpolationspolynom zu diesen Stützpunkten ist dann in Bezug auf (6.16) nur um einen Term zu erweitern:

Das Horner-Schema zur Berechnung von letzterem Polynom an der Stelle lässt sich mit

wie folgt darstellen, wobei hier ist:

Offenbar ist .

6.5 Der Fehler bei der Polynominterpolation[Bearbeiten]

Der folgende Satz gibt für hinreichend oft differenzierbare Funktionen eine Darstellung des bei der Polynominterpolation auftretenden Fehlers an.

Satz 6.11[Bearbeiten]

Es seien und . Für jedes genügt dann die Lösung des Interpolationsproblems (IP) der Gleichung
(6.17)
mit
(6.18)
und einem .

Beweis.[Bearbeiten]

Da für für nichts zu zeigen ist, nehmen wir für an. Sei nun

mit

so dass folgt. Also besitzt in dem Intervall mindestens paarweise verschiedene Nullstellen

Wiederholte Anwendung des Satzes von Rolle zeigt, dass in dem Intervall mindestens Nullstellen besitzt, mindestens usw. und somit mindestens noch eine Nullstelle . Nun gilt aber

wobei die zweite Identität aus der Tatsache folgt, dass den Hauptkoeffizienten 1 hat. Insgesamt erhält man damit

was den Beweis vervollständigt.

q.e.d.

Eine weitere Darstellung für den bei der Polynominterpolation entstehenden Fehler erhält man mittels dividierter Differenzen.

Satz 6.12[Bearbeiten]

Es seien und . Für jedes genügt dann die Lösung des Interpolationsproblems (IP) der Gleichung

Beweis.[Bearbeiten]

Mit für hat man nach Satz 6.9

für alle , so dass mit der Identität die Behauptung folgt.

q.e.d.

Als Konsequenz aus den Sätzen 6.11 und 6.12 ergibt sich für die dividierten Differenzen:

Korollar 6.13[Bearbeiten]

Es seien und Stützwerte zu Stützstellen mit für . Dann existiert ein mit

Beweis.[Bearbeiten]

Für ist die Behauptung trivial und für folgt sie unmittelbar aus einem Vergleich der rechten Seiten in den Sätzen 6.11 und 6.12, wenn diese auf und angewandt werden.

q.e.d.

Wir wollen nun der Frage nachgehen, ob die Wahl von mehr Stützstellen automatisch auch zu einer Verringerung des bezüglich maximalen Interpolationsfehlers führt oder, anders ausgedrückt, ob der maximale Interpolationsfehler für eine Folge von Interpolationspolynomen zu zunehmend wachsender Zahl von Stützstellen gegen Null strebt. Dazu sei für jedes für den Rest des Unterabschnitts

(6.19)

mit einem eine Partition von und

ein Maß für die Feinheit der Unterteilung. Weiter sei das Interpolationspolynom zu mit den Stützstellen . Aus Satz 6.11 können wir dann zunächst das folgende Konvergenzergebnis schließen. Man beachte, dass dafür nicht gefordert ist.

Satz 6.14[Bearbeiten]

Es sei und es gelte mit einem
Weiter sei eine Folge von Partitionen von der Form (6.19) mit . Dann konvergiert die Folge der zugehörigen Interpolationspolynome auf gleichmäßig gegen , d. h., es gilt

Beweis.[Bearbeiten]

Aus Satz 6.11 schließt man

Für konvergiert der letzte Term für gegen Null, so dass alles gezeigt ist.

q.e.d.

Beispiel 6.15[Bearbeiten]

Für hat man

und somit z. B. für

Allgemein kann man jedoch nicht erwarten, dass eine gegebene Funktion auf einem kompakten Intervall umso besser durch ein Interpolationspolynom approximiert wird, je feiner die Unterteilung der Stützstellen gewählt wird. Wie man zeigen kann, ist dafür die Funktion

ein Beispiel. Für deren Ableitungen in man

zeigen kann, so dass z. B. für mit einer Konstanten folgt:

In diesem Fall ist also auch die Voraussetzung von Satz 6.14 nicht erfüllt. Allgemein hat man in diesem Zusammenhang das folgende „Negativergebnis“, den Satz von Faber, welcher insbesondere für Folgen von Partitionen mit von Interesse ist. (Einen Beweis, der allerdings einiges voraussetzt, findet man bei E. W. Cheney: Introduction to Approximation Theory, 2nd edition, Chelsea, New York, 1982.)

Satz 6.16 (Faber)[Bearbeiten]

Zu jeder Folge von Partitionen von der Form (6.19) existiert eine Funktion , so dass für die Folge der zugehörigen Interpolationspolynome auf gilt:

6.6 Tschebyscheff-Polynome[Bearbeiten]

Der Fehler des Interpolationspolynoms zu vorgegebenen Stützstellen wird durch (6.17) beschrieben. Da der Punkt in (6.17) i. a. unbekannt ist, macht es Sinn, statt der Darstellung (6.17) des Interpolationsfehlers die Abschätzung

(6.20)

zu betrachten. In diesem Abschnitt wird der Frage nachgegangen, für welche Stützstellen der darin stehende Ausdruck

am kleinsten wird, d. h. es soll das Minimax-Problem

gelöst werden. Da jedes Polynom vom Grad mit Hauptkoeffizientem 1 mit Hilfe seiner Nullstellen als Produkt geschrieben werden kann, ist also ein Polynom gesucht, welches unter allen Polynomen vom Grad mit Hauptkoeffizienten 1 die Maximumnorm bezüglich minimal macht. Wählt man die Nullstellen eines solchen Polynoms als Stützstellen, so erzeugt also das zugehörige Interpolationspolynom unter allen Interpolationspolynomen zu Stützpunkten die kleinste obere Fehlerschranke in (6.20).

Wir betrachten zunächst nur das Intervall . Es wird sich im Folgenden herausstellen, dass die gesuchten „optimalen“ Stützstellen gerade die Nullstellen des -ten Tschebyscheff-Polynoms erster Art sind.

Definition 6.17[Bearbeiten]

Die Funktionen
(6.21)
heißen Tschebyscheff-Polynome erster Art.

Im folgenden Satz sind einige Eigenschaften dieser Funktionen aufgeführt.

Satz 6.18[Bearbeiten]

Für wie in (6.21) gelten die folgenden Aussagen:
(i)
(ii) Für gilt und
(6.22)
und Fortsetzung des Definitionsbereichs der so definierten auf ganz liefert
(6.23)
(iii) hat für den Hauptkoeffizienten .
(iv) Es gilt
(v) besitzt die einfachen Nullstellen
(6.24)
welche alle in dem Intervall liegen.
(vi) besitzt in dem Intervall insgesamt Extremwerte
für
(6.25)

Beweis.[Bearbeiten]

(i) gilt offensichtlich und die Darstellungen für und in (ii) ergeben sich sofort aus der Definition (6.21). Für die Herleitung der Rekursionsformel (6.22) benötigen wir die Formel

Mit (i) liefert diese für und

Weiter folgt (iii) aus der Rekursionsformel (ii) und folgt (iv) mit (i) wegen

Schließlich sind die Aussagen (v) und (vi) offensichtlich richtig.

q.e.d.

Nach Satz 6.18 (iii) und (v) gilt mit den Nullstellen von wie in (6.24) die Darstellung

(6.26)

Der folgende Satz besagt nun, dass dieses Polynom unter allen Polynomen vom Grad mit Hauptkoeffizienten 1 die Maximumnorm auf minimal macht und dass man überdies den zugehörigen Wert dieser Norm auch angeben kann.

Satz 6.19[Bearbeiten]

Für und die wie in (6.24) gilt die folgende Optimalitätseigenschaft:

(6.27)

Beweis.[Bearbeiten]

Die zweite Identität folgt aus (6.26) mit Satz 6.18 (iv). Weiter ist bei der ersten Identität in (6.27) die Abschätzung „“ offensichtlich. Die Abschätzung „“ soll nun durch eine Widerspruchsannahme nachgewiesen werden.

Angenommen, es gibt Zahlen mit

(6.28)

für . Also ist insbesondere

(6.29)

Für das Polynom

schließt man mit (6.25) und (6.29)

Also hat mindestens Vorzeichenwechsel in und gilt allgemein

Das Polynom besitzt demnach einfache paarweise verschiedene Nullstellen in . Nun ist sowohl als auch ein Polynom vom Grad und besitzen beide Funktionen den führenden Koeffizienten 1, so dass notwendigerweise gilt. Da im Fall nur höchstens paarweise verschiedene Nullstellen haben kann, folgt bzw.

was aber wegen Satz 6.18 (iv) und (6.29) der Annahme (6.28) widerspricht.

q.e.d.

Damit haben wir den Fall behandelt. Abschließend werden wir nun noch allgemeine Intervalle betrachten. Dazu verwenden wir die affin-lineare Transformation

(6.30)

mit welcher der nachfolgende Satz leicht aus Satz 6.19 zu schließen ist.

Satz 6.20[Bearbeiten]

Mit der Funktion aus (6.30) und den wie in (6.24) gilt die Optimalitätseigenschaft
(6.31)
(6.32)

Beweis.[Bearbeiten]

Die Identität (6.32) ergibt sich mit Satz 6.19 unter Verwendung von (6.30) aus

Weiter ist in (6.31) sicher die Ungleichung „“ richtig. Zum Beweis der Ungleichung „“ seien nun beliebig. Dann gibt es eindeutig bestimmte Zahlen mit für und mit diesen erhält man ähnlich wie im ersten Teil des Beweises

q.e.d.

Korollar 6.21[Bearbeiten]

Sei und das Interpolationspolynom zu den Stützpunkten mit für aus (6.30) und wie in (6.24). Dann gilt für den Interpolationsfehler
(6.33)

Man beachte aber, dass nach dem Satz von Faber 6.16 auch bei Wahl der Tschebyscheff-Knoten die Interpolationspolynome mit wachsendem nicht gleichmäßig auf gegen konvergieren müssen.

Beispiel 6.22[Bearbeiten]

Gegeben sei die Funktion , welche im Intervall in 5 Punkten durch ein Interpolationspolynom möglichst kleinen Grades so interpoliert werden soll, dass die maximale Schranke für den Approximationsfehler möglichst klein ausfällt. Die Stützstellen sind dann gemäß Korollar 6.21 zu wählen. Da der erste Punkt den Index 0 hat, ist hier . Mit

und (6.24) lauten die gesuchten Stützstellen

Demnach errechnet man mit

Man hat weiter für

und damit

Für das Interpolationspolynom zu den berechneten Stützpunkten kann man also gemäß (6.33) die folgende maximale Abweichung von auf vorhersagen:

Abschließend sei noch gesagt, dass ein Nachteil der in diesem gesamten Kapitel dargestellten Form der Interpolation ihrer großen Fehlerempfindlichkeit ist. Fehlerhafte Daten wirken sich nicht nur lokal bei der Stützstelle aus, sondern verändern den Verlauf über das ganze Intervall hinweg relativ stark. Dies wird an dem folgenden einfachen Beispiel deutlich.

Beispiel 6.23[Bearbeiten]

Seien

Dann hat man und somit

Darstellung des Interpolationspolynoms und damit des auf bezogenen Interpolationsfehlers für z. B. zeigt, dass durch „Messfehler“ und an der Stelle sehr unterschiedlich verändert wird und zwar keineswegs nur an der Stelle .

Sieha auch[Bearbeiten]

Seiteninformation[Bearbeiten]

Diese Lernresource können Sie als Wiki2Reveal-Foliensatz darstellen.

Wiki2Reveal[Bearbeiten]

Dieser Wiki2Reveal Foliensatz wurde für den Lerneinheit Kurs:Numerik I' erstellt der Link für die Wiki2Reveal-Folien wurde mit dem Wiki2Reveal-Linkgenerator erstellt.