Kurs:Analysis II/Kapitel IV: Partielle Differentiation für Funktionen mehrerer Veränderlicher/Taylorsche Formel im R^n und Extremwertaufgaben (§3)
Aus Wikiversity
[Bearbeiten] Satz 1 (Taylorsche Formel in mehreren Variablen)
- Seien die Dimensionen
und die offene Menge Ω im
gewählt. Es seien x und y zwei feste Punkte aus Ω, so dass die Verbindungsgerade σ(x,y) – auch Segment genannt – die Inklusion

- erfüllt.Weiter sei die reellwertige Funktion in der Klasse
gegeben. Unter Verwendung der Differentiale aus §2 haben wir dann die Darstellung

- mit einem Punkt
.
[Bearbeiten] Beweis
Wir betrachten die Funktion
der Klasse Cm([0,1]). Mit Hilfe der Kettenregel erhält man
,woraus sich wegen Formel (4) aus §2
ergibt. Durch wiederholte Differentiation findet man

für
. Die eindimensionale Taylorsche Formel aus Satz 1 von §6 in Kapitel II liefert die Identität

Dabei wurde
gewählt und
gesetzt.
q.e.d.
[Bearbeiten] Definition 1
- Sei auf der offenen Menge
die Funktion
erklärt. Dann hat f ein absolutes oder auch globales Maximum bzw. Minimum im Punkt
, wenn die Ungleichung
bzw.
für alle 
- gilt.
- Die Funktion f hat ein – schwaches – relatives oder auch lokales Maximum bzw. Minimum an der Stelle x = a, wenn es eine Kugel

- vom hinreichend kleinen Radius
so gibt, dass die Ungleichung
bzw.
für alle 
- erfüllt ist.
- Die Funktion f hat ein striktes relatives oder auch lokales Maximum bzw. Minimum an der Stelle x = a, wenn es eine Kugel
vom Radius
so gibt, dass die Ungleichung
mit 
- richtig ist.
- Wir sprechen von einem Extremum, wenn wir sowohl ein Maximum als auch ein Minimum zulassen.
[Bearbeiten] Satz 2 (Notwendige Bedingung erster Ordnung)
- Die stetige Funktion
auf der offenen Menge
besitze an der Stelle
ein relatives Maximum oder Minimum – also ein Extremum. Außerdem existieren die ersten partiellen Ableitungen
für
. Dann gilt die Beziehung
für
, das heißt
.[Bearbeiten] Beweis
Da die offene Menge Ω den Punkt a enthält, gibt es eine Kugel
von hinreichend großem Radius ρ > 0. Wir betrachten nun die Funktion
,die an der Stelle t = ai ein Extremum hat. Weiter existiert
und wie im Beweis des Rolleschen Satzes aus §3 in Kapitel II zeigen wir
für
.q.e.d.
[Bearbeiten] Definition 2
- In der offenen Menge
nennen wir
einen kritischen Punkt der Funktion
, falls
erfüllt ist.
[Bearbeiten] Satz 3 (Notwendige Bedingung zweiter Ordnung)
- Die Funktion
auf der offenen Menge
gehöre zur Klasse C2(Ω) und besitze an der Stelle
ein relatives Minimum. Dann gilt
für alle
.[Bearbeiten] Beweis
Es sei
beliebig gewählt. Dann liegt für ein hinreichend kleines t > 0 die Strecke σ(a,a + tξ) in Ω. Die Taylorsche Formel liefert

mit einem geeigneten
. Da an der Stelle x = a ein relatives Minimum vorliegt folgt df(a,tξ) = 0. Ferner ist für alle hinreichend kleinen t > 0 die Ungleichung
erfüllt. Damit folgt
.Für
folgt
und wegen
erhalten wir die Behauptung
für alle
.[Bearbeiten] Satz 4 (Hinreichende Bedingung zweiter Ordnung)
- Sei die Funktion
auf der offenen Menge
gegeben. Weiter sei
ein Punkt, welcher
für
sowie
für alle 
- erfüllt. Dann besitzt f an der Stelle x = a ein striktes relatives Minimum.
[Bearbeiten] Beweis
Nach Voraussetzung gilt
für alle 
auf der kompakten Einheitssphäre
. Nun ist die quadratische Form aus (7) als Funktion von ξ stetig auf S und nach Satz 8 aus §1 in Kapitel II gibt es eine Zahl α > 0, so dass
für alle 
ausfällt. Wegen
gibt es eine hinreichend kleine Zahl
, so dass die Ungleichung
für alle
und alle 
erfüllt ist. Somit folgt
für alle
und alle
.Die Taylorsche Formel liefert für beliebiges
die Identität
,wobei z auf der Verbindungsstrecke
liegt. Beachten wir df(a,y − a) = 0, so folgt mit (10) die Ungleichung
.Wir erhalten
mit
.Somit nimmt f im Punkt a ein striktes relatives Minimum an.
q.e.d.
[Bearbeiten] Definition 3
- Sei
eine Funktion auf der offenen Menge
und sei ein Punkt
gewählt. Dann nennen wir

- die Hessesche Matrix von f an der Stelle a. Ihr ist die Hessesche quadratische Form

- zugeordnet.
[Bearbeiten] Definition 4
- Wir nennen die quadratische Form q positiv-definit, falls q(ξ) > 0 für alle
gilt – und positiv-semidefinit, falls
für alle
richtig ist. - Entsprechen heißt die quadratische Form q negativ-definit, falls q(ξ) < 0 für alle
gilt – und negativ-semidefinit, falls
für alle
richtig ist. - Die quadratische Form q wird indefinit genannt, falls es Punkte
gibt, für die q(ξ) > 0 bzw. q(η) < 0 richtig ist.
[Bearbeiten] Bemerkungen
1. Als notwendige Bedingung für ein relatives Minimum im Punkt a haben wir in Satz 3 hergeleitet, dass die Hessesche Form im kritischen Punkt a positiv-semidefinit sein muss.
2. Im Satz 4 haben wir gezeigt, dass eine hinreichende Bedingung für ein relatives Minimum eine positiv-definite Hessesche Form im kritischen Punkt a ist.
3. Durch den Übergang von f zu − f erhalten wir Kriterien für relative Maxima von Funktionen.
4. Die Hessesche Form erlaubt nur die Kontrolle relativer aber nicht absoluter Extrema.
5. Die Voraussetzung
für alle 
in Satz 4 lässt sich nicht durch die schwächere Voraussetzung
für alle 
ersetzen. Hierzu betrachten wir die Funktion
, die eine solche schwächere Voraussetzung für a = 0 erfüllt – dort jedoch kein relatives Minimum besitzt.
6. Andererseits ist die Behauptung in Satz 3 nicht durch die stärkere Aussage
für alle 
ersetzbar, wie man mit Hilfe der Funktion
an der Stelle a = 0 einsehen kann.
[Bearbeiten] Satz 5
- Auf der offenen Menge
sei die Funktion
gegeben mit dem kritischen Punkt
. Weiter sei die Hessesche Matrix
mit der zugeordneten quadratischen Form q(ξ) indefinit. Dann nimmt f im Punkt a weder ein lokales Maximum noch ein lokales Minimum an.
[Bearbeiten] Beweis
Da q indefinit ist, können wir mit den Überlegungen des Beweises von Satz 4 in jeder Umgebung von a Punkte x + und x − mit der Eigenschaft f(x − ) < f(a) < f(x + ) finden.
[Bearbeiten] Bemerkungen
1. Die in Satz 5 betrachteten kritischen Punkte
heißen Sattelpunkte.
2. Die Hessesche Matrix

ist genau dann positiv-definit bzw. positiv-semidefinit, falls ihre Hauptminoren

für
die Bedingungen
bzw.
erfüllen. Dieses Kriterium von A. Hurwitz können wir mit der Hauptachsentransformation symmetrischer, reeller Matrizen sofort einsehen.
3. Als Spezialfall ergibt sich: Die Hessesche Matrix

ist positiv-definit genau dann, wenn die Bedingung

erfüllt ist.
[Bearbeiten] Beispiel 1
Wir untersuchen nun Funktionen
für
mit ihren kritischen Punkten.
1. Die Funktion f1(x,y) = x2 + y2 hat als einzigen kritischen Punkt den Nullpunkt als ein lokales Minimum, da aus
dann (x,y) = (0,0) folgt und die Matrix

positiv-definit ist.
2. Die Funktion f2(x,y) = − x2 − y2 hat im Nullpunkt als einzigen kritischen Punkt ein lokales Maximum. Aus
folgt wegen
die Bedingung (x,y) = (0,0). Außerdem ist die Matrix

negativ-definit.
3. Die Funktion f3(x,y) = x2 − y2 besitzt als einzigen kritischen Punkt im Nullpunkt einen Sattelpunkt. Aus der notwendigen Bedingung
folgt (x,y) = (0,0) und die Matrix

ist indefinit.
4. Die Funktion f1(x,y) = x2 + y4 erfüllt im Nullpunkt (x,y) = (0,0) die notwendige Bedingung
, jedoch ist die Hessesche Matrix

positiv-semidefinit. Obwohl über die Hessesche Matrix keine generellen Aussagen möglich sind, hat die Funktion f4 im Nullpunkt ein striktes lokales Minimum.
[Bearbeiten] Definition 5
- Sei
eine reelle
-Matrix und λ eine reelle Zahl. Dann nennen wir λ einen Eigenwert der Matrix A, wenn es einen Vektor
mit der Eigenschaft
gibt. Der Vektor
heißt Eigenvektor zum Eigenwert λ.
Das Extremalverhalten der Funktion
in kritischen Punkten wird besonders einfach überprüfbar, wenn man mittels Hauptachsentransformation dort die Hessesche quadratische Form in die Normalform

überführt. Dabei sind
für
die Eigenwerte der Hesseschen Matrix. Den größten Eigenwert erhalten wir wie folgt durch ein Maximierungsverfahren:
[Bearbeiten] Satz 6 (Existenz des größten Eigenwerts)
- Jede reelle, symmetrische Matrix
besitzt einen reellen Eigenwert λ, d. h. es gibt einen Vektor
mit
und | x | = 1.
[Bearbeiten] Beweis
Wir betrachten die Funktion

auf der kompakten Kugelschale
. Nun ist g(x) stetig auf K – und nimmt nach Satz 8 aus §1 in Kapitel II ihr Maximum in einem Punkt
an. Dabei kann | ξ | = 1 gewählt werden, da die folgende Beziehung gilt:
für alle
.Nach obigem Satz 2 folgt
für
.Wir berechnen zunächst

für
. Dann ermitteln wir

sowie

Dabei benutzen wir die Symmetriebedingung

und verstehen unter
für 
das Kronecker-Symbol. Somit ergibt sich
für 
Wegen | ξ | = 1 folgt
für 
und schließlich
mit | ξ | = 1 und dem größten Eigenwert
.q.e.d.
[Bearbeiten] Bemerkungen
1. Indem wir das obige Maximierungsproblem

auf der Ebene senkrecht zum Eigenvektor ξ lösen, erhalten wir den nächst kleineren Eigenwert; dabei bezeichnet
das Skalarprodukt im
. Wir erhalten so für die Matrix A sukzessiv die Eigenwerte
.2. In der Linearen Algebra bestimmt man alle Eigenwerte einer Matrix A, wenn wir mit E die Einheitsmatrix benennen, als Nullstellen des charakteristischen Polynoms

über den Fundamentalsatz der Algebra. Letzteren hatten wir in §8 von Kapitel III mit einer Extremalmethode bewiesen.
3. Aus der Identität
erhalten wir durch Skalarmultiplikation mit dem Einheitsvektor ξ und wegen der Symmetrie der Matrix A den reellen Charakter der Eigenwerte wie folgt:
.