Kurs:Analysis II/Kapitel IV: Partielle Differentiation für Funktionen mehrerer Veränderlicher/Taylorsche Formel im R^n und Extremwertaufgaben (§3)

Aus Wikiversity

Satz 1 (Taylorsche Formel in mehreren Variablen)[Bearbeiten]

Seien die Dimensionen und die offene Menge im gewählt. Es seien und zwei feste Punkte aus , so dass die Verbindungsgerade – auch Segment genannt – die Inklusion
erfüllt.Weiter sei die reellwertige Funktion in der Klasse gegeben. Unter Verwendung der Differentiale aus §2 haben wir dann die Darstellung
(1)
mit einem Punkt .

Beweis[Bearbeiten]

Wir betrachten die Funktion der Klasse . Mit Hilfe der Kettenregel erhält man

(2) ,

woraus sich wegen Formel (4) aus §2

(3)

ergibt. Durch wiederholte Differentiation findet man

(4)

für . Die eindimensionale Taylorsche Formel aus Satz 1 von §6 in Kapitel II liefert die Identität

(5)

Dabei wurde gewählt und gesetzt.

q.e.d.

Definition 1[Bearbeiten]

Sei auf der offenen Menge die Funktion erklärt. Dann hat ein absolutes oder auch globales Maximum bzw. Minimum im Punkt , wenn die Ungleichung
bzw. für alle
gilt.
Die Funktion hat ein – schwaches – relatives oder auch lokales Maximum bzw. Minimum an der Stelle , wenn es eine Kugel
vom hinreichend kleinen Radius so gibt, dass die Ungleichung
bzw. für alle
erfüllt ist.
Die Funktion hat ein striktes relatives oder auch lokales Maximum bzw. Minimum an der Stelle , wenn es eine Kugel vom Radius so gibt, dass die Ungleichung
bzw. für alle mit
richtig ist.
Wir sprechen von einem Extremum, wenn wir sowohl ein Maximum als auch ein Minimum zulassen.

Satz 2 (Notwendige Bedingung erster Ordnung)[Bearbeiten]

Die stetige Funktion auf der offenen Menge besitze an der Stelle ein relatives Maximum oder Minimum – also ein Extremum. Außerdem existieren die ersten partiellen Ableitungen für . Dann gilt die Beziehung
(6) für , das heißt .

Beweis[Bearbeiten]

Da die offene Menge den Punkt enthält, gibt es eine Kugel von hinreichend großem Radius . Wir betrachten nun die Funktion

,

die an der Stelle ein Extremum hat. Weiter existiert und wie im Beweis des Rolleschen Satzes aus §3 in Kapitel II zeigen wir

für .

q.e.d.

Definition 2[Bearbeiten]

In der offenen Menge nennen wir einen kritischen Punkt der Funktion , falls erfüllt ist.

Satz 3 (Notwendige Bedingung zweiter Ordnung)[Bearbeiten]

Die Funktion auf der offenen Menge gehöre zur Klasse und besitze an der Stelle ein relatives Minimum. Dann gilt
für alle .

Beweis[Bearbeiten]

Es sei beliebig gewählt. Dann liegt für ein hinreichend kleines die Strecke in . Die Taylorsche Formel liefert

mit einem geeigneten . Da an der Stelle ein relatives Minimum vorliegt folgt . Ferner ist für alle hinreichend kleinen die Ungleichung erfüllt. Damit folgt

.

Für folgt und wegen erhalten wir die Behauptung

für alle .

Satz 4 (Hinreichende Bedingung zweiter Ordnung)[Bearbeiten]

Sei die Funktion auf der offenen Menge gegeben. Weiter sei ein Punkt, welcher für sowie
für alle
erfüllt. Dann besitzt an der Stelle ein striktes relatives Minimum.

Beweis[Bearbeiten]

Nach Voraussetzung gilt

(7) für alle

auf der kompakten Einheitssphäre . Nun ist die quadratische Form aus (7) als Funktion von stetig auf und nach Satz 8 aus §1 in Kapitel II gibt es eine Zahl , so dass

(8) für alle

ausfällt. Wegen gibt es eine hinreichend kleine Zahl , so dass die Ungleichung

(9) für alle und alle

erfüllt ist. Somit folgt

(10) für alle und alle .

Die Taylorsche Formel liefert für beliebiges die Identität

,

wobei auf der Verbindungsstrecke liegt. Beachten wir , so folgt mit (10) die Ungleichung

(11) .

Wir erhalten

(12) für alle mit .

Somit nimmt im Punkt ein striktes relatives Minimum an.

q.e.d.

Definition 3[Bearbeiten]

Sei eine Funktion auf der offenen Menge und sei ein Punkt gewählt. Dann nennen wir
die Hessesche Matrix von an der Stelle . Ihr ist die Hessesche quadratische Form
zugeordnet.

Definition 4[Bearbeiten]

Wir nennen die quadratische Form positiv-definit, falls für alle gilt – und positiv-semidefinit, falls für alle richtig ist.
Entsprechen heißt die quadratische Form negativ-definit, falls für alle gilt – und negativ-semidefinit, falls für alle richtig ist.
Die quadratische Form wird indefinit genannt, falls es Punkte gibt, für die bzw. richtig ist.

Bemerkungen[Bearbeiten]

1. Als notwendige Bedingung für ein relatives Minimum im Punkt haben wir in Satz 3 hergeleitet, dass die Hessesche Form im kritischen Punkt positiv-semidefinit sein muss.
2. Im Satz 4 haben wir gezeigt, dass eine hinreichende Bedingung für ein relatives Minimum eine positiv-definite Hessesche Form im kritischen Punkt ist.
3. Durch den Übergang von zu erhalten wir Kriterien für relative Maxima von Funktionen.
4. Die Hessesche Form erlaubt nur die Kontrolle relativer aber nicht absoluter Extrema.
5. Die Voraussetzung

für alle

in Satz 4 lässt sich nicht durch die schwächere Voraussetzung

für alle

ersetzen. Hierzu betrachten wir die Funktion , die eine solche schwächere Voraussetzung für erfüllt – dort jedoch kein relatives Minimum besitzt.
6. Andererseits ist die Behauptung in Satz 3 nicht durch die stärkere Aussage

für alle

ersetzbar, wie man mit Hilfe der Funktion an der Stelle einsehen kann.

Satz 5[Bearbeiten]

Auf der offenen Menge sei die Funktion gegeben mit dem kritischen Punkt . Weiter sei die Hessesche Matrix mit der zugeordneten quadratischen Form indefinit. Dann nimmt im Punkt weder ein lokales Maximum noch ein lokales Minimum an.

Beweis[Bearbeiten]

Da indefinit ist, können wir mit den Überlegungen des Beweises von Satz 4 in jeder Umgebung von Punkte und mit der Eigenschaft finden.

Bemerkungen[Bearbeiten]

1. Die in Satz 5 betrachteten kritischen Punkte heißen Sattelpunkte.
2. Die Hessesche Matrix

ist genau dann positiv-definit bzw. positiv-semidefinit, falls ihre Hauptminoren

für die Bedingungen bzw. erfüllen. Dieses Kriterium von A. Hurwitz können wir mit der Hauptachsentransformation symmetrischer, reeller Matrizen sofort einsehen.
3. Als Spezialfall ergibt sich: Die Hessesche Matrix

ist positiv-definit genau dann, wenn die Bedingung

(13)

erfüllt ist.

Beispiel 1[Bearbeiten]

Wir untersuchen nun Funktionen für mit ihren kritischen Punkten.

1. Die Funktion hat als einzigen kritischen Punkt den Nullpunkt als ein lokales Minimum, da aus dann folgt und die Matrix

positiv-definit ist.
2. Die Funktion hat im Nullpunkt als einzigen kritischen Punkt ein lokales Maximum. Aus folgt wegen die Bedingung . Außerdem ist die Matrix

negativ-definit.
3. Die Funktion besitzt als einzigen kritischen Punkt im Nullpunkt einen Sattelpunkt. Aus der notwendigen Bedingung folgt und die Matrix

ist indefinit.
4. Die Funktion erfüllt im Nullpunkt die notwendige Bedingung , jedoch ist die Hessesche Matrix

positiv-semidefinit. Obwohl über die Hessesche Matrix keine generellen Aussagen möglich sind, hat die Funktion im Nullpunkt ein striktes lokales Minimum.

Definition 5[Bearbeiten]

Sei eine reelle -Matrix und eine reelle Zahl. Dann nennen wir einen Eigenwert der Matrix , wenn es einen Vektor mit der Eigenschaft gibt. Der Vektor heißt Eigenvektor zum Eigenwert .

Das Extremalverhalten der Funktion in kritischen Punkten wird besonders einfach überprüfbar, wenn man mittels Hauptachsentransformation dort die Hessesche quadratische Form in die Normalform

(14)

überführt. Dabei sind für die Eigenwerte der Hesseschen Matrix. Den größten Eigenwert erhalten wir wie folgt durch ein Maximierungsverfahren:

Satz 6 (Existenz des größten Eigenwerts)[Bearbeiten]

Jede reelle, symmetrische Matrix besitzt einen reellen Eigenwert , d. h. es gibt einen Vektor mit und .

Beweis[Bearbeiten]

Wir betrachten die Funktion

(15)

auf der kompakten Kugelschale . Nun ist stetig auf – und nimmt nach Satz 8 aus §1 in Kapitel II ihr Maximum in einem Punkt an. Dabei kann gewählt werden, da die folgende Beziehung gilt:

für alle .

Nach obigem Satz 2 folgt

für .

Wir berechnen zunächst

(16)

für . Dann ermitteln wir

(17)

sowie

(18)

Dabei benutzen wir die Symmetriebedingung

für

und verstehen unter

(19) für

das Kronecker-Symbol. Somit ergibt sich

für

Wegen folgt

(20) für

und schließlich mit und dem größten Eigenwert

(21) .

q.e.d.

Bemerkungen[Bearbeiten]

1. Indem wir das obige Maximierungsproblem

(22)

auf der Ebene senkrecht zum Eigenvektor lösen, erhalten wir den nächst kleineren Eigenwert; dabei bezeichnet das Skalarprodukt im . Wir erhalten so für die Matrix sukzessiv die Eigenwerte

(23) .

2. In der Linearen Algebra bestimmt man alle Eigenwerte einer Matrix , wenn wir mit die Einheitsmatrix benennen, als Nullstellen des charakteristischen Polynoms

(24)

über den Fundamentalsatz der Algebra. Letzteren hatten wir in §8 von Kapitel III mit einer Extremalmethode bewiesen.
3. Aus der Identität erhalten wir durch Skalarmultiplikation mit dem Einheitsvektor und wegen der Symmetrie der Matrix den reellen Charakter der Eigenwerte wie folgt:

(25) .