Satz 1 (Taylorsche Formel in mehreren Variablen)[Bearbeiten]
- Seien die Dimensionen und die offene Menge im gewählt. Es seien und zwei feste Punkte aus , so dass die Verbindungsgerade – auch Segment genannt – die Inklusion
- erfüllt.Weiter sei die reellwertige Funktion in der Klasse gegeben. Unter Verwendung der Differentiale aus §2 haben wir dann die Darstellung
(1)
- mit einem Punkt .
Wir betrachten die Funktion der Klasse . Mit Hilfe der Kettenregel erhält man
(2)
,
woraus sich wegen Formel (4) aus §2
(3)
ergibt. Durch wiederholte Differentiation findet man
(4)
für . Die eindimensionale Taylorsche Formel aus Satz 1 von §6 in Kapitel II liefert die Identität
(5)
Dabei wurde gewählt und gesetzt.
q.e.d.
- Sei auf der offenen Menge die Funktion erklärt. Dann hat ein absolutes oder auch globales Maximum bzw. Minimum im Punkt , wenn die Ungleichung
bzw. für alle
- gilt.
- Die Funktion hat ein – schwaches – relatives oder auch lokales Maximum bzw. Minimum an der Stelle , wenn es eine Kugel
- vom hinreichend kleinen Radius so gibt, dass die Ungleichung
bzw. für alle
- erfüllt ist.
- Die Funktion hat ein striktes relatives oder auch lokales Maximum bzw. Minimum an der Stelle , wenn es eine Kugel vom Radius so gibt, dass die Ungleichung
bzw. für alle mit
- richtig ist.
- Wir sprechen von einem Extremum, wenn wir sowohl ein Maximum als auch ein Minimum zulassen.
Satz 2 (Notwendige Bedingung erster Ordnung)[Bearbeiten]
- Die stetige Funktion auf der offenen Menge besitze an der Stelle ein relatives Maximum oder Minimum – also ein Extremum. Außerdem existieren die ersten partiellen Ableitungen für . Dann gilt die Beziehung
Da die offene Menge den Punkt enthält, gibt es eine Kugel von hinreichend großem Radius . Wir betrachten nun die Funktion
,
die an der Stelle ein Extremum hat. Weiter existiert und wie im Beweis des Rolleschen Satzes aus §3 in Kapitel II zeigen wir
für
.
q.e.d.
- In der offenen Menge nennen wir einen kritischen Punkt der Funktion , falls erfüllt ist.
Satz 3 (Notwendige Bedingung zweiter Ordnung)[Bearbeiten]
- Die Funktion auf der offenen Menge gehöre zur Klasse und besitze an der Stelle ein relatives Minimum. Dann gilt
für alle .
Es sei beliebig gewählt. Dann liegt für ein hinreichend kleines die Strecke in . Die Taylorsche Formel liefert
mit einem geeigneten . Da an der Stelle ein relatives Minimum vorliegt folgt . Ferner ist für alle hinreichend kleinen die Ungleichung erfüllt. Damit folgt
.
Für folgt und wegen erhalten wir die Behauptung
für alle
.
Satz 4 (Hinreichende Bedingung zweiter Ordnung)[Bearbeiten]
- Sei die Funktion auf der offenen Menge gegeben. Weiter sei ein Punkt, welcher für sowie
für alle
- erfüllt. Dann besitzt an der Stelle ein striktes relatives Minimum.
Nach Voraussetzung gilt
(7)
für alle
auf der kompakten Einheitssphäre . Nun ist die quadratische Form aus (7) als Funktion von stetig auf und nach Satz 8 aus §1 in Kapitel II gibt es eine Zahl , so dass
(8)
für alle
ausfällt. Wegen gibt es eine hinreichend kleine Zahl , so dass die Ungleichung
(9)
für alle
und alle
erfüllt ist. Somit folgt
(10)
für alle
und alle
.
Die Taylorsche Formel liefert für beliebiges die Identität
,
wobei auf der Verbindungsstrecke liegt. Beachten wir , so folgt mit (10) die Ungleichung
(11)
.
Wir erhalten
(12)
für alle
mit
.
Somit nimmt im Punkt ein striktes relatives Minimum an.
q.e.d.
- Sei eine Funktion auf der offenen Menge und sei ein Punkt gewählt. Dann nennen wir
- die Hessesche Matrix von an der Stelle . Ihr ist die Hessesche quadratische Form
- zugeordnet.
- Wir nennen die quadratische Form positiv-definit, falls für alle gilt – und positiv-semidefinit, falls für alle richtig ist.
- Entsprechen heißt die quadratische Form negativ-definit, falls für alle gilt – und negativ-semidefinit, falls für alle richtig ist.
- Die quadratische Form wird indefinit genannt, falls es Punkte gibt, für die bzw. richtig ist.
1. Als notwendige Bedingung für ein relatives Minimum im Punkt haben wir in Satz 3 hergeleitet, dass die Hessesche Form im kritischen Punkt positiv-semidefinit sein muss.
2. Im Satz 4 haben wir gezeigt, dass eine hinreichende Bedingung für ein relatives Minimum eine positiv-definite Hessesche Form im kritischen Punkt ist.
3. Durch den Übergang von zu erhalten wir Kriterien für relative Maxima von Funktionen.
4. Die Hessesche Form erlaubt nur die Kontrolle relativer aber nicht absoluter Extrema.
5. Die Voraussetzung
für alle
in Satz 4 lässt sich nicht durch die schwächere Voraussetzung
für alle
ersetzen. Hierzu betrachten wir die Funktion , die eine solche schwächere Voraussetzung für erfüllt – dort jedoch kein relatives Minimum besitzt.
6. Andererseits ist die Behauptung in Satz 3 nicht durch die stärkere Aussage
für alle
ersetzbar, wie man mit Hilfe der Funktion an der Stelle einsehen kann.
- Auf der offenen Menge sei die Funktion gegeben mit dem kritischen Punkt . Weiter sei die Hessesche Matrix mit der zugeordneten quadratischen Form indefinit. Dann nimmt im Punkt weder ein lokales Maximum noch ein lokales Minimum an.
Da indefinit ist, können wir mit den Überlegungen des Beweises von Satz 4 in jeder Umgebung von Punkte und mit der Eigenschaft finden.
1. Die in Satz 5 betrachteten kritischen Punkte heißen Sattelpunkte.
2. Die Hessesche Matrix
ist genau dann positiv-definit bzw. positiv-semidefinit, falls ihre Hauptminoren
für die Bedingungen bzw. erfüllen. Dieses Kriterium von A. Hurwitz können wir mit der Hauptachsentransformation symmetrischer, reeller Matrizen sofort einsehen.
3. Als Spezialfall ergibt sich: Die Hessesche Matrix
ist positiv-definit genau dann, wenn die Bedingung
(13)
erfüllt ist.
Wir untersuchen nun Funktionen für mit ihren kritischen Punkten.
1. Die Funktion hat als einzigen kritischen Punkt den Nullpunkt als ein lokales Minimum, da aus dann folgt und die Matrix
positiv-definit ist.
2. Die Funktion hat im Nullpunkt als einzigen kritischen Punkt ein lokales Maximum. Aus folgt wegen die Bedingung . Außerdem ist die Matrix
negativ-definit.
3. Die Funktion besitzt als einzigen kritischen Punkt im Nullpunkt einen Sattelpunkt. Aus der notwendigen Bedingung folgt und die Matrix
ist indefinit.
4. Die Funktion erfüllt im Nullpunkt die notwendige Bedingung , jedoch ist die Hessesche Matrix
positiv-semidefinit. Obwohl über die Hessesche Matrix keine generellen Aussagen möglich sind, hat die Funktion im Nullpunkt ein striktes lokales Minimum.
- Sei eine reelle -Matrix und eine reelle Zahl. Dann nennen wir einen Eigenwert der Matrix , wenn es einen Vektor mit der Eigenschaft gibt. Der Vektor heißt Eigenvektor zum Eigenwert .
Das Extremalverhalten der Funktion in kritischen Punkten wird besonders einfach überprüfbar, wenn man mittels Hauptachsentransformation dort die Hessesche quadratische Form in die Normalform
(14)
überführt. Dabei sind für die Eigenwerte der Hesseschen Matrix. Den größten Eigenwert erhalten wir wie folgt durch ein Maximierungsverfahren:
Satz 6 (Existenz des größten Eigenwerts)[Bearbeiten]
- Jede reelle, symmetrische Matrix besitzt einen reellen Eigenwert , d. h. es gibt einen Vektor mit und .
Wir betrachten die Funktion
(15)
auf der kompakten Kugelschale . Nun ist stetig auf – und nimmt nach Satz 8 aus §1 in Kapitel II ihr Maximum in einem Punkt an. Dabei kann gewählt werden, da die folgende Beziehung gilt:
für alle
.
Nach obigem Satz 2 folgt
für
.
Wir berechnen zunächst
(16)
für . Dann ermitteln wir
(17)
sowie
(18)
Dabei benutzen wir die Symmetriebedingung
für
und verstehen unter
(19)
für
das Kronecker-Symbol. Somit ergibt sich
für
Wegen folgt
(20)
für
und schließlich mit und dem größten Eigenwert
(21)
.
q.e.d.
1. Indem wir das obige Maximierungsproblem
(22)
auf der Ebene senkrecht zum Eigenvektor lösen, erhalten wir den nächst kleineren Eigenwert; dabei bezeichnet das Skalarprodukt im . Wir erhalten so für die Matrix sukzessiv die Eigenwerte
(23)
.
2. In der Linearen Algebra bestimmt man alle Eigenwerte einer Matrix , wenn wir mit die Einheitsmatrix benennen, als Nullstellen des charakteristischen Polynoms
(24)
über den Fundamentalsatz der Algebra. Letzteren hatten wir in §8 von Kapitel III mit einer Extremalmethode bewiesen.
3. Aus der Identität erhalten wir durch Skalarmultiplikation mit dem Einheitsvektor und wegen der Symmetrie der Matrix den reellen Charakter der Eigenwerte wie folgt:
(25)
.