Kurs:Mathematik für Anwender (Osnabrück 2020-2021)/Teil II/Vorlesung 51/latex

\setcounter{section}{51}

\zwischenueberschrift{Extrema}

Zu einer reellwertigen Funktion \maabbdisp {f} {G} {\R } {} auf einer offenen Menge
\mavergleichskette
{\vergleichskette
{G }
{ \subseteq }{\R^n }
{ }{ }
{ }{ }
{ }{ }
} {}{}{} interessieren wir uns, wie schon bei einem eindimensionalen Definitionsbereich, für die Extrema, also Maxima und Minima, der Funktion, und inwiefern man dies anhand der \zusatzklammer {höheren} {} {} Ableitungen \zusatzklammer {falls diese existieren} {} {} erkennen kann. Wir verallgemeinern zuerst die relevanten Definitionen auf die Situation, wo der Definitionsbereich ein beliebiger metrischer Raum ist.

\inputdefinition
{}
{

Es sei
\mathl{(M,d)}{} ein \definitionsverweis {metrischer Raum}{}{} und \maabbdisp {f} {M} {\R } {} eine \definitionsverweis {Funktion}{}{.} Man sagt, dass $f$ in einem Punkt
\mavergleichskette
{\vergleichskette
{x }
{ \in }{ M }
{ }{ }
{ }{ }
{ }{ }
} {}{}{} ein \definitionswort {lokales Maximum}{} besitzt, wenn es ein
\mavergleichskette
{\vergleichskette
{ \epsilon }
{ > }{0 }
{ }{ }
{ }{ }
{ }{ }
} {}{}{} derart gibt, dass für alle
\mathbed {x' \in M} {mit}
{d(x,x') \leq \epsilon} {}
{} {} {} {} die Abschätzung
\mavergleichskettedisp
{\vergleichskette
{ f(x) }
{ \geq} { f(x') }
{ } { }
{ } { }
{ } { }
} {}{}{} gilt. Man sagt, dass $f$ in
\mavergleichskette
{\vergleichskette
{x }
{ \in }{ M }
{ }{ }
{ }{ }
{ }{ }
} {}{}{} ein \definitionswort {lokales Minimum}{} besitzt, wenn es ein
\mavergleichskette
{\vergleichskette
{ \epsilon }
{ > }{0 }
{ }{ }
{ }{ }
{ }{ }
} {}{}{} derart gibt, dass für alle
\mathbed {x' \in M} {mit}
{d(x,x') \leq \epsilon} {}
{} {} {} {} die Abschätzung
\mavergleichskettedisp
{\vergleichskette
{ f(x) }
{ \leq} { f(x') }
{ } { }
{ } { }
{ } { }
} {}{}{} gilt.

}

\inputdefinition
{}
{

Es sei
\mathl{(M,d)}{} ein \definitionsverweis {metrischer Raum}{}{} und \maabbdisp {f} {M} {\R } {} eine \definitionsverweis {Funktion}{}{.} Man sagt, dass $f$ in einem Punkt
\mavergleichskette
{\vergleichskette
{x }
{ \in }{ M }
{ }{ }
{ }{ }
{ }{ }
} {}{}{} ein \definitionswort {isoliertes lokales Maximum}{} besitzt, wenn es ein
\mavergleichskette
{\vergleichskette
{ \epsilon }
{ > }{0 }
{ }{ }
{ }{ }
{ }{ }
} {}{}{} derart gibt, dass für alle
\mathbed {x' \in M} {mit}
{d(x,x') \leq \epsilon} {und}
{x' \neq x} {} {} {} die Abschätzung
\mavergleichskettedisp
{\vergleichskette
{ f(x) }
{ >} { f(x') }
{ } { }
{ } { }
{ } { }
} {}{}{} gilt. Man sagt, dass $f$ in
\mavergleichskette
{\vergleichskette
{x }
{ \in }{ M }
{ }{ }
{ }{ }
{ }{ }
} {}{}{} ein \definitionswort {isoliertes lokales Minimum}{} besitzt, wenn es ein
\mavergleichskette
{\vergleichskette
{ \epsilon }
{ > }{0 }
{ }{ }
{ }{ }
{ }{ }
} {}{}{} derart gibt, dass für alle
\mathbed {x' \in M} {mit}
{d(x,x') \leq \epsilon} {und}
{x' \neq x} {} {} {} die Abschätzung
\mavergleichskettedisp
{\vergleichskette
{ f(x) }
{ <} {f(x') }
{ } { }
{ } { }
{ } { }
} {}{}{} gilt.

}

Ein \stichwort {globales Maximum} {} liegt in
\mavergleichskette
{\vergleichskette
{x }
{ \in }{M }
{ }{ }
{ }{ }
{ }{ }
} {}{}{} vor, wenn
\mavergleichskette
{\vergleichskette
{f(x) }
{ \geq }{f(x') }
{ }{ }
{ }{ }
{ }{ }
} {}{}{} für alle
\mavergleichskette
{\vergleichskette
{x' }
{ \in }{M }
{ }{ }
{ }{ }
{ }{ }
} {}{}{} ist.

\inputbeispiel{}
{

Die Funktion \maabbeledisp {} {\R^2} {\R } {(x,y)} {x^2+y^2 } {,} hat in
\mavergleichskette
{\vergleichskette
{P }
{ = }{ (0,0) }
{ }{ }
{ }{ }
{ }{ }
} {}{}{} den Wert $0$ und überall sonst positive Werte, daher liegt in $P$ ein \zusatzklammer {isoliertes} {} {} \definitionsverweis {globales Minimum}{}{} vor.

}

Wenn die Funktion \maabb {f} {M} {\R } {} ein lokales Minimum im Punkt
\mavergleichskette
{\vergleichskette
{P }
{ \in }{M }
{ }{ }
{ }{ }
{ }{ }
} {}{}{} besitzt, so gilt dies auch für die Einschränkung von $f$ auf jede Teilmenge
\mavergleichskette
{\vergleichskette
{N }
{ \subseteq }{M }
{ }{ }
{ }{ }
{ }{ }
} {}{}{,} die $P$ enthält. Beispielsweise muss ein \zusatzklammer {lokales} {} {} Minimum einer Funktion der Ebene auch auf jeder Geraden durch diesen Punkt ein \zusatzklammer {lokales} {} {} Minimum sein.

\bild{ \begin{center}
\includegraphics[width=5.5cm]{\bildeinlesung {Saddle_point.png} }
\end{center}
\bildtext {} }

\bildlizenz { Saddle point.png } {} {Ævar Arnfjörð Bjarmason} {PD} {} {}

Dies heißt umgekehrt, dass wenn eine Funktion \maabb {f} {\R^2} {\R } {} auf einer Geraden $L_1$ durch $P$ ein isoliertes lokales Maximum und auf einer anderen Geraden $L_2$ ein isoliertes lokales Minimum besitzt, dass dann kein lokales Extremum vorliegen kann. Solche Punkte nennt man \stichwort {Sattelpunkt} {} oder \stichwort {Passpunkt} {,} das Standardbeispiel ist das folgende.

\inputbeispiel{}
{

Wir betrachten das Verhalten der Funktion \maabbeledisp {} {\R^2} {\R } {(x,y)} {x^2-y^2 } {.} in
\mavergleichskette
{\vergleichskette
{P }
{ = }{(0,0) }
{ }{ }
{ }{ }
{ }{ }
} {}{}{.} Die \definitionsverweis {Einschränkung}{}{} dieser Funktion auf die durch
\mavergleichskette
{\vergleichskette
{y }
{ = }{ 0 }
{ }{ }
{ }{ }
{ }{ }
} {}{}{} gegebene Gerade \zusatzklammer {also auf der $x$-Achse} {} {} ist die Funktion
\mathl{x \mapsto x^2}{,} die in $P$ ein \zusatzklammer {isoliertes} {} {} \definitionsverweis {globales Minimum}{}{} besitzt. Die Einschränkung dieser Funktion auf die durch
\mavergleichskette
{\vergleichskette
{x }
{ = }{ 0 }
{ }{ }
{ }{ }
{ }{ }
} {}{}{} gegebene Gerade \zusatzklammer {also auf der $y$-Achse} {} {} ist die Funktion
\mathl{y \mapsto -y^2}{,} die in $P$ ein \zusatzklammer {isoliertes} {} {} \definitionsverweis {globales Maximum}{}{} besitzt. Daher kann $f$ in $P$ kein Extremum besitzen. Auf den durch
\mavergleichskette
{\vergleichskette
{y }
{ = }{x }
{ }{ }
{ }{ }
{ }{ }
} {}{}{} und
\mavergleichskette
{\vergleichskette
{y }
{ = }{-x }
{ }{ }
{ }{ }
{ }{ }
} {}{}{} gegebenen Geraden ist die Funktion die Nullfunktion.

}

\bild{ \begin{center}
\includegraphics[width=5.5cm]{\bildeinlesung {Functionseeinsel.png} }
\end{center}
\bildtext {} }

\bildlizenz { Functionseeinsel.png } {Lilli Hasimatzi} {Bocardodarapti} {Commons} {CC-by-sa 4.0} {}

Es sei \maabbdisp {f} {\R^2} {\R } {} eine stetige Funktion, die im Nullpunkt
\mathl{(0,0)}{} folgende Eigenschaft erfülle. Zu jeder Geraden
\mavergleichskette
{\vergleichskette
{G }
{ \subseteq }{ \R^2 }
{ }{ }
{ }{ }
{ }{ }
} {}{}{} durch den Nullpunkt besitzt die auf $G$ eingeschränkte Funktion ein lokales isoliertes Maximum. Jeder Wanderer, der durch das durch $f$ gegebene Gebirge schnurstracks in eine bestimmte Richtung durch den Punkt läuft, wird also in diesem Punkt ein Gipfelerlebnis haben. Folgt daraus, dass wirklich ein Gipfel vorliegt? Das folgende Beispiel zeigt, dass das nicht der Fall sein muss.

\inputbeispiel{}
{

Wir betrachten im $\R^2$ die beiden Kreise \mathkor {} {K_1} {und} {K_2} {,} wobei $K_1$ den Mittelpunkt
\mathl{(0,1)}{} und Radius $1$ und $K_2$ den Mittelpunkt
\mathl{(0,2)}{} und Radius $2$ habe. $K_1$ liegt innerhalb von $K_2$, und die beiden Kreise berühren sich in
\mavergleichskette
{\vergleichskette
{P }
{ = }{(0,0) }
{ }{ }
{ }{ }
{ }{ }
} {}{}{.} Durch diese beiden Kreise wird die Ebene \zusatzklammer {neben den zwei Kreislinien selbst} {} {} in drei offene Gebiete aufgeteilt: Das Innere des Kreises $K_1$ \zusatzklammer {$= A$} {} {,} die große offene Kreisscheibe ohne die kleine abgeschlossene Kreisscheibe \zusatzklammer {$= B$} {} {} und das Äußere von $K_2$ \zusatzklammer {$= C$} {} {.} Der innere Kreis $K_1$ wird als Nullstelle der Funktion
\mavergleichskettedisp
{\vergleichskette
{ f_1(x,y) }
{ =} { x^2+(y-1)^2 -1 }
{ } { }
{ } { }
{ } { }
} {}{}{} beschrieben. Im Innern von $K_1$ ist diese Funktion negativ, auf $K_1$ hat sie den Wert $0$ und außerhalb davon hat sie positive Werte. Entsprechendes gilt für $K_2$ und die Funktion
\mavergleichskette
{\vergleichskette
{ f_2(x,y) }
{ = }{ x^2+(y-2)^2 -4 }
{ }{ }
{ }{ }
{ }{ }
} {}{}{.} Wir setzen
\mavergleichskettealign
{\vergleichskettealign
{ f(x,y) }
{ \defeq} {f_1(x,y) \cdot f_2(x,y) }
{ =} { { \left( x^2+(y-1)^2 -1 \right) } \cdot { \left( x^2+(y-2)^2 -4 \right) } }
{ =} { { \left( x^2+y^2 -2y \right) } \cdot { \left( x^2+y^2 -4y \right) } }
{ =} { x^4+y^4+2x^2y^2-6y^3-6x^2y+8y^2 }
} {} {}{.} Diese Funktion nimmt auf den beiden Kreisen den Wert $0$ an, sie ist auf $A$ positiv, auf $B$ negativ und auf $C$ wieder positiv.

Die Funktion $f$ besitzt in $P$ kein lokales Minimum, da sie dort den Wert $0$ besitzt und da jede beliebig kleine Ballumgebung
\mathl{U { \left( P,\epsilon \right) }}{} den Bereich $B$ trifft, wo $f$ negative Werte besitzt. Die Einschränkung der Funktion auf jede Gerade durch den Nullpunkt besitzt aber dort ein \definitionsverweis {lokales Minimum}{}{.} Es sei dazu $G$ eine solche Gerade. Wenn $G$ die $x$-Achse ist, so verläuft diese Gerade \zusatzklammer {bis auf $P$ selbst} {} {} in $C$, wo $f$ nur positive Werte annimmt, sodass in $P$ ein \zusatzklammer {sogar globales} {} {} Minimum vorliegt. Es sei also $G$ eine von der $x$-Achse verschiedene Gerade durch $P$. Die eine Hälfte der Geraden verläuft ganz in $C$, wo die Funktion positiv ist. Die andere Hälfte verläuft, ausgehend von $P$, zuerst in $A$, dann in $B$ und schließlich wieder in $C$. Da die Funktion auf $A$ positiv ist, kann man ein Teilintervall
\mathl{[- \delta, \delta]}{} der Geraden derart wählen, dass dieses Teilstück \zusatzklammer {abgesehen von $P$} {} {} nur in \mathkor {} {A} {und} {C} {} verläuft. Auf diesem Teilintervall nimmt die Funktion in $P$ den Wert $0$ und sonst überall positive Werte an. Daher besitzt die eingeschränkte Funktion ein lokales Minimum. Das dabei zu wählende $\delta$ hängt natürlich wesentlich von der Steigung der Geraden ab, es gibt kein gemeinsames $\delta$ für alle Geraden.

}

\zwischenueberschrift{Der Gradient}

Wenn eine Funktion \maabb {f} {V} {\R } {} total differenzierbar ist, so ist das totale Differential in einem Punkt eine lineare Abbildung von \mathkor {} {V} {nach} {\R} {,} also eine \definitionsverweis {Linearform}{}{.}

Wenn
\mavergleichskette
{\vergleichskette
{G }
{ \subseteq }{\R^n }
{ }{ }
{ }{ }
{ }{ }
} {}{}{} ist, so bilden die partiellen Ableitungen von \maabbdisp {f} {G} {\R } {} in einem Punkt
\mavergleichskette
{\vergleichskette
{P }
{ \in }{G }
{ }{ }
{ }{ }
{ }{ }
} {}{}{} eine Matrix mit einer einzigen Zeile, die bei stetigen partiellen Ableitungen nach Satz 48.11 das totale Differential repräsentiert. Eine solche Matrix kann man aber ebenso auch als ein $n$-Tupel in $\R$ und damit als einen Vektor in $\R^n$ auffassen. Vergleiche Lemma 34.19.

\inputdefinition
{}
{

Es sei
\mathl{(V, \left\langle - , - \right\rangle)}{} ein \definitionsverweis {euklidischer Vektorraum}{}{,}
\mavergleichskette
{\vergleichskette
{G }
{ \subseteq }{V }
{ }{ }
{ }{ }
{ }{ }
} {}{}{} \definitionsverweis {offen}{}{} und \maabbdisp {f} {G} {\R } {} eine in
\mavergleichskette
{\vergleichskette
{P }
{ \in }{G }
{ }{ }
{ }{ }
{ }{ }
} {}{}{} \definitionsverweis {differenzierbare Funktion}{}{.} Dann nennt man den eindeutig bestimmten Vektor
\mavergleichskette
{\vergleichskette
{ w }
{ \in }{ V }
{ }{ }
{ }{ }
{ }{ }
} {}{}{} mit
\mavergleichskettedisp
{\vergleichskette
{ { \left( Df \right) }_{P} { \left( v \right) } }
{ =} { \left\langle w , v \right\rangle }
{ } { }
{ } { }
{ } { }
} {}{}{} für alle
\mavergleichskette
{\vergleichskette
{v }
{ \in }{V }
{ }{ }
{ }{ }
{ }{ }
} {}{}{} den \definitionswort {Gradienten}{} von $f$ in $P$. Er wird mit
\mathdisp {\operatorname{Grad} \, f ( P )} { }
bezeichnet.

}

Man beachte, dass wir durchgehend die endlichdimensionalen Vektorräume mit einem Skalarprodukt versehen, um topologische Grundbegriffe wie Konvergenz und Stetigkeit zur Verfügung zu haben, dass diese Begriffe aber nicht von dem gewählten Skalarprodukt abhängen. Dem entgegen hängt aber der Gradient von dem gewählten Skalarprodukt ab, was schon für den Gradienten zu einer Linearform gilt, siehe Aufgabe 34.25.

Bei
\mavergleichskette
{\vergleichskette
{V }
{ = }{\R^n }
{ }{ }
{ }{ }
{ }{ }
} {}{}{,} versehen mit dem \definitionsverweis {Standardskalarprodukt}{}{,} ist der Gradient einfach gleich
\mavergleichskettedisp
{\vergleichskette
{ \operatorname{Grad} \, f ( P ) }
{ =} { \begin{pmatrix} { \frac{ \partial f }{ \partial x_1 } } (P) \\\vdots\\ { \frac{ \partial f }{ \partial x_n } } (P) \end{pmatrix} }
{ } { }
{ } { }
{ } { }
} {}{}{.}

\inputbemerkung
{}
{

Zu einer \definitionsverweis {differenzierbaren Funktion}{}{} \maabb {f} {\R^n} {\R } {} lässt sich der Gradient \zusatzklammer {bezüglich des Standardskalarproduktes} {} {} einfach durch partielles Differenzieren berechnen. Es wäre aber eine künstliche Einschränkung, nur diese Situation zu betrachten. Um dies zu illustrieren sei beispielsweise \maabbdisp {f} {\R^3} {\R } {} eine differenzierbare Funktion und
\mavergleichskette
{\vergleichskette
{E }
{ \subseteq }{ \R^3 }
{ }{ }
{ }{ }
{ }{ }
} {}{}{} eine Ebene, die etwa als Lösungsmenge der linearen Gleichung
\mavergleichskette
{\vergleichskette
{ 5x-4y+9z }
{ = }{ 0 }
{ }{ }
{ }{ }
{ }{ }
} {}{}{} gegeben sei. Dann induziert das Standardskalarprodukt des $\R^3$ durch Einschränkung ein Skalarprodukt auf $E$. Diese Ebene ist zwar isomorph zu $\R^2$, es ergibt aber keinen Sinn, das eingeschränkte Skalarprodukt als Standardskalarprodukt anzusprechen. Der Gradient $G$ zu $f$ in einem Punkt
\mavergleichskette
{\vergleichskette
{P }
{ \in }{ \R^3 }
{ }{ }
{ }{ }
{ }{ }
} {}{}{} lässt sich direkt mit den partiellen Ableitungen zu den drei Raumkoordinaten berechnen. Bei
\mavergleichskette
{\vergleichskette
{P }
{ \in }{E }
{ }{ }
{ }{ }
{ }{ }
} {}{}{} wird im Allgemeinen der Gradient
\betonung{nicht}{} auf $E$ liegen. Die eingeschränkte Funktion \maabbdisp {f {{|}}_E} {E} {\R } {} ist aber ebenfalls differenzierbar und besitzt daher einen Gradienten $\tilde{G}$, der auf $E$ liegt, und dieser lässt sich nicht über partielle Ableitungen berechnen, da es auf $E$ keine Standardbasis gibt. Übrigens ist $\tilde{G}$ die \definitionsverweis {orthogonale Projektion}{}{} von $G$ auf $E$.

}

\inputfaktbeweisnichtvorgefuehrt
{Differenzierbare Funktion/Steigungsabschätzung über Cauchy Schwarz/Gradient/Fakt}
{Satz}
{}
{

\faktsituation {Es sei
\mathl{(V, \left\langle - , - \right\rangle )}{} ein \definitionsverweis {euklidischer Vektorraum}{}{,} sei
\mavergleichskette
{\vergleichskette
{G }
{ \subseteq }{V }
{ }{ }
{ }{ }
{ }{ }
} {}{}{} \definitionsverweis {offen}{}{} und sei \maabbdisp {f} {G} {\R } {} eine in
\mavergleichskette
{\vergleichskette
{P }
{ \in }{G }
{ }{ }
{ }{ }
{ }{ }
} {}{}{}}
\faktvoraussetzung {\definitionsverweis {differenzierbare Funktion}{}{.}}
\faktuebergang {Dann gelten folgende Aussagen.}
\faktfolgerung {\aufzaehlungdrei{Für jeden Vektor
\mavergleichskette
{\vergleichskette
{v }
{ \in }{V }
{ }{ }
{ }{ }
{ }{ }
} {}{}{} ist
\mavergleichskettedisp
{\vergleichskette
{ \betrag { { \left( Df \right) }_{P} { \left( v \right) } } }
{ \leq} { \Vert {v} \Vert \cdot \Vert { \operatorname{Grad} \, f ( P ) } \Vert }
{ } { }
{ } { }
{ } { }
} {}{}{.} }{Dabei gilt Gleichheit genau dann, wenn $v$ \definitionsverweis {linear abhängig}{}{} zum \definitionsverweis {Gradienten}{}{} ist. }{Sei
\mavergleichskette
{\vergleichskette
{ \operatorname{Grad} \, f ( P ) }
{ \neq }{ 0 }
{ }{ }
{ }{ }
{ }{ }
} {}{}{.} Unter allen Vektoren
\mathbed {v \in V} {mit}
{\Vert {v} \Vert =1} {}
{} {} {} {} ist die \definitionsverweis {Richtungsableitung}{}{} in Richtung des normierten Gradienten maximal, und zwar gleich der \definitionsverweis {Norm}{}{} des Gradienten. }}
\faktzusatz {}
\faktzusatz {}

}
{

\teilbeweis {}{}{}
{(1) folgt wegen
\mavergleichskettedisp
{\vergleichskette
{ { \left( Df \right) }_{P} { \left( v \right) } }
{ =} { \left\langle v , \operatorname{Grad} \, f ( P ) \right\rangle }
{ } { }
{ } { }
{ } { }
} {}{}{} direkt aus der Abschätzung von Cauchy-Schwarz.}
{} \teilbeweis {}{}{}
{(2) ergibt sich aus den Zusätzen zur Abschätzung von Cauchy-Schwarz, siehe Aufgabe *****.}
{} \teilbeweis {}{}{}
{(3). Aus (1) und (2) folgt, dass
\mavergleichskettealignhandlinks
{\vergleichskettealignhandlinks
{ \betrag { \left\langle \operatorname{Grad} \, f ( P ) , \pm { \frac{ \operatorname{Grad} \, f ( P ) }{ \Vert { \operatorname{Grad} \, f ( P )} \Vert } } \right\rangle } }
{ =} { \betrag { { \left( Df \right) }_{P} { \left( \pm { \frac{ \operatorname{Grad} \, f ( P ) }{ \Vert { \operatorname{Grad} \, f ( P )} \Vert } } \right) } } }
{ =} { \Vert { \operatorname{Grad} \, f ( P )} \Vert }
{ } { }
{ } { }
} {} {}{} gilt, und dass diese beiden Vektoren die einzigen Vektoren der Norm $1$ sind, für die diese Gleichung gilt. Wenn man links die Betragstriche weglässt, so gilt die Gleichheit für
\mathl{{ \frac{ \operatorname{Grad} \, f ( P ) }{ \Vert { \operatorname{Grad} \, f ( P )} \Vert } }}{} nach wie vor, da das Skalarprodukt positiv definit ist.}
{}

}

Der Gradient gibt demnach die Richtung an, in die die Funktion den steilsten Anstieg hat. In die entgegengesetze Richtung liegt entsprechend der steilste Abstieg vor.

\inputbeispiel{}
{

Ein Punkt
\mavergleichskette
{\vergleichskette
{ \left( x , \, y \right) }
{ \in }{ \R^2 }
{ }{ }
{ }{ }
{ }{ }
} {}{}{} legt das Rechteck mit den Eckpunkten
\mathl{\left( 0 , \, 0 \right) ,\, \left( x , \, 0 \right) , \,\left( 0 , \, y \right) , \, \left( x , \, y \right)}{} fest. Wenn der Punkt
\mathl{\left( x , \, y \right)}{} bewegt wird, bewegt sich das zugehörige Rechteck mit.

In welche Richtung muss der Punkt
\mathl{\left( x , \, y \right)}{} bewegt werden, damit der Umfang des Rechteckes möglichst schnell wächst? Der Umfang des Rechteckes ist durch
\mavergleichskettedisp
{\vergleichskette
{ U(x,y) }
{ =} { 2x+2y }
{ } { }
{ } { }
{ } { }
} {}{}{} gegeben, nach Satz 51.8 wächst diese Funktion am schnellsten in Richtung des Gradienten, also in Richtung
\mathl{\left( 2 , \, 2 \right)}{,} was insbesondere unabhängig vom gegebenen Eckpunkt ist.

\bild{ \begin{center}
\includegraphics[width=5.5cm]{\bildeinlesung {RechteckGradient.png} }
\end{center}
\bildtext {} }

\bildlizenz { RechteckGradient.png } {} {Mgausmann} {Commons} {CC-by-sa 4.0} {}

In welche Richtung muss der Punkt
\mathl{\left( x , \, y \right)}{} bewegt werden, damit der Flächeninhalt des Rechteckes möglichst schnell wächst? Der Flächeninhalt des Rechteckes ist durch
\mavergleichskettedisp
{\vergleichskette
{ F(x,y) }
{ =} { x y }
{ } { }
{ } { }
{ } { }
} {}{}{} gegeben, nach Satz 51.8 wächst diese Funktion am schnellsten in Richtung des Gradienten, also in Richtung
\mathl{\left( y , \, x \right)}{.}

}

\zwischenueberschrift{Lokale Extrema von Funktionen in mehreren Variablen}

Wir wollen mit den Mitteln der Differentialrechnung Kriterien erarbeiten, in welchen Punkten eine Funktion \maabbdisp {f} { G } { \R } {} ein lokales Minimum oder ein lokales Maximum annimmt. Wenn man sich den Graphen einer solchen Funktion als ein Gebirge über der Grundmenge $G$ vorstellt, so geht es also um die Gipfel und die Senken des Gebirges. Der folgende Satz liefert ein notwendiges Kriterium für die Existenz eines lokalen Extremums, das das entsprechende Kriterium \zusatzklammer {Satz 15.3} {} {} in einer Variablen verallgemeinert.

\inputfaktbeweis
{Lokales Extremum/Richtungsableitung/Totales Differential/Fakt}
{Satz}
{}
{

\faktsituation {Es sei $V$ ein \definitionsverweis {endlichdimensionaler}{}{} \definitionsverweis {reeller Vektorraum}{}{} und
\mavergleichskette
{\vergleichskette
{ G }
{ \subseteq }{V }
{ }{ }
{ }{ }
{ }{ }
} {}{}{} eine \definitionsverweis {offene}{}{} Teilmenge.}
\faktvoraussetzung {Es sei \maabbdisp {f} {G } {\R } {} eine \definitionsverweis {Funktion}{}{,} die im Punkt
\mavergleichskette
{\vergleichskette
{ P }
{ \in }{ G }
{ }{ }
{ }{ }
{ }{ }
} {}{}{} ein \definitionsverweis {lokales Extremum}{}{} besitzt.}
\faktuebergang {Dann gelten folgende Aussagen.}
\faktfolgerung {\aufzaehlungzwei {Wenn $f$ in $P$ in Richtung
\mavergleichskette
{\vergleichskette
{v }
{ \in }{ V }
{ }{ }
{ }{ }
{ }{ }
} {}{}{} \definitionsverweis {differenzierbar}{}{} ist, so ist
\mavergleichskettedisp
{\vergleichskette
{ { \left( D_{v} f \right) } { \left( P \right) } }
{ =} { 0 }
{ } { }
{ } { }
{ } { }
} {}{}{.} } {Wenn $f$ in $P$ \definitionsverweis {total differenzierbar}{}{} ist, so verschwindet das totale Differential, also
\mavergleichskettedisp
{\vergleichskette
{ \left(Df\right)_{P} }
{ =} { 0 }
{ } { }
{ } { }
{ } { }
} {}{}{.} }}
\faktzusatz {}
\faktzusatz {}

}
{

\teilbeweis {}{}{}
{(1) Zu
\mavergleichskette
{\vergleichskette
{v }
{ \in }{V }
{ }{ }
{ }{ }
{ }{ }
} {}{}{} betrachten wir die Funktion \maabbeledisp {h} {I} {\R } {t} {h(t) = f(P+tv) } {,} wobei $I$ ein geeignetes reelles Intervall ist. Da die Funktion $f$ in $P$ ein lokales Extremum besitzt, besitzt die Funktion $h$ in
\mavergleichskette
{\vergleichskette
{ t }
{ = }{ 0 }
{ }{ }
{ }{ }
{ }{ }
} {}{}{} ebenfalls ein lokales Extremum. Nach Voraussetzung ist $h$ \definitionsverweis {differenzierbar}{}{} und nach Satz 15.3 ist
\mavergleichskette
{\vergleichskette
{ h'(0) }
{ = }{ 0 }
{ }{ }
{ }{ }
{ }{ }
} {}{}{.} Diese Ableitung stimmt aber mit der Richtungsableitung überein, also ist
\mavergleichskettedisp
{\vergleichskette
{ { \left( D_{v} f \right) } { \left( P \right) } }
{ =} { h'(0) }
{ =} { 0 }
{ } { }
{ } { }
} {}{}{.}}
{} \teilbeweis {}{}{}
{(2) folgt aus (1) aufgrund von Proposition 48.9.}
{}

}

Ein lokales Extremum kann also nur in einem sogenannten kritischen Punkt einer Funktion auftreten.

\inputdefinition
{}
{

Es sei $V$ ein \definitionsverweis {endlichdimensionaler}{}{} \definitionsverweis {reeller Vektorraum}{}{,}
\mavergleichskette
{\vergleichskette
{ G }
{ \subseteq }{V }
{ }{ }
{ }{ }
{ }{ }
} {}{}{} \definitionsverweis {offen}{}{} und \maabbdisp {f} {G } {\R } {} eine \definitionsverweis {differenzierbare Funktion}{}{.} Dann heißt
\mavergleichskette
{\vergleichskette
{P }
{ \in }{G }
{ }{ }
{ }{ }
{ }{ }
} {}{}{} ein \definitionswort {kritischer Punkt}{} von $f$ \zusatzklammer {oder ein \definitionswort {stationärer Punkt}{}} {} {,} wenn
\mavergleichskettedisp
{\vergleichskette
{ \left(Df\right)_{P} }
{ =} { 0 }
{ } { }
{ } { }
{ } { }
} {}{}{} ist. Andernfalls spricht man von einem \definitionswort {regulären Punkt}{.}

}

Bei einer differenzierbaren Funktion \maabb {f} { \R^n } { \R } {} ist $P$ genau dann ein kritischer Punkt, wenn sämtliche partiellen Ableitungen von $f$ in $P$ gleich $0$ sind.

\zwischenueberschrift{Die Hesse-Form}

Wir sind natürlich auch an hinreichenden Kriterien für das Vorliegen von lokalen Extrema interessiert. Wie schon im eindimensionalen Fall muss man sich die zweiten Ableitungen anschauen, wobei die Situation natürlich dadurch wesentlich verkompliziert wird, dass es zu je zwei Richtungsvektoren \mathkor {} {v} {und} {w} {} eine zweite Richtungsableitung
\mavergleichskette
{\vergleichskette
{ D_{vw} }
{ = }{ D_v D_w }
{ }{ }
{ }{ }
{ }{ }
} {}{}{} gibt. Die zweite Richtungsableitung wird dadurch handhabbar, dass man sie in die sogenannte Hesse-Form bzw. Hesse-Matrix zusammenfasst.

\inputdefinition
{}
{

Es sei $V$ ein \definitionsverweis {endlichdimensionaler}{}{} \definitionsverweis {reeller Vektorraum}{}{,}
\mavergleichskette
{\vergleichskette
{ G }
{ \subseteq }{ V }
{ }{ }
{ }{ }
{ }{ }
} {}{}{} eine \definitionsverweis {offene Menge}{}{} und \maabbdisp {f} {G} {\R } {} eine zweimal \definitionsverweis {stetig differenzierbare Funktion}{}{.} Zu
\mavergleichskette
{\vergleichskette
{ P }
{ \in }{ G }
{ }{ }
{ }{ }
{ }{ }
} {}{}{} heißt die \definitionsverweis {Abbildung}{}{} \maabbeledisp {\operatorname{Hess}_{ P } \, f} {V \times V } {\R } {(u,v)} { D_u D_v f (P) } {,} die \definitionswort {Hesse-Form}{} im Punkt
\mavergleichskette
{\vergleichskette
{ P }
{ \in }{ G }
{ }{ }
{ }{ }
{ }{ }
} {}{}{.}

}

\inputdefinition
{}
{

Es sei $V$ ein \definitionsverweis {endlichdimensionaler}{}{} \definitionsverweis {reeller Vektorraum}{}{,}
\mavergleichskette
{\vergleichskette
{ G }
{ \subseteq }{ V }
{ }{ }
{ }{ }
{ }{ }
} {}{}{} eine \definitionsverweis {offene Menge}{}{} und \maabbdisp {f} {G} {\R } {} eine zweimal \definitionsverweis {stetig differenzierbare Funktion}{}{.} Es sei eine \definitionsverweis {Basis}{}{}
\mathbed {v_i} {}
{i=1 , \ldots , n} {}
{} {} {} {,} von $V$ gegeben mit den zugehörigen \definitionsverweis {Richtungsableitungen}{}{}
\mathbed {D_i \defeq D_{v_i}} {}
{i=1 , \ldots , n} {}
{} {} {} {.} Zu
\mavergleichskette
{\vergleichskette
{ P }
{ \in }{ G }
{ }{ }
{ }{ }
{ }{ }
} {}{}{} heißt dann die \definitionsverweis {Matrix}{}{}
\mathdisp {\begin{pmatrix} D_1D_1 f (P) & \cdots & D_1D_{ n } f (P) \\ \vdots & \ddots & \vdots \\ D_{ n } D_1 f (P) & \cdots & D_{ n }D_{ n } f (P) \end{pmatrix}} { }
die \definitionswort {Hesse-Matrix}{} zu $f$ im Punkt $P$ bezüglich der gegebenen Basis.

}

Die Hesse-Form zu einem festen Punkt $P$ ordnet also zwei Vektoren eine reelle Zahl zu, und sie ist durch ihre Hesse-Matrix vollständig beschrieben. Damit ordnet sie sich in das Konzept von symmetrischen Bilinearformen ein.