Kurs:Analysis (Osnabrück 2021-2023)/Teil II/Vorlesung 47

Linearformen und Bilinearformen

Zu ${}G\subseteq V$ offen und einer reellwertigen Funktion

f\colon G\longrightarrow \mathbb {R}

interessieren wir uns wie schon bei einem eindimensionalen Definitionsbereich für die Extrema, also Maxima und Minima, der Funktion, und inwiefern man dies anhand der Ableitungen (falls diese existieren) erkennen kann. Wenn eine solche Funktion total differenzierbar ist, so ist das totale Differential in einem Punkt eine lineare Abbildung von ${}V$ nach ${}{\mathbb {K} }$ . Für solche linearen Abbildungen gibt es einen eigenen Namen.

Definition

Es sei ${}K$ ein Körper und sei ${}V$ ein ${}K$ - Vektorraum. Eine lineare Abbildung

V\longrightarrow K

heißt eine Linearform auf ${}V$ .

Das totale Differential ${}\left(Df\right)_{P}$ zu ${}f\colon G\rightarrow \mathbb {R}$ ist also eine Linearform.

Definition

Es sei ${}K$ ein Körper und ${}V$ ein ${}K$ - Vektorraum. Dann heißt der Homomorphismenraum

{}{V}^{*}=\operatorname {Hom} _{K}{\left(V,K\right)}\,

der Dualraum zu ${}V$ .

Wenn ${}G\subseteq {\mathbb {K} }^{n}$ ist, so bilden die partiellen Ableitungen in einem Punkt ${}P\in G$ eine Matrix mit einer einzigen Zeile, nämlich

\left({\frac {\partial f}{\partial x_{1}}}(P),\,\ldots ,\,{\frac {\partial f}{\partial x_{n}}}(P)\right),

die bei stetigen partiellen Ableitungen das totale Differential repräsentiert. Eine solche Matrix kann man aber ebenso gut als ein ${}n$ -Tupel in ${}{\mathbb {K} }$ und damit als einen Vektor über ${}{\mathbb {K} }^{n}$ auffassen. Dieser Zusammenhang zwischen Vektoren und Linearformen beruht auf dem Standardskalarprodukt des ${}{\mathbb {K} }^{n}$ , und lässt sich konzeptioneller mit Hilfe von Bilinearformen erfassen.

Definition

Es sei ${}K$ ein Körper und ${}V$ ein ${}K$ - Vektorraum. Eine Abbildung

V\times V\longrightarrow K,\,(v,w)\longmapsto \left\langle v,w\right\rangle ,

heißt Bilinearform, wenn für alle ${}v\in V$ die induzierten Abbildungen

V\longrightarrow K,\,w\longmapsto \left\langle v,w\right\rangle ,

und für alle ${}w\in V$ die induzierten Abbildungen

V\longrightarrow K,\,v\longmapsto \left\langle v,w\right\rangle ,

${}K$ - linear sind.

Eine wichtige Eigenschaft von Bilinearformen, die Skalarprodukte erfüllen, wird in der nächsten Definition formuliert.

Definition

Es sei ${}K$ ein Körper und ${}V$ ein ${}K$ - Vektorraum. Eine Bilinearform

V\times V\longrightarrow K,\,(v,w)\longmapsto \left\langle v,w\right\rangle ,

heißt nicht ausgeartet, wenn für alle ${}v\in V,\,v\neq 0$ , die induzierten Abbildungen

V\longrightarrow K,\,w\longmapsto \left\langle v,w\right\rangle ,

und für alle ${}w\in V,\,w\neq 0$ , die induzierten Abbildungen

V\longrightarrow K,\,v\longmapsto \left\langle v,w\right\rangle ,

nicht die Nullabbildung sind.

In dieser Vorlesung werden wir für Vektorräume, auf denen eine nicht-ausgeartete Bilinearform gegeben ist, eine bijektive Beziehung zwischen Vektoren und Linearformen beweisen und damit einen Zusammenhang zwischen dem totalen Differential zu einer Funktion in einem Punkt und einem Vektor, dem sogenannten Gradienten der Funktion in diesem Punkt, herstellen.

Der Gradient

Lemma

Es sei ${}K$ ein Körper und ${}V$ ein ${}K$ - Vektorraum, der mit einer Bilinearform ${}\left\langle -,-\right\rangle$ versehen sei. Dann gelten folgende Aussagen

Für jeden Vektor ${}u\in V$ sind die Zuordnungen
$V\longrightarrow K,\,v\longmapsto \left\langle u,v\right\rangle ,$

und

$V\longrightarrow K,\,v\longmapsto \left\langle v,u\right\rangle ,$

${}K$ - linear.

Die Zuordnung
$V\longrightarrow {V}^{*},\,u\longmapsto \left\langle u,-\right\rangle ,$

ist ${}K$ -linear.

Wenn ${}\left\langle -,-\right\rangle$ nicht ausgeartet ist, so ist die Zuordnung in (2) injektiv. Ist ${}V$ zusätzlich endlichdimensional, so ist diese Zuordnung bijektiv.

Beweis

(1) folgt unmittelbar aus der Bilinearität.
(2). Es seien ${}u_{1},u_{2}\in V$ und ${}a_{1},a_{2}\in K$ . Dann ist für jeden Vektor ${}v\in V$

{}\left\langle a_{1}u_{1}+a_{2}u_{2},v\right\rangle =a_{1}\left\langle u_{1},v\right\rangle +a_{2}\left\langle u_{2},v\right\rangle \,,

und dies bedeutet gerade die Linearität der Zuordnung.
(3). Da die Zuordnung nach (2) linear ist, müssen wir zeigen, dass der Kern davon trivial ist. Es sei also ${}u\in V$ so, dass ${}\left\langle u,-\right\rangle$ die Nullabbildung ist. D.h. ${}\left\langle u,v\right\rangle =0$ für alle ${}v\in V$ . Dann muss aber nach der Definition von nicht ausgeartet ${}u=0$ sein.
Wenn ${}V$ endliche Dimension hat, so liegt eine injektive lineare Abbildung zwischen Vektorräumen der gleichen Dimension vor, und eine solche ist nach Korollar 11.9 (Lineare Algebra (Osnabrück 2024-2025)) bijektiv.

\Box

Wenn es also in einem endlichdimensionalen Vektorraum eine nicht ausgeartete Bilinearform gibt, beispielsweise ein Skalarprodukt, so gibt es zu jeder Linearform einen eindeutig bestimmten Vektor, mit dem diese Linearform beschrieben werden kann. Wendet man dies auf die Linearform an, die durch das totale Differential zu einer differenzierbaren Funktion ${}f\colon V\rightarrow \mathbb {R}$ gegeben ist, so gelangt man zum Begriff des Gradienten.

Definition

Es sei ${}(V,\left\langle -,-\right\rangle )$ ein euklidischer Vektorraum, ${}G\subseteq V$ offen und

f\colon G\longrightarrow \mathbb {R}

eine in ${}P\in G$ differenzierbare Funktion. Dann nennt man den eindeutig bestimmten Vektor ${}w\in V$ mit

{}{\left(Df\right)}_{P}{\left(v\right)}=\left\langle w,v\right\rangle \,

für alle ${}v\in V$ den Gradienten von ${}f$ in ${}P$ . Er wird mit

\operatorname {Grad} \,f(P)

bezeichnet.

Man beachte, dass wir durchgehend die endlichdimensionalen Vektorräume mit einem Skalarprodukt versehen, um topologische Grundbegriffe wie Konvergenz und Stetigkeit zur Verfügung zu haben, dass diese Begriffe aber nicht von dem gewählten Skalarprodukt abhängen. Dem entgegen hängt aber der Gradient von dem gewählten Skalarprodukt ab.

Bei ${}V=\mathbb {R} ^{n}$ , versehen mit dem Standardskalarprodukt, ist der Gradient einfach gleich

{}\operatorname {Grad} \,f(P)={\begin{pmatrix}{\frac {\partial f}{\partial x_{1}}}(P)\\\vdots \\{\frac {\partial f}{\partial x_{n}}}(P)\end{pmatrix}}\,.

Bemerkung

Zu einer differenzierbaren Funktion ${}f\colon \mathbb {R} ^{n}\rightarrow \mathbb {R}$ lässt sich der Gradient (bezüglich des Standardskalarproduktes) einfach durch partielles Differenzieren berechnen. Es wäre aber eine künstliche Einschränkung, nur diese Situation zu betrachten. Um dies zu illustrieren sei beispielsweise

f\colon \mathbb {R} ^{3}\longrightarrow \mathbb {R}

eine differenzierbare Funktion und ${}E\subseteq \mathbb {R} ^{3}$ eine Ebene, die etwa als Lösungsmenge der linearen Gleichung ${}5x-4y+9z=0$ gegeben sei. Dann induziert das Standardskalarprodukt des ${}\mathbb {R} ^{3}$ durch Einschränkung ein Skalarprodukt auf ${}E$ . Diese Ebene ist zwar isomorph zu ${}\mathbb {R} ^{2}$ , es ergibt aber keinen Sinn, das eingeschränkte Skalarprodukt als Standardskalarprodukt anzusprechen. Der Gradient ${}G$ zu ${}f$ in einem Punkt ${}P\in \mathbb {R} ^{3}$ lässt sich direkt mit den partiellen Ableitungen zu den drei Raumkoordinaten berechnen. Bei ${}P\in E$ wird im Allgemeinen der Gradient nicht auf ${}E$ liegen. Die eingeschränkte Funktion

f{|}_{E}\colon E\longrightarrow \mathbb {R}

ist aber ebenfalls differenzierbar und besitzt daher einen Gradienten ${}{\tilde {G}}$ , der auf ${}E$ liegt, und dieser lässt sich nicht über partielle Ableitungen berechnen, da es auf ${}E$ keine Standardbasis gibt. Übrigens ist ${}{\tilde {G}}$ die orthogonale Projektion von ${}G$ auf ${}E$ .

Satz

Es sei ${}(V,\left\langle -,-\right\rangle )$ ein euklidischer Vektorraum, sei ${}G\subseteq V$ offen und sei

f\colon G\longrightarrow \mathbb {R}

eine in ${}P\in G$ differenzierbare Funktion. Dann gelten folgende Aussagen.

Für jeden Vektor ${}v\in V$ ist
${}\vert {{\left(Df\right)}_{P}{\left(v\right)}}\vert \leq \Vert {v}\Vert \cdot \Vert {\operatorname {Grad} \,f(P)}\Vert \,.$

Dabei gilt Gleichheit genau dann, wenn ${}v$ linear abhängig zum Gradienten ist.

Sei ${}\operatorname {Grad} \,f(P)\neq 0$ . Unter allen Vektoren ${}v\in V$ mit ${}\Vert {v}\Vert =1$ ist die Richtungsableitung in Richtung des normierten Gradienten maximal, und zwar gleich der Norm des Gradienten.

Beweis

(1) folgt wegen

{}{\left(Df\right)}_{P}{\left(v\right)}=\left\langle v,\operatorname {Grad} \,f(P)\right\rangle \,

direkt aus der Abschätzung von Cauchy-Schwarz.
(2) ergibt sich aus den Zusätzen zur Abschätzung von Cauchy-Schwarz, siehe Aufgabe 32.13.
(3). Aus (1) und (2) folgt, dass

{}{\begin{aligned}\vert {\left\langle \operatorname {Grad} \,f(P),\pm {\frac {\operatorname {Grad} \,f(P)}{\Vert {\operatorname {Grad} \,f(P)}\Vert }}\right\rangle }\vert &=\vert {{\left(Df\right)}_{P}{\left(\pm {\frac {\operatorname {Grad} \,f(P)}{\Vert {\operatorname {Grad} \,f(P)}\Vert }}\right)}}\vert \\&=\Vert {\operatorname {Grad} \,f(P)}\Vert \end{aligned}}

gilt, und dass diese beiden Vektoren die einzigen Vektoren der Norm ${}1$ sind, für die diese Gleichung gilt. Wenn man links die Betragstriche weglässt, so gilt die Gleichheit für ${}{\frac {\operatorname {Grad} \,f(P)}{\Vert {\operatorname {Grad} \,f(P)}\Vert }}$ nach wie vor, da das Skalarprodukt positiv definit ist.

\Box

Der Gradient gibt demnach die Richtung an, in die die Funktion den stärksten Anstieg hat. In die entgegengesetze Richtung liegt entsprechend der steilste Abstieg vor.

Beispiel

Ein Punkt ${}\left(x,\,y\right)\in \mathbb {R} ^{2}$ legt das Rechteck mit den Eckpunkten ${}\left(0,\,0\right),\,\left(x,\,0\right),\,\left(0,\,y\right),\,\left(x,\,y\right)$ fest. Wenn der Punkt ${}\left(x,\,y\right)$ bewegt wird, bewegt sich das zugehörige Rechteck mit.

In welche Richtung muss der Punkt ${}\left(x,\,y\right)$ bewegt werden, damit der Umfang des Rechteckes möglichst schnell wächst? Der Umfang des Rechteckes ist durch

{}U(x,y)=2x+2y\,

gegeben, nach Satz 47.8 wächst diese Funktion am schnellsten in Richtung des Gradienten, also in Richtung ${}\left(2,\,2\right)$ , was insbesondere unabhängig vom gegebenen Eckpunkt ist.

In welche Richtung muss der Punkt ${}\left(x,\,y\right)$ bewegt werden, damit der Flächeninhalt des Rechteckes möglichst schnell wächst? Der Flächeninhalt des Rechteckes ist durch

{}F(x,y)=xy\,

gegeben, nach Satz 47.8 wächst diese Funktion am schnellsten in Richtung des Gradienten, also in Richtung ${}\left(y,\,x\right)$ .

Gradient und Niveaumengen

In einer topographischen Karte wird ein Gebirge durch seine Niveaulinien (Höhenlinien) repräsentiert.

Definition

Zu einer Funktion

f\colon G\longrightarrow {\mathbb {K} },

wobei ${}G$ ein metrischer Raum sei, nennt man zu ${}c\in {\mathbb {K} }$ die Menge

{}N_{c}={\left\{x\in G\mid f(x)=c\right\}}\,

die Niveaumenge zu ${}f$ zum Wert ${}c$ .

Wir werden Niveaumengen (ein anderes Wort ist Faser oder bei ${}V=\mathbb {R} ^{2}$ auch Höhenlinie) später systematischer untersuchen. Die folgende Aussage bedeutet, dass der Gradient stets senkrecht auf den Niveaumengen steht. Da ein Bach stets dem steilsten Abstieg folgt, verläuft ein Bach stets senkrecht zu den Höhenlinien.

Eine Panoramakarte des Oberharzer Wasserregals. Hier verlaufen die Bäche senkrecht zum Wassergraben, der ja auch ein Bach ist. Widerspricht dies Lemma 47.11?

Lemma

Es sei ${}(V,\left\langle -,-\right\rangle )$ ein euklidischer Vektorraum, ${}G\subseteq V$ offen und

f\colon G\longrightarrow \mathbb {R}

eine in ${}P\in G$ differenzierbare Funktion. Es sei

h\colon I\longrightarrow G

eine differenzierbare Kurve mit ${}h(0)=P$ , die ganz innerhalb einer Niveaumenge von ${}f$ verläuft.

Dann steht der Gradient zu ${}f$ senkrecht auf ${}h'(0)$ .

Beweis

Es sei ${}N$ die Niveaumenge zu ${}c\in \mathbb {R}$ , in der die Kurve ${}h$ verlaufe. Dann ist die Hintereinanderschaltung ${}f\circ h$ konstant gleich ${}c$ und daher ist unter Verwendung der Kettenregel

{}0=\left(D(f\circ h)\right)_{0}=\left(Df\right)_{P}\circ \left(Dh\right)_{0}\,.

Daher liegt

{}\left(Dh\right)_{0}(1)=h'(0)\,

im Kern von ${}\left(Df\right)_{P}$ , und das bedeutet, dass ${}h'(0)$ senkrecht auf dem Gradienten steht.

\Box

Lokale Extrema von Funktionen in mehreren Variablen

Wir wollen mit den Mitteln der Differentialrechnung Kriterien erarbeiten, in welchen Punkten eine Funktion

f\colon G\longrightarrow \mathbb {R}

ein lokales Minimum oder ein lokales Maximum annimmt. Wenn man sich den Graphen einer solchen Funktion als ein Gebirge über der Grundmenge ${}G$ vorstellt, so geht es also um die Gipfel und die Senken des Gebirges. Der folgende Satz liefert ein notwendiges Kriterium für die Existenz eines lokalen Extremums, das das entsprechende Kriterium (Satz 19.1) in einer Variablen verallgemeinert.

Satz

Es sei ${}V$ ein endlichdimensionaler reeller Vektorraum und ${}G\subseteq V$ eine offene Teilmenge. Es sei

f\colon G\longrightarrow \mathbb {R}

eine Funktion, die im Punkt ${}P\in G$ ein lokales Extremum besitzt. Dann gelten folgende Aussagen.

Wenn ${}f$ in ${}P$ in Richtung ${}v\in V$ differenzierbar ist, so ist
${}{\left(D_{v}f\right)}{\left(P\right)}=0\,.$

Wenn ${}f$ in ${}P$ total differenzierbar ist, so verschwindet das totale Differential, also
${}\left(Df\right)_{P}=0\,.$

Beweis

(1) Zu ${}v\in V$ betrachten wir die Funktion

h\colon I\longrightarrow \mathbb {R} ,\,t\longmapsto h(t)=f(P+tv),

wobei ${}I$ ein geeignetes reelles Intervall ist. Da die Funktion ${}f$ in ${}P$ ein lokales Extremum besitzt, besitzt die Funktion ${}h$ in ${}t=0$ ebenfalls ein lokales Extremum. Nach Voraussetzung ist ${}h$ differenzierbar und nach Satz 19.1 ist ${}h'(0)=0$ . Diese Ableitung stimmt aber mit der Richtungsableitung überein, also ist

{}{\left(D_{v}f\right)}{\left(P\right)}=h'(0)=0\,.

(2) folgt aus (1) aufgrund von Proposition 46.1.

\Box

Ein lokales Extremum kann also nur in einem sogenannten kritischen Punkt einer Funktion auftreten.

Definition

Es sei ${}V$ ein endlichdimensionaler reeller Vektorraum, ${}G\subseteq V$ offen und

f\colon G\longrightarrow \mathbb {R}

eine differenzierbare Funktion. Dann heißt ${}P\in G$ ein kritischer Punkt von ${}f$ (oder ein stationärer Punkt), wenn

{}\left(Df\right)_{P}=0\,

ist. Andernfalls spricht man von einem regulären Punkt.

Bei einer differenzierbaren Funktion ${}f\colon \mathbb {R} ^{n}\rightarrow \mathbb {R}$ ist ${}P$ genau dann ein kritischer Punkt, wenn sämtliche partiellen Ableitungen von ${}f$ in ${}P$ gleich ${}0$ sind.

<< | Kurs:Analysis (Osnabrück 2021-2023)/Teil II | >>

PDF-Version dieser Vorlesung

Arbeitsblatt zur Vorlesung (PDF)