Kurs:Analysis II/Kapitel IV: Partielle Differentiation für Funktionen mehrerer Veränderlicher/Partielle Ableitungen erster Ordnung (§1)

Definition 1[Bearbeiten]

Seien die Dimensionen $n,m\in \mathbb {N}$ gewählt, $f=f(x):\Omega \to \mathbb {R} ^{m}$ sei eine auf der offenen Menge $\Omega \subset \mathbb {R} ^{n}$ erklärte Funktion und schließlich sei $x^{0}=(x_{1}^{0},\ldots ,x_{n}^{0})\in \Omega$ ein fester Punkt. Für hinreichend kleines $\varepsilon >0$ betrachten wir die Funktion

$\Phi _{j}:(x_{j}^{0}-\varepsilon ,x_{j}^{0}+\varepsilon )\to \mathbb {R} ^{m}$ vermöge $\Phi _{j}(t):=f(x_{1}^{0},\ldots ,x_{j-1}^{0},t,x_{j+1}^{0},\ldots ,x_{n}^{0}),\quad t\in (x_{j}^{0}-\varepsilon ,x_{j}^{0}+\varepsilon )$ .

Existiert die Ableitung der Funktion $\Phi _{j}$ an der Stelle $t=x_{j}^{0}$ , so heißt $\Phi '_{j}(x_{j}^{0})$ die partielle Ableitung von $f$ nach $x_{j}$ im Punkt $x^{0}$ . Wir schreiben

\Phi '_{j}(x_{j}^{0})=:f_{x_{j}}(x^{0})={\frac {\partial }{\partial x_{j}}}f(x^{0})

für ein

j\in \{1,\ldots ,n\}

.

Definition 2[Bearbeiten]

Sei $\Omega \subset \mathbb {R} ^{n}$ eine offene Menge. Existieren die partiellen Ableitungen $f_{x_{j}}(x)$ mit $j=1,\ldots ,n$ für alle $x\in \Omega$ und stellen sie in $\Omega$ eine stetige Funktion dar, so gehört die Funktion $f$ zur Klasse $C^{1}(\Omega ,\mathbb {R} ^{m})$ der einmal stetig differenzierbaren Funktionen – oder kurz $f\in C^{1}(\Omega ,\mathbb {R} ^{m})$ . Falls $m=1$ ist, schreiben wir $C^{1}(\Omega ):=C^{1}(\Omega ,\mathbb {R} )$ . Für $m=2$ identifizieren wir $\mathbb {R} ^{2}=\mathbb {C}$ und setzen $C^{1}(\Omega ,\mathbb {C} ):=C^{1}(\Omega ,\mathbb {R} ^{2})$ . Falls der Bildbereich aus dem Zusammenhang hervorgeht, werden wir diesen nicht notwendig angeben.

Satz 1 (Kettenregel in mehreren Veränderlichen)[Bearbeiten]

Voraussetzungen:

(1) Die Mengen $\Omega \subset \mathbb {R} ^{n}$ und $\Theta \subset \mathbb {R} ^{m}$ – mit $m,n\in \mathbb {N}$ – sind offen.

(2) Die Funktion $y=f(x)=(f_{1}(x_{1},\ldots ,x_{n}),\ldots ,f_{m}(x_{1},\ldots ,x_{n})):\Omega \to \Theta$ gehört zur Klasse $C^{1}(\Omega ,\mathbb {R} ^{m})$ .

(3) Weiter sei $f\in C^{0}(\Omega ,\mathbb {R} ^{m})$ erfüllt.

(4) Es sei $z=g(y)=g(y_{1},\ldots ,y_{m}):\Theta \to \mathbb {C}$ eine Funktion der Klasse $C^{1}(\Theta ,\mathbb {C} )$ .

Behauptung: Dann gehört die Funktion

h=h(x)=g(f(x))=g(f_{1}(x_{1},\ldots ,x_{n}),\ldots ,f_{m}(x_{1},\ldots ,x_{n})):\Omega \to \mathbb {C}

zur Klasse $C^{1}(\Theta ,\mathbb {C} )$ und es gilt

(5)

{\frac {\partial }{\partial x_{j}}}h(x)=\sum _{k=1}^{m}{\frac {\partial }{\partial y_{k}}}g(f(x)){\frac {\partial f_{k}(x)}{\partial x_{j}}},\quad x\in \Omega

für $j=1,\ldots ,n$ .

Beweis[Bearbeiten]

Offenbar genügt es, die Situation $n=1,\Omega =(a,b)$ und $g\in C^{1}(\Theta ,\mathbb {R} )$ zu betrachten. Zu zeigen ist die Differenzierbarkeit von $h$ und die Identität (5): Sei $x^{0}\in (a,b)$ und $x\in (a,b)$ mit $0<|x-x^{0}|<\varepsilon$ gewählt. Dann gilt

{\begin{matrix}h(x)-h(x^{0})&=&g(f_{1}(x),\ldots ,f_{m}(x))-g(f_{1}(x^{0}),\ldots ,f_{m}(x^{0}))\\&=&[g(f_{1}(x),\ldots ,f_{m}(x))-g(f_{1}(x^{0}),\ldots ,f_{m}(x))]\\&+&[g(f_{1}(x^{0}),f_{2}(x)\ldots ,f_{m}(x))-g(f_{1}(x^{0}),f_{2}(x^{0}),\ldots ,f_{m}(x))]\\&+&\cdots \\&+&[g(f_{1}(x^{0}),\ldots ,f_{m-1}(x^{0}),f_{m}(x))-g(f_{1}(x^{0}),\ldots ,f_{m}(x^{0}))].\end{matrix}}

Wendet man auf die Ausdrücke in den eckigen Klammern den Mittelwertsatz der Differentialrechnung an, so folgt

{\begin{matrix}h(x)-h(x^{0})&=&g_{y_{1}}(\eta _{1},f_{2}(x),\ldots ,f_{m}(x))(f_{1}(x)-f_{1}(x^{0}))\\&+&g_{y_{2}}(f_{1}(x^{0}),\eta _{2}(x),\ldots ,f_{m}(x))(f_{2}(x)-f_{2}(x^{0}))\\&+&\cdots \\&+&g_{y_{m}}(f_{1}(x^{0}),\ldots ,f_{m-1}(x^{0}),\eta _{m})(f_{m}(x)-f_{m}(x^{0}))\end{matrix}}

mit $|\eta _{j}-f_{j}(x^{0})|\leq |f_{j}(x)-f_{j}(x^{0})|$ für $j=1,\ldots ,m$ . Für den Differenzenquotienten erhalten wir dann

{\begin{matrix}{\frac {h(x)-h(x^{0})}{x-x^{0}}}&=&g_{y_{1}}(\eta _{1},f_{2}(x),\ldots ,f_{m}(x)){\frac {f_{1}(x)-f_{1}(x^{0})}{x-x^{0}}}\\&+&\cdots \\&+&g_{y_{m}}(f_{1}(x^{0}),\ldots ,f_{m-1}(x^{0}),\eta _{m}){\frac {f_{m}(x)-f_{m}(x^{0})}{x-x^{0}}}.\end{matrix}}

Mittels Grenzübergang $x\to x^{0}$ folgt in

h'(x_{0})=g_{y_{1}}(f(x^{0}))\cdot f_{1}'(x^{0})+\ldots +g_{y_{m}}(f(x^{0}))\cdot f_{m}'(x^{0})

die Behauptung.

q.e.d.

Satz 2 (Mittelwertsatz in mehreren Veränderlichen)[Bearbeiten]

Sei $f\in C^{1}(\Omega )$ eine reellwertige Funktion auf der offenen Menge $\Omega \subset \mathbb {R} ^{n}$ . Weiter seien $x',x''\in \Omega \subset \mathbb {R} ^{n}$ zwei Punkte, so dass deren Verbindungsstrecke die folgende Inklusion erfüllt:

\sigma (x',x''):=\{x\in \mathbb {R} ^{n}:x=\lambda x'+(1-\lambda )x'',0\leq \lambda \leq 1\}\subset \Omega

.

Dann gibt es einen Punkt $z\in {\stackrel {\circ }{\sigma }}:=\sigma (x',x'')\setminus \{x',x''\}$ , so dass

f(x')-f(x'')=\sum _{k=1}^{n}f_{x_{k}}(z)(x_{k}'-x_{k}'')

gilt.

Beweis[Bearbeiten]

Wir wenden nun den Mittelwertsatz der Differentialrechnung aus Kapitel II §3 auf die Funktion

g(\lambda ):=f{\Bigl (}\lambda x'+(1-\lambda )x''{\Bigr )},\quad 0\leq \lambda \leq 1

an. Da $g$ differenzierbar in $\lambda$ ist, folgt $g\in C^{1}((0,1))\cap C^{0}([0,1])$ . Dann erhalten wir die Identität

(6)

f(x')-f(x'')=g(1)-g(0)=g'(\tau )

mit einem geeigneten $\tau \in (0,1)$ . Wir berechnen

{\begin{matrix}g'(\lambda )&=&{\frac {d}{d\lambda }}f(x_{1}'+\lambda (x_{1}''-x_{1}'),\ldots ,x_{n}'+\lambda (x_{n}''-x_{n}'))\\&=&f_{x_{1}}(x'+\lambda (x''-x'))(x_{1}''-x_{1}')+\ldots +f_{x_{n}}(x'+\lambda (x''-x'))(x_{n}''-x_{n}').\end{matrix}}

Mit Hilfe von (6) folgt die behauptete Gleichung

f(x')-f(x'')=\sum _{k=1}^{n}f_{x_{k}}(z)(x_{k}'-x_{k}'')

,

wobei $z:=x'+\tau (x''-x')\in {\stackrel {\circ }{\sigma }}(x',x'')$ erklärt ist.

q.e.d.

Definition 3[Bearbeiten]

Sei $\Omega \subset \mathbb {R} ^{n}$ eine offene Menge und $f\in C^{1}(\Omega )$ eine reellwertige Funktion, so nennen wir

\nabla f(x)={\Bigl (}f_{x_{1}}(x),\ldots ,f_{x_{n}}(x){\Bigr )},\quad x\in \Omega

den Gradienten von $f$ an der Stelle $x$ .

Definition 4[Bearbeiten]

Mit $C^{0}(\Omega )$ bezeichnen wir den Vektorraum aller reellwertigen stetigen Funktionen auf der offenen Menge $\Omega \subset \mathbb {R} ^{n}$ .

Satz 3[Bearbeiten]

Jede Funktion $f=f(x)\in C^{1}(\Omega )$ ist in der offenen Menge $\Omega \subset \mathbb {R} ^{n}$ stetig, d. h. die Inklusion $C^{1}(\Omega )\subset C^{0}(\Omega )$ ist erfüllt.

Beweis[Bearbeiten]

Diese Aussage ergibt sich als Folgerung aus Satz 2. Es gilt nämlich

|f(x')-f(x'')|=|\nabla f(z)\cdot (x'-x'')|\leq |\nabla f(z)|\cdot |x'-x''|

für alle $x',x''\in \Omega$ mit $z\in \sigma (x',x'')\subset \Omega$ .

Definition 5[Bearbeiten]

Sei $f\in C^{1}(\Omega )$ auf der offenen Menge $\Omega \subset \mathbb {R} ^{n}$ eine Funktion und $v\in \mathbb {R} ^{n}$ mit $|v|=1$ ein Richtungsvektor. Dann nennen wir die Ableitung der Funktion

$\Phi (t):=f(x+tv),\quad t\in (-\varepsilon ,\varepsilon )$ mit einem $\varepsilon >0$

an der Stelle $t=0$ die Richtungsableitung von an der Stelle $x\in \Omega$ in Richtung $v$ , also

(7)

\Phi '(0)=\nabla f(x)\cdot v=:{\frac {\partial }{\partial v}}f(x)

.

Satz 4[Bearbeiten]

Für eine Funktion $f\in C^{1}(\Omega )$ auf der offenen Menge $\Omega \subset \mathbb {R} ^{n}$ gilt die Abschätzung

(8) $-|\nabla f(x)|\leq {\frac {\partial }{\partial v}}f(x)\leq +|\nabla f(x)|$ für alle $v\in \mathbb {R} ^{n}$ mit $|v|=1$

in jedem Punkt $x\in \Omega$ . Falls $|\nabla f(x)|>0$ erfüllt ist, so tritt Gleichheit in (8) genau in den Fällen

$v=-|\nabla f(x)|^{-1}\nabla f(x)$ bzw. $v=|\nabla f(x)|^{-1}\nabla f(x)$

ein. Somit zeigt der Gradient in Richtung des höchsten Anstiegs von $f$ .

Beweis[Bearbeiten]

Die Identität (7) mit ${\frac {\partial }{\partial v}}f(x)=\nabla f(x)\cdot v$ und $v\in \mathbb {R} ^{n}$ sowie $|v|=1$ liefert die Ungleichung

\left|{\frac {\partial }{\partial v}}f(x)\right|\leq |\nabla f(x)|

.

Die Diskussion des Gleichheitszeichens überlassen wir dem Leser.

q.e.d.

Definition 6[Bearbeiten]

Für eine Abbildung

$y=f(x)=(f_{1}(x_{1},\ldots ,x_{n}),\ldots ,f_{m}(x_{1},\ldots ,x_{n})):\Omega \to \mathbb {R} ^{m}$ mit $f\in C^{1}(\Omega ,\mathbb {R} ^{m})$

auf der offenen Menge $\Omega \subset \mathbb {R} ^{n}$ nennen wir

(9)

\partial f(x):=\left({\frac {\partial f_{i}(x)}{\partial x_{j}}}\right)_{i=1,\ldots ,m \atop j=1,\ldots ,n}={\begin{pmatrix}f_{1,x_{1}}(x)&\ldots &f_{1,x_{n}}(x)\\\vdots &\ddots &\vdots \\f_{m,x_{1}}(x)&\ldots &f_{m,x_{n}}(x)\end{pmatrix}}

die Funktionalmatrix (oder Jacobimatrix) von $f$ an der Stelle $x$ .

Satz 5[Bearbeiten]

Sei die Gültigkeit von (1) und (2) aus Satz 1 vorausgesetzt und weiter gehöre die Funktion

(10)

z=g(y)=(g_{1}(y_{1},\ldots ,y_{m}),\ldots ,g_{l}(y_{1},\ldots ,y_{m})):\Theta \to \mathbb {R} ^{l}

zur Klasse $C^{1}(\Theta ,\mathbb {R} ^{l}),l\in \mathbb {N}$ . Dann liegt die Funktion

h(x):=(h_{1}(x),\ldots ,h_{l}(x))=g(f(x))={\begin{pmatrix}g_{1}(f_{1}(x),\ldots ,f_{m}(x))\\\vdots \\g_{l}(f_{1}(x),\ldots ,f_{m}(x))\end{pmatrix}}:\Omega \to \mathbb {R} ^{l}

in der Klasse $C^{1}(\Omega ,\mathbb {R} ^{l})$ und es gilt

{\frac {\partial }{\partial x_{j}}}h_{i}(x)=\sum _{k=1}^{m}{\frac {\partial g_{i}}{\partial y_{k}}}(f(x)){\frac {\partial f_{k}(x)}{\partial x_{j}}}

mit $i=1,\ldots ,l$ und $j=1,\ldots ,n$ bzw.

(11)

\partial h(x)=\partial g(f(x))\circ \partial f(x),\quad x\in \Omega

.

Beweis[Bearbeiten]

Dieser ergibt sich unmittelbar aus Satz 1 und Definition 6.

q.e.d.

Satz 6 (Differentialgleichungssystem von Cauchy und Riemann)[Bearbeiten]

Sei die Funktion $w=f(z)=u(x,y)+iv(x,y):\Omega \to \mathbb {C}$ auf der offenen Menge $\Omega \subset \mathbb {C}$ holomorph. Dann folgt $f\in C^{1}(\Omega ,\mathbb {C} )$ und $f$ erfüllt eine der folgenden beiden gleichwertigen Bedingungen:

(12) $f_{x}+if_{y}=0$ in $\Omega$

oder das Cauchy -Riemannsche Differentialgleichungssystem

(13) $u_{x}=v_{y},\quad u_{y}=-v_{x}$ in $\Omega$ .

Dabei erklären wir $u=Re\,f(z)$ und $v=Im\,f(z)$ als Real- bzw. Imaginärteil der Funktion $f$ .

Beweis[Bearbeiten]

Da $f(z)$ holomorph in $\Omega$ ist, existiert

f'(z)=\lim _{k\to \infty }{\frac {f(z+\zeta _{k})-f(z)}{\zeta _{k}}}

für jede komplexe Nullfolge $\{\zeta _{k}\}_{k\in \mathbb {N} }\subset \mathbb {C} \setminus \{0\}$ mit $\zeta _{k}\to 0\ (k\to \infty )$ . Somit ergibt sich

f'(z)=\lim _{\varepsilon \to \infty ,\varepsilon \neq 0}{\frac {f(z+\varepsilon )-f(z)}{\varepsilon }}=\lim _{\varepsilon \to \infty ,\varepsilon \neq 0}{\frac {f(x+\varepsilon ,y)-f(x,y)}{\varepsilon }}=f_{x}(x,y),

f'(z)=\lim _{\varepsilon \to \infty ,\varepsilon \neq 0}{\frac {f(z+i\varepsilon )-f(z)}{i\varepsilon }}=\lim _{\varepsilon \to \infty ,\varepsilon \neq 0}{\frac {f(x,y+\varepsilon )-f(x,y)}{i\varepsilon }}={\frac {1}{i}}f_{y}(x,y).

Damit erhalten wir $f\in C^{1}(\Omega ,\mathbb {C} )$ und folglich

f_{x}=f'(x)={\frac {1}{i}}f_{y}

oder

f_{x}-{\frac {1}{i}}f_{y}=f_{x}+if_{y}=0

in

\Omega

.

Weiter gilt

0=f_{x}-{\frac {1}{i}}f_{y}=(u(x,y)+iv(x,y))_{x}+i(u(x,y)+iv(x,y))_{y}=(u_{x}-v_{y})+i(v_{x}+u_{y})

genau dann, wenn

u_{x}=v_{y},\quad v_{x}=-u_{y}

in

\Omega

erfüllt ist.

q.e.d.

Bemerkungen[Bearbeiten]

1. Umgekehrt kann man von dem Cauchy-Riemannschen Differentialgleichungssystem auf die Holomorphie der Funktion schließen.
2. Die Eigenschaft (12) holomorpher Funktionen beinhaltet die Winkeltreue der Abbildung $f:\Omega \to \mathbb {C}$ in allen Punkten $z\in \Omega$ mit $f'(z)\neq 0$ . Wegen $f_{y}=if_{x}$ entsteht nämlich die Tangente an die Kurve $y\mapsto f(x,y)$ durch eine Drehung um ${\frac {\pi }{2}}$ aus der Tangente an die Kurve $x\mapsto f(x,y)$ .
3. Die Cauchy-Riemannschen Differentialgleichungen implizieren, dass die folgende Matrix

(14)

{\frac {1}{\sqrt {u_{x}^{2}+u_{y}^{2}}}}\cdot {\begin{pmatrix}u_{x}(x,y),&u_{y}(x,y)\\v_{x}(x,y),&v_{y}(x,y)\end{pmatrix}},\quad z=x+iy\in \Omega

orthogonal mit Determinante +1 ist – also eine Drehung darstellt. Somit sind holomorphe Funktionen mit nichtverschwindender Ableitung infinitesimal Drehungen in der $x,y$ -Ebene.
4. Winkeltreue Abbildungen wurden von C. F. Gauß auch konform genannt; sie sind bei der Erstellung von Landkarten bedeutend.

Definition 7[Bearbeiten]

Eine offene Menge $\Omega \subset \mathbb {R} ^{n}$ heißt Gebiet, wenn sie im folgenden Sinne zusammenhängend ist: Zu je zwei Punkten $x',x''\in \Omega$ gibt es einen stetigen Weg

\varphi (t):[0,1]\to \Omega \in C^{0}([0,1],\mathbb {R} ^{n})

mit

\varphi (0)=x'

und

\varphi (1)=x''

.

Dieser Weg verbindet $x'$ und $x''$ stetig in $\Omega$ .

Satz 7[Bearbeiten]

Sei $\Omega \subset \mathbb {R} ^{n}$ ein Gebiet und $f\in C^{1}(\Omega )$ eine reellwertige Funktion mit $\nabla f(x)\equiv 0$ in $\Omega$ . Dann ist $f(x)\equiv c$ für alle $x\in \Omega$ erfüllt – mit einer Konstante $c\in \mathbb {R}$ .

Beweis[Bearbeiten]

Im ersten Teil wird die Eigenschaft 'die Funktion $f$ ist konstant' lokal geprüft, während im zweiten Teil die globale Aussage gezeigt wird.

1. Sei $x\in \Omega$ ein beliebiger Punkt, so gibt es eine Kugel $K_{\varepsilon }(x)\subset \Omega$ mit einem hinreichend kleinen $\varepsilon >0$ . Zu $y\in K_{\varepsilon }(x)$ gibt es nach dem Mittelwertsatz – in mehreren Veränderlichen – einen Punkt $z\in {\stackrel {\circ }{\sigma }}(x,y)$ mit der Eigenschaft

f(y)-f(x)=\nabla f(z)\cdot (y-x)=0

,

weil $\nabla f$ nach Voraussetzung verschwindet. Somit folgt

f(x)=f(y)

für alle

y\in K_{\varepsilon }(x)

und $f$ ist lokal konstant.

2. Wie im Teil 3.) des Beweises von Satz 5 aus Kapitel II §5 zeigt man über die Gebietseigenschaft, dass $f$ global konstant ist.

q.e.d.

Satz 8 (Additionstheorem für die Arcusfunktionen)[Bearbeiten]

Für alle $x,y\in \mathbb {R}$ mit $x\cdot y\neq 1$ und $|\arctan x+\arctan y|<{\frac {\pi }{2}}$ gilt

(15)

\arctan {\frac {x+y}{1-xy}}=\arctan x+\arctan y

.

Für alle $x,y\in \mathbb {R}$ mit $|x|\leq 1$ und $y\leq 1$ sowie $|\arcsin x+\arcsin y|\leq 1$ gilt

(16)

\arcsin \left(x{\sqrt {1-y^{2}}}+y{\sqrt {1-x^{2}}}\right)=\arcsin x+\arcsin y

.

Beweis[Bearbeiten]

Zum Beweis von (15) betrachte man die Funktion

f(x,y)=\arctan \left({\frac {x+y}{1-xy}}\right)-\arctan x-\arctan y

für alle $x,y$ mit $x\cdot y\neq 1$ und $|\arctan x+\arctan y|<{\frac {\pi }{2}}$ . Man berechnet dann

f_{x}(x,y)=0=f_{y}(x,y)

und somit ist $f$ konstant. Da $f(0,0)=0$ richtig ist, folgt $f(x,y)\equiv 0$ und somit die Identität (15). Ebenso beweist man (16).

q.e.d.

Wir bezeichnen mit ${}^{*}$ die Transposition von Matrizen.

Satz 9[Bearbeiten]

Auf der offenen Menge $\Omega \subset \mathbb {R} ^{n}$ sei die Funktion

f=(f_{1},\ldots ,f_{m})^{*}:\Omega \to \mathbb {R} ^{m}\in C^{1}(\Omega ,\mathbb {R} ^{m})

gegeben. Dann gilt in jedem Punkt $x\in \Omega$ die linear approximative Darstellung

(17)

{\begin{matrix}f(x+h)=f(x)+\partial f(x)\circ h^{*}+F(x,h)\circ h^{*},\\h=(h_{1},\ldots ,h_{n})\in \mathbb {R} ^{n}\setminus \{0\}\ mit\ 0<|h|<\varepsilon \end{matrix}}

für ein hinreichend kleines $\varepsilon >0$ . Hierbei liefert $h\mapsto \partial f(x)\circ h^{*}$ eine lineare Abbildung vom $\mathbb {R} ^{n}$ in den $\mathbb {R} ^{m}$ mit der Funktionalmatrix $\partial f(x)$ . Ferner haben wir für die $m\times n$ -Matrix $F(x,h)\in \mathbb {R} ^{m\times n}$ die asymptotische Beziehung

\lim _{h\to 0,h\in \mathbb {R} ^{n}\setminus \{0\}}F(x,h)=0

,

wobei wir ihre Konvergenz natürlich im $\mathbb {R} ^{m\cdot n}$ verstehen.

Beweis[Bearbeiten]

Für $j=1,\ldots ,m$ wenden wir auf jede Komponentenfunktion $f_{j}$ den Mittelwertsatz an. Dann gibt es eine Zwischenstelle $z^{(j)}\in {\stackrel {\circ }{\sigma }}(x,x+h)$ mit der Eigenschaft