Kurs:Analysis II/Kapitel IV: Partielle Differentiation für Funktionen mehrerer Veränderlicher/Partielle Ableitungen erster Ordnung (§1)

Aus Wikiversity

Wechseln zu: Navigation, Suche

Inhaltsverzeichnis

[Bearbeiten] Definition 1

Seien die Dimensionen n,m \in \mathbb{N} gewählt, f=f(x): \Omega \to \mathbb{R}^m sei eine auf der offenen Menge \Omega \subset \mathbb{R}^n erklärte Funktion und schließlich sei x^0 = (x_1^0, \ldots, x_n^0) \in \Omega ein fester Punkt. Für hinreichend kleines \varepsilon > 0 betrachten wir die Funktion
\Phi_j: (x_j^0 - \varepsilon, x_j^0 + \varepsilon) \to \mathbb{R}^m vermöge \Phi_j(t) := f(x_1^0, \ldots, x_{j - 1}^0, t, x_{j + 1}^0, \ldots, x_n^0), \quad t \in (x_j^0 - \varepsilon, x_j^0 + \varepsilon).
Existiert die Ableitung der Funktion Φj an der Stelle t = x_j^0, so heißt \Phi'_j(x^0_j), so heißt die partielle Ableitung von f nach xj im Punkt x0. Wir schreiben
\Phi'_j(x_j^0) =: f_{x_j}(x^0) = \frac{\partial}{\partial x_j} f(x^0) für ein j \in \{1, \ldots, n\}.

[Bearbeiten] Definition 2

Sei \Omega \subset \mathbb{R}^n eine offene Menge. Existieren die partiellen Ableitungen f_{x_j}(x) mit j = 1, \ldots, n für alle x \in \Omega und stellen sie in Ω eine stetige Funktion dar, so gehört die Funktion f zur Klasse C^1 (\Omega, \mathbb{R}^m) der einmal stetig differenzierbaren Funktionen – oder kurz f \in C^1 (\Omega, \mathbb{R}^m). Falls m = 1 ist, schreiben wir C^1(\Omega) := C^1(\Omega, \mathbb{R}). Für m = 2 identifizieren wir \mathbb{R}^2 = \mathbb{C} und setzen C^1 (\Omega, \mathbb{C}) := C^1 (\Omega, \mathbb{R}^2). Falls der Bildbereich aus dem Zusammenhang hervorgeht, werden wir diesen nicht notwendig angeben.

[Bearbeiten] Satz 1 (Kettenregel in mehreren Veränderlichen)

Voraussetzungen:
(1) Die Mengen \Omega \subset \mathbb{R}^n und \Theta \subset \mathbb{R}^m – mit m, n \in \mathbb{N} – sind offen.
(2) Die Funktion y=f(x) = (f_1(x_1, \ldots, x_n), \ldots, f_m(x_1, \ldots, x_n)) : \Omega \to \Theta gehört zur Klasse C^1 (\Omega, \mathbb{R}^m).
(3) Weiter sei f \in C^0 (\Omega, \mathbb{R}^m) erfüllt.
(4) Es sei z = g(y) = g(y_1, \ldots, y_m) : \Theta \to \mathbb{C} eine Funktion der Klasse C^1 (\Theta, \mathbb{C}).
Behauptung: Dann gehört die Funktion
h = h(x) = g(f(x)) = g(f_1(x_1, \ldots, x_n), \ldots, f_m(x_1, \ldots, x_n)) : \Omega \to \mathbb{C}
zur Klasse C^1 (\Theta, \mathbb{C}) und es gilt
(5) \frac{\partial}{\partial x_j} h(x) = \sum^m_{k = 1} \frac{\partial}{\partial y_k} g(f(x)) \frac{\partial f_k(x)}{\partial x_j}, \quad x \in \Omega
für j = 1, \ldots, n.

[Bearbeiten] Beweis

Offenbar genügt es, die Situation n = 1,Ω = (a,b) und g \in C^1(\Theta, \mathbb{R}) zu betrachten. Zu zeigen ist die Differenzierbarkeit von h und die Identität (5): Sei x^0 \in (a, b) und x \in (a, b) mit 0 < |x - x^0| < \varepsilon gewählt. Dann gilt

\begin{matrix} h(x) - h(x^0) & = & g(f_1(x), \ldots, f_m(x)) - g(f_1(x^0), \ldots, f_m(x^0)) \\ & = & [g(f_1(x), \ldots, f_m(x)) - g(f_1(x^0), \ldots, f_m(x))] \\ & + & [g(f_1(x^0), f_2(x) \ldots, f_m(x)) - g(f_1(x^0), f_2(x^0), \ldots, f_m(x))] \\ & + & \cdots \\ & + & [g(f_1(x^0), \ldots, f_{m - 1}(x^0), f_m(x)) - g(f_1(x^0), \ldots, f_m(x^0))]. \end{matrix}

Wendet man auf die Ausdrücke in den eckigen Klammern den Mittelwertsatz der Differentialrechnung an, so folgt

\begin{matrix} h(x) - h(x^0) & = & g_{y_1}(\eta_1, f_2(x), \ldots, f_m(x)) (f_1(x) - f_1(x^0)) \\ & + & g_{y_2}(f_1(x^0), \eta_2(x), \ldots, f_m(x)) (f_2(x) - f_2(x^0)) \\ & + & \cdots \\ & + & g_{y_m}(f_1(x^0), \ldots, f_{m - 1}(x^0), \eta_m) (f_m(x) - f_m(x^0)) \end{matrix}

mit |\eta_j - f_j(x^0)| \le |f_j(x) - f_j(x^0)| für j = 1, \ldots, m. Für den Differenzenquotienten erhalten wir dann

\begin{matrix} \frac{h(x) - h(x^0)}{x - x^0} & = & g_{y_1}(\eta_1, f_2(x), \ldots, f_m(x)) \frac{f_1(x) - f_1(x^0)}{x - x^0} \\ & + & \cdots \\ & + & g_{y_m}(f_1(x^0), \ldots, f_{m - 1}(x^0), \eta_m) \frac{f_m(x) - f_m(x^0)}{x - x^0}. \end{matrix}

Mittels Grenzübergang x \to x^0 folgt in

h'(x_0) = g_{y_1}(f(x^0)) \cdot f_1'(x^0) + \ldots + g_{y_m}(f(x^0)) \cdot f_m'(x^0)

die Behauptung.

q.e.d.

[Bearbeiten] Satz 2 (Mittelwertsatz in mehreren Veränderlichen)

Sei f \in C^1(\Omega) eine reellwertige Funktion auf der offenen Menge \Omega \subset \mathbb{R}^n. Weiter seien x', x'' \in \Omega \subset \mathbb{R}^n zwei Punkte, so dass deren Verbindungsstrecke die folgende Inklusion erfüllt:
\sigma(x', x'') := \{x \in \mathbb{R}^n: x = \lambda x' + (1 - \lambda) x'', 0 \le \lambda \le 1 \} \subset \Omega.
Dann gibt es einen Punkt z \in \stackrel{\circ}{\sigma} := \sigma (x', x'') \setminus \{x', x''\}, so dass
f(x') - f(x'') = \sum^n_{k = 1} f_{x_k}(z) (x_k' - x_k'')
gilt.

[Bearbeiten] Beweis

Wir wenden nun den Mittelwertsatz der Differentialrechnung aus Kapitel II §3 auf die Funktion

g(\lambda):= f \Bigl( \lambda x' + (1 - \lambda) x'' \Bigr), \quad 0 \le \lambda \le 1

an. Da g differenzierbar in λ ist, folgt g \in C^1((0,1)) \cap C^0([0,1]). Dann erhalten wir die Identität

(6) f(x') − f(x'') = g(1) − g(0) = g'(τ)

mit einem geeigneten \tau \in (0,1). Wir berechnen

\begin{matrix} g'(\lambda) &=& \frac{d}{d\lambda} f(x_1' + \lambda(x_1'' - x_1'), \ldots, x_n' + \lambda(x_n'' - x_n')) \\ &=& f_{x_1}(x' + \lambda(x'' - x')) (x_1'' - x_1') + \ldots + f_{x_n}(x' + \lambda(x'' - x')) (x_n'' - x_n'). \end{matrix}

Mit Hilfe von (6) folgt die behauptete Gleichung

f(x') - f(x'') = \sum^n_{k = 1} f_{x_k}(z) (x_k' - x_k''),

wobei z := x' + \tau(x'' - x') \in \stackrel{\circ}{\sigma}(x', x'') erklärt ist.

q.e.d.

[Bearbeiten] Definition 3

Sei \Omega \subset \mathbb{R}^n eine offene Menge und f \in C^1(\Omega) eine reellwertige Funktion, so nennen wir
\nabla f(x) = \Bigl( f_{x_1}(x), \ldots, f_{x_n}(x) \Bigr), \quad x \in \Omega
den Gradienten von f an der Stelle x.

[Bearbeiten] Definition 4

Mit C0(Ω) bezeichnen wir den Vektorraum aller reellwertigen stetigen Funktionen auf der offenen Menge \Omega \subset \mathbb{R}^n.

[Bearbeiten] Satz 3

Jede Funktion f = f(x) \in C^1(\Omega) ist in der offenen Menge \Omega \subset \mathbb{R}^n stetig, d. h. die Inklusion C^1(\Omega) \subset C^0(\Omega) ist erfüllt.

[Bearbeiten] Beweis

Diese Aussage ergibt sich als Folgerung aus Satz 2. Es gilt nämlich

|f(x') - f(x'')| = |\nabla f(z) \cdot (x' - x'')| \le |\nabla f(z)| \cdot |x' - x''|

für alle x', x'' \in \Omega mit z \in \sigma(x', x'') \subset \Omega.

[Bearbeiten] Definition 5

Sei f \in C^1(\Omega) auf der offenen Menge \Omega \subset \mathbb{R}^n eine Funktion und v \in \mathbb{R}^n mit | v | = 1 ein Richtungsvektor. Dann nennen wir die Ableitung der Funktion
\Phi(t) := f(x + tv), \quad t \in (- \varepsilon, \varepsilon) mit einem \varepsilon > 0
an der Stelle t = 0 die Richtungsableitung von an der Stelle x \in \Omega in Richtung v, also
(7) \Phi'(0) = \nabla f(x) \cdot v =: \frac{\partial}{\partial v} f(x).

[Bearbeiten] Satz 4

Für eine Funktion f \in C^1(\Omega) auf der offenen Menge \Omega \subset \mathbb{R}^n gilt die Abschätzung
(8) - |\nabla f(x)| \le \frac{\partial}{\partial v} f(x) \le + |\nabla f(x)| für alle v \in \mathbb{R}^n mit | v | = 1
in jedem Punkt x \in \Omega. Falls |\nabla f(x)| > 0 erfüllt ist, so tritt Gleichheit in (8) genau in den Fällen
v = - |\nabla f(x)|^{-1} \nabla f(x) bzw. v = |\nabla f(x)|^{-1} \nabla f(x)
ein. Somit zeigt der Gradient in Richtung des höchsten Anstiegs von f.

[Bearbeiten] Beweis

Die Identität (7) mit \frac{\partial}{\partial v} f(x) = \nabla f(x) \cdot v und v \in \mathbb{R}^n sowie | v | = 1 liefert die Ungleichung

\left| \frac{\partial}{\partial v} f(x) \right| \le |\nabla f(x)|.

Die Diskussion des Gleichheitszeichens überlassen wir dem Leser.

q.e.d.

[Bearbeiten] Definition 6

Für eine Abbildung
y = f(x) = (f_1(x_1, \ldots, x_n), \ldots, f_m(x_1, \ldots, x_n)): \Omega \to \mathbb{R}^m mit f \in C^1(\Omega, \mathbb{R}^m)
auf der offenen Menge \Omega \subset \mathbb{R}^n nennen wir
(9) \partial f(x) := \left( \frac{\partial f_i(x)}{\partial x_j} \right)_{i = 1, \ldots, m \atop j = 1, \ldots, n} = \begin{pmatrix} f_{1, x_1}(x) & \ldots & f_{1, x_n}(x) \\ \vdots & \ddots & \vdots \\ f_{m, x_1}(x) & \ldots & f_{m, x_n}(x) \end{pmatrix}
die Funktionalmatrix (oder Jacobimatrix) von f an der Stelle x.

[Bearbeiten] Satz 5

Sei die Gültigkeit von (1) und (2) aus Satz 1 vorausgesetzt und weiter gehöre die Funktion
(10) z = g(y) = (g_1(y_1, \ldots, y_m), \ldots, g_l(y_1, \ldots, y_m)): \Theta \to \mathbb{R}^l
zur Klasse C^1(\Theta, \mathbb{R}^l), l \in \mathbb{N}. Dann liegt die Funktion
h(x) := (h_1(x), \ldots, h_l(x)) = g(f(x)) = \begin{pmatrix} g_1(f_1(x), \ldots, f_m(x)) \\ \vdots \\ g_l(f_1(x), \ldots, f_m(x)) \end{pmatrix}: \Omega \to \mathbb{R}^l
in der Klasse C^1(\Omega, \mathbb{R}^l) und es gilt
\frac{\partial}{\partial x_j} h_i(x) = \sum^m_{k = 1} \frac{\partial g_i}{\partial y_k} (f(x)) \frac{\partial f_k(x)}{\partial x_j}
mit i = 1, \ldots, l und j = 1, \ldots, n bzw.
(11) \partial h(x) = \partial g(f(x)) \circ \partial f(x), \quad x \in \Omega.

[Bearbeiten] Beweis

Dieser ergibt sich unmittelbar aus Satz 1 und Definition 6.

q.e.d.

[Bearbeiten] Satz 6 (Differentialgleichungssystem von Cauchy und Riemann)

Sei die Funktion w = f(z) = u(x, y) + iv(x,y): \Omega \to \mathbb{C} auf der offenen Menge \Omega \subset \mathbb{C} holomorph. Dann folgt f \in C^1(\Omega, \mathbb{C}) und f erfüllt eine der folgenden beiden gleichwertigen Bedingungen:
(12) fx + ify = 0 in Ω
oder das Cauchy -Riemannsche Differentialgleichungssystem
(13) u_x = v_y, \quad u_y = - v_x in Ω.
Dabei erklären wir u = Re\, f(z) und v = Im\, f(z) als Real- bzw. Imaginärteil der Funktion f.

[Bearbeiten] Beweis

Da f(z) holomorph in Ω ist, existiert

f'(z) = \lim_{k \to \infty} \frac{f(z + \zeta_k) - f(z)}{\zeta_k}

für jede komplexe Nullfolge \{\zeta_k\}_{k \in \mathbb{N}} \subset \mathbb{C} \setminus \{0\} mit \zeta_k \to 0 \ (k \to \infty). Somit ergibt sich

f'(z) = \lim_{\varepsilon \to \infty, \varepsilon \neq 0} \frac{f(z + \varepsilon) - f(z)}{\varepsilon} = \lim_{\varepsilon \to \infty, \varepsilon \neq 0} \frac{f(x + \varepsilon, y) - f(x, y)}{\varepsilon} = f_x(x, y),
f'(z) = \lim_{\varepsilon \to \infty, \varepsilon \neq 0} \frac{f(z + i\varepsilon) - f(z)}{i\varepsilon} = \lim_{\varepsilon \to \infty, \varepsilon \neq 0} \frac{f(x, y + \varepsilon) - f(x, y)}{i\varepsilon} = \frac{1}{i} f_y(x, y) .

Damit erhalten wir f \in C^1(\Omega, \mathbb{C}) und folglich

f_x = f'(x) = \frac{1}{i} f_y oder f_x - \frac{1}{i} f_y = f_x + if_y = 0 in Ω.

Weiter gilt

0 = f_x - \frac{1}{i} f_y = (u(x, y) + iv(x, y))_x + i(u(x, y) + iv(x, y))_y = (u_x - v_y) + i(v_x + u_y)

genau dann, wenn

u_x = v_y, \quad v_x = - u_y in Ω

erfüllt ist.

q.e.d.

[Bearbeiten] Bemerkungen

1. Umgekehrt kann man von dem Cauchy-Riemannschen Differentialgleichungssystem auf die Holomorphie der Funktion schließen.
2. Die Eigenschaft (12) holomorpher Funktionen beinhaltet die Winkeltreue der Abbildung f: \Omega \to \mathbb{C} in allen Punkten z \in \Omega mit f'(z) \neq 0. Wegen fy = ifx entsteht nämlich die Tangente an die Kurve y \mapsto f(x, y) durch eine Drehung um \frac{\pi}{2} aus der Tangente an die Kurve x \mapsto f(x, y).
3. Die Cauchy-Riemannschen Differentialgleichungen implizieren, dass die folgende Matrix

(14) \frac{1}{\sqrt{u^2_x + u^2_y}} \cdot \begin{pmatrix} u_x(x, y), & u_y(x, y) \\ v_x(x, y), & v_y(x, y) \end{pmatrix}, \quad z = x + iy \in \Omega

orthogonal mit Determinante +1 ist – also eine Drehung darstellt. Somit sind holomorphe Funktionen mit nichtverschwindender Ableitung infinitesimal Drehungen in der x,y-Ebene.
4. Winkeltreue Abbildungen wurden von C. F. Gauß auch konform genannt; sie sind bei der Erstellung von Landkarten bedeutend.

[Bearbeiten] Definition 7

Eine offene Menge \Omega \subset \mathbb{R}^n heißt Gebiet, wenn sie im folgenden Sinne zusammenhängend ist: Zu je zwei Punkten x', x'' \in \Omega gibt es einen stetigen Weg
\varphi(t): [0, 1] \to \Omega \in C^0([0, 1], \mathbb{R}^n) mit \varphi(0) = x' und \varphi(1) = x''.
Dieser Weg verbindet x' und x'' stetig in Ω.

[Bearbeiten] Satz 7

Sei \Omega \subset \mathbb{R}^n ein Gebiet und f \in C^1(\Omega) eine reellwertige Funktion mit \nabla f(x) \equiv 0 in Ω. Dann ist f(x) \equiv c für alle x \in \Omega erfüllt – mit einer Konstante c \in \mathbb{R}.

[Bearbeiten] Beweis

Im ersten Teil wird die Eigenschaft 'die Funktion f ist konstant' lokal geprüft, während im zweiten Teil die globale Aussage gezeigt wird.

1. Sei x \in \Omega ein beliebiger Punkt, so gibt es eine Kugel K_\varepsilon(x) \subset \Omega mit einem hinreichend kleinen \varepsilon > 0. Zu y \in K_\varepsilon(x) gibt es nach dem Mittelwertsatz – in mehreren Veränderlichen – einen Punkt z \in \stackrel{\circ}{\sigma}(x, y) mit der Eigenschaft

f(y) - f(x) = \nabla f(z) \cdot (y - x) = 0,

weil \nabla f nach Voraussetzung verschwindet. Somit folgt

f(x) = f(y) für alle y \in K_\varepsilon(x)

und f ist lokal konstant.

2. Wie im Teil 3.) des Beweises von Satz 5 aus Kapitel II §5 zeigt man über die Gebietseigenschaft, dass f global konstant ist.

q.e.d.

[Bearbeiten] Satz 8 (Additionstheorem für die Arcusfunktionen)

Für alle x, y \in \mathbb{R} mit x \cdot y \neq 1 und |\arctan x + \arctan y| < \frac{\pi}{2} gilt
(15) \arctan \frac{x + y}{1 - xy} = \arctan x + \arctan y.
Für alle x, y \in \mathbb{R} mit |x| \le 1 und y \le 1 sowie |\arcsin x + \arcsin y| \le 1 gilt
(16) \arcsin \left( x \sqrt{1 - y^2} + y \sqrt{1 - x^2} \right) = \arcsin x + \arcsin y.

[Bearbeiten] Beweis

Zum Beweis von (15) betrachte man die Funktion

f(x, y) = \arctan \left( \frac{x + y}{1 - xy} \right) - \arctan x - \arctan y

für alle x,y mit x \cdot y \neq 1 und |\arctan x + \arctan y| < \frac{\pi}{2}. Man berechnet dann

fx(x,y) = 0 = fy(x,y)

und somit ist f konstant. Da f(0,0) = 0 richtig ist, folgt f(x, y) \equiv 0 und somit die Identität (15). Ebenso beweist man (16).

q.e.d.

Wir bezeichnen mit * die Transposition von Matrizen.

[Bearbeiten] Satz 9

Auf der offenen Menge \Omega \subset \mathbb{R}^n sei die Funktion
f = (f_1, \ldots, f_m)^*: \Omega \to \mathbb{R}^m \in C^1(\Omega, \mathbb{R}^m)
gegeben. Dann gilt in jedem Punkt x \in \Omega die linear approximative Darstellung
(17) \begin{matrix} f(x + h) = f(x) + \partial f(x) \circ h^* + F(x, h) \circ h^*, \\ h = (h_1, \ldots, h_n) \in \mathbb{R}^n \setminus \{0\}\ mit\ 0 < |h| < \varepsilon \end{matrix}
für ein hinreichend kleines \varepsilon > 0. Hierbei liefert h \mapsto \partial f(x) \circ h^* eine lineare Abbildung vom \mathbb{R}^n in den \mathbb{R}^m mit der Funktionalmatrix \partial f(x). Ferner haben wir für die m \times n-Matrix F(x, h) \in \mathbb{R}^{m \times n} die asymptotische Beziehung
\lim_{h \to 0, h \in \mathbb{R}^n \setminus \{0\}} F(x, h) = 0,
wobei wir ihre Konvergenz natürlich im \mathbb{R}^{m \cdot n} verstehen.

[Bearbeiten] Beweis

Für j = 1, \ldots, m wenden wir auf jede Komponentenfunktion fj den Mittelwertsatz an. Dann gibt es eine Zwischenstelle z^{(j)} \in \stackrel{\circ}{\sigma}(x, x + h) mit der Eigenschaft

f_j(x + h) - f_j(x) = f_j(x_1 + h_1, \ldots, x_n + h_n) - f_j(x_1, \ldots, x_n)
= \nabla f_j\left( z^{(j)} \right) \cdot h = \nabla f_j(x) \cdot h + \left( \nabla f_j\left( z^{(j)} \right) - \nabla f_j(x) \right) \cdot h.

Mit der m \times n-Matrix-wertigen Funktion

(18) F(x, h) := \begin{pmatrix} \nabla f_1\left( z^{(1)} \right) - \nabla f_1(x) \\ \vdots \\ \nabla f_m\left( z^{(m)} \right) - \nabla f_m(x) \end{pmatrix}

erhalten wir die angegebene Darstellung.

q.e.d.

Persönliche Werkzeuge