Kurs:Analysis II/Kapitel IV: Partielle Differentiation für Funktionen mehrerer Veränderlicher/Fundamentalsatz über die inverse Abbildung (§4)

Aus Wikiversity

Wechseln zu: Navigation, Suche

Inhaltsverzeichnis

[Bearbeiten] Definition 1

Unter einer Umgebung A eines Punktes a \in \mathbb{R}^n verstehen wir eine offene Menge A \subset \mathbb{R}^n, welche diesen Punkt gemäß a \in A enthält.

Auf einer offenen Menge \Omega \subset \mathbb{R}^n sei eine einmal stetig partiell differenzierbare Abbildung f \in C^1(\Omega, \mathbb{R}^n) gegeben. Nun untersuchen wir die lokale Umkehrbarkeit der Funktion

(1) y = f(x): \Omega \to \mathbb{R}^n im Punkt a \in \Omega mit dem Bildpunkt b := f(a) \in \mathbb{R}^n.

Genauer beantworten wir positiv die folgenden Fragen:

  1. Gibt es eine Umgebung B des Bildpunktes b, die das bijektive Bild einer Umgebung A des Punktes a bezüglich der Abbildung (1) ist?
  2. Übertragen sich die Differenzierbarkeitseigenschaften von f auf die Umkehrabbildung g – auch die höhere Differenzierbarkeit?

[Bearbeiten] Bemerkung

Die Lösung des Problems ist offenbar äquivalent zur lokalen Lösung eines nichtlinearen Gleichungssystems der Form

(2) \left. \begin{matrix} f_1(x_1, \ldots, x_n) = y_1 \\ \vdots \\ f_n(x_1, \ldots, x_n) = y_n \end{matrix} \right\} x = (x_1, \ldots, x_n) \in A, y = (y_1, \ldots, y_n) \in B.

[Bearbeiten] Beispiel 1

Eine lineare Abbildung

f: \mathbb{R}^n \to \mathbb{R}^n vermöge x \mapsto y = f(x) = A \circ x

mit den Komponenten

f_i(x) = \sum^n_{j = 1} a_{ij} x_j, \quad x = (x_1, \ldots, x_n)^* für i = 1, \ldots, n

und der assoziierten reellen Matrix A = (a_{ij})_{i, j = 1, \ldots, n} sei gegeben. Dann zeigt man in der Linearen Algebra die fundamentale Äquivalenz

(3) f ist bijektiv \Leftrightarrow \det A \neq 0.

Die vektorwertige Funktion f(x) = (f_1(x), \ldots, f_n(x))^* besitzt die Funktionalmatrix

(4) \partial f(x) := \left( \frac{\partial f_i}{\partial x_k} (x) \right)_{i, k = 1, \ldots, n} = (a_{ik})_{i, k = 1, \ldots, n}.

Mit dem Kroneckersymbol ermitteln wir für i, k = 1, \ldots, n nämlich

\frac{\partial f_i}{\partial x_k} (x) = \frac{\partial}{\partial x_k} \left( \sum^n_{l = 1} a_{il} x_l \right) = \sum^n_{l = 1} a_{il} \delta_{lk} = a_{ik}.

Somit erscheint die Äquivalenz (3) in der Form

(5) f ist bijektiv \Leftrightarrow \det \left( \frac{\partial f_i}{\partial x_k} (x) \right)_{i, k = 1, \ldots, n} \neq 0.

Also ist die Invertierbarkeit der Funktionalmatrix im Punkt a \in \Omega für unsere Fragestellung entscheidend! Nach Formel (17) von Satz 9 aus §1 gilt für die Abbildung (1) die linear-approximative Darstellung

(6) f(x) = f(a) + \partial f(a) \circ (x - a)^* + F(x, a) \circ (x - a)^* mit \lim_{x \to a, x \neq a} F(x, a) = 0.

[Bearbeiten] Definition 2

Auf der offenen Menge \Omega \subset \mathbb{R}^n sei die folgende Abbildung f: \Omega \to \mathbb{R}^n \in C^1(\Omega, \mathbb{R}^n) gegeben. Dann nennen wir
J_f(x) := \det \left( \frac{\partial f_i}{\partial x_j} (x) \right)_{i, j = 1, \ldots, n}
die Funktionaldeterminante oder auch Jacobische (Determinante) der Abbildung f im Punkt x \in \Omega.

[Bearbeiten] Beispiel 2

Für n = 2 betrachten wir die Koordinatentransformation zwischen Polarkoordinaten und kartesischen Koordinaten. Auf der offenen Menge

\Omega := \{(r, \varphi): 0 < r < R, 0 < \varphi < 2 \pi\} mit R \in (0, + \infty)

definieren wir die Abbildung

(7) f: \Omega \to \mathbb{R}^2 vermöge x := \begin{pmatrix} r \\ \varphi \end{pmatrix} \mapsto y := f(x) = \begin{pmatrix} r \cdot \cos \varphi \\ r \cdot \sin \varphi \end{pmatrix}.

Wir berechnen ihre Funktionalmatrix

(8) \partial f(r, \varphi) = \begin{pmatrix} \frac{\partial f_1}{\partial r}, & \frac{\partial f_1}{\partial \varphi} \\ \frac{\partial f_2}{\partial r}, & \frac{\partial f_2}{\partial \varphi} \end{pmatrix} = \begin{pmatrix} \cos \varphi & - r \sin \varphi \\ \sin \varphi & r \cos \varphi \end{pmatrix}

sowie ihre Funktionaldeterminante

(9) J_f(r, \varphi) = \det \partial f(r, \varphi) = r > 0 in Ω.

Der Fundamentalsatz über die inverse Abbildung wird in den nachfolgenden Hilfssätzen erarbeitet.

[Bearbeiten] Hilfssatz 1

Sei die offene Menge \Omega \subset \mathbb{R}^n, die Abbildung f: \Omega \to \mathbb{R}^n \in C^1(\Omega, \mathbb{R}^n) und der reguläre Punkt a \in \Omega mit J_f(a) \neq 0 gegeben. Dann gibt es eine Zahl ρ > 0, so dass die Abbildung f eingeschränkt auf die Menge K_\rho(a) := \{x \in \mathbb{R}^n: |x - a| \le \rho\} injektiv ist. Weiter ist mit einer Konstanten M > 0 die Ungleichung
(10) |f(x') - f(x'')| \ge M \cdot |x' - x''| für alle x', x'' \in K_\rho(a)
erfüllt. Schließlich gilt J_f(x) \neq 0 für alle Punkte x \in K_\rho(a).

[Bearbeiten] Beweis

1. Wegen J_f(a) \neq 0 und der Stetigkeit der Funktionen \frac{\partial f_i}{\partial x_j} gibt es ein ρ > 0, so dass für alle \eta = (z^{(1)}, \ldots, z^{(n)}) \in K_\rho(a) \times \ldots \times K_\rho(a) die folgende Matrix invertierbar ist:

\partial f(\eta) := \begin{pmatrix} f_{1, x_1} \left( z^{(1)} \right) & \ldots & f_{1, x_n} \left( z^{(1)} \right) \\ \vdots & \ddots & \vdots \\ f_{n, x_1} \left( z^{(n)} \right) & \ldots & f_{n, x_n} \left( z^{(n)} \right) \end{pmatrix}.

Mit S := \{\xi \in \mathbb{R}^n: |\xi| = 1\} und D := K_\rho(a) \times \ldots \times K_\rho(a) \times S \subset \mathbb{R}^{n \cdot n + n} betrachten wir die Hilfsfunktion

(11) \begin{matrix} \Phi: D \to \mathbb{R}\ \mathrm{verm\ddot oge}\ \Phi(z^{(1)}, \ldots, z^{(n)}; \xi) := |\partial f(\eta) \circ \xi^*| \\ \mathrm{f\ddot ur}\ \eta = (z^{(1)}, \ldots, z^{(n)}) \in K_\rho(a) \times \ldots \times K_\rho(a), \quad \xi \in S. \end{matrix}

Unter Beachtung der Cramerschen Regel sehen wir die Aussage

Φ(η;ξ) > 0 für alle (\eta, \xi) \in D

ein. Da die Funktion Φ stetig auf ihrem kompakten Definitionsbereich D ist, nimmt sie ihr Minimum M > 0 dort an – und ein Homogenitätsargument liefert die Abschätzung

(12) \begin{matrix} \Phi(z^{(1)}, \ldots, z^{(n)}; \xi) \ge M |\xi|\ \mathrm{f\ddot ur\ alle}\ z^{(i)} \in K_\rho(a) \\ \text{mit } i = 1, \ldots, n \text{ und } \xi \in \mathbb{R}^n. \end{matrix}

2. Seien x', x'' \in K_\rho(a) beliebig gewählte Punkte. Nun wenden wir den Mittelwertsatz auf jede Komponentenfunktion f_i: K_\rho(a) \to \mathbb{R} wie folgt an:

(13) f_i(x'') - f_i(x') = \sum^n_{j = 1} \frac{\partial f_i}{\partial x_j} \left( z^{(i)} \right) \left( x_j'' - x_j' \right)

mit z^{(i)} \in \stackrel{\circ}{\sigma}(x', x'') \subset K_\rho(a) für i = 1, \ldots, n. Wir fassen nun die Gleichung (13) zusammen:

f(x'') - f(x') = \partial f(\eta) \circ (x'' - x')^* = \begin{pmatrix} f_{1, x_1} \left( z^{(1)} \right) & \ldots & f_{1, x_n} \left( z^{(1)} \right) \\ \vdots & \ddots & \vdots \\ f_{n, x_1} \left( z^{(n)} \right) & \ldots & f_{n, x_n} \left( z^{(n)} \right) \end{pmatrix} \circ \begin{pmatrix} x_1'' - x_1' \\ \vdots \\ x_n'' - x_n' \end{pmatrix}.

Schließlich erhält man mittels (12) und ξ: = x'' − x' die Ungleichung

|f(x'') - f(x')| = |\partial f(\eta) \circ (x'' - x')^*| \ge M |x'' - x'| für alle x', x'' \in K_\rho(a).

q.e.d.

[Bearbeiten] Hilfssatz 2

Auf der offenen Menge \Omega \subset \mathbb{R}^n sei f: \Omega \to \mathbb{R}^n \in C^1(\Omega, \mathbb{R}^n) eine Abbildung und a \in \Omega ein regulärer Punkt mit J_f(x) \neq 0. Neben der Größe ρ > 0 aus Hilfssatz 1 existiert dann eine Zahl σ > 0 mit folgender Eigenschaft:
Wir setzen b: = f(a) sowie K_\sigma(b) := \{y \in \mathbb{R}^n: |y - b| \le \sigma\} und finden zu jedem y' \in K_\sigma(b) ein x' \in K_\rho(a) mit f(x') = y'.

[Bearbeiten] Beweis

Wir betrachten die Funktion

h: K_\rho(a) \to \mathbb{R} vermöge x \mapsto h(x) := |f(x) - y'|^2 = \sum^n_{i = 1} (f_i(x) - y'_i)^2.

Mit \tau := M \cdot \rho > 0 erhält man aus Hilfssatz 1 zunächst die Ungleichung

|f(x) - b| \ge M \cdot |x - a| = \tau für alle x \in \partial K_\rho(a).

Jetzt sei y' ein beliebiger Punkt aus Kσ(b), wobei σ mit 0 < \sigma < \frac{1}{2} \tau gewählt wurde. Wir werden die Existenz eines Urbildes x' \in K_\rho(a) mit y' = f(x') zeigen: Wir beginnen mit

(14) |f(x) - y'| = |f(x) - b + b - y'| \ge |f(x) - b| - |b - y'| \ge \tau - \sigma > \frac{1}{2} \tau für alle x \in \partial K_\rho(a)

und erhalten die Abschätzung

(15) h(x) > \frac{1}{4} \tau^2 für alle x \in \partial K_\rho(a).

Ferner gilt die Beziehung

(16) |f(a) - y'| = |b - y'| \le \sigma < \frac{1}{2} \tau bzw. h(a) = |f(a) - y'|^2 < \frac{1}{4} \tau^2.

Auf der kompakten Menge Kρ(a) nimmt die stetige Funktion h wegen (15) und (16) ihr Minimum in einem inneren Punkt

x' \in \stackrel{\circ}{K}_\rho(a) := \{x \in \mathbb{R}^n: |x - a| < \rho\}

an. Nach Satz 2 aus §3 erhält man die Gleichungen

(17) 0 = \frac{\partial}{\partial x_k} h(x') = \frac{\partial}{\partial x_k} \left( \sum^n_{i = 1} (f_i(x) - y_i')^2 \right) \biggl|_{x = x'} = 2 \sum^n_{i = 1} \frac{\partial f_i(x')}{\partial x_k} \cdot (f_i(x) - y_i')

für k = 1, 2, \ldots, n. Wegen

J_f(x') = \det \left( \frac{\partial f_i}{\partial x_k} (x') \right)_{i, k = 1, \ldots, n} \neq 0

hat das Gleichungssystem (17) nach der Cramerschen Regel nur die triviale Lösung

fi(x') − y' = 0 für i = 1, 2, \ldots, n.

Damit folgt fi(x') = y'.

q.e.d.

[Bearbeiten] Definition 3

Mit den Größen ρ > 0 aus Hilfssatz 1 und σ > 0 aus Hilfssatz 2 nennen wir die Funktion
(18) g: K_\sigma(b) \to K_\rho(a) vermöge y \mapsto x =: g(y), falls x \in K_\rho(a) und f(x) = y gilt,
die zu f inverse Abbildung oder auch die Umkehrfunktion von f auf Kσ(b). Diese erfüllt die Identität
f(g(y)) = y für alle y \in K_\sigma(b).

[Bearbeiten] Hilfssatz 3

Die Abbildung g ist in Kσ(b) stetig.

[Bearbeiten] Beweis

Wegen der Stetigkeit der Abbildung f: K_\rho(a) \to \mathbb{R}^n ist die Menge D := \{x \in K_\rho(a): f(x) \in K_\sigma(b)\} kompakt. Nun wenden wir Satz 6 in §1 aus Kapitel II auf die stetige, umkehrbare Funktion f: D \to K_\sigma(b) an und wir erhalten die Stetigkeit der Abbildung g: K_\sigma(b) \to D.

q.e.d.

[Bearbeiten] Hilfssatz 4

Die Abbildung g aus Definition 3 gehört zur Klasse
C^1\left( \stackrel{\circ}{K}_\sigma (b), \mathbb{R}^n \right)
und besitzt die Funktionalmatrix
\partial g(y) := \left( \frac{\partial g_i}{\partial y_j} (y) \right)_{i, j = 1, \ldots, n} = \{\partial f(g(y))\}^{- 1} = \frac{1}{J_f(g(y))} \cdot \left( \det F_{ij}(g(y)) \right)_{i, j = 1, \ldots, n}.
Dabei entsteht die Matrix Fij(x) aus der Funktionalmatrix \partial f(x) durch Ersetzen der i-ten Spalte durch den j-ten Einheitsvektor
\mathbf{e}_j := (\delta_{1j}, \ldots, \delta_{jj}, \ldots, \delta_{nj})^*.

[Bearbeiten] Beweis

1. Nach Hilfssatz 1 gilt J_f(x) \neq 0 für alle x \in K_\rho(a) und die Inverse der Funktionalmatrix

\{\partial f(x)\}^{- 1} =: (a_{ij}(x))_{i, j = 1, \ldots, n}

existiert. Wir erhalten die Koeffizienten aij(x) als Lösung des linearen Gleichungssystems

\partial f(x) \circ \begin{pmatrix} a_{1j} \\ a_{2j} \\ \vdots \\ a_{nj} \end{pmatrix} = \begin{pmatrix} \delta_{1j} \\ \delta_{2j} \\ \vdots \\ \delta_{nj} \end{pmatrix} für j = 1, \ldots, n.

Die Cramersche Regel liefert

a_{ij}(x) = \frac{\det F_{ij}(x)}{J_f(x)} für i, j = 1, \ldots, n.

Damit ist die Funktion \{\partial f(x)\}^{- 1}, x \in K_\rho(a) stetig.

2. Da f \in C^1(K_\rho(a), \mathbb{R}^n erfüllt ist, gilt für festes x \in \stackrel{\circ}{K}_\rho(a) und beliebiges x' \in \stackrel{\circ}{K}_\rho(a) nach Satz 9 aus §1 die linear approximative Darstellung

f(x') - f(x) = \partial f(x) \circ (x' - x)^* + F(x', x) \circ (x' - x)^*, \lim_{x' \to x, x' \neq x} F(x, x') = 0.

Die Multiplikation mit \partial f(x)^{- 1} liefert die Identität

\partial f(x)^{- 1} \circ (f(x') - f(x)) = (x' - x)^* + \partial f(x)^{- 1} \circ F(x', x) \circ (x' - x)^*.

Wir setzen nun y = f(x),y' = f(x') bzw. x = g(y),x' = g(y') und erhalten

(19) \begin{matrix} g(y') - g(y) = \partial f(g(y))^{- 1} \circ (y' - y)^* - \partial f(g(y))^{- 1} \circ F(g(y'), g(y)) \circ (g(y') - g(y)) \\ = \partial f(g(y))^{- 1} \circ (y' - y)^* + G(y', y). \end{matrix}

3. Die oben verwendete Restgliedfunktion

G(y', y) := - \partial f(g(y))^{- 1} \circ F(g(y'), g(y)) \circ (g(y') - g(y))

ist superlinear gemäß

\lim_{y' \to y, y' \neq y} \frac{1}{|y' - y|} G(y', y) = 0.

Da nämlich \lim_{x' \to x, x' \neq x} F(x, x') = 0 erfüllt ist und g sowie \{\partial f\}^{- 1} stetige Funktionen darstellen, bleibt nur die Beschränktheit des Quotienten

\frac{|g(y') - g(y)|}{|y' - y|}, y' \to y, y' \neq y

zu zeigen: Nach Hilfssatz 1 existiert eine Konstante M > 0, so dass die Abschätzung

|y' - y| = |f(g(y')) - f(g(y))| \ge M \cdot |g(y') - g(y)| für alle y', y \in K_\sigma(b) mit y' \neq y

bzw.

\frac{|g(y') - g(y)|}{|y' - y|} \le \frac{1}{M} für alle y', y \in K_\sigma(b) mit y' \neq y

erfüllt ist.

4. Mit h \in \mathbb{R} \setminus \{0\} setzen wir y' = (y_1, \ldots, y_j + h, \ldots, y_n)^* in (19) ein. Multiplikation mit dem Vektor h^{- 1}(\delta_{i1}, \ldots, \delta_{in}) von links liefert beim Grenzübergang h \to 0 die Identität

(20) \frac{\partial}{\partial y_j} g_i(y) = \frac{\det F_{ij}(g(y))}{J_f(g(y))} für i, j = 1, 2, \ldots, n,

wobei wir die Superlinearität des Restglieds verwenden. Da die rechte Seite von (20) stetig auf der Menge \stackrel{\circ}{K}_\sigma(b) ist, folgt die Aussage

g \in C^1\left( \stackrel{\circ}{K}_\sigma(b), \mathbb{R}^n \right).

q.e.d.

[Bearbeiten] Hilfssatz 5

Zu p \in \mathbb{N} sei f: \Omega \to \mathbb{R}^n eine Abbildung der Klasse C^p(\Omega, \mathbb{R}^n) mit J_f(a) \neq 0 in a \in \Omega. Dann gehört die inverse Abbildung g: K_\sigma(b) \to K_\rho(a) aus Definition 3 zur folgenden Regularitätsklasse:
g \in C^p\left( \stackrel{\circ}{K}_\sigma(b), \mathbb{R}^n\right).

[Bearbeiten] Beweis

Für p = 1 wurde die Aussage in Hilfssatz 4 hergeleitet. In den Fällen p \ge 2 ist der Beweis mittels vollständiger Induktion zu führen: Sei also f \in C^p(\Omega, \mathbb{R}^n) und nach Induktionsvoraussetzung sei g \in C^{p - 1}\left(\stackrel{\circ}{K}_\sigma(b), \mathbb{R}^n\right) richtig. Dann liefert Hilfssatz 4

\frac{\partial g_i}{\partial y_j} = \frac{\det F_{ij}(g(y))}{J_f(g(y))} \in C^{p - 1} \left( \stackrel{\circ}{K}_\sigma(b), \mathbb{R}^n\right) für i, j = 1, \ldots, n,

denn es sind bereits die Regularitätsaussagen g, F_{ij}, J_f \in C^{p - 1} erfüllt. Somit folgt

g \in C^p\left( \stackrel{\circ}{K}_\sigma(b), \mathbb{R}^n \right).

[Bearbeiten] Satz 1 (Fundamentalsatz über die inverse Abbildung)

Sei \Omega \subset \mathbb{R}^n eine offene Menge, p eine natürliche Zahl und die Abbildung f: \Omega \to \mathbb{R}^n gehöre zur Klasse C^p(\Omega, \mathbb{R}^n). Weiter sei für einen Punkt a \in \Omega die Bedingung J_f(a) \neq 0 erfüllt und wir setzen b: = f(a).
Dann gibt es zwei offene Mengen A und B im \mathbb{R}^n, die folgende Eigenschaften haben:
(i) Es gilt a \in A und b \in B.
(ii) Die Funktion f bildet A topologisch auf B ab, d. h. f: A \to B besitzt eine Umkehrfunktion g: B \to A und beide Funktionen sind auf ihren Definitionsbereichen stetig.
(iii) Die Umkehrabbildung g gehört zur Klasse C^p(B, \mathbb{R}^n) und es gelten die beiden Identitäten
f(g(y)) = y für alle y \in B sowie g(f(x)) = x für alle x \in A.

[Bearbeiten] Beweis

Wir wählen die Definitionsbereiche

B := \stackrel{\circ}{K}_\sigma(b) = \{y \in \mathbb{R}^n: |y - b| < \sigma\} und A := g \left( \stackrel{\circ}{K}_\sigma(b) \right).

Nun kann man zeigen, dass A wegen der Stetigkeit von f eine offene Menge im \mathbb{R}^n ist. Wenn x' ein beliebiger Punkt aus A ist, so liegt y' = f(x') in \stackrel{\circ}{K}_\sigma(b). Nun ist \stackrel{\circ}{K}_\sigma(b) offen und es gibt ein \varepsilon > 0 mit der Eigenschaft

\stackrel{\circ}{K}_\varepsilon(y') := \{y \in \mathbb{R}^n: |y - y'| < \varepsilon\} \subset \stackrel{\circ}{K}_\sigma(b).

Wegen der Stetigkeit von f existiert zu diesem \varepsilon > 0 ein δ > 0, so dass Kδ(x') in Ω liegt und

|f(x) - f(x')| < \varepsilon für alle x \in K_\delta(x')

gilt. Somit wird Kδ(x') durch f in \stackrel{\circ}{K}_\varepsilon(y') \subset \stackrel{\circ}{K}_\sigma(b) abgebildet. Also ist K_\delta(x') \subset A erfüllt und x' ist innerer Punkt von A. Damit ist A offen. Nun folgt Satz 1 aus den Hilfssätzen 1 bis 5.

q.e.d.

Persönliche Werkzeuge