Kurs:Lineare Algebra I/Normalform von Operatoren, Diagonalisierbarkeit

Unter einer Normalform verstehen wir in der linearen Algebra in der Regel eine möglichst einfache (und weitestgehend eindeutige) Form der Matrixdarstellung eines Objektes. Was konkret unter ’einer einfachen Form’ zu verstehen ist, gehört meist zur Fragestellung dazu. Oft gibt man sich eine Form vor und fragt, welche Objekte oder ob alle Objekte in dieser Form dargestellt werden können.

Beispiel: Normalform einer linearen Abbildung.

Zu $L\in Hom(V,W)$ , $\dim(V)=n$ und $\dim(W)=m$ , gibt es Basen $B$ von $V$ und $C$ von $W$ , so dass

M_{C}^{B}(L)={\begin{pmatrix}\mathbb {E} _{r}&0\\0&0\end{pmatrix}}

,

r=\dim(im(L))

.

Dieses Beispiel gilt natürlich auch für den Fall $(V=W)$ . Solche linearen Abbildungen $L:V\to V$ werden Endomorphismen oder Operatoren genannt. Diese sollen näher untersucht werden. Allerdings ist es hier nicht sinnvoll, zwei verschiedene Basen gleichzeitig in einem Vektorraum zu betrachten. Deshalb formulieren wir das Normalformproblem für Operatoren (eines endlich erzeugten Vektorraumes):

Auf welche Form kann die Matrixdarstellung $M_{B}^{B}(L)$ eines Operators $L\in Hom(V;V)$ bei geeigneter Basiswahl gebracht werden?

In der Sprache der Matrizen bedeutet dies: Zu einer quadratischen Matrix $A\in Mat(n,n;K)$ suchen wir eine reguläre Matrix $C\in Gl_{n}$ , so dass $C^{-1}AC$ eine einfache Gestalt hat. Diese Relation zwischen den Matrizen trägt einen Namen:

Definition 5.1[Bearbeiten]

Zwei quadratische Matrizen $A,A'\in Mat(n,n;K)$ heißen konjugiert, falls $A'=C^{-1}AC$ und $C\in Gl_{n}(K)$ .

Die Konjugiertheit ist eine Äquivalenzrelation auf der Menge der quadratischen Matrizen. Insbesondere zerfällt $Mat(n,n;K)$ in eine disjunkte Vereinigung von Äquivalenzklassen (hier Konjugationsklassen genannt), deren Elemente jeweils die verschiedenen Matrixdarstellungen eines Operators sind. Das Finden einer Normalform bedeutet hier, aus jeder Konjugationsklasse einen eindeutig bestimmten Vertreter (zumindest eindeutig bis auf endlich viele z.B. Umordnungen) einer bestimmten Gestalt zu finden. Es gibt verschiedene Antworten auf das Normalformproblem für Operatoren. Im Unterschied zu dem obigen Beispiel wird die Antwort auch vom Körper $K$ anhängen bzw. werden einige Normalformen nur für bestimmte Operatoren existieren. Zunächst werden wir nur die einfachen Fälle behandeln: Diagonalform und Dreiecksform (Schur-Normalform). Im nächsten Semester werden wir eine vollständige Antwort in den Varianten der Jordan-Normalform kennenlernen.

Eigenvektoren und Eigenwerte[Bearbeiten]

Stets sei $L\in Hom(V,V)$ ein Operator (lineare Abbildung) und $V$ ein $n$ -dimensionaler $K$ -Vektorraum. Alle Begriffe und Aussagen des folgenden Abschnittes können ebenso gut für quadratische Matrizen $A\in Mat(n,n;K)$ formuliert werden, indem wir $A$ als Operator $L_{A}:x\mapsto Ax$ auf $K^{n}$ auffassen.

Definition 5.2[Bearbeiten]

$\lambda \in K$ heißt Eigenwert eines Operators $L$ , falls ein Vektor $v\neq 0$ aus $V$ existiert, so dass $L(v)=\lambda v$ . Ein solcher Vektor $v$ heißt Eigenvektor von $L$ zum Eigenwert $\lambda$ . Die Menge aller Eigenvektoren zu $\lambda$ (einschließlich der Nullvektors) bildet den Eigenraum $V:=\{v|L(v)=v\}$ .

Offensichtlich ist jeder Eigenraum ein Vektorunterraum, da $V_{\lambda }=\ker(L-id_{V})$ bzw. (für eine Matrix $A$ ) $V_{\lambda }={\mathcal {H}}_{0}(A-\lambda \mathbb {E} _{n})$ . Nach Definition ist $\lambda \in K$ Eigenwert gdw. $V\neq \{0\}$ . Beispiele: Für $n=2,K=\mathbb {R} ,L=L_{A},A\in Mat(2,2)$ betrachten wir folgende Spezialfälle.

a) Diagonalmatrix

A={\begin{pmatrix}a&0\\0&a\end{pmatrix}}

: Einziger Eigenwerte ist

\lambda =a;V=\mathbb {R} ^{2}

.

b) Diagonalmatrix

A={\begin{pmatrix}a&0\\0&d\end{pmatrix}}

,

a\neq d

: Zwei Eigenwerte

\lambda _{1}=a

,

\lambda _{2}=d

mit Eigenvektoren

e_{1}

bzw.

e_{2}

.

c) Dreiecksmatrix

A={\begin{pmatrix}a&0\\c&a\end{pmatrix}}

,

c\neq 0

: Einziger Eigenwert ist

\lambda =a;V=\mathbb {R} ^{2}

.

d) Dreiecksmatrix

A={\begin{pmatrix}a&b\\0&d\end{pmatrix}}

,

b\neq 0

,

a\neq d

: Eigenwerte sind

\lambda _{1}=a

und

\lambda _{2}=d

; zugehörige Eigenvektoren sind

e_{1}={\begin{pmatrix}1\\0\end{pmatrix}}

und

v_{2}={\begin{pmatrix}b\\d-a\end{pmatrix}}

.

e) Symmetrische Matrix

A={\begin{pmatrix}a&b\\b&d\end{pmatrix}}

,

b\neq 0

: Es gibt stets zwei verschiedene Eigenwerte

\lambda _{1,2}={\frac {a+d\pm {\sqrt {(a-d)^{2}+4b^{2}}}}{2}}

.

f) Schiefsymmetrische Matrix

A={\begin{pmatrix}a&b\\b&d\end{pmatrix}}

,

b\neq 0

: Es gibt zwei verschiedene (reelle) Eigenwerte

\lambda _{1,2}={\frac {a+d\pm {\sqrt {(a-d)^{2}+4b^{2}}}}{2}}

gdw.

|a-d|>|2b|

.

g) Drehmatrix

A={\begin{pmatrix}\cos(\varphi )&-\sin(\varphi )\\\sin(\varphi )&\cos(\varphi )\end{pmatrix}}

,

\varphi \neq k\pi

: Es gibt keine (reellen) Eigenwerte und damit keine Eigenvektoren. Dies ist ebenso aus geometrischen Gründen einsichtig.

Diese Beispiele ergeben offenbar keine vollständige Fallunterscheidung.

Satz 5.3[Bearbeiten]

Eigenvektoren zu verschiedenen Eigenwerten sind linear unabhängig.

Corollar 5.4[Bearbeiten]

(1) Ein Operator besitzt höchstens $n=\dim(V)$ Eigenwerte.

(2) Hat ein Operator $n=\dim(V)$ verschiedene Eigenwerte, so gibt es eine Basis aus Eigenvektoren.

Für eine Matrix lassen sich die zugehörigen Eigenwerte durch das Verschwinden von Determinanten charakterisieren:

Satz 5.5[Bearbeiten]

Für $A\in Mat(n,n;K)$ gilt: $\lambda \in K$ ist Eigenwert von $A\Leftrightarrow \det(A-\lambda \mathbb {E} )=0$ .

Dies kann mittels der Matrixdarstellung auf Operatoren erweitert werden.

Definition 5.6[Bearbeiten]

Das charakteristische Polynom eines Operators ${\begin{matrix}L\end{matrix}}$ bezüglich einer Basis ${\begin{matrix}B\end{matrix}}$ von ${\begin{matrix}V\end{matrix}}$ ist die Determinante: $\chi _{L}(T):=\det(M_{B}^{B}(L)-T\mathbb {E} )$ .

Bemerkungen:

${\begin{matrix}\chi _{L}(T)\end{matrix}}$ ist unabhängig von der Wahl einer Basis ${\begin{matrix}B\end{matrix}}$ in ${\begin{matrix}V\end{matrix}}$ .
${\begin{matrix}\chi _{L}(T)\end{matrix}}$ ist ein Polynom vom Grad ${\begin{matrix}n\end{matrix}}$ mit Koeffizienten aus ${\begin{matrix}K\end{matrix}}$ .
Der höchste Term von ${\begin{matrix}\chi _{L}(T)\end{matrix}}$ ist ${\begin{matrix}(-1)^{n}T^{n}\end{matrix}}$ , der absolute Term ist $\det(M_{B}^{B}(L))=:\det(L)$ .

Beispiele: $A=(a_{ij})\in Mat(n,n)$ .

n=2

:

\chi _{A}(T)=T^{2}-(a_{11}+a_{22})T+\det(A)

.

n=3

:

\chi _{A}(T)=-T^{3}+(a_{11}+a_{22}+a_{33})T^{2}-(a_{11}^{\#}+a_{22}^{\#}+a_{33}^{\#})T+\det(A)

.

Generell ist der Koeffizient $c_{i}$ von $T^{i}$ im charakteristischen Polynom $\chi _{L}(T)$ von der Form $(-1)^{n-i}$ multipliziert mit der Summe aller Hauptminoren von $M_{B}^{B}(L)$ der Ordnung $(n-i)$ . Ein Hauptminor ist eine Unterdeterminante der Matrix, die durch Streichen von Zeilen und Spalten mit gleichem Index entsteht, hier also von jeweils $i$ Zeilen und Spalten.

Lemma 5.7[Bearbeiten]

Ein Skalar $\lambda \in K$ ist Eigenwert von ${\begin{matrix}L\end{matrix}}$ gdw. ${\begin{matrix}\lambda \end{matrix}}$ ist Nullstelle des charakteristischen Polynoms ${\begin{matrix}\chi _{L}(\lambda )=0\end{matrix}}$ .

Einschub: Aussagen zu Nullstellen von Polynomen[Bearbeiten]

Definition 5.8[Bearbeiten]

Mit $K[T]=\{f(T)=\sum _{i=0}^{n}a_{i}T^{i}|n\in \mathbb {N} ;a_{i}\in K\}$ bezeichnen wir die Menge aller Polynome in der Variablen ${\begin{matrix}T\end{matrix}}$ mit Koeffizienten im Körper ${\begin{matrix}K\end{matrix}}$ .

Polynome können addiert und multipliziert werden. Addition und Multiplikation (mit Konstanten) induzieren auf ${\begin{matrix}K[T]\end{matrix}}$ die Struktur eines K-Vektorraumes. Die konstanten Polynome (von Grad 0) identifizieren wir mit dem Körper ${\begin{matrix}K\end{matrix}}$ . Der Grad eines Polynoms ist die höchste Potenz von ${\begin{matrix}T\end{matrix}}$ : $\deg f:=\max\{k|ak\neq 0\}$ . In ${\begin{matrix}K[T]\end{matrix}}$ gilt die Teilbarkeitslehre (wie in $\mathbb {Z}$ ; wird später allgemein behandelt), insbesondere gibt es eine Division mit Rest:

Satz 5.9 (Division mit Rest)[Bearbeiten]

Zu je zwei Polymonen $f,g\in K[T],g\neq 0$ , gibt es stets eindeutig bestimmte Polynome $q,r\in K[T]$ mit ${\begin{matrix}f=qg+r\end{matrix}}$ , wobei ${\begin{matrix}\deg(r)<\deg(g)\end{matrix}}$ oder ${\begin{matrix}r=0\end{matrix}}$ .

Corollar 5.10[Bearbeiten]

(1) $\lambda \in K$ ist Nullstelle von ${\begin{matrix}f(T)\end{matrix}}$ gdw. ${\begin{pmatrix}T-\lambda \end{pmatrix}}$ teilt ${\begin{matrix}f(T)\end{matrix}}$ , d.h. ${\begin{matrix}f(T)=(T-\lambda )h(T)\end{matrix}}$ für ein $h(T)\in K[T]$ .

(2) Ein Polynom vom Grad ${\begin{matrix}n\end{matrix}}$ besitzt höchstens ${\begin{matrix}n\end{matrix}}$ Nullstellen.

(3) $k(\lambda ):=\max\{k|(T-\lambda )^{k}\ teilt\ f(T)\}$ heißt Vielfachheit der Nullstelle ${\begin{matrix}\lambda \end{matrix}}$ von ${\begin{matrix}f(T)\end{matrix}}$ .

An dieser Stelle formulieren wir:

Satz 5.10i (Fundamentalsatz der Algebra)[Bearbeiten]

Jedes nichtkonstante Polynom $f(T)\in \mathbb {C} [T]$ hat eine Nullstelle in $\mathbb {C}$ , somit ist $\mathbb {C}$ algebraisch abgeschlossen.

Daraus kann gefolgert werden, dass jeder Körper in einem algebraisch abgeschlossenen Körper liegt.

Corollar 5.11[Bearbeiten]

(1) Jedes Polynom positiven Grades $f(T)\in \mathbb {C} [T]$ besitzt eine eindeutige Faktorisierung in lineare Polynome: $f(T)=c(T-\lambda _{1})^{k_{1}}\cdot ...\cdot (T-\lambda _{r})^{k_{r}}$ ; $\deg(f)=\sum k_{i}$ ; $c,\lambda _{1},...,\lambda _{r}\in \mathbb {C}$ .

(2) Jedes Polynom positiven Grades $f(T)\in \mathbb {R} [T]$ besitzt eine eindeutige Faktorisierung in lineare oder quadratische Polynome: $f(T)=c(T-\lambda _{1})^{k_{1}}\cdot ...\cdot (T-\lambda _{r})^{k_{r}}(T^{2}+a_{1}T+b_{1})^{s_{1}}\cdot ...\cdot (T^{2}+a_{l}T+b_{l})^{s_{l}}$ ; $\deg(f)=\sum k_{i}+2\sum s_{j}$ ; $a_{j}^{2}-4b_{j}<0$ ; $c,\lambda _{i},a_{j},b_{j}\in \mathbb {R}$ .

Beim Auffinden rationaler Nullstellen von rationalen Polynomen hilft die folgende Überlegung, die auf einen Test endlich vieler Zahlen hinausläuft.

Lemma 5.12[Bearbeiten]

Sei ${\begin{matrix}f(T)=a_{n}T^{n}+...+a_{1}T+a_{0}\end{matrix}}$ ein Polynom mit ganzzahligen Koeffizienten. Ist $\lambda ={\frac {p}{q}}\in \mathbb {Q}$ eine rationale Nullstelle von ${\begin{matrix}f(T)\end{matrix}}$ , dann ist ${\begin{matrix}p\end{matrix}}$ ein Teiler von ${\begin{matrix}a_{0}\end{matrix}}$ und ${\begin{matrix}q\end{matrix}}$ ein Teiler von ${\begin{matrix}a_{n}\end{matrix}}$ .

Warum ist der Fall von ganzzahligen Polyomen keine Beschränkung der beschriebenen Situation?

Diagonalisierbare Operatoren[Bearbeiten]

Definition 5.13[Bearbeiten]

Ein Operator ${\begin{matrix}L\end{matrix}}$ heißt diagonalisierbar, wenn es eine Basis in ${\begin{matrix}V\end{matrix}}$ gibt, so dass die zugehörige Matrix $M_{B}^{B}(L)$ Diagonalgestalt besitzt.

Nicht jeder Operator ist diagonalisierbar. Nach der folgenden Charakterisierung kann es zwei Ursachen dafür geben.

Satz 5.14[Bearbeiten]

Die folgenden Bedingungen sind äquivalent:

(1) ${\begin{matrix}L\end{matrix}}$ ist diagonalisierbar,

(2) ${\begin{matrix}V\end{matrix}}$ hat eine Basis aus Eigenvektoren von ${\begin{matrix}L\end{matrix}}$ ,

(3) ${\begin{matrix}L(T)\end{matrix}}$ faktorisiert ${\begin{matrix}K[T]\end{matrix}}$ in lineare Polynome und die Vielfachheiten der Nullstellen sind die Dimensionen der zugehörigen Eigenräume.

Corollar 5.15[Bearbeiten]

Die Dimension eines Eigenraumes $\dim(V)$ ist beschränkt durch die algebraische Vielfachheit der Nullstelle ${\begin{matrix}\lambda \end{matrix}}$ im charakteristischen Polynom ${\begin{matrix}L(T)\end{matrix}}$ .

Beschränken wir uns auf den Fall, dass alle Nullstellen von ${\begin{matrix}L(T)\end{matrix}}$ aus ${\begin{matrix}K\end{matrix}}$ sind, d.h. ${\begin{matrix}L(T)\end{matrix}}$ zerfällt in ${\begin{matrix}K[T]\end{matrix}}$ in ein Produkt von Linearfaktoren. Dies ist beispielsweise über dem Körper $\mathbb {C}$ immer erfüllt. Dann ist ein Operator genau dann nicht diagonalisierbar, wenn die Dimension eines Eigenraumes kleiner als die Vielfachheit des zugehörigen Eigenwertes im charakteristischen Polynom ist. Ein solcher Operator lässt sich stets noch mit einer Dreiecksmatrix darstellen.

Satz 5.16 (Schur-Normalform)[Bearbeiten]

Zerfällt das charakteristische Polynom ${\begin{matrix}L(T)\end{matrix}}$ � vollständig in ein Produkt von Linearfaktoren, dann gibt es eine Basis ${\begin{matrix}B\end{matrix}}$ von ${\begin{matrix}V\end{matrix}}$ , so dass $M_{B}^{B}(L)$ eine obere Dreiecksmatrix ist mit den Eigenwerten auf der Hauptdiagonale.

Bemerkungen:

Während bei einer diagonalisierbaren Matrix die Diagonalform bis auf die Reihenfolgen der Diagonalelemente (d.h. der Eigenwerte) eindeutig bestimmt ist (und damit unsere Erwartung an eine Normalform erfüllt wird), sind bei der Dreiecksform der Schur-Normalform nur die Hauptdiagonalelemente (ebenfalls die Eigenwerte) eindeutig bestimmt.
Hinweis: Reelle symmetrische Matrizen sind stets diagonalisierbar. (Beweis im Teil 2, Stichwort: Hauptachsentransformation)
Hinweis: Die Dreiecksmatrix der Schur-Normalform kann weiter vereinfacht werden, dass höchstens unmittelbar über der Hauptdiagonalen statt ’Null’ ’Eins’ stehen kann (Beweis im Teil 2, Stichwort: Jordan-Normalform).
Die Normalformen von Operatoren sind u.a. wichtig für die Lösung linearer Differentialgleichungssysteme!
Hinweis: (Simultane Diagonalisierbarkeit vertauschbarer Operatoren) Sind zwei diagonalisierbare Operatoren ${\begin{matrix}L_{1}\end{matrix}}$ und ${\begin{matrix}L_{2}\end{matrix}}$ vertauschbar, also ${\begin{matrix}L_{1}L_{2}=L_{2}L_{1}\end{matrix}}$ , dann existiert eine Basis aus gemeinsamen Eigenvektoren.

Hier ein Beispiel für die Gestalt der Jordan-Normalform (eine 010 steht höchstens nur ’zwischen’ gleichen Eigenwerten!):

${\begin{pmatrix}\lambda &1&0&0&0&0&0\\0&\lambda &1&0&0&0&0\\0&0&\lambda &0&0&0&0\\0&0&0&\mu &0&0&0\\0&0&0&0&\mu &0&0\\0&0&0&0&0&\mu &1\\0&0&0&0&0&0&\mu \end{pmatrix}}.$