Kurs:Lineare Algebra I/Normalform von Operatoren, Diagonalisierbarkeit

Aus Wikiversity

Unter einer Normalform verstehen wir in der linearen Algebra in der Regel eine möglichst einfache (und weitestgehend eindeutige) Form der Matrixdarstellung eines Objektes. Was konkret unter ’einer einfachen Form’ zu verstehen ist, gehört meist zur Fragestellung dazu. Oft gibt man sich eine Form vor und fragt, welche Objekte oder ob alle Objekte in dieser Form dargestellt werden können.

Beispiel: Normalform einer linearen Abbildung.

Zu , und , gibt es Basen von und von , so dass

, .

Dieses Beispiel gilt natürlich auch für den Fall . Solche linearen Abbildungen werden Endomorphismen oder Operatoren genannt. Diese sollen näher untersucht werden. Allerdings ist es hier nicht sinnvoll, zwei verschiedene Basen gleichzeitig in einem Vektorraum zu betrachten. Deshalb formulieren wir das Normalformproblem für Operatoren (eines endlich erzeugten Vektorraumes):

Auf welche Form kann die Matrixdarstellung eines Operators bei geeigneter Basiswahl gebracht werden?

In der Sprache der Matrizen bedeutet dies: Zu einer quadratischen Matrix suchen wir eine reguläre Matrix , so dass eine einfache Gestalt hat. Diese Relation zwischen den Matrizen trägt einen Namen:

Definition 5.1[Bearbeiten]

Zwei quadratische Matrizen heißen konjugiert, falls und .

Die Konjugiertheit ist eine Äquivalenzrelation auf der Menge der quadratischen Matrizen. Insbesondere zerfällt in eine disjunkte Vereinigung von Äquivalenzklassen (hier Konjugationsklassen genannt), deren Elemente jeweils die verschiedenen Matrixdarstellungen eines Operators sind. Das Finden einer Normalform bedeutet hier, aus jeder Konjugationsklasse einen eindeutig bestimmten Vertreter (zumindest eindeutig bis auf endlich viele z.B. Umordnungen) einer bestimmten Gestalt zu finden. Es gibt verschiedene Antworten auf das Normalformproblem für Operatoren. Im Unterschied zu dem obigen Beispiel wird die Antwort auch vom Körper anhängen bzw. werden einige Normalformen nur für bestimmte Operatoren existieren. Zunächst werden wir nur die einfachen Fälle behandeln: Diagonalform und Dreiecksform (Schur-Normalform). Im nächsten Semester werden wir eine vollständige Antwort in den Varianten der Jordan-Normalform kennenlernen.

Eigenvektoren und Eigenwerte[Bearbeiten]

Stets sei ein Operator (lineare Abbildung) und ein -dimensionaler -Vektorraum. Alle Begriffe und Aussagen des folgenden Abschnittes können ebenso gut für quadratische Matrizen formuliert werden, indem wir als Operator auf auffassen.

Definition 5.2[Bearbeiten]

heißt Eigenwert eines Operators , falls ein Vektor aus existiert, so dass . Ein solcher Vektor heißt Eigenvektor von zum Eigenwert . Die Menge aller Eigenvektoren zu (einschließlich der Nullvektors) bildet den Eigenraum .

Offensichtlich ist jeder Eigenraum ein Vektorunterraum, da bzw. (für eine Matrix ) . Nach Definition ist Eigenwert gdw. . Beispiele: Für betrachten wir folgende Spezialfälle.

a) Diagonalmatrix : Einziger Eigenwerte ist .
b) Diagonalmatrix , : Zwei Eigenwerte , mit Eigenvektoren bzw. .
c) Dreiecksmatrix , : Einziger Eigenwert ist .
d) Dreiecksmatrix , , : Eigenwerte sind und ; zugehörige Eigenvektoren sind und .
e) Symmetrische Matrix , : Es gibt stets zwei verschiedene Eigenwerte .
f) Schiefsymmetrische Matrix , : Es gibt zwei verschiedene (reelle) Eigenwerte gdw. .
g) Drehmatrix , : Es gibt keine (reellen) Eigenwerte und damit keine Eigenvektoren. Dies ist ebenso aus geometrischen Gründen einsichtig.

Diese Beispiele ergeben offenbar keine vollständige Fallunterscheidung.

Satz 5.3[Bearbeiten]

Eigenvektoren zu verschiedenen Eigenwerten sind linear unabhängig.

Corollar 5.4[Bearbeiten]

(1) Ein Operator besitzt höchstens Eigenwerte.
(2) Hat ein Operator verschiedene Eigenwerte, so gibt es eine Basis aus Eigenvektoren.

Für eine Matrix lassen sich die zugehörigen Eigenwerte durch das Verschwinden von Determinanten charakterisieren:

Satz 5.5[Bearbeiten]

Für gilt: ist Eigenwert von .

Dies kann mittels der Matrixdarstellung auf Operatoren erweitert werden.

Definition 5.6[Bearbeiten]

Das charakteristische Polynom eines Operators bezüglich einer Basis von ist die Determinante: .

Bemerkungen:

  • ist unabhängig von der Wahl einer Basis in .
  • ist ein Polynom vom Grad mit Koeffizienten aus .
  • Der höchste Term von ist , der absolute Term ist .

Beispiele: .

: .
: .

Generell ist der Koeffizient von im charakteristischen Polynom von der Form multipliziert mit der Summe aller Hauptminoren von der Ordnung . Ein Hauptminor ist eine Unterdeterminante der Matrix, die durch Streichen von Zeilen und Spalten mit gleichem Index entsteht, hier also von jeweils Zeilen und Spalten.

Lemma 5.7[Bearbeiten]

Ein Skalar ist Eigenwert von gdw. ist Nullstelle des charakteristischen Polynoms .

Einschub: Aussagen zu Nullstellen von Polynomen[Bearbeiten]

Definition 5.8[Bearbeiten]

Mit bezeichnen wir die Menge aller Polynome in der Variablen mit Koeffizienten im Körper .

Polynome können addiert und multipliziert werden. Addition und Multiplikation (mit Konstanten) induzieren auf die Struktur eines K-Vektorraumes. Die konstanten Polynome (von Grad 0) identifizieren wir mit dem Körper . Der Grad eines Polynoms ist die höchste Potenz von : . In gilt die Teilbarkeitslehre (wie in ; wird später allgemein behandelt), insbesondere gibt es eine Division mit Rest:

Satz 5.9 (Division mit Rest)[Bearbeiten]

Zu je zwei Polymonen , gibt es stets eindeutig bestimmte Polynome mit , wobei oder .

Corollar 5.10[Bearbeiten]

(1) ist Nullstelle von gdw. teilt , d.h. für ein .
(2) Ein Polynom vom Grad besitzt höchstens Nullstellen.
(3) heißt Vielfachheit der Nullstelle von .

An dieser Stelle formulieren wir:

Satz 5.10i (Fundamentalsatz der Algebra)[Bearbeiten]

Jedes nichtkonstante Polynom hat eine Nullstelle in , somit ist algebraisch abgeschlossen.

Daraus kann gefolgert werden, dass jeder Körper in einem algebraisch abgeschlossenen Körper liegt.

Corollar 5.11[Bearbeiten]

(1) Jedes Polynom positiven Grades besitzt eine eindeutige Faktorisierung in lineare Polynome: ; ; .
(2) Jedes Polynom positiven Grades besitzt eine eindeutige Faktorisierung in lineare oder quadratische Polynome: ; ; ; .

Beim Auffinden rationaler Nullstellen von rationalen Polynomen hilft die folgende Überlegung, die auf einen Test endlich vieler Zahlen hinausläuft.

Lemma 5.12[Bearbeiten]

Sei ein Polynom mit ganzzahligen Koeffizienten. Ist eine rationale Nullstelle von , dann ist ein Teiler von und ein Teiler von .

Warum ist der Fall von ganzzahligen Polyomen keine Beschränkung der beschriebenen Situation?

Diagonalisierbare Operatoren[Bearbeiten]

Definition 5.13[Bearbeiten]

Ein Operator heißt diagonalisierbar, wenn es eine Basis in gibt, so dass die zugehörige Matrix Diagonalgestalt besitzt.

Nicht jeder Operator ist diagonalisierbar. Nach der folgenden Charakterisierung kann es zwei Ursachen dafür geben.

Satz 5.14[Bearbeiten]

Die folgenden Bedingungen sind äquivalent:
(1) ist diagonalisierbar,
(2) hat eine Basis aus Eigenvektoren von ,
(3) faktorisiert in lineare Polynome und die Vielfachheiten der Nullstellen sind die Dimensionen der zugehörigen Eigenräume.

Corollar 5.15[Bearbeiten]

Die Dimension eines Eigenraumes ist beschränkt durch die algebraische Vielfachheit der Nullstelle im charakteristischen Polynom .

Beschränken wir uns auf den Fall, dass alle Nullstellen von aus sind, d.h. zerfällt in in ein Produkt von Linearfaktoren. Dies ist beispielsweise über dem Körper immer erfüllt. Dann ist ein Operator genau dann nicht diagonalisierbar, wenn die Dimension eines Eigenraumes kleiner als die Vielfachheit des zugehörigen Eigenwertes im charakteristischen Polynom ist. Ein solcher Operator lässt sich stets noch mit einer Dreiecksmatrix darstellen.

Satz 5.16 (Schur-Normalform)[Bearbeiten]

Zerfällt das charakteristische Polynom � vollständig in ein Produkt von Linearfaktoren, dann gibt es eine Basis von , so dass eine obere Dreiecksmatrix ist mit den Eigenwerten auf der Hauptdiagonale.

Bemerkungen:

  • Während bei einer diagonalisierbaren Matrix die Diagonalform bis auf die Reihenfolgen der Diagonalelemente (d.h. der Eigenwerte) eindeutig bestimmt ist (und damit unsere Erwartung an eine Normalform erfüllt wird), sind bei der Dreiecksform der Schur-Normalform nur die Hauptdiagonalelemente (ebenfalls die Eigenwerte) eindeutig bestimmt.
  • Hinweis: Reelle symmetrische Matrizen sind stets diagonalisierbar. (Beweis im Teil 2, Stichwort: Hauptachsentransformation)
  • Hinweis: Die Dreiecksmatrix der Schur-Normalform kann weiter vereinfacht werden, dass höchstens unmittelbar über der Hauptdiagonalen statt ’Null’ ’Eins’ stehen kann (Beweis im Teil 2, Stichwort: Jordan-Normalform).
  • Die Normalformen von Operatoren sind u.a. wichtig für die Lösung linearer Differentialgleichungssysteme!
  • Hinweis: (Simultane Diagonalisierbarkeit vertauschbarer Operatoren) Sind zwei diagonalisierbare Operatoren und vertauschbar, also , dann existiert eine Basis aus gemeinsamen Eigenvektoren.

Hier ein Beispiel für die Gestalt der Jordan-Normalform (eine 010 steht höchstens nur ’zwischen’ gleichen Eigenwerten!):