Kurs:Lineare Algebra I/Affine Räume
Aus Wikiversity
Inhaltsverzeichnis |
[Bearbeiten] Punkte und Vektoren
Im Kapitel 1 haben wir den Standardraum
eingeführt und seine Elemente einmal als Punkte und andererseits als Vektoren interpretiert. Die naive Vektorvorstellung (als gerichtete Strecke) war hilfreich zur Veranschaulichung der Operationen Vektoraddition und skalare Multiplikation, die für Punkte keinen Sinn machen. Ferner gibt es im Vektoraum stets ein ausgezeichnetes Element - den Nullvektor. Dagegen sind im Punktraum alle Elemente gleichberechtigt. Durch den Begriff des affinen Punktraumes werden wir mathematisch korrekt zwischen Punkten und Vektoren unterscheiden. Nehmen wir den naiven Punktraum als gegeben, dann wollen wir jetzt Vektoren als Parallelverschiebungen (Translationen) des Punktraumes interpretieren, die sich durch einen (ungebundenen) Pfeil charakterisieren lassen. Translationen können verknüpft werden (Hintereinanderausführung der Abbildungen) und durch einen skalaren Faktor gedehnt (resp. gestaucht) werden. Diese beiden Operationen induzieren die Struktur eines Vektorraumes auf der Menge aller Translationen des Punktraumes. Dieses Modell führt zum Begriff des affinen Raumes, die zugehörige mathematische Theorie ist die analytische Geometrie. Lineare Algebra und analytische Geometrie sind zwei verschiedene Betrachtungsweisen zum gleichen mathematischen Gebiet.
[Bearbeiten] Definition 4.1
- Ein affiner Raum ist ein Tripel (
) aus einer nichtleeren Punktmenge
, einem Vektorraum (von Translationen)
und einer Abbildung (Operation von
auf
) der Form Punkt + Vektor = Punkt:
-
,
-
- die folgenden Regeln genügt:
- (a1) P + 0 = P,
- (a2) (P + x) + y = P + (x + y),
- (a3) Je zwei Punkte P,Q bestimmen eindeutig einen Vektor x mit P + x = Q.
Schreibweisen:
. Jedem Vektor
entspricht die Translation
. Die Dimension eines affinen Raumes ist die Dimension des zugehörigen Vektorraumes,
. Meist spricht man allein von der Punktmenge
als affinen Raum ohne den zugehörigen Vektorraum explizit anzugeben. Die Punktmenge ist bijektiv zum Vektorraum der Translationen nach Fixierung eines Punktes P0, indem jedem Punkt Q der ’Ortvektor’ von Q bzgl. P0 zugeordnet wird:
. Die dazu inverse Abbildung lautet:
.
[Bearbeiten] Definition 4.2
- Eine Teilmenge eines affines Raumes
der Form
und
ein Vektorunterraum, heißt affiner Unterraum.
Ein affiner Unterraum ist selbst affiner Raum. Für jeden Punkt
gilt P0 + TH = H = P + TH. Beispiele:
- 1. Der affine n-dimensionale Standardraum:
. Zur Unterscheidung zwischen Punkten und Vektoren wird eine (n + 1)-te Komponente vorangestellt, die 1 für Punkte und 0 für Vektoren gesetzt wird. - 2. Die Lösungsmenge eines inhomogenen linearen Gleichungssystems
ist ein affiner Raum. Die Translationen sind die Lösungen des zugehörigen homogenen Gleichungssystems
.
ist affiner Unterraum des affinen Standardraumes
. Umgekehrt ist jeder affine Unterraum des Standardraumes Lösungsmenge eines linearen Gleichungssystems. - 3. Je zwei verschiedene Punkte
liegen in einem eindeutig bestimmten affinen Unterraum:
, der Geraden durch P und Q.
[Bearbeiten] Satz 4.3
- Eine Teilmenge
von Punkten eines affinen Raumes ist affiner Unterraum gdw. mit je zwei Punkten die Gerade durch diese Punkte in H liegt:
.
Folgende Einschränkung ist zu beachten: Im Beweis wird benutzt:
in K. Dies ist nicht in jedem Körper erfüllt. Man denke an
. Deshalb ist diese Bedingung notwendige Voraussetzung des Satzes!
[Bearbeiten] Lage affiner Unterräume
Der Durchschnitt zweier affiner Unterräume ist offensichtlich wieder ein affiner Unterraum, falls es einen gemeinsamen Punkt gibt: Sei
, dann gilt
. Im Gegensatz zu Vektorunterräumen kann der Durchschnitt affiner Unterräume leer sein:
[Bearbeiten] Definition 4.4
- Seien
zwei affine Unterräume mit leerem Durchschnitt. H1 und H2 heißen zueinander parallel, falls die zugehörigen Translationsräume ineinander enthalten sind, d.h.
oder umgekehrt. Andernfalls heißen die Unterräume windschief.
Jeder Punktmenge ordnen wir den kleinsten affinen Unterraum zu, der diese enthält:
[Bearbeiten] Definition 4.5
- Sei
eine Menge von Punkten, dann heißt der kleinste affine Unterraum, der M enthält, die affine Hülle
.
[Bearbeiten] Lemma 4.6
.
Bezeichne
als Verbindung der affinen Unterräume H1 und H2. Man vergleiche die ’affine Hülle’ mit der ’linearen Hülle’. Welche Konstruktion im Vektorraum entspricht der ’Verbindung’? Ist
, dann ist
. Dies gilt jedoch nur, wenn der Durchschnitt der Unteräume nicht leer ist. Allgemein haben wir die folgende Aussage:
[Bearbeiten] Lemma 4.7
- Seien H1 und H2 affine Unterräume, seien
und
zwei Punkte. Die affine Hülle von H1 und H2 ist von der Form
, wobei
.
[Bearbeiten] Corollar 4.8 (5. Dimensionsformel)
- Ist
, dann gilt
.
Der linearen Unabhängigkeit von Vektoren entspricht die allgemeine Lage von Punkten.
[Bearbeiten] Definition 4.9
- Die Punkte
heißen in allgemeiner Lage, wenn
für i = 0,...,k − 1.
[Bearbeiten] Lemma 4.10
sind in allgemeiner Lage gdw.
gdw. {vec(P0,P1),...,vec(P0,Pk)} linear unabhängig in TA.
Insbesondere hängt damit die Eigenschaft ´allgemeine Lage´ nicht von der Reihenfolge der Punkte ab. Maximal (n + 1) Punkte sind in einem n-dimensionalen affinen Raum in allgemeiner Lage. (Hinweis: Hat eine Punktmenge M mehr als
Elemente, so gibt es noch eine verallgemeinerte Variante zum Begriff ’allgemeine Lage’, in dem definiert wird:
für jede Teilmenge
. Frage: Wie könnte man den Begriff ’allgemeine Lage’ für eine beliebige Menge von Vektoren formulieren?)
[Bearbeiten] Satz 4.11
- Jeder affine Unterraum
ist Lösungsmenge eines linearen Gleichungssystems:
-
.
-
[Bearbeiten] Affine und baryzentrische Koordinaten
Im Vektorraum induziert jede Basis einen Koordinatenisomorphismus auf den Standardvektorraum. Im affinen Raum gilt dies analog, man benötigt dafür stets noch einen Punkt. Damit kann dann insbesondere der letzte Satz auf jeden affinen Raum verallgemeinert werden.
[Bearbeiten] Definition 4.12
- Eine Menge K = (P0,v1,...,vn) bestehend aus einem Punkt von
(Ursprung) und einer Basis von
heißt affines Koordinatensystem. Die zugehörige Koordinatenabbildung
ordnet jedem Punkt P = P0 + λ1v1 + ... + λnvn das Koordinaten-Tupel (P)K: = (1;1,...,n)t zu.
Analog zum Basiswechsel gibt es reguläre Transformationsmatrizen hier aus Gln + 1 der Form
, die den Wechsel des Koordinatensystems beschreiben. Dabei ist T die Transformationsmatrix zwischen den Basen des zugehörigen Vektorraumes und in der ersten Spalte (1;b1,...,bn)t stehen die Koordinaten des Ursprungs bzgl. des neuen Koordinatensystems. Für Anwendungen in der linearen Optimierung sind die folgenden Begriffe bedeutsam. Sie gelten im wesentlichen jedoch nur für reelle affine Räume. Deshalb sei bis zum Ende dieses Anschnittes
vorausgesetzt, d. h. alle affinen Räume und Vektorräume seien reell. Zur Einführung der so genannten baryzentrischen Koordinaten benötigen wir die folgende Vorbereitung.
[Bearbeiten] Lemma 4.13
- Seien
Punkte und
reelle Zahlen mit λ0 + ... + λk = 1, dann ist der Punkt P: = Q + λ0vec(Q,P0) + ... + λkvec(Q,Pk) unabhängig von der Auswahl eines Punktes Q.
[Bearbeiten] Definition 4.14
- Seien
Punkte und
reelle Zahlen mit λ0 + ... + λk = 1, dann heißt P = λ0P0 + ... + λkPk eine baryzentrische Darstellung bzgl. der Punkte P0,...,Pk. Dies ist wohldefiniert durch
.
Bemerkungen:
- Ein Punkt P besitzt eine baryzentrische Darstellung bzgl. der Punkte P0,...,Pk gdw.
. - Die baryzentrische Darstellung eines Punktes P ist eindeutig gdw. die Punkte P0,...,Pk in allgemeiner Lage sind. In diesem Fall sprechen wir von den Koeffizienten λ0,...,λk als die baryzentrischen Koordinaten von P.
- Ein Punkt
liegt zwischen A und B gdw. Q = sA + tB und s + t = 1 und
. Mit [A,B] bezeichnen wir die Menge dieser Punkte, also die Strecke von A nach B. Entsprechende Verallgemeinerungen gelten für konvexe Vielecke. (Hier benötigen wir für die Ordnungsrelation
die reellen Zahlen!) - Der Punkt
ist der Mittelpunkt der Strecke [A,B]. - Der Punkt
ist der ’Schwerpunkt’ des Dreiecks mit dem Ecken A,B,C (hier auch der Schnittpunkt der Seitenhalbierenden).
Entsprechende Verallgemeinerungen gelten für Vielecke. Von besonderem Interesse in der linearen Optimierung sind konvexe Polyeder als höher-dimensionale Verallgemeinerung von konvexen Vielecken. Am einfachsten lassen sich konvexe Polyeder als konvexe Hülle einer endlichen Punktmenge beschreiben:
[Bearbeiten] Definition 4.15 (konvex, konvexe Hülle, endliches konvexes Polyeder)
- Eine Teilmenge
heißt konvex, wenn mit je zwei Punkten
die Verbindungsstrecke [A,B] stets in K liegt. Sei
eine Punktmenge. Die konvexe Hülle K(M) ist die kleinste konvexe Obermenge von M. Ein endliches konvexes Polyeder ist die konvexe Hülle von endlich vielen Punkten.
Die konvexe Hülle ist (wie auch die lineare und die affine Hülle) ein Hüllenoperator, d. h. K(K(M)) = K(M). Die konvexe Hülle von k + 1 Punkten in allgemeiner Lage wird ein k-Simplex genannt.
[Bearbeiten] Satz 4.16
.
Offensichtlich ist der Durchschnitt konvexer Mengen wieder konvex. Die Menge der Punkte, die eine lineare Ungleichung erfüllen, nennen wir Halbraum. Halbräume sind konvex. Damit ist die Lösungsmenge eines Systems von linearen Gleichungen und linearen Ungleichungen ebenfalls konvex. In der linearen Optimierung wird daran anknüpfend die Frage gestellt, für eine konvexe Menge gegeben durch lineare Gleichungen und lineare Ungleichungen zu entscheiden, ob sie ein endliches Polyeder ist und wie die Ecken zu finden sind.
[Bearbeiten] Affine Abbildungen
Zwischen affinen Räumen betrachten wir affine Abbildungen. Diese sollen geometrische Eigenschaften im affinen Raum erhalten: (1.) Geraden bleiben erhalten. (2.) Teilverhältnisse bleiben erhalten.
Liegen A,B,C auf einer Geraden L,
, dann ist
. Die Zahl λ wird Teilverhältnis von A,B,C genannt: (A:B:C): = λ. Um die folgende Definition einer affinen Abbildung zu motivieren, schließen wir wie folgt: Sei
eine Abbildung mit den Eigenschaften (1.) und (2.). Wir betrachten das Bild des Parallelogramms mit den Eckpunkten A,B: = A + a, C: = A + a + b und D: = A + b einschließlich seiner Diagonalen. Dies ist dann wieder ein Parallelogramm (warum?). Damit induziert
eine Abbildung, und sogar eine lineare:
-
-
.
-
[Bearbeiten] Definition 4.17
- Seien
und
affine Räume, eine Abbildung
heißt affin, wenn eine lineare Abbildung der zugehörigen Vektorräume
existiert, so dass gilt:
für alle Punkte
.
Anders gesagt, eine affine Abbildung ist die Komposition einer Translation mit einer linearen Abbildung.
Beispiele: Translationen (hier:
), Parallelprojektionen in einen affinen Unterraum (hier ist
ein Projektionsoperator:
) und Zentralprojektionen zwischen parallelen Unterräumen (hier:
).
Analog zum Prinzip der linearen Fortsetzung in Vektorräumen gilt für affine Abbildungen:
[Bearbeiten] Satz 4.18
- Eine affine Abbildung
ist eindeutig bestimmt durch das Bild von (n + 1) Punkten in allgemeiner Lage,
.
Insbesondere können wir einer affinen Abbildung
eine Matrix
zuordnen. Dabei ergeben sich die Spalten aus den Bildern
, also
. Entsprechend der Konvention mit der ’0-ten Komponente’ gilt sowohl für Punkte, als auch für Vektoren:
und
. Ferner kann unschwer der Formalismus der Darstellungsmatrix einer affiner Abbildung bzgl. affiner Koordinatensysteme formuliert werden. Es gelten analoge Transformationsformeln.