Kurs:Lineare Algebra I/Affine Räume

Aus Wikiversity

Wechseln zu: Navigation, Suche

Inhaltsverzeichnis

[Bearbeiten] Punkte und Vektoren

Im Kapitel 1 haben wir den Standardraum \mathbb{R}^n eingeführt und seine Elemente einmal als Punkte und andererseits als Vektoren interpretiert. Die naive Vektorvorstellung (als gerichtete Strecke) war hilfreich zur Veranschaulichung der Operationen Vektoraddition und skalare Multiplikation, die für Punkte keinen Sinn machen. Ferner gibt es im Vektoraum stets ein ausgezeichnetes Element - den Nullvektor. Dagegen sind im Punktraum alle Elemente gleichberechtigt. Durch den Begriff des affinen Punktraumes werden wir mathematisch korrekt zwischen Punkten und Vektoren unterscheiden. Nehmen wir den naiven Punktraum als gegeben, dann wollen wir jetzt Vektoren als Parallelverschiebungen (Translationen) des Punktraumes interpretieren, die sich durch einen (ungebundenen) Pfeil charakterisieren lassen. Translationen können verknüpft werden (Hintereinanderausführung der Abbildungen) und durch einen skalaren Faktor gedehnt (resp. gestaucht) werden. Diese beiden Operationen induzieren die Struktur eines Vektorraumes auf der Menge aller Translationen des Punktraumes. Dieses Modell führt zum Begriff des affinen Raumes, die zugehörige mathematische Theorie ist die analytische Geometrie. Lineare Algebra und analytische Geometrie sind zwei verschiedene Betrachtungsweisen zum gleichen mathematischen Gebiet.

[Bearbeiten] Definition 4.1

Ein affiner Raum ist ein Tripel (\mathbf{A}, T_\mathbf{A}, +) aus einer nichtleeren Punktmenge \mathbf{A}, einem Vektorraum (von Translationen) T_\mathbf{A} und einer Abbildung (Operation von T_\mathbf{A} auf \mathbf{A}) der Form Punkt + Vektor = Punkt:
+ : \mathbf{A} \times T_\mathbf{A} \rightarrow \mathbf{A}, (P, x) \mapsto P + x,
die folgenden Regeln genügt:
(a1) P + 0 = P,
(a2) (P + x) + y = P + (x + y),
(a3) Je zwei Punkte P,Q bestimmen eindeutig einen Vektor x mit P + x = Q.

Schreibweisen: x = \overrightarrow {PQ} = vec(P,Q). Jedem Vektor x \in T_\mathbf{A} entspricht die Translation t_x : \mathbf{A} \rightarrow \mathbf{A}, P \mapsto P + x. Die Dimension eines affinen Raumes ist die Dimension des zugehörigen Vektorraumes, dim\mathbf{A} := dim T_\mathbf{A}. Meist spricht man allein von der Punktmenge \mathbf{A} als affinen Raum ohne den zugehörigen Vektorraum explizit anzugeben. Die Punktmenge ist bijektiv zum Vektorraum der Translationen nach Fixierung eines Punktes P0, indem jedem Punkt Q der ’Ortvektor’ von Q bzgl. P0 zugeordnet wird: \mathbf{A} \rightarrow T_\mathbf{A}, Q \mapsto vec(P_0,Q). Die dazu inverse Abbildung lautet: x \mapsto P_0 + x.

[Bearbeiten] Definition 4.2

Eine Teilmenge eines affines Raumes H \subset \mathbf{A} der Form H = P + T_H, P \in H und T_H \subset T_\mathbf{A} ein Vektorunterraum, heißt affiner Unterraum.

Ein affiner Unterraum ist selbst affiner Raum. Für jeden Punkt P \in H gilt P0 + TH = H = P + TH. Beispiele:

1. Der affine n-dimensionale Standardraum: \mathbf{A}^n = (K^n,K^n, +). Zur Unterscheidung zwischen Punkten und Vektoren wird eine (n + 1)-te Komponente vorangestellt, die 1 für Punkte und 0 für Vektoren gesetzt wird.
2. Die Lösungsmenge eines inhomogenen linearen Gleichungssystems \mathcal{H}:= \mathcal{H}(A, b) ist ein affiner Raum. Die Translationen sind die Lösungen des zugehörigen homogenen Gleichungssystems \mathcal{H}(A, 0). \mathcal{H} ist affiner Unterraum des affinen Standardraumes \mathbf{A}^n. Umgekehrt ist jeder affine Unterraum des Standardraumes Lösungsmenge eines linearen Gleichungssystems.
3. Je zwei verschiedene Punkte P,Q \in \mathbf{A} liegen in einem eindeutig bestimmten affinen Unterraum:
L(P,Q) := \{X \in \mathbf{A} | X = P + t \cdot vec(P,Q), t \in K\}, der Geraden durch P und Q.

[Bearbeiten] Satz 4.3

Eine Teilmenge H \subset \mathbf{A} von Punkten eines affinen Raumes ist affiner Unterraum gdw. mit je zwei Punkten die Gerade durch diese Punkte in H liegt: P,Q \in H \Rightarrow L(P,Q) \subset H.

Folgende Einschränkung ist zu beachten: Im Beweis wird benutzt: 1 + 1 \neq 0 in K. Dies ist nicht in jedem Körper erfüllt. Man denke an K = \mathbb{F}_2. Deshalb ist diese Bedingung notwendige Voraussetzung des Satzes!

[Bearbeiten] Lage affiner Unterräume

Der Durchschnitt zweier affiner Unterräume ist offensichtlich wieder ein affiner Unterraum, falls es einen gemeinsamen Punkt gibt: Sei P_0 \in H_1 \cap H_2, dann gilt H_1 \cap H_2 = P_0 + (T_{H_1} \cap T_{H_2} ). Im Gegensatz zu Vektorunterräumen kann der Durchschnitt affiner Unterräume leer sein:

[Bearbeiten] Definition 4.4

Seien H_1,H_2 \subset \mathbf{A} zwei affine Unterräume mit leerem Durchschnitt. H1 und H2 heißen zueinander parallel, falls die zugehörigen Translationsräume ineinander enthalten sind, d.h. T_{H_1} \subset T_{H_2} oder umgekehrt. Andernfalls heißen die Unterräume windschief.

Jeder Punktmenge ordnen wir den kleinsten affinen Unterraum zu, der diese enthält:

[Bearbeiten] Definition 4.5

Sei M \subset \mathbf{A} eine Menge von Punkten, dann heißt der kleinste affine Unterraum, der M enthält, die affine Hülle \mathcal{H}(M).

[Bearbeiten] Lemma 4.6

\mathcal{H}(P_0, ..., P_k) = P_0 + Lin\{vec(P_0, P_1), . . . , vec(P_0, P_k)\}.

Bezeichne H_1 \vee H_2 := \mathcal{H}(H_1 \cup H_2) als Verbindung der affinen Unterräume H1 und H2. Man vergleiche die ’affine Hülle’ mit der ’linearen Hülle’. Welche Konstruktion im Vektorraum entspricht der ’Verbindung’? Ist P_0 \in H_1 \cap H_2, dann ist H_1 \vee H_2 = P_0 +(T_{H_1} +T_{H_2}). Dies gilt jedoch nur, wenn der Durchschnitt der Unteräume nicht leer ist. Allgemein haben wir die folgende Aussage:

[Bearbeiten] Lemma 4.7

Seien H1 und H2 affine Unterräume, seien P_1 \in H_1 und P_2 \in H_2 zwei Punkte. Die affine Hülle von H1 und H2 ist von der Form H_1 \vee H_2 := P_1 +U, wobei U := T_{H_1} +T_{H_2} +K \cdot vec(P_1, P_2).

[Bearbeiten] Corollar 4.8 (5. Dimensionsformel)

Ist H_1 \cap H_2 = \O, dann gilt dim(H_1 \vee H_2) = dim(H_1) + dim(H_2) - dim(T_{H_1} \cap T_{H_2}) + 1.

Der linearen Unabhängigkeit von Vektoren entspricht die allgemeine Lage von Punkten.

[Bearbeiten] Definition 4.9

Die Punkte P_0, ..., P_k \in \mathbf{A} heißen in allgemeiner Lage, wenn P_{i+1} \notin \mathcal{H}(P_0, ..., P_i) für i = 0,...,k − 1.

[Bearbeiten] Lemma 4.10

P_0, ..., P_k \in \mathbf{A} sind in allgemeiner Lage gdw. dim(\mathcal{H}(P_0, ..., P_k)) = k gdw. {vec(P0,P1),...,vec(P0,Pk)} linear unabhängig in TA.

Insbesondere hängt damit die Eigenschaft ´allgemeine Lage´ nicht von der Reihenfolge der Punkte ab. Maximal (n + 1) Punkte sind in einem n-dimensionalen affinen Raum in allgemeiner Lage. (Hinweis: Hat eine Punktmenge M mehr als (dim(\mathbf{A})+1) Elemente, so gibt es noch eine verallgemeinerte Variante zum Begriff ’allgemeine Lage’, in dem definiert wird: dim(\mathcal{H}(N)) = min\{\#N - 1, dim(\mathbf{A})\} für jede Teilmenge N \subset M. Frage: Wie könnte man den Begriff ’allgemeine Lage’ für eine beliebige Menge von Vektoren formulieren?)

[Bearbeiten] Satz 4.11

Jeder affine Unterraum H \subseteq \mathbf{A}^n ist Lösungsmenge eines linearen Gleichungssystems:
H = \mathcal{H}(A, b).

[Bearbeiten] Affine und baryzentrische Koordinaten

Im Vektorraum induziert jede Basis einen Koordinatenisomorphismus auf den Standardvektorraum. Im affinen Raum gilt dies analog, man benötigt dafür stets noch einen Punkt. Damit kann dann insbesondere der letzte Satz auf jeden affinen Raum verallgemeinert werden.

[Bearbeiten] Definition 4.12

Eine Menge K = (P0,v1,...,vn) bestehend aus einem Punkt von \mathbf{A} (Ursprung) und einer Basis von T_\mathbf{A} heißt affines Koordinatensystem. Die zugehörige Koordinatenabbildung \Phi_K : \mathbf{A} \to \mathbf{A}^n ordnet jedem Punkt P = P0 + λ1v1 + ... + λnvn das Koordinaten-Tupel (P)K: = (1;1,...,n)t zu.

Analog zum Basiswechsel gibt es reguläre Transformationsmatrizen hier aus Gln + 1 der Form \tilde{T} = \begin{pmatrix} 1 & 0 \\ b & T \end{pmatrix}, die den Wechsel des Koordinatensystems beschreiben. Dabei ist T die Transformationsmatrix zwischen den Basen des zugehörigen Vektorraumes und in der ersten Spalte (1;b1,...,bn)t stehen die Koordinaten des Ursprungs bzgl. des neuen Koordinatensystems. Für Anwendungen in der linearen Optimierung sind die folgenden Begriffe bedeutsam. Sie gelten im wesentlichen jedoch nur für reelle affine Räume. Deshalb sei bis zum Ende dieses Anschnittes K = \mathbb{R} vorausgesetzt, d. h. alle affinen Räume und Vektorräume seien reell. Zur Einführung der so genannten baryzentrischen Koordinaten benötigen wir die folgende Vorbereitung.

[Bearbeiten] Lemma 4.13

Seien P_0, ..., P_k \in \mathbf{A} Punkte und  \lambda_0, ..., \lambda_k \in \mathbb{R} reelle Zahlen mit λ0 + ... + λk = 1, dann ist der Punkt P: = Q + λ0vec(Q,P0) + ... + λkvec(Q,Pk) unabhängig von der Auswahl eines Punktes Q.

[Bearbeiten] Definition 4.14

Seien P_0, ..., P_k \in \mathbf{A} Punkte und  \lambda_0, ..., \lambda_k \in \mathbb{R} reelle Zahlen mit λ0 + ... + λk = 1, dann heißt P = λ0P0 + ... + λkPk eine baryzentrische Darstellung bzgl. der Punkte P0,...,Pk. Dies ist wohldefiniert durch P := P_0 + \sum^k_{i=1} \lambda_i \cdot vec(P_0, P_i).

Bemerkungen:

  • Ein Punkt P besitzt eine baryzentrische Darstellung bzgl. der Punkte P0,...,Pk gdw. P \in \mathcal{H}(P_0, ..., P_k).
  • Die baryzentrische Darstellung eines Punktes P ist eindeutig gdw. die Punkte P0,...,Pk in allgemeiner Lage sind. In diesem Fall sprechen wir von den Koeffizienten λ0,...,λk als die baryzentrischen Koordinaten von P.
  • Ein Punkt Q \in L(A,B) liegt zwischen A und B gdw. Q = sA + tB und s + t = 1 und 0 \le s, t. Mit [A,B] bezeichnen wir die Menge dieser Punkte, also die Strecke von A nach B. Entsprechende Verallgemeinerungen gelten für konvexe Vielecke. (Hier benötigen wir für die Ordnungsrelation \le die reellen Zahlen!)
  • Der Punkt \frac{1}{2} A + \frac{1}{2} B ist der Mittelpunkt der Strecke [A,B].
  • Der Punkt \frac{1}{3} A + \frac{1}{3} B + \frac{1}{3} C ist der ’Schwerpunkt’ des Dreiecks mit dem Ecken A,B,C (hier auch der Schnittpunkt der Seitenhalbierenden).

Entsprechende Verallgemeinerungen gelten für Vielecke. Von besonderem Interesse in der linearen Optimierung sind konvexe Polyeder als höher-dimensionale Verallgemeinerung von konvexen Vielecken. Am einfachsten lassen sich konvexe Polyeder als konvexe Hülle einer endlichen Punktmenge beschreiben:

[Bearbeiten] Definition 4.15 (konvex, konvexe Hülle, endliches konvexes Polyeder)

Eine Teilmenge K \subset \mathbf{A} heißt konvex, wenn mit je zwei Punkten A,B \in K die Verbindungsstrecke [A,B] stets in K liegt. Sei M \subset \mathbf{A} eine Punktmenge. Die konvexe Hülle K(M) ist die kleinste konvexe Obermenge von M. Ein endliches konvexes Polyeder ist die konvexe Hülle von endlich vielen Punkten.

Die konvexe Hülle ist (wie auch die lineare und die affine Hülle) ein Hüllenoperator, d. h. K(K(M)) = K(M). Die konvexe Hülle von k + 1 Punkten in allgemeiner Lage wird ein k-Simplex genannt.

[Bearbeiten] Satz 4.16

K(P_0, ..., P_k) = \{\sum^k_{i=0} \lambda_i P_i | \lambda_i \geq 0, \sum \lambda_i = 1 \}.

Offensichtlich ist der Durchschnitt konvexer Mengen wieder konvex. Die Menge der Punkte, die eine lineare Ungleichung erfüllen, nennen wir Halbraum. Halbräume sind konvex. Damit ist die Lösungsmenge eines Systems von linearen Gleichungen und linearen Ungleichungen ebenfalls konvex. In der linearen Optimierung wird daran anknüpfend die Frage gestellt, für eine konvexe Menge gegeben durch lineare Gleichungen und lineare Ungleichungen zu entscheiden, ob sie ein endliches Polyeder ist und wie die Ecken zu finden sind.

[Bearbeiten] Affine Abbildungen

Zwischen affinen Räumen betrachten wir affine Abbildungen. Diese sollen geometrische Eigenschaften im affinen Raum erhalten: (1.) Geraden bleiben erhalten. (2.) Teilverhältnisse bleiben erhalten.

Liegen A,B,C auf einer Geraden L, A \neq B, dann ist vec(A,C) = \lambda \cdot vec(A,B). Die Zahl λ wird Teilverhältnis von A,B,C genannt: (A:B:C): = λ. Um die folgende Definition einer affinen Abbildung zu motivieren, schließen wir wie folgt: Sei \varphi eine Abbildung mit den Eigenschaften (1.) und (2.). Wir betrachten das Bild des Parallelogramms mit den Eckpunkten A,B: = A + a, C: = A + a + b und D: = A + b einschließlich seiner Diagonalen. Dies ist dann wieder ein Parallelogramm (warum?). Damit induziert \varphi eine Abbildung, und sogar eine lineare:

T_\varphi : T_\mathbf{A} \to T_\mathbf{A}, vec(P,Q) \mapsto vec(\varphi(P), \varphi(Q)).

[Bearbeiten] Definition 4.17

Seien \mathbf{A} und \mathbf{A}' affine Räume, eine Abbildung \varphi : \mathbf{A} \to \mathbf{A}' heißt affin, wenn eine lineare Abbildung der zugehörigen Vektorräume T_\varphi : T_\mathbf{A} \to T_{\mathbf{A}'} existiert, so dass gilt: \varphi(Q) =
\varphi(P) + T_\varphi(vec(P,Q)) für alle Punkte P,Q \in \mathbf{A}.

Anders gesagt, eine affine Abbildung ist die Komposition einer Translation mit einer linearen Abbildung.

Beispiele: Translationen (hier: T_\varphi = id), Parallelprojektionen in einen affinen Unterraum (hier ist T_\varphi ein Projektionsoperator: T_\varphi = T^2_\varphi) und Zentralprojektionen zwischen parallelen Unterräumen (hier: T_\varphi = \lambda \cdot id).

Analog zum Prinzip der linearen Fortsetzung in Vektorräumen gilt für affine Abbildungen:

[Bearbeiten] Satz 4.18

Eine affine Abbildung \varphi : \mathbf{A} \to \mathbf{A}' ist eindeutig bestimmt durch das Bild von (n + 1) Punkten in allgemeiner Lage, n = \dim \mathbf{A}.

Insbesondere können wir einer affinen Abbildung \varphi : \mathbf{A}^n \to \mathbf{A}^m eine Matrix M(\varphi) \in Mat(m + 1, n + 1) zuordnen. Dabei ergeben sich die Spalten aus den Bildern \varphi(0), T_\varphi(e_1), ..., T_\varphi(e_n), also M(\varphi) = \begin{pmatrix} 1 & 0 \\ \varphi(0) & M(T_\varphi) \end{pmatrix}. Entsprechend der Konvention mit der ’0-ten Komponente’ gilt sowohl für Punkte, als auch für Vektoren: \varphi(P) = M(\varphi)P und T_\varphi(x) = M(\varphi)x. Ferner kann unschwer der Formalismus der Darstellungsmatrix einer affiner Abbildung bzgl. affiner Koordinatensysteme formuliert werden. Es gelten analoge Transformationsformeln.

Persönliche Werkzeuge