Kurs:Lineare Algebra I/Affine Räume

Punkte und Vektoren

Im Kapitel 1 haben wir den Standardraum $\mathbb {R} ^{n}$ eingeführt und seine Elemente einmal als Punkte und andererseits als Vektoren interpretiert. Die naive Vektorvorstellung (als gerichtete Strecke) war hilfreich zur Veranschaulichung der Operationen Vektoraddition und skalare Multiplikation, die für Punkte keinen Sinn machen. Ferner gibt es im Vektorraum stets ein ausgezeichnetes Element - den Nullvektor. Dagegen sind im Punktraum alle Elemente gleichberechtigt. Durch den Begriff des affinen Punktraumes werden wir mathematisch korrekt zwischen Punkten und Vektoren unterscheiden. Nehmen wir den naiven Punktraum als gegeben, dann wollen wir jetzt Vektoren als Parallelverschiebungen (Translationen) des Punktraumes interpretieren, die sich durch einen (ungebundenen) Pfeil charakterisieren lassen. Translationen können verknüpft werden (Hintereinanderausführung der Abbildungen) und durch einen skalaren Faktor gedehnt (resp. gestaucht) werden. Diese beiden Operationen induzieren die Struktur eines Vektorraumes auf der Menge aller Translationen des Punktraumes. Dieses Modell führt zum Begriff des affinen Raumes, die zugehörige mathematische Theorie ist die analytische Geometrie. Lineare Algebra und analytische Geometrie sind zwei verschiedene Betrachtungsweisen zum gleichen mathematischen Gebiet.

Definition 4.1

Ein affiner Raum ist ein Tripel ( $\mathbf {A} ,T_{\mathbf {A} },+$ ) aus einer nichtleeren Punktmenge $\mathbf {A}$ , einem Vektorraum (von Translationen) $T_{\mathbf {A} }$ und einer Abbildung (Operation von $T_{\mathbf {A} }$ auf $\mathbf {A}$ ) der Form $Punkt+Vektor=Punkt$ :

+:\mathbf {A} \times T_{\mathbf {A} }\rightarrow \mathbf {A} ,(P,x)\mapsto P+x

,

die folgenden Regeln genügt:

(

a_{1}

) $P+0=P$ ,

(

a_{2}

) $(P+x)+y=P+(x+y)$ ,

(

a_{3}

) Je zwei Punkte P,Q bestimmen eindeutig einen Vektor $x$ mit $P+x=Q$ .

Schreibweisen: $x={\overrightarrow {PQ}}=vec(P,Q)$ . Jedem Vektor $x\in T_{\mathbf {A} }$ entspricht die Translation $t_{x}:\mathbf {A} \rightarrow \mathbf {A} ,P\mapsto P+x$ . Die Dimension eines affinen Raumes ist die Dimension des zugehörigen Vektorraumes, $dim\mathbf {A} :=dimT_{\mathbf {A} }$ . Meist spricht man allein von der Punktmenge $\mathbf {A}$ als affinen Raum ohne den zugehörigen Vektorraum explizit anzugeben. Die Punktmenge ist bijektiv zum Vektorraum der Translationen nach Fixierung eines Punktes $P_{0}$ , indem jedem Punkt $Q$ der ’Ortvektor’ von $Q$ bzgl. $P_{0}$ zugeordnet wird: $\mathbf {A} \rightarrow T_{\mathbf {A} },Q\mapsto vec(P_{0},Q)$ . Die dazu inverse Abbildung lautet: $x\mapsto P_{0}+x$ .

Definition 4.2

Eine Teilmenge eines affines Raumes $H\subset \mathbf {A}$ der Form $H=P+T_{H},P\in H$ und $T_{H}\subset T_{\mathbf {A} }$ ein Vektorunterraum, heißt affiner Unterraum.

Ein affiner Unterraum ist selbst affiner Raum. Für jeden Punkt $P\in H$ gilt $P_{0}+T_{H}=H=P+T_{H}$ . Beispiele:

1. Der affine n-dimensionale Standardraum:

\mathbf {A} ^{n}=(K^{n},K^{n},+)

. Zur Unterscheidung zwischen Punkten und Vektoren wird eine (

n+1

)-te Komponente vorangestellt, die 1 für Punkte und 0 für Vektoren gesetzt wird.

2. Die Lösungsmenge eines inhomogenen linearen Gleichungssystems

{\mathcal {H}}:={\mathcal {H}}(A,b)

ist ein affiner Raum. Die Translationen sind die Lösungen des zugehörigen homogenen Gleichungssystems

{\mathcal {H}}(A,0)

.

{\mathcal {H}}

ist affiner Unterraum des affinen Standardraumes

\mathbf {A} ^{n}

. Umgekehrt ist jeder affine Unterraum des Standardraumes Lösungsmenge eines linearen Gleichungssystems.

3. Je zwei verschiedene Punkte

P,Q\in \mathbf {A}

liegen in einem eindeutig bestimmten affinen Unterraum:

L(P,Q):=\{X\in \mathbf {A} |X=P+t\cdot vec(P,Q),t\in K\}

, der Geraden durch

P

und

Q

.

Satz 4.3

Eine Teilmenge $H\subset \mathbf {A}$ von Punkten eines affinen Raumes ist affiner Unterraum gdw. mit je zwei Punkten die Gerade durch diese Punkte in $H$ liegt: $P,Q\in H\Rightarrow L(P,Q)\subset H$ .

Folgende Einschränkung ist zu beachten: Im Beweis wird benutzt: $1+1\neq 0$ in $K$ . Dies ist nicht in jedem Körper erfüllt. Man denke an $K=\mathbb {F} _{2}$ . Deshalb ist diese Bedingung notwendige Voraussetzung des Satzes!

Lage affiner Unterräume

Der Durchschnitt zweier affiner Unterräume ist offensichtlich wieder ein affiner Unterraum, falls es einen gemeinsamen Punkt gibt: Sei $P_{0}\in H_{1}\cap H_{2}$ , dann gilt $H_{1}\cap H_{2}=P_{0}+(T_{H_{1}}\cap T_{H_{2}})$ . Im Gegensatz zu Vektorunterräumen kann der Durchschnitt affiner Unterräume leer sein:

Definition 4.4

Seien $H_{1},H_{2}\subset \mathbf {A}$ zwei affine Unterräume mit leerem Durchschnitt. $H_{1}$ und $H_{2}$ heißen zueinander parallel, falls die zugehörigen Translationsräume ineinander enthalten sind, d.h. $T_{H_{1}}\subset T_{H_{2}}$ oder umgekehrt. Andernfalls heißen die Unterräume windschief.

Jeder Punktmenge ordnen wir den kleinsten affinen Unterraum zu, der diese enthält:

Definition 4.5

Sei $M\subset \mathbf {A}$ eine Menge von Punkten, dann heißt der kleinste affine Unterraum, der $M$ enthält, die affine Hülle ${\mathcal {H}}(M)$ .

Lemma 4.6

${\mathcal {H}}(P_{0},...,P_{k})=P_{0}+Lin\{vec(P_{0},P_{1}),...,vec(P_{0},P_{k})\}$ .

Bezeichne $H_{1}\vee H_{2}:={\mathcal {H}}(H_{1}\cup H_{2})$ als Verbindung der affinen Unterräume $H_{1}$ und $H_{2}$ . Man vergleiche die ’affine Hülle’ mit der ’linearen Hülle’. Welche Konstruktion im Vektorraum entspricht der ’Verbindung’? Ist $P_{0}\in H_{1}\cap H_{2}$ , dann ist $H_{1}\vee H_{2}=P_{0}+(T_{H_{1}}+T_{H_{2}})$ . Dies gilt jedoch nur, wenn der Durchschnitt der Unteräume nicht leer ist. Allgemein haben wir die folgende Aussage:

Lemma 4.7

Seien $H_{1}$ und $H_{2}$ affine Unterräume, seien $P_{1}\in H_{1}$ und $P_{2}\in H_{2}$ zwei Punkte. Die affine Hülle von $H_{1}$ und $H_{2}$ ist von der Form $H_{1}\vee H_{2}:=P_{1}+U$ , wobei $U:=T_{H_{1}}+T_{H_{2}}+K\cdot vec(P_{1},P_{2})$ .

Corollar 4.8 (5. Dimensionsformel)

Ist $H_{1}\cap H_{2}=\emptyset$ , dann gilt $dim(H_{1}\vee H_{2})=dim(H_{1})+dim(H_{2})-dim(T_{H_{1}}\cap T_{H_{2}})+1$ .

Der linearen Unabhängigkeit von Vektoren entspricht die allgemeine Lage von Punkten.

Definition 4.9

Die Punkte $P_{0},...,P_{k}\in \mathbf {A}$ heißen in allgemeiner Lage, wenn $P_{i+1}\notin {\mathcal {H}}(P_{0},...,P_{i})$ für $i=0,...,k-1$ .

Lemma 4.10

$P_{0},...,P_{k}\in \mathbf {A}$ sind in allgemeiner Lage gdw. $dim({\mathcal {H}}(P_{0},...,P_{k}))=k$ gdw. $\{vec(P_{0},P_{1}),...,vec(P_{0},P_{k})\}$ linear unabhängig in $T_{A}$ .

Insbesondere hängt damit die Eigenschaft ´allgemeine Lage´ nicht von der Reihenfolge der Punkte ab. Maximal ( $n+1$ ) Punkte sind in einem $n$ -dimensionalen affinen Raum in allgemeiner Lage. (Hinweis: Hat eine Punktmenge $M$ mehr als $(dim(\mathbf {A} )+1)$ Elemente, so gibt es noch eine verallgemeinerte Variante zum Begriff ’allgemeine Lage’, in dem definiert wird: $dim({\mathcal {H}}(N))=min\{\#N-1,dim(\mathbf {A} )\}$ für jede Teilmenge $N\subset M$ . Frage: Wie könnte man den Begriff ’allgemeine Lage’ für eine beliebige Menge von Vektoren formulieren?)

Satz 4.11

Jeder affine Unterraum $H\subseteq \mathbf {A} ^{n}$ ist Lösungsmenge eines linearen Gleichungssystems:

$H={\mathcal {H}}(A,b)$ .

Affine und baryzentrische Koordinaten

Im Vektorraum induziert jede Basis einen Koordinatenisomorphismus auf den Standardvektorraum. Im affinen Raum gilt dies analog, man benötigt dafür stets noch einen Punkt. Damit kann dann insbesondere der letzte Satz auf jeden affinen Raum verallgemeinert werden.

Definition 4.12

Eine Menge $K=(P_{0},v_{1},...,v_{n})$ bestehend aus einem Punkt von $\mathbf {A}$ (Ursprung) und einer Basis von $T_{\mathbf {A} }$ heißt affines Koordinatensystem. Die zugehörige Koordinatenabbildung $\Phi _{K}:\mathbf {A} \to \mathbf {A} ^{n}$ ordnet jedem Punkt $P=P_{0}+\lambda _{1}v_{1}+...+\lambda _{n}v_{n}$ das Koordinaten-Tupel $(P)_{K}:=(1;1,...,n)^{t}$ zu.

Analog zum Basiswechsel gibt es reguläre Transformationsmatrizen hier aus $Gl_{n+1}$ der Form ${\tilde {T}}={\begin{pmatrix}1&0\\b&T\end{pmatrix}}$ , die den Wechsel des Koordinatensystems beschreiben. Dabei ist $T$ die Transformationsmatrix zwischen den Basen des zugehörigen Vektorraumes und in der ersten Spalte $(1;b_{1},...,b_{n})^{t}$ stehen die Koordinaten des Ursprungs bzgl. des neuen Koordinatensystems. Für Anwendungen in der linearen Optimierung sind die folgenden Begriffe bedeutsam. Sie gelten im wesentlichen jedoch nur für reelle affine Räume. Deshalb sei bis zum Ende dieses Anschnittes $K=\mathbb {R}$ vorausgesetzt, d. h. alle affinen Räume und Vektorräume seien reell. Zur Einführung der so genannten baryzentrischen Koordinaten benötigen wir die folgende Vorbereitung.

Lemma 4.13

Seien $P_{0},...,P_{k}\in \mathbf {A}$ Punkte und $\lambda _{0},...,\lambda _{k}\in \mathbb {R}$ reelle Zahlen mit $\lambda _{0}+...+\lambda _{k}=1$ , dann ist der Punkt $P:=Q+\lambda _{0}vec(Q,P_{0})+...+\lambda _{k}vec(Q,P_{k})$ unabhängig von der Auswahl eines Punktes $Q$ .

Definition 4.14

Seien $P_{0},...,P_{k}\in \mathbf {A}$ Punkte und $\lambda _{0},...,\lambda _{k}\in \mathbb {R}$ reelle Zahlen mit $\lambda _{0}+...+\lambda _{k}=1$ , dann heißt $P=\lambda _{0}P_{0}+...+\lambda _{k}P_{k}$ eine baryzentrische Darstellung bzgl. der Punkte $P_{0},...,P_{k}$ . Dies ist wohldefiniert durch $P:=P_{0}+\sum _{i=1}^{k}\lambda _{i}\cdot vec(P_{0},P_{i})$ .

Bemerkungen:

Ein Punkt $P$ besitzt eine baryzentrische Darstellung bzgl. der Punkte $P_{0},...,P_{k}$ gdw. $P\in {\mathcal {H}}(P_{0},...,P_{k})$ .
Die baryzentrische Darstellung eines Punktes $P$ ist eindeutig gdw. die Punkte $P_{0},...,P_{k}$ in allgemeiner Lage sind. In diesem Fall sprechen wir von den Koeffizienten $\lambda _{0},...,\lambda _{k}$ als die baryzentrischen Koordinaten von P.
Ein Punkt $Q\in L(A,B)$ liegt zwischen $A$ und $B$ gdw. $Q=sA+tB$ und $s+t=1$ und $0\leq s,t$ . Mit [ $A,B$ ] bezeichnen wir die Menge dieser Punkte, also die Strecke von $A$ nach $B$ . Entsprechende Verallgemeinerungen gelten für konvexe Vielecke. (Hier benötigen wir für die Ordnungsrelation $\leq$ die reellen Zahlen!)
Der Punkt ${\frac {1}{2}}A+{\frac {1}{2}}B$ ist der Mittelpunkt der Strecke [A,B].
Der Punkt ${\frac {1}{3}}A+{\frac {1}{3}}B+{\frac {1}{3}}C$ ist der ’Schwerpunkt’ des Dreiecks mit dem Ecken A,B,C (hier auch der Schnittpunkt der Seitenhalbierenden).

Entsprechende Verallgemeinerungen gelten für Vielecke. Von besonderem Interesse in der linearen Optimierung sind konvexe Polyeder als höher-dimensionale Verallgemeinerung von konvexen Vielecken. Am einfachsten lassen sich konvexe Polyeder als konvexe Hülle einer endlichen Punktmenge beschreiben:

Definition 4.15 (konvex, konvexe Hülle, endliches konvexes Polyeder)

Eine Teilmenge $K\subset \mathbf {A}$ heißt konvex, wenn mit je zwei Punkten $A,B\in K$ die Verbindungsstrecke $[A,B]$ stets in $K$ liegt. Sei $M\subset \mathbf {A}$ eine Punktmenge. Die konvexe Hülle $K(M)$ ist die kleinste konvexe Obermenge von $M$ . Ein endliches konvexes Polyeder ist die konvexe Hülle von endlich vielen Punkten.

Die konvexe Hülle ist (wie auch die lineare und die affine Hülle) ein Hüllenoperator, d. h. $K(K(M))=K(M)$ . Die konvexe Hülle von $k+1$ Punkten in allgemeiner Lage wird ein k-Simplex genannt.

Satz 4.16

$K(P_{0},...,P_{k})=\{\sum _{i=0}^{k}\lambda _{i}P_{i}|\lambda _{i}\geq 0,\sum \lambda _{i}=1\}$ .

Offensichtlich ist der Durchschnitt konvexer Mengen wieder konvex. Die Menge der Punkte, die eine lineare Ungleichung erfüllen, nennen wir Halbraum. Halbräume sind konvex. Damit ist die Lösungsmenge eines Systems von linearen Gleichungen und linearen Ungleichungen ebenfalls konvex. In der linearen Optimierung wird daran anknüpfend die Frage gestellt, für eine konvexe Menge gegeben durch lineare Gleichungen und lineare Ungleichungen zu entscheiden, ob sie ein endliches Polyeder ist und wie die Ecken zu finden sind.

Affine Abbildungen

Zwischen affinen Räumen betrachten wir affine Abbildungen. Diese sollen geometrische Eigenschaften im affinen Raum erhalten: (1.) Geraden bleiben erhalten. (2.) Teilverhältnisse bleiben erhalten.

Liegen $A,B,C$ auf einer Geraden $L$ , $A\neq B$ , dann ist $vec(A,C)=\lambda \cdot vec(A,B)$ . Die Zahl $\lambda$ wird Teilverhältnis von $A,B,C$ genannt: $(A:B:C):=\lambda$ . Um die folgende Definition einer affinen Abbildung zu motivieren, schließen wir wie folgt: Sei $\varphi$ eine Abbildung mit den Eigenschaften (1.) und (2.). Wir betrachten das Bild des Parallelogramms mit den Eckpunkten $A,B:=A+a$ , $C:=A+a+b$ und $D:=A+b$ einschließlich seiner Diagonalen. Dies ist dann wieder ein Parallelogramm (warum?). Damit induziert $\varphi$ eine Abbildung, und sogar eine lineare:

T_{\varphi }:T_{\mathbf {A} }\to T_{\mathbf {A} },vec(P,Q)\mapsto vec(\varphi (P),\varphi (Q))

.

Definition 4.17

Seien $\mathbf {A}$ und $\mathbf {A} '$ affine Räume, eine Abbildung $\varphi :\mathbf {A} \to \mathbf {A} '$ heißt affin, wenn eine lineare Abbildung der zugehörigen Vektorräume $T_{\varphi }:T_{\mathbf {A} }\to T_{\mathbf {A} '}$ existiert, so dass gilt: $\varphi (Q)=\varphi (P)+T_{\varphi }(vec(P,Q))$ für alle Punkte $P,Q\in \mathbf {A}$ .

Anders gesagt, eine affine Abbildung ist die Komposition einer Translation mit einer linearen Abbildung.

Beispiele: Translationen (hier: $T_{\varphi }=id$ ), Parallelprojektionen in einen affinen Unterraum (hier ist $T_{\varphi }$ ein Projektionsoperator: $T_{\varphi }=T_{\varphi }^{2}$ ) und Zentralprojektionen zwischen parallelen Unterräumen (hier: $T_{\varphi }=\lambda \cdot id$ ).

Analog zum Prinzip der linearen Fortsetzung in Vektorräumen gilt für affine Abbildungen:

Satz 4.18

Eine affine Abbildung $\varphi :\mathbf {A} \to \mathbf {A} '$ ist eindeutig bestimmt durch das Bild von $(n+1)$ Punkten in allgemeiner Lage, $n=\dim \mathbf {A}$ .

Insbesondere können wir einer affinen Abbildung $\varphi :\mathbf {A} ^{n}\to \mathbf {A} ^{m}$ eine Matrix $M(\varphi )\in Mat(m+1,n+1)$ zuordnen. Dabei ergeben sich die Spalten aus den Bildern $\varphi (0),T_{\varphi }(e_{1}),...,T_{\varphi }(e_{n})$ , also $M(\varphi )={\begin{pmatrix}1&0\\\varphi (0)&M(T_{\varphi })\end{pmatrix}}$ . Entsprechend der Konvention mit der ’0-ten Komponente’ gilt sowohl für Punkte, als auch für Vektoren: $\varphi (P)=M(\varphi )P$ und $T_{\varphi }(x)=M(\varphi )x$ . Ferner kann unschwer der Formalismus der Darstellungsmatrix einer affiner Abbildung bzgl. affiner Koordinatensysteme formuliert werden. Es gelten analoge Transformationsformeln.