Zufallsvariablen

Gegeben sei ein endlicher W-Raum ${\textstyle (\Omega ,P)}$ (zugehörig zu einem ZE). Eine Funktion ${\textstyle Z:\Omega \to \mathbb {R} }$ , die jedem möglichen Ergebnis eine reelle Zahl zuordnet, heißt diskrete Zufallsvariable (ZV),

Die Menge ${\textstyle Z(\Omega )=\{Z(\omega );\ \omega \in \Omega \}}$ aller Werte (Realisationen), die die ZV ${\textstyle Z}$ annehmen kann, nennt man das Bild von ${\textstyle \mathbf {Z} }$ .

Ist ${\textstyle Z:\Omega \to \mathbb {R} }$ eine ZV, so schreibt man für eine Zahl ${\textstyle x\in \mathbb {R} }$ auch $\{Z=x\}=\{\omega \in \Omega ;\ Z(\omega )=x\}\quad {\text{und}}\quad P\left(Z=x\right)=P\left(\{Z=x\}\right)=P\left(\{\omega \in \Omega ;\ Z(\omega )=x\}\right)$ (Man beachte, dass ${\textstyle \{Z=x\}=\emptyset }$ und folglich ${\textstyle P(Z=x)=0}$ ist, falls ${\textstyle x\notin Z(\Omega )}$ ist.) Um eine diskrete ZV ${\textstyle Z}$ zu untersuchen, kann man oft auf eine Beschreibung des W-Raumes ${\textstyle (\Omega ,P)}$ verzichten und nur das Bild ${\textstyle Z(\Omega )}$ sowie die Wahrscheinlichkeiten ${\textstyle P(Z=x)}$ für ${\textstyle x\in Z(\Omega )}$ angeben. Zusammen nennt man dies die Wahrscheinlichkeitsverteilung (W-Verteilung) von ${\textstyle \mathbf {Z} }$ . Es gilt stets: ${\textstyle \quad \sum \limits _{x\in Z(\omega )}P(Z=x)=1}$
(Eine Beschreibung des W-Raumes kann aber manchmal helfen, um die Wahrscheinlichkeiten ${\textstyle P(Z=x)}$ überhaupt zu bestimmen.)

Anmerkung:

Wahrschienlichkeitsverteilungen, unabhängig davon, ob sie stetig oder diskret sind, sind immer Modelle, welche die Realität mehr oder weniger gut abbilden.

Beispiel

- Die ZV ${\textstyle X}$ gibt die Augenzahl eines Würfels an. Dann hat man ${\textstyle \Omega =\{1,\ldots ,6\}}$ und ${\textstyle X(i)=i\ {\text{für alle}}\ i\in \Omega }$ . Also: ${\textstyle X(\Omega )=\{1,\ldots ,6\}}$ und $P(X=1)={\frac {1}{6}},\quad P(X=2)={\frac {1}{6}},\quad P(X=3)={\frac {1}{6}},$ $P(X=4)={\frac {1}{6}},\quad P(X=5)={\frac {1}{6}},\quad P(X=6)={\frac {1}{6}}.$
- Die ZV ${\textstyle Y}$ gibt die das Quadrat der Augenzahl eines Würfels an. Dann hat man ${\textstyle \Omega =\{1,\ldots ,6\}}$ und ${\textstyle Y(i)=i^{2}\ {\text{für alle}}\ i\in \Omega }$ . Also: ${\textstyle Y(\Omega )=\{1,4,9,16,25,36\}}$ und $P(Y=1)={\frac {1}{6}},\quad P(Y=4)={\frac {1}{6}},\quad P(Y=9)={\frac {1}{6}},$ $P(Y=16)={\frac {1}{6}},\quad P(Y=25)={\frac {1}{6}},\quad P(Y=36)={\frac {1}{6}}.$
- Die ZV ${\textstyle Z}$ beschreibt die Augensumme zweier Würfel. Dann hat man ${\textstyle \Omega =\{1,\ldots ,6\}^{2}}$ und ${\textstyle Z((i,j))=i+j\ {\text{für alle}}\ (i,j)\in \Omega }$ . Also: ${\textstyle Z(\Omega )=\{2,\ldots ,12\}}$ und ${\begin{array}{|rclcl|}\hline P(Z=2)&=&P\left(\{(1,1)\}\right)&=&{\frac {1}{36}}\\P(Z=3)&=&P\left(\{(1,2),(2,1)\}\right)&=&{\frac {2}{36}}\\P(Z=4)&=&P\left(\{(1,3),(2,2),(3,1)\}\right)&=&{\frac {3}{36}}\\P(Z=5)&=&P\left(\{(1,4),(2,3),(3,2),(4,1)\}\right)&=&{\frac {4}{36}}\\P(Z=6)&=&P\left(\{(1,5),(2,4),(3,3),(4,2),(5,1)\}\right)&=&{\frac {5}{36}}\\P(Z=7)&=&P\left(\{(1,6),(2,5),(3,4),(4,3),(5,2),(6,1)\}\right)&=&{\frac {6}{36}}\\P(Z=8)&=&P\left(\{(2,6),(3,5),(4,4),(5,3),(6,2)\}\right)&=&{\frac {5}{36}}\\P(Z=9)&=&P\left(\{(3,6),(4,5),(5,4),(6,3)\}\right)&=&{\frac {4}{36}}\\P(Z=10)&=&P\left(\{(4,6),(4,5),(6,4)\}\right)&=&{\frac {3}{36}}\\P(Z=11)&=&P\left(\{(5,6),(6,5)\}\right)&=&{\frac {2}{36}}\\P(Z=12)&=&P\left(\{(6,6)\}\right)&=&{\frac {1}{36}}\\\hline \end{array}}$
Bei einem Glücksspiel befinden sich ${\textstyle 1}$ rote, ${\textstyle 4}$ schwarze und ${\textstyle 15}$ weiße Kugeln in einer Lostrommel.
- Man darf eine Kugel ziehen. Zieht man die Rote gewinnt man ${\textstyle 20}$ Euro, zieht man eine Schwarze gewinnt man ${\textstyle 5}$ Euro, zieht man eine Weiße gewinnt man nichts. Die ZV ${\textstyle G}$ , die den Gewinn beschreibt, hat als Bild ${\textstyle G(\Omega )=\{0,5,20\}}$ und es gilt: $P(G=0)={\frac {15}{20}}=0.75,\quad P(G=5)={\frac {4}{20}}=0.2,\quad P(G=20)={\frac {1}{20}}=0.05$
- Nun darf man zwei Kugeln mit Zurücklegen ziehen. Die ZV ${\textstyle G_{2}}$ beschreibt den Gesamtgewinn. Man berechnet ${\textstyle G_{2}(\Omega )=\{0,5,10,20,25,40\}}$ und: ${\begin{array}{|c|c|c|}\hline P(G_{2}=0)={\frac {225}{400}}=0.5625&P(G_{2}=5)={\frac {120}{400}}=0.3&P(G_{2}=10)={\frac {16}{400}}=0.04\\\hline P(G_{2}=20)={\frac {30}{400}}=0.075&P(G_{2}=25)={\frac {8}{400}}=0.02&P(G_{2}=40)={\frac {1}{400}}=0.0025\\\hline \end{array}}$
- Nun darf man zwei Kugeln ohne Zurücklegen ziehen. Die ZV ${\textstyle {\tilde {G_{2}}}}$ beschreibt den Gesamtgewinn. Man berechnet ${\textstyle {\tilde {G_{2}}}(\Omega )=\{0,5,10,20,25\}}$ und: ${\begin{array}{|c|c|c|}\hline P({\tilde {G_{2}}}=0)={\frac {210}{380}}=0.5526&P({\tilde {G_{2}}}=5)={\frac {120}{380}}=0.3158&P({\tilde {G_{2}}}=10)={\frac {12}{380}}=0.0316\\\hline P({\tilde {G_{2}}}=20)={\frac {30}{380}}=0.0789&P({\tilde {G_{2}}}=25)={\frac {8}{380}}=0.0211&\\\hline \end{array}}$
(Die angegebenen Wahrscheinlichkeiten können durch die Aufstellung eines geeigneten W-Raums bestimmt werden, man kann aber auch anders vorgehen, z.B. mittels Erstellung von Baumdiagrammen.)

Erwartungswert und Standardabweichung einer diskreten ZV

Sei ${\textstyle (\Omega ,P)}$ ein endlicher oder abzählbarer W-Raum und ${\textstyle Z:\Omega \to \mathbb {R} }$ eine (diskrete) ZV auf ${\textstyle \Omega }$ . Dann hei"sen:

${\begin{array}{rcll}\mu _{Z}=E(Z)&=&\sum \limits _{x\in Z(\Omega )}P(Z=x)\cdot x&{\text{Erwartungswert von }}Z\\V(Z)&=&\sum \limits _{x\in Z(\Omega )}P(Z=x)\cdot \left(x-E(Z)\right)^{2}&{\text{Varianz von }}Z\\\sigma _{Z}&=&{\sqrt {V(Z)}}&{\text{Standardabweichung von }}Z\end{array}}$

Verschiebungssatz

Für die Varianz gilt ebenso wie für die empirische Varianz der Verschiebungssatz: Für eine endliche ZV ${\textstyle X}$ , die die Werte ${\textstyle a_{1},...,a_{m}\in \mathbb {R} }$ annehmen kann, gilt stets: $V(X)=\sum _{k=1}^{m}P(X=a_{k})\cdot a_{k}^{2}-E(X)^{2}$

Beispiel:

(vergleiche das Beispiel in 1)

Für die ZV ${\textstyle X,Y,Z}$ ${\textstyle X,Y,Z}$ gilt:
- Der Erwartungswert von ${\textstyle X}$ ist: $E(X)={\frac {1}{6}}\cdot 1+{\frac {1}{6}}\cdot 2+{\frac {1}{6}}\cdot 3+{\frac {1}{6}}\cdot 4+{\frac {1}{6}}\cdot 5+{\frac {1}{6}}\cdot 6=3.5$ Die Varianz von ${\textstyle X}$ ist: $V(X)={\frac {1}{6}}(1-3.5)^{2}+{\frac {1}{6}}(2-3.5)^{2}+{\frac {1}{6}}(3-3.5)^{2}+{\frac {1}{6}}(4-3.5)^{2}+{\frac {1}{6}}(5-3.5)^{2}+{\frac {1}{6}}(6-3.5)^{2}=2.917$ Daraus ergibt sich ${\textstyle \sigma _{X}={\sqrt {2.917}}=1.708}$ .
- Der Erwartungswert von ${\textstyle Y}$ ist: $E(Y)=\sum \limits _{x\in Y(\Omega )}P(Y=x)\cdot x={\frac {1}{6}}\cdot 1+{\frac {1}{6}}\cdot 4+{\frac {1}{6}}\cdot 9+{\frac {1}{6}}\cdot 16+{\frac {1}{6}}\cdot 25+{\frac {1}{6}}\cdot 36=15.167$ Die Varianz von ${\textstyle Y}$ ist:

${\begin{aligned}V(Y)&=&{\frac {1}{6}}(1-15.167)^{2}+{\frac {1}{6}}(4-15.167)^{2}+{\frac {1}{6}}(9-15.167)^{2}\\&+&{\frac {1}{6}}(16-15.167)^{2}+{\frac {1}{6}}(25-15.167)^{2}+{\frac {1}{6}}(36-15.167)^{2}\\&=&149.14\end{aligned}}$ Daraus ergibt sich ${\textstyle \sigma _{Y}={\sqrt {149.14}}=12.212}$ .

- Der Erwartungswert von ${\textstyle Z}$ ist: $E(Z)={\frac {1}{36}}\cdot 2+{\frac {2}{36}}\cdot 3+{\frac {3}{36}}\cdot 4+{\frac {4}{36}}\cdot 5+{\frac {5}{36}}\cdot 6+{\frac {6}{36}}\cdot 7+{\frac {5}{36}}\cdot 8+{\frac {4}{36}}\cdot 9+{\frac {3}{36}}\cdot 10+{\frac {2}{36}}\cdot 11+{\frac {1}{36}}\cdot 12=7$ Die Varianz von ${\textstyle Z}$ ist: ${\begin{aligned}V(Z)&=&\left\{{\begin{array}{c}{\frac {1}{36}}\cdot (2-7)^{2}+{\frac {2}{36}}\cdot (3-7)^{2}+{\frac {3}{36}}\cdot (4-7)^{2}+{\frac {4}{36}}\cdot (5-7)^{2}\\+{\frac {5}{36}}\cdot (6-7)^{2}+{\frac {6}{36}}\cdot (7-7)^{2}+{\frac {5}{36}}\cdot (8-7)^{2}+{\frac {4}{36}}\cdot (9-7)^{2}\\+{\frac {3}{36}}\cdot (10-7)^{2}+{\frac {2}{36}}\cdot (11-7)^{2}+{\frac {1}{36}}\cdot (12-7)^{2}\end{array}}\right\}\\&=&5.833\end{aligned}}$ Daraus ergibt sich ${\textstyle \sigma _{Z}={\sqrt {5.833}}=2.415}$ .
F"ur die ZV ${\textstyle G,G_{2},{\tilde {G_{2}}}}$ ${\textstyle G,G_{2},{\tilde {G_{2}}}}$ gilt:
- ${\textstyle E(G)=0.75\cdot 0+0.2\cdot 5+0.05\cdot 20=2}$ ,

${\textstyle V(G)=0.75\cdot (0-2)^{2}+0.2\cdot (5-2)^{2}+0.05\cdot (20-2)^{2}=21}$

- ${\textstyle E(G_{2})=0.5625\cdot 0+0.3\cdot 5+0.04\cdot 10+0.075\cdot 20+0.02\cdot 25+0.0025\cdot 40=4}$ , ${\begin{aligned}V(G_{2})&=&0.5625\cdot (0-4)^{2}+0.3\cdot (5-4)^{2}+0.04\cdot (10-4)^{2}+0.075\cdot (20-4)^{2}\\&+&0.02\cdot (25-4)^{2}+0.0025\cdot (40-4)^{2}=42\end{aligned}}$
- ${\textstyle E({\tilde {G_{2}}})=0.5526\cdot 0+0.3158\cdot 5+0.0316\cdot 10+0.0789\cdot 20+0.0211\cdot 25=4}$ , ${\begin{aligned}V({\tilde {G_{2}}})&=&0.5526\cdot (0-4)^{2}+0.3158\cdot (5-4)^{2}+0.00316\cdot (10-4)^{2}+0.0789\cdot (20-4)^{2}\\&+&0.0211\cdot (25-4)^{2}=39.79\end{aligned}}$

Der Erwartungswert gibt den im Durchschnitt zu erwartenden Wert einer ZV an, die Varianz gibt die im Durchschnitt zu erwartende quadratische Abweichung vom Erwartungswert an. Die Standardabweichung ist ein Maß für die zu erwartende Schwankung (Streuung).

Verknüpfung diskreter ZV

Sei ${\textstyle (\Omega ,P)}$ ein W-Raum, ${\textstyle X,Y:\Omega \to \mathbb {R} }$ ZV auf ${\textstyle \Omega }$ und ${\textstyle a,b\in \mathbb {R} ,\ n\in \mathbb {N} }$ . Dann erhält man weitere ZV auf ${\textstyle \Omega }$ durch $a\cdot X+b:\Omega \to \mathbb {R} ,\ \omega \mapsto a\cdot X(\omega )+b,$ $X^{n}:\Omega \to \mathbb {R} ,\ \omega \mapsto X(\omega )^{n}$ $X+Y:\Omega \to \mathbb {R} ,\ \omega \mapsto X(\omega )+Y(\omega ),$ $X\cdot Y:\Omega \to \mathbb {R} ,\ \omega \mapsto X(\omega )\cdot Y(\omega ),$ $X-Y:\Omega \to \mathbb {R} ,\ \omega \mapsto X(\omega )-Y(\omega ),$ ${\text{(weitere Verknüpfungen von ZV sind denkbar)}}$

Gemeinsame Verteilung zweier endlicher ZV und Unabhängigkeit

(Gemeinsame W-Funktion zweier endlicher ZV)
Gegeben seien zwei endliche ZV ${\textstyle X,Y,}$ wobei ${\textstyle X}$ die Werte ${\textstyle a_{1},\ldots ,a_{m}}$ und ${\textstyle Y}$ die Werte ${\textstyle b_{1},\ldots ,b_{\ell }}$ annehmen kann.

Die Funktion { a 1 , … , a m } × { b 1 , … , b ℓ } → [ 0 , 1 ] , ( a j , b k ) ↦ P ( X = a j ∧ Y = b k ) {\displaystyle \{a_{1},\ldots ,a_{m}\}\times \{b_{1},\ldots ,b_{\ell }\}\to [0,1]\ ,\ (a_{j},b_{k})\mapsto P(X=a_{j}\wedge Y=b_{k})} hei"st gemeinsame Wahrscheinlichkeitsfunktion von X {\textstyle X} und Y . {\textstyle Y.} Man kann sie "ubersichtlich in Form einer Tabelle darstellen, wobei die möglichen Werte a 1 , … , a m {\textstyle a_{1},\ldots ,a_{m}} für X {\textstyle X} zu den einzelnen Spalten und die möglichen Werte b 1 , … , b ℓ {\textstyle b_{1},\ldots ,b_{\ell }} für Y {\textstyle Y} zu den einzelnen Zeilen gehören. In die Spalte zu a j {\textstyle a_{j}} und die Zeile zu b k {\textstyle b_{k}} trägt man dann die Wahrscheinlichkeit P ( X = a j ∧ Y = b k ) {\textstyle P(X=a_{j}\wedge Y=b_{k})} ein.

Beispiel:

Zwei Laplace-Würfel werden geworfen. Die ZV X {\textstyle X} gibt die Zahl auf dem ersten und die ZV Y {\textstyle Y} gibt die Zahl auf dem zweiten Würfel an. Die gemeinsame W-Funktion sieht wie folgt aus: b 1 = 1 b 2 = 2 b 3 = 3 b 4 = 4 b 5 = 5 b 6 = 6 Summe P ( X = 1 ∧ Y = 1 ) P ( X = 1 ∧ Y = 2 ) P ( X = 1 ∧ Y = 3 ) P ( X = 1 ∧ Y = 4 ) P ( X = 1 ∧ Y = 5 ) P ( X = 1 ∧ Y = 6 ) P ( X = 1 ) a 1 = 1 ∥ ∥ ∥ ∥ ∥ ∥ ∥ 1 36 1 36 1 36 1 36 1 36 1 36 1 6 P ( X = 2 ∧ Y = 1 ) P ( X = 2 ∧ Y = 2 ) P ( X = 2 ∧ Y = 3 ) P ( X = 2 ∧ Y = 4 ) P ( X = 2 ∧ Y = 5 ) P ( X = 2 ∧ Y = 6 ) P ( X = 2 ) a 2 = 2 ∥ ∥ ∥ ∥ ∥ ∥ ∥ 1 36 1 36 1 36 1 36 1 36 1 36 1 6 P ( X = 3 ∧ Y = 1 ) P ( X = 3 ∧ Y = 2 ) P ( X = 3 ∧ Y = 3 ) P ( X = 3 ∧ Y = 4 ) P ( X = 3 ∧ Y = 5 ) P ( X = 3 ∧ Y = 6 ) P ( X = 3 ) a 3 = 3 ∥ ∥ ∥ ∥ ∥ ∥ ∥ 1 36 1 36 1 36 1 36 1 36 1 36 1 6 P ( X = 4 ∧ Y = 1 ) P ( X = 4 ∧ Y = 2 ) P ( X = 4 ∧ Y = 3 ) P ( X = 4 ∧ Y = 4 ) P ( X = 4 ∧ Y = 5 ) P ( X = 4 ∧ Y = 6 ) P ( X = 4 ) a 4 = 4 ∥ ∥ ∥ ∥ ∥ ∥ ∥ 1 36 1 36 1 36 1 36 1 36 1 36 1 6 P ( X = 5 ∧ Y = 1 ) P ( X = 5 ∧ Y = 2 ) P ( X = 5 ∧ Y = 3 ) P ( X = 5 ∧ Y = 4 ) P ( X = 5 ∧ Y = 5 ) P ( X = 5 ∧ Y = 6 ) P ( X = 5 ) a 5 = 5 ∥ ∥ ∥ ∥ ∥ ∥ ∥ 1 36 1 36 1 36 1 36 1 36 1 36 1 6 P ( X = 6 ∧ Y = 1 ) P ( X = 6 ∧ Y = 2 ) P ( X = 6 ∧ Y = 3 ) P ( X = 6 ∧ Y = 4 ) P ( X = 6 ∧ Y = 5 ) P ( X = 6 ∧ Y = 6 ) P ( X = 6 ) a 6 = 6 ∥ ∥ ∥ ∥ ∥ ∥ ∥ 1 36 1 36 1 36 1 36 1 36 1 36 1 6 P ( Y = 1 ) P ( Y = 2 ) P ( Y = 3 ) P ( Y = 4 ) P ( Y = 5 ) P ( Y = 6 ) Summe ∥ ∥ ∥ ∥ ∥ ∥ 1 6 1 6 1 6 1 6 1 6 1 6 1 {\displaystyle {\begin{array}{|c||c|c|c|c|c|c||c|}\hline &b_{1}=1&b_{2}=2&b_{3}=3&b_{4}=4&b_{5}=5&b_{6}=6&{\text{Summe}}\\\hline \hline &P(X=1\wedge Y=1)&P(X=1\wedge Y=2)&P(X=1\wedge Y=3)&P(X=1\wedge Y=4)&P(X=1\wedge Y=5)&P(X=1\wedge Y=6)&P(X=1)\\a_{1}=1&\parallel &\parallel &\parallel &\parallel &\parallel &\parallel &\parallel \\&{\frac {1}{36}}&{\frac {1}{36}}&{\frac {1}{36}}&{\frac {1}{36}}&{\frac {1}{36}}&{\frac {1}{36}}&{\frac {1}{6}}\\\hline &P(X=2\wedge Y=1)&P(X=2\wedge Y=2)&P(X=2\wedge Y=3)&P(X=2\wedge Y=4)&P(X=2\wedge Y=5)&P(X=2\wedge Y=6)&P(X=2)\\a_{2}=2&\parallel &\parallel &\parallel &\parallel &\parallel &\parallel &\parallel \\&{\frac {1}{36}}&{\frac {1}{36}}&{\frac {1}{36}}&{\frac {1}{36}}&{\frac {1}{36}}&{\frac {1}{36}}&{\frac {1}{6}}\\\hline &P(X=3\wedge Y=1)&P(X=3\wedge Y=2)&P(X=3\wedge Y=3)&P(X=3\wedge Y=4)&P(X=3\wedge Y=5)&P(X=3\wedge Y=6)&P(X=3)\\a_{3}=3&\parallel &\parallel &\parallel &\parallel &\parallel &\parallel &\parallel \\&{\frac {1}{36}}&{\frac {1}{36}}&{\frac {1}{36}}&{\frac {1}{36}}&{\frac {1}{36}}&{\frac {1}{36}}&{\frac {1}{6}}\\\hline &P(X=4\wedge Y=1)&P(X=4\wedge Y=2)&P(X=4\wedge Y=3)&P(X=4\wedge Y=4)&P(X=4\wedge Y=5)&P(X=4\wedge Y=6)&P(X=4)\\a_{4}=4&\parallel &\parallel &\parallel &\parallel &\parallel &\parallel &\parallel \\&{\frac {1}{36}}&{\frac {1}{36}}&{\frac {1}{36}}&{\frac {1}{36}}&{\frac {1}{36}}&{\frac {1}{36}}&{\frac {1}{6}}\\\hline &P(X=5\wedge Y=1)&P(X=5\wedge Y=2)&P(X=5\wedge Y=3)&P(X=5\wedge Y=4)&P(X=5\wedge Y=5)&P(X=5\wedge Y=6)&P(X=5)\\a_{5}=5&\parallel &\parallel &\parallel &\parallel &\parallel &\parallel &\parallel \\&{\frac {1}{36}}&{\frac {1}{36}}&{\frac {1}{36}}&{\frac {1}{36}}&{\frac {1}{36}}&{\frac {1}{36}}&{\frac {1}{6}}\\\hline &P(X=6\wedge Y=1)&P(X=6\wedge Y=2)&P(X=6\wedge Y=3)&P(X=6\wedge Y=4)&P(X=6\wedge Y=5)&P(X=6\wedge Y=6)&P(X=6)\\a_{6}=6&\parallel &\parallel &\parallel &\parallel &\parallel &\parallel &\parallel \\&{\frac {1}{36}}&{\frac {1}{36}}&{\frac {1}{36}}&{\frac {1}{36}}&{\frac {1}{36}}&{\frac {1}{36}}&{\frac {1}{6}}\\\hline \hline &P(Y=1)&P(Y=2)&P(Y=3)&P(Y=4)&P(Y=5)&P(Y=6)&\\{\text{Summe}}&\parallel &\parallel &\parallel &\parallel &\parallel &\parallel &\\&{\frac {1}{6}}&{\frac {1}{6}}&{\frac {1}{6}}&{\frac {1}{6}}&{\frac {1}{6}}&{\frac {1}{6}}&1\\\hline \end{array}}}

Ein Laplace-Würfel, bei dem sich die Augenzahlen 1 {\textstyle 1} und 6 {\textstyle 6} , sowie 2 {\textstyle 2} und 5 {\textstyle 5} sowie 3 {\textstyle 3} und 4 {\textstyle 4} gegenüberliegen, wird geworfen. Die ZV X {\textstyle X} gibt die Zahl auf der Oberseite und die ZV Y {\textstyle Y} gibt die Zahl auf der Unterseite des Würfels an. Die gemeinsame W-Funktion sieht wie folgt aus: b 1 = 1 b 2 = 2 b 3 = 3 b 4 = 4 b 5 = 5 b 6 = 6 Summe P ( X = 1 ∧ Y = 1 ) P ( X = 1 ∧ Y = 2 ) P ( X = 1 ∧ Y = 3 ) P ( X = 1 ∧ Y = 4 ) P ( X = 1 ∧ Y = 5 ) P ( X = 1 ∧ Y = 6 ) P ( X = 1 ) a 1 = 1 ∥ ∥ ∥ ∥ ∥ ∥ ∥ 0 0 0 0 0 1 6 1 6 P ( X = 2 ∧ Y = 1 ) P ( X = 2 ∧ Y = 2 ) P ( X = 2 ∧ Y = 3 ) P ( X = 2 ∧ Y = 4 ) P ( X = 2 ∧ Y = 5 ) P ( X = 2 ∧ Y = 6 ) P ( X = 2 ) a 2 = 2 ∥ ∥ ∥ ∥ ∥ ∥ ∥ 0 0 0 0 1 6 0 1 6 P ( X = 3 ∧ Y = 1 ) P ( X = 3 ∧ Y = 2 ) P ( X = 3 ∧ Y = 3 ) P ( X = 3 ∧ Y = 4 ) P ( X = 3 ∧ Y = 5 ) P ( X = 3 ∧ Y = 6 ) P ( X = 3 ) a 3 = 3 ∥ ∥ ∥ ∥ ∥ ∥ ∥ 0 0 0 1 6 0 0 1 6 P ( X = 4 ∧ Y = 1 ) P ( X = 4 ∧ Y = 2 ) P ( X = 4 ∧ Y = 3 ) P ( X = 4 ∧ Y = 4 ) P ( X = 4 ∧ Y = 5 ) P ( X = 4 ∧ Y = 6 ) P ( X = 4 ) a 4 = 4 ∥ ∥ ∥ ∥ ∥ ∥ ∥ 0 0 1 6 0 0 0 1 6 P ( X = 5 ∧ Y = 1 ) P ( X = 5 ∧ Y = 2 ) P ( X = 5 ∧ Y = 3 ) P ( X = 5 ∧ Y = 4 ) P ( X = 5 ∧ Y = 5 ) P ( X = 5 ∧ Y = 6 ) P ( X = 5 ) a 5 = 5 ∥ ∥ ∥ ∥ ∥ ∥ ∥ 0 1 6 0 0 0 0 1 6 P ( X = 6 ∧ Y = 1 ) P ( X = 6 ∧ Y = 2 ) P ( X = 6 ∧ Y = 3 ) P ( X = 6 ∧ Y = 4 ) P ( X = 6 ∧ Y = 5 ) P ( X = 6 ∧ Y = 6 ) P ( X = 6 ) a 6 = 6 ∥ ∥ ∥ ∥ ∥ ∥ ∥ 1 6 0 0 0 0 0 1 6 P ( Y = 1 ) P ( Y = 2 ) P ( Y = 3 ) P ( Y = 4 ) P ( Y = 5 ) P ( Y = 6 ) Summe ∥ ∥ ∥ ∥ ∥ ∥ 1 6 1 6 1 6 1 6 1 6 1 6 1 {\displaystyle {\begin{array}{|c||c|c|c|c|c|c||c|}\hline &b_{1}=1&b_{2}=2&b_{3}=3&b_{4}=4&b_{5}=5&b_{6}=6&{\text{Summe}}\\\hline \hline &P(X=1\wedge Y=1)&P(X=1\wedge Y=2)&P(X=1\wedge Y=3)&P(X=1\wedge Y=4)&P(X=1\wedge Y=5)&P(X=1\wedge Y=6)&P(X=1)\\a_{1}=1&\parallel &\parallel &\parallel &\parallel &\parallel &\parallel &\parallel \\&0&0&0&0&0&{\frac {1}{6}}&{\frac {1}{6}}\\\hline &P(X=2\wedge Y=1)&P(X=2\wedge Y=2)&P(X=2\wedge Y=3)&P(X=2\wedge Y=4)&P(X=2\wedge Y=5)&P(X=2\wedge Y=6)&P(X=2)\\a_{2}=2&\parallel &\parallel &\parallel &\parallel &\parallel &\parallel &\parallel \\&0&0&0&0&{\frac {1}{6}}&0&{\frac {1}{6}}\\\hline &P(X=3\wedge Y=1)&P(X=3\wedge Y=2)&P(X=3\wedge Y=3)&P(X=3\wedge Y=4)&P(X=3\wedge Y=5)&P(X=3\wedge Y=6)&P(X=3)\\a_{3}=3&\parallel &\parallel &\parallel &\parallel &\parallel &\parallel &\parallel \\&0&0&0&{\frac {1}{6}}&0&0&{\frac {1}{6}}\\\hline &P(X=4\wedge Y=1)&P(X=4\wedge Y=2)&P(X=4\wedge Y=3)&P(X=4\wedge Y=4)&P(X=4\wedge Y=5)&P(X=4\wedge Y=6)&P(X=4)\\a_{4}=4&\parallel &\parallel &\parallel &\parallel &\parallel &\parallel &\parallel \\&0&0&{\frac {1}{6}}&0&0&0&{\frac {1}{6}}\\\hline &P(X=5\wedge Y=1)&P(X=5\wedge Y=2)&P(X=5\wedge Y=3)&P(X=5\wedge Y=4)&P(X=5\wedge Y=5)&P(X=5\wedge Y=6)&P(X=5)\\a_{5}=5&\parallel &\parallel &\parallel &\parallel &\parallel &\parallel &\parallel \\&0&{\frac {1}{6}}&0&0&0&0&{\frac {1}{6}}\\\hline &P(X=6\wedge Y=1)&P(X=6\wedge Y=2)&P(X=6\wedge Y=3)&P(X=6\wedge Y=4)&P(X=6\wedge Y=5)&P(X=6\wedge Y=6)&P(X=6)\\a_{6}=6&\parallel &\parallel &\parallel &\parallel &\parallel &\parallel &\parallel \\&{\frac {1}{6}}&0&0&0&0&0&{\frac {1}{6}}\\\hline \hline &P(Y=1)&P(Y=2)&P(Y=3)&P(Y=4)&P(Y=5)&P(Y=6)&\\{\text{Summe}}&\parallel &\parallel &\parallel &\parallel &\parallel &\parallel &\\&{\frac {1}{6}}&{\frac {1}{6}}&{\frac {1}{6}}&{\frac {1}{6}}&{\frac {1}{6}}&{\frac {1}{6}}&1\\\hline \end{array}}}

Ein Laplace-Würfel, bei dem sich die Augenzahlen 1 {\textstyle 1} und 6 {\textstyle 6} , sowie 2 {\textstyle 2} und 5 {\textstyle 5} sowie 3 {\textstyle 3} und 4 {\textstyle 4} gegenüberliegen, wird geworfen. Die ZV X {\textstyle X} gibt die Zahl auf der Oberseite und die ZV Y {\textstyle Y} gibt die Zahl auf der Vorderseite des Würfels an. Die gemeinsame W-Funktion sieht wie folgt aus: b 1 = 1 b 2 = 2 b 3 = 3 b 4 = 4 b 5 = 5 b 6 = 6 Summe P ( X = 1 ∧ Y = 1 ) P ( X = 1 ∧ Y = 2 ) P ( X = 1 ∧ Y = 3 ) P ( X = 1 ∧ Y = 4 ) P ( X = 1 ∧ Y = 5 ) P ( X = 1 ∧ Y = 6 ) P ( X = 1 ) a 1 = 1 ∥ ∥ ∥ ∥ ∥ ∥ ∥ 0 1 24 1 24 1 24 1 24 0 1 6 P ( X = 2 ∧ Y = 1 ) P ( X = 2 ∧ Y = 2 ) P ( X = 2 ∧ Y = 3 ) P ( X = 2 ∧ Y = 4 ) P ( X = 2 ∧ Y = 5 ) P ( X = 2 ∧ Y = 6 ) P ( X = 2 ) a 2 = 2 ∥ ∥ ∥ ∥ ∥ ∥ ∥ 1 24 0 1 24 1 24 0 1 24 1 6 P ( X = 3 ∧ Y = 1 ) P ( X = 3 ∧ Y = 2 ) P ( X = 3 ∧ Y = 3 ) P ( X = 3 ∧ Y = 4 ) P ( X = 3 ∧ Y = 5 ) P ( X = 3 ∧ Y = 6 ) P ( X = 3 ) a 3 = 3 ∥ ∥ ∥ ∥ ∥ ∥ ∥ 1 24 1 24 0 0 1 24 1 24 1 6 P ( X = 4 ∧ Y = 1 ) P ( X = 4 ∧ Y = 2 ) P ( X = 4 ∧ Y = 3 ) P ( X = 4 ∧ Y = 4 ) P ( X = 4 ∧ Y = 5 ) P ( X = 4 ∧ Y = 6 ) P ( X = 4 ) a 4 = 4 ∥ ∥ ∥ ∥ ∥ ∥ ∥ 1 24 1 24 0 0 1 24 1 24 1 6 P ( X = 5 ∧ Y = 1 ) P ( X = 5 ∧ Y = 2 ) P ( X = 5 ∧ Y = 3 ) P ( X = 5 ∧ Y = 4 ) P ( X = 5 ∧ Y = 5 ) P ( X = 5 ∧ Y = 6 ) P ( X = 5 ) a 5 = 5 ∥ ∥ ∥ ∥ ∥ ∥ ∥ 1 24 0 1 24 1 24 0 1 24 1 6 P ( X = 6 ∧ Y = 1 ) P ( X = 6 ∧ Y = 2 ) P ( X = 6 ∧ Y = 3 ) P ( X = 6 ∧ Y = 4 ) P ( X = 6 ∧ Y = 5 ) P ( X = 6 ∧ Y = 6 ) P ( X = 6 ) a 6 = 6 ∥ ∥ ∥ ∥ ∥ ∥ ∥ 0 1 24 1 24 1 24 1 24 0 1 6 P ( Y = 1 ) P ( Y = 2 ) P ( Y = 3 ) P ( Y = 4 ) P ( Y = 5 ) P ( Y = 6 ) Summe ∥ ∥ ∥ ∥ ∥ ∥ 1 6 1 6 1 6 1 6 1 6 1 6 1 {\displaystyle {\begin{array}{|c||c|c|c|c|c|c||c|}\hline &b_{1}=1&b_{2}=2&b_{3}=3&b_{4}=4&b_{5}=5&b_{6}=6&{\text{Summe}}\\\hline \hline &P(X=1\wedge Y=1)&P(X=1\wedge Y=2)&P(X=1\wedge Y=3)&P(X=1\wedge Y=4)&P(X=1\wedge Y=5)&P(X=1\wedge Y=6)&P(X=1)\\a_{1}=1&\parallel &\parallel &\parallel &\parallel &\parallel &\parallel &\parallel \\&0&{\frac {1}{24}}&{\frac {1}{24}}&{\frac {1}{24}}&{\frac {1}{24}}&0&{\frac {1}{6}}\\\hline &P(X=2\wedge Y=1)&P(X=2\wedge Y=2)&P(X=2\wedge Y=3)&P(X=2\wedge Y=4)&P(X=2\wedge Y=5)&P(X=2\wedge Y=6)&P(X=2)\\a_{2}=2&\parallel &\parallel &\parallel &\parallel &\parallel &\parallel &\parallel \\&{\frac {1}{24}}&0&{\frac {1}{24}}&{\frac {1}{24}}&0&{\frac {1}{24}}&{\frac {1}{6}}\\\hline &P(X=3\wedge Y=1)&P(X=3\wedge Y=2)&P(X=3\wedge Y=3)&P(X=3\wedge Y=4)&P(X=3\wedge Y=5)&P(X=3\wedge Y=6)&P(X=3)\\a_{3}=3&\parallel &\parallel &\parallel &\parallel &\parallel &\parallel &\parallel \\&{\frac {1}{24}}&{\frac {1}{24}}&0&0&{\frac {1}{24}}&{\frac {1}{24}}&{\frac {1}{6}}\\\hline &P(X=4\wedge Y=1)&P(X=4\wedge Y=2)&P(X=4\wedge Y=3)&P(X=4\wedge Y=4)&P(X=4\wedge Y=5)&P(X=4\wedge Y=6)&P(X=4)\\a_{4}=4&\parallel &\parallel &\parallel &\parallel &\parallel &\parallel &\parallel \\&{\frac {1}{24}}&{\frac {1}{24}}&0&0&{\frac {1}{24}}&{\frac {1}{24}}&{\frac {1}{6}}\\\hline &P(X=5\wedge Y=1)&P(X=5\wedge Y=2)&P(X=5\wedge Y=3)&P(X=5\wedge Y=4)&P(X=5\wedge Y=5)&P(X=5\wedge Y=6)&P(X=5)\\a_{5}=5&\parallel &\parallel &\parallel &\parallel &\parallel &\parallel &\parallel \\&{\frac {1}{24}}&0&{\frac {1}{24}}&{\frac {1}{24}}&0&{\frac {1}{24}}&{\frac {1}{6}}\\\hline &P(X=6\wedge Y=1)&P(X=6\wedge Y=2)&P(X=6\wedge Y=3)&P(X=6\wedge Y=4)&P(X=6\wedge Y=5)&P(X=6\wedge Y=6)&P(X=6)\\a_{6}=6&\parallel &\parallel &\parallel &\parallel &\parallel &\parallel &\parallel \\&0&{\frac {1}{24}}&{\frac {1}{24}}&{\frac {1}{24}}&{\frac {1}{24}}&0&{\frac {1}{6}}\\\hline \hline &P(Y=1)&P(Y=2)&P(Y=3)&P(Y=4)&P(Y=5)&P(Y=6)&\\{\text{Summe}}&\parallel &\parallel &\parallel &\parallel &\parallel &\parallel &\\&{\frac {1}{6}}&{\frac {1}{6}}&{\frac {1}{6}}&{\frac {1}{6}}&{\frac {1}{6}}&{\frac {1}{6}}&1\\\hline \end{array}}}

Es gilt stets: Für alle j ∈ { 1 , … , m } : ∑ k = 1 ℓ P ( X = a j ∧ Y = b k ) = P ( X = a j ) (Spaltensummen) Für alle k ∈ { 1 , … , ℓ } : ∑ j = 1 m P ( X = a j ∧ Y = b k ) = P ( Y = b k ) (Zeilensummen) ∑ j = 1 m ∑ k = 1 ℓ P ( X = a j ∧ Y = b k ) = 1 (Gesamtsumme) {\displaystyle {\begin{array}{rcrcll}{\text{Für alle}}\ j\in \{1,\ldots ,m\}&:&\sum \limits _{k=1}^{\ell }P(X=a_{j}\wedge Y=b_{k})&=&P(X=a_{j})&{\text{(Spaltensummen)}}\\{\text{Für alle}}\ k\in \{1,\ldots ,\ell \}&:&\sum \limits _{j=1}^{m}P(X=a_{j}\wedge Y=b_{k})&=&P(Y=b_{k})&{\text{(Zeilensummen)}}\\&&\sum \limits _{j=1}^{m}\sum \limits _{k=1}^{\ell }P(X=a_{j}\wedge Y=b_{k})&=&1&{\text{(Gesamtsumme)}}\end{array}}}
Definitionsgemäß {\textstyle \;} sind X {\textstyle X} und Y {\textstyle Y} unabhängig voneinander, falls für alle j ∈ { 1 , … , m } {\textstyle j\in \{1,\ldots ,m\}} und alle k ∈ { 1 , … , ℓ } {\textstyle k\in \{1,\ldots ,\ell \}} die Ereignisse { X = a j } {\textstyle \{X=a_{j}\}} und { Y = b k } {\textstyle \{Y=b_{k}\}} stochastisch unabhängig voneinander sind, das heißt, falls gilt: P ( X = a j ∧ Y = b k ) = P ( X = a j ) ⋅ P ( Y = b k ) {\displaystyle P(X=a_{j}\wedge Y=b_{k})=P(X=a_{j})\cdot P(Y=b_{k})} für alle j ∈ { 1 , … , m } und alle k ∈ { 1 , … , ℓ } {\displaystyle {\text{für alle}}\ j\in \{1,\ldots ,m\}\ {\text{und alle}}\ k\in \{1,\ldots ,\ell \}}

Beispiel:

Die Zahlen X {\textstyle X} und Y {\textstyle Y} auf zwei verschiedenen Laplace-Würfeln sind unabhängig voneinander.

Die Zahl X {\textstyle X} auf der Oberseite und die Zahl Y {\textstyle Y} auf der Unterseite eines Laplace-Würfels sind nicht unabhängig voneinander.

Die Zahl X {\textstyle X} auf der Oberseite und die Zahl Y {\textstyle Y} auf der Vorderseite eines Laplace-Würfels sind nicht unabhängig voneinander.

Ist X {\textstyle X} die Mathematiknote und Y {\textstyle Y} die Physiknote eines zufällig ausgewählten Schülers, so sind X {\textstyle X} und Y {\textstyle Y} wohl nicht unabhängig voneinander.

Ist X {\textstyle X} die Mathematiknote und Y {\textstyle Y} die Anzahl der Geschwister eines zufällig ausgewählten Schülers, so könnten X {\textstyle X} und Y {\textstyle Y} als unabhängig voneinander angenommen werden.

Zum Zusammenhang zwischen den einzelnen W-Funktionen und der gemeinsamen W-Funktionen:

Kennt man die gemeinsame W-Funktion zweier ZV, so kann man daraus auf die W-Funktionen der einzelnen ZV schließen.
Aus den einzelnen W-Funktion zweier ZV kann man jedoch im Allgemeinen nicht auf ihre gemeinsame Funktion schließen. (Die gemeinsame W-Funktion enth"alt also mehr Informationen als die einzelnen ZV.
Ist jedoch zusätzlich bekannt, dass zwei ZV unabhängig voneinander sind, so ergibt sich ihre gemeinsame W-Funktion als Multiplikationstabelle aus den einzelnen W-Funktionen.

Linearkombinationen und Verknüpfungen von ZV

Ist ${\textstyle X}$ eine endliche ZV und sind ${\textstyle u,v\in \mathbb {R} }$ , so ist auch ${\textstyle u\cdot X+v}$ eine endliche ZV.
Sind ${\textstyle X,Y}$ endliche ZV, so sind auch ${\textstyle X+Y,\ X-Y}$ und ${\textstyle X\cdot Y}$ endliche ZV.

Zur W-Funktion von Linearkombinationen und Verknüpfungen von ZV:

Ist X {\textstyle X} eine endliche ZV, die die Werte a 1 , … , a m {\textstyle a_{1},\ldots ,a_{m}} annehmen kann und sind u , v ∈ R {\textstyle u,v\in \mathbb {R} } mit u ≠ 0 {\textstyle u\not =0} , so kann die ZV u X + v {\textstyle uX+v} die Werte u ⋅ a 1 + v , … , u ⋅ a m + v {\textstyle u\cdot a_{1}+v,\ldots ,u\cdot a_{m}+v} annehmen und es gilt: P ( u X + v = u ⋅ a k + v ) = P ( X = a k ) für alle k = 1 , … , n {\displaystyle P(uX+v=u\cdot a_{k}+v)=P(X=a_{k})\quad {\text{für alle}}\ k=1,\ldots ,n}

Beispiel:

Ein Laplace-Würfel wird geworfen. Die ZV X {\textstyle X} gibt die Zahl auf dem Würfel an. Die ZV Y {\textstyle Y} gibt die Zahl an, die man erhält, wenn man das Würfelergebnis vervierfacht und dann 8 {\textstyle 8} abzieht, also Y = 4 ⋅ X − 8 {\textstyle Y=4\cdot X-8} .

Für die W-Funktionen von X {\textstyle X} und Y {\textstyle Y} gilt: mögl. Wert für X mögl. Wert für Y Wahrscheinlichkeit 1 4 ⋅ 1 − 8 = − 4 P ( Y = − 4 ) = P ( X = 1 ) = 1 6 2 4 ⋅ 2 − 8 = 0 P ( Y = 0 ) = P ( X = 2 ) = 1 6 3 4 ⋅ 3 − 8 = 4 P ( Y = 4 ) = P ( X = 3 ) = 1 6 4 4 ⋅ 4 − 8 = 8 P ( Y = 8 ) = P ( X = 4 ) = 1 6 5 4 ⋅ 5 − 8 = 12 P ( Y = 12 ) = P ( X = 5 ) = 1 6 6 4 ⋅ 6 − 8 = 16 P ( Y = 16 ) = P ( X = 6 ) = 1 6 {\displaystyle {\begin{array}{c|rcr|rcccl}{\text{mögl. Wert für }}X&{\text{mögl. Wert für }}Y&&&{\text{Wahrscheinlichkeit}}&&\\\hline 1&4\cdot 1-8&=&-4&P(Y=-4)&=&P(X=1)&=&{\frac {1}{6}}\\\hline 2&4\cdot 2-8&=&0&P(Y=0)&=&P(X=2)&=&{\frac {1}{6}}\\\hline 3&4\cdot 3-8&=&4&P(Y=4)&=&P(X=3)&=&{\frac {1}{6}}\\\hline 4&4\cdot 4-8&=&8&P(Y=8)&=&P(X=4)&=&{\frac {1}{6}}\\\hline 5&4\cdot 5-8&=&12&P(Y=12)&=&P(X=5)&=&{\frac {1}{6}}\\\hline 6&4\cdot 6-8&=&16&P(Y=16)&=&P(X=6)&=&{\frac {1}{6}}\end{array}}} Man berechnet daraus: E ( X ) = 3.5 und V ( X ) = 2.9167 sowie E ( Y ) = 6 und V ( Y ) = 46.6667 {\displaystyle E(X)=3.5\ {\text{und}}\ V(X)=2.9167\quad {\text{sowie}}\quad E(Y)=6\ {\text{und}}\ V(Y)=46.6667}
Seien X , Y {\textstyle X,Y} endliche ZV. Um die W-Funktion von Verknüpfungen von X {\textstyle X} und Y {\textstyle Y} zu ermitteln, muss man die gemeinsame W-Funktion von X {\textstyle X} und Y {\textstyle Y} kennen (es genügt nicht, die einzelnen W-Funktionen von X {\textstyle X} und Y {\textstyle Y} zu kennen).

Ist ⋆ {\textstyle \star } eine Verknüpfung, so ergibt sich die Wahrscheinlichkeit P ( X ⋆ Y = c ) {\textstyle P(X\star Y=c)} für c ∈ R {\textstyle c\in \mathbb {R} } als Summe der Einzelwahrscheinlichkeiten P ( X = a ∧ Y = b ) {\textstyle P(X=a\wedge Y=b)} über alle Kombinationen ( a , b ) {\textstyle (a,b)} mit a ⋆ b = c {\textstyle a\star b=c} . Also: P ( X ⋆ Y = c ) = ∑ ( a , b ) , a ⋆ b = c P ( X = a ∧ Y = b ) {\displaystyle {\text{Also:}}\quad P(X\star Y=c)=\sum \limits _{(a,b),\ a\star b=c}P(X=a\wedge Y=b)}

Beispiel:

Zwei Laplace-Würfel werden geworfen. Die ZV X {\textstyle X} gibt die Zahl auf dem ersten und die ZV Y {\textstyle Y} gibt die Zahl auf dem zweiten Würfel an. Aus der gemeinsamen W-Funktion von X {\textstyle X} und Y {\textstyle Y} (vgl. 2.1) ermittelt man die W-Funktionen von:

X + Y {\textstyle X+Y} : c 2 3 4 5 6 7 8 9 10 11 12 P ( X + Y ) = c 1 36 2 36 3 36 4 36 5 36 6 36 5 36 4 36 3 36 2 36 1 36 {\displaystyle {\begin{array}{c||c|c|c|c|c|c|c|c|c|c|c}c&2&3&4&5&6&7&8&9&10&11&12\\\hline P(X+Y)=c&{\frac {1}{36}}&{\frac {2}{36}}&{\frac {3}{36}}&{\frac {4}{36}}&{\frac {5}{36}}&{\frac {6}{36}}&{\frac {5}{36}}&{\frac {4}{36}}&{\frac {3}{36}}&{\frac {2}{36}}&{\frac {1}{36}}\end{array}}} Daraus berechnet man: E ( X + Y ) = 7 {\textstyle \quad E(X+Y)=7} und V ( X + Y ) = 5.8333 {\textstyle V(X+Y)=5.8333}

X − Y {\textstyle X-Y} : c − 5 − 4 − 3 − 2 − 1 0 1 2 3 4 5 P ( X − Y = c ) 1 36 2 36 3 36 4 36 5 36 6 36 5 36 4 36 3 36 2 36 1 36 {\displaystyle {\begin{array}{c||c|c|c|c|c|c|c|c|c|c|c}c&-5&-4&-3&-2&-1&0&1&2&3&4&5\\\hline P(X-Y=c)&{\frac {1}{36}}&{\frac {2}{36}}&{\frac {3}{36}}&{\frac {4}{36}}&{\frac {5}{36}}&{\frac {6}{36}}&{\frac {5}{36}}&{\frac {4}{36}}&{\frac {3}{36}}&{\frac {2}{36}}&{\frac {1}{36}}\end{array}}} Daraus berechnet man: E ( X − Y ) = 0 {\textstyle \quad E(X-Y)=0} und V ( X − Y ) = 5.8333 {\textstyle V(X-Y)=5.8333}

X ⋅ Y {\textstyle X\cdot Y} : c 1 2 3 4 5 6 8 9 10 P ( X ⋅ Y = c ) 1 36 2 36 2 36 3 36 2 36 4 36 2 36 1 36 2 36 {\displaystyle {\begin{array}{c||c|c|c|c|c|c|c|c|c}c&1&2&3&4&5&6&8&9&10\\\hline P(X\cdot Y=c)&{\frac {1}{36}}&{\frac {2}{36}}&{\frac {2}{36}}&{\frac {3}{36}}&{\frac {2}{36}}&{\frac {4}{36}}&{\frac {2}{36}}&{\frac {1}{36}}&{\frac {2}{36}}\end{array}}} c 12 15 16 18 20 24 25 30 36 P ( X ⋅ Y = c ) 4 36 2 36 1 36 2 36 2 36 2 36 1 36 2 36 1 36 {\displaystyle {\begin{array}{c||c|c|c|c|c|c|c|c|c}c&12&15&16&18&20&24&25&30&36\\\hline P(X\cdot Y=c)&{\frac {4}{36}}&{\frac {2}{36}}&{\frac {1}{36}}&{\frac {2}{36}}&{\frac {2}{36}}&{\frac {2}{36}}&{\frac {1}{36}}&{\frac {2}{36}}&{\frac {1}{36}}\end{array}}} Daraus berechnet man: E ( X ⋅ Y ) = 12.25 {\textstyle \quad E(X\cdot Y)=12.25}

Ein Laplace-Würfel, bei dem sich die Augenzahlen 1 {\textstyle 1} und 6 {\textstyle 6} , sowie 2 {\textstyle 2} und 5 {\textstyle 5} sowie 3 {\textstyle 3} und 4 {\textstyle 4} gegenüberliegen, wird geworfen. Die ZV X {\textstyle X} gibt die Zahl auf der Oberseite und die ZV Y {\textstyle Y} gibt die Zahl auf der Unterseite des Würfels an. Aus der gemeinsamen W-Funktion von X {\textstyle X} und Y {\textstyle Y} (vgl. 2.1) ermittelt man die W-Funktionen von:

X + Y {\textstyle X+Y} : c 7 P ( X + Y ) = c 1 {\displaystyle {\begin{array}{c||c}c&7\\\hline P(X+Y)=c&1\end{array}}} Daraus berechnet man: E ( X + Y ) = 7 {\textstyle \quad E(X+Y)=7} und V ( X + Y ) = 0 {\textstyle V(X+Y)=0}

X − Y {\textstyle X-Y} : c − 5 − 3 − 1 1 3 5 P ( X − Y = c ) 1 6 1 6 1 6 1 6 1 6 1 6 {\displaystyle {\begin{array}{c||c|c|c|c|c|c}c&-5&-3&-1&1&3&5\\\hline P(X-Y=c)&{\frac {1}{6}}&{\frac {1}{6}}&{\frac {1}{6}}&{\frac {1}{6}}&{\frac {1}{6}}&{\frac {1}{6}}\end{array}}} Daraus berechnet man: E ( X − Y ) = 0 {\textstyle \quad E(X-Y)=0} und V ( X − Y ) = 11.6667 {\textstyle V(X-Y)=11.6667}

X ⋅ Y {\textstyle X\cdot Y} : c 6 10 12 P ( X ⋅ Y = c ) 1 3 1 3 1 3 {\displaystyle {\begin{array}{c||c|c|c}c&6&10&12\\\hline P(X\cdot Y=c)&{\frac {1}{3}}&{\frac {1}{3}}&{\frac {1}{3}}\end{array}}} Daraus berechnet man: E ( X ⋅ Y ) = 9.3333 {\textstyle \quad E(X\cdot Y)=9.3333}

Ein Laplace-Würfel, bei dem sich die Augenzahlen 1 {\textstyle 1} und 6 {\textstyle 6} , sowie 2 {\textstyle 2} und 5 {\textstyle 5} sowie 3 {\textstyle 3} und 4 {\textstyle 4} gegenüberliegen, wird geworfen. Die ZV X {\textstyle X} gibt die Zahl auf der Oberseite und die ZV Y {\textstyle Y} gibt die Zahl auf der Vorderseite des Würfels an. Aus der gemeinsamen W-Funktion von X {\textstyle X} und Y {\textstyle Y} (vgl. 2.1) ermittelt man die W-Funktionen von:

X + Y {\textstyle X+Y} : c 3 4 5 6 8 9 10 11 P ( X + Y ) = c 2 24 2 24 4 24 4 24 4 24 4 24 2 24 2 24 {\displaystyle {\begin{array}{c||c|c|c|c|c|c|c|c}c&3&4&5&6&8&9&10&11\\\hline P(X+Y)=c&{\frac {2}{24}}&{\frac {2}{24}}&{\frac {4}{24}}&{\frac {4}{24}}&{\frac {4}{24}}&{\frac {4}{24}}&{\frac {2}{24}}&{\frac {2}{24}}\end{array}}} Daraus berechnet man: E ( X + Y ) = 7 {\textstyle \quad E(X+Y)=7} und V ( X + Y ) = 5.8333 {\textstyle V(X+Y)=5.8333}

X − Y {\textstyle X-Y} : c − 4 − 3 − 2 − 1 1 2 3 4 P ( X − Y ) = c 2 24 2 24 4 24 4 24 4 24 4 24 2 24 2 24 {\displaystyle {\begin{array}{c||c|c|c|c|c|c|c|c}c&-4&-3&-2&-1&1&2&3&4\\\hline P(X-Y)=c&{\frac {2}{24}}&{\frac {2}{24}}&{\frac {4}{24}}&{\frac {4}{24}}&{\frac {4}{24}}&{\frac {4}{24}}&{\frac {2}{24}}&{\frac {2}{24}}\end{array}}} Daraus berechnet man: E ( X − Y ) = 0 {\textstyle \quad E(X-Y)=0} und V ( X − Y ) = 5.8333 {\textstyle V(X-Y)=5.8333}

X ⋅ Y {\textstyle X\cdot Y} : c 2 3 4 5 6 8 12 15 18 20 24 30 P ( X ⋅ Y = c ) 2 24 2 24 2 24 2 24 2 24 2 24 2 24 2 24 2 24 2 24 2 24 2 24 {\displaystyle {\begin{array}{c||c|c|c|c|c|c|c|c|c|c|c|c}c&2&3&4&5&6&8&12&15&18&20&24&30\\\hline P(X\cdot Y=c)&{\frac {2}{24}}&{\frac {2}{24}}&{\frac {2}{24}}&{\frac {2}{24}}&{\frac {2}{24}}&{\frac {2}{24}}&{\frac {2}{24}}&{\frac {2}{24}}&{\frac {2}{24}}&{\frac {2}{24}}&{\frac {2}{24}}&{\frac {2}{24}}\end{array}}} Daraus berechnet man: E ( X ⋅ Y ) = 12.25 {\textstyle \quad E(X\cdot Y)=12.25}

Rechenregeln für Erwartungswert und Varianz

Sind ${\textstyle X,Y}$ endliche ZV und sind ${\textstyle u,v\in \mathbb {R} }$ , so gilt: ${\begin{array}{|l|l|l|}\hline {\text{stets}}&{\text{stets}}&{\text{stets}}\\E(u\cdot X+v)=u\cdot E(X)+v&V(u\cdot X+v)=u^{2}\cdot V(X)&\sigma _{u\cdot X+v}=|u|\cdot \sigma _{X}\\\hline {\text{stets}}&{\text{falls X,Y unabhängig}}&{\text{falls X,Y unabhängig}}\\E(X+Y)=E(X)+E(Y)&V(X+Y)=V(X)+V(Y)&\sigma _{X+Y}={\sqrt {{\sigma _{X}}^{2}+{\sigma _{Y}}^{2}}}\\\hline {\text{stets}}&{\text{falls X,Y unabhängig}}&{\text{falls X,Y unabhängig}}\\E(X-Y)=E(X)-E(Y)&V(X-Y)=V(X)+V(Y)&\sigma _{X-Y}={\sqrt {{\sigma _{X}}^{2}+{\sigma _{Y}}^{2}}}\\\hline {\text{falls X,Y unabhängig}}&&\\E(X\cdot Y)=E(X)\cdot E(Y)&&\\\hline \end{array}}$
Sind ${\textstyle X_{1},\ldots ,X_{n}}$ ZV, so gilt: ${\begin{array}{|l|rcl|}\hline {\text{stets}}&{\text{falls }}X_{1},\ldots ,X_{n}{\text{unabhängig}}\\E(\sum _{j=1}^{n}X_{j})=\sum _{j=1}^{n}E(X_{j})&V(\sum _{j=1}^{n}X_{j})&=&\sum _{j=1}^{n}V(X_{j})\\&\sigma _{X_{1}+\ldots +X_{n}}&=&{\sqrt {{\sigma _{X_{1}}}^{2}+\ldots +{\sigma _{X_{n}}}^{2}}}\\\hline \end{array}}$

Vergleich von Erwartungswert und arithmetischem Mittelwert

Wir betrachten eine (diskrete) ZV ${\textstyle X}$ , mit ihrer Wahrscheinlichkeitsverteilung:

mögl. Wert	${\textstyle x_{1}}$	${\textstyle x_{2}}$	${\textstyle \ldots }$	${\textstyle x_{m}}$	gesamt
Wahrsch.	${\textstyle P(X=x_{1})=w_{1}}$	${\textstyle P(X=x_{2})=w_{2}}$	${\textstyle \ldots }$	${\textstyle P(X=x_{m})=w_{m}}$	${\textstyle w_{1}+w_{2}+\ldots +w_{m}=1}$

Der Erwartungswert der ZV ${\textstyle X}$ ergibt sich dann als: $E(X)=x_{1}\cdot w_{1}+x_{2}\cdot w_{2}+\ldots +x_{m}\cdot w_{m}$ Führt man das zugehörige ZE ${\textstyle n}$ -mal durch, so erhält man eine Stichprobe mit absoluten und relativen Häufigkeiten:

Wert	${\textstyle x_{1}}$	${\textstyle x_{2}}$	${\textstyle \ldots }$	${\textstyle x_{m}}$	gesamt
abs. Häuf.	${\textstyle h(x_{1})=h_{1}}$	${\textstyle h(x_{2})=h_{2}}$	${\textstyle \ldots }$	${\textstyle h(x_{m})=h_{m}}$	${\textstyle h_{1}+h_{2}+\ldots +h_{m}=n}$
rel. Häuf.	${\textstyle r(x_{1})={\frac {h_{1}}{n}}}$	${\textstyle r(x_{2})={\frac {h_{2}}{n}}}$	${\textstyle \ldots }$	${\textstyle r(x_{m})={\frac {h_{m}}{n}}}$	${\textstyle r_{1}+r_{2}+\ldots +r_{m}=1}$

Der arithmetischen Mittelwert des Merkmals ${\textstyle X}$ ergibt sich dann als: ${\overline {X}}=x_{1}\cdot r_{1}+x_{2}\cdot r_{2}+\ldots +x_{m}\cdot r_{m}$ Allerdings stimmen die relativen Häufigkeiten ${\textstyle r_{k}}$ (normalerweise) nicht exakt mit den Wahrscheinlichkeiten ${\textstyle w_{k}}$ überein und folglich ist (normalerweise) ${\textstyle {\overline {X}}\not =E(X)}$ .
Folgendes ist erkennbar:

Die relative Häufigkeit ${\textstyle {\frac {h(a_{k})}{n}}}$ ist eine Schätzung für die Wahrscheinlichkeit ${\textstyle P(X=a_{k})}$ .
Der arithmetische Mittelwert ${\textstyle {\overline {x}}}$ ist eine Schätzung für den EW ${\textstyle E(X)}$ der ZV.
Die empirische Varianz ${\textstyle {s_{x}}^{2}}$ ist eine Schätzung für die Varianz ${\textstyle V(X)}$ der ZV.

Es ist wichtig, eine Unterscheidung zwischen ${\textstyle P(X=a_{k})}$ und ${\textstyle r(a_{k})}$ bzw. zwischen ${\textstyle E(X)}$ und ${\textstyle {\overline {x}}}$ bzw. zwischen ${\textstyle V(X)}$ und ${\textstyle {s_{x}}^{2}}$ vorzunehmen. Zu beachten ist dabei:

${\textstyle P(X=a_{k}),\ E(X)}$ und ${\textstyle \sigma _{X}}$ sind der ZV ${\textstyle X}$ zugeordnet. Sie sind durch das Zufallsexperiment eindeutig festgelegt und hängen nicht von der Stichprobe ab. Leider sind sie in vielen in der Praxis relevanten Situationen nicht bekannt.
${\textstyle h(a_{k}),\ {\overline {x}}}$ und ${\textstyle s_{x}}$ sind der Stichprobe zugeordnet. Sie können aus ihr leicht berechnet werden und sind somit bekannt. Allerdings hängen Sie (wie auch die Stichprobe) vom Zufall ab. Erhebt man eine neue Stichprobe, so erhält man andere Werte für ${\textstyle h(a_{k}),\ {\overline {x}}}$ und ${\textstyle s_{x}}$ .

Es gibt nun zwei typische Situationen, die völlig unterschiedliche Blickwinkel bieten:

Die möglichen Werte und die zugehörigen Wahrscheinlichkeiten sind bekannt. Man kann dann einfach ${\textstyle E(X)}$ berechnen, die Erhebung einer Stichprobe und die Bestimmung des arithmetischen Mittelwerts ${\textstyle {\overline {X}}}$ sind zwar möglich, bringen aber nichts ein.

Beispiel:

Beim Würfelwurf sind die Werte ${\textstyle 1,\ldots ,6}$ möglich (alle mit Wahrscheinlichkeit ${\textstyle {\frac {1}{6}}}$ ) und daraus bestimmt man ${\textstyle E(X)=3.5}$ . Man könnte nun mehrmals werfen und erhält (zum Beispiel) die folgenden Häufigkeiten:

${\textstyle k}$	${\textstyle 1}$	${\textstyle 2}$	${\textstyle 3}$	${\textstyle 4}$	${\textstyle 5}$	${\textstyle 6}$	gesamt
${\textstyle h_{k}}$	${\textstyle h(1)=5}$	${\textstyle h(2)=1}$	${\textstyle h(3)=4}$	${\textstyle h(4)=4}$	${\textstyle h(5)=2}$	${\textstyle h(6)=4}$	${\textstyle n=20}$
${\textstyle r_{k}}$	${\textstyle r(1)=0.25}$	${\textstyle r(2)=0.05}$	${\textstyle r(3)=0.2}$	${\textstyle r(4)=0.2}$	${\textstyle r(5)=0.1}$	${\textstyle r(6)=0.2}$	${\textstyle 1}$

Daraus lässt sich ${\overline {X}}=0.25\cdot 1+0.05\cdot 2+0.2\cdot 3+0.2\cdot 4+0.1\cdot 5+0.2\cdot 6=3.45$ bestimmen. Dabei liegt ${\textstyle {\overline {X}}}$ nahe bei ${\textstyle E(X)}$ . Dies ist wahrscheinlich, muss aber nicht so sein (im Extremfall wäre auch ${\textstyle {\overline {X}}=1}$ oder ${\textstyle {\overline {X}}=6}$ möglich gewesen).

Man kennt die möglichen Werte und die zugehörigen Wahrscheinlichkeiten nicht, möchte aber gerne etwas über ${\textstyle E(X)}$ wissen. Daher erhebt man eine Stichprobe. Dann kann man ${\textstyle {\overline {X}}}$ als Schätzwert für ${\textstyle E(X)}$ nehmen. Man weiß dann aber im konkreten Fall nicht, wie gut diese Schätzung ist. In der schließenden Statistik (siehe Vorlesung ’Statistik für Anwender II’) untersucht man Methoden zur Beurteilung solcher Schätzungen.

Beispiel:

In einer Lostrommel befinden sich viele Kugeln mit Zahlen darauf. Sie wissen nicht, welche Zahlen daraufstehen und mit welcher Häufigkeit sie vertreten sind. Bei ${\textstyle 50}$ -maligem Ziehen erhalten Sie die folgenden absoluten Häufigkeiten:

${\textstyle k}$	${\textstyle 0}$	${\textstyle 1}$	${\textstyle 2}$	${\textstyle 3}$	${\textstyle 4}$	${\textstyle 7}$	${\textstyle 11}$	gesamt
${\textstyle h_{k}}$	${\textstyle 17}$	${\textstyle 15}$	${\textstyle 9}$	${\textstyle 5}$	${\textstyle 2}$	${\textstyle 1}$	${\textstyle 1}$	${\textstyle n=50}$
${\textstyle r_{k}}$	${\textstyle 0.34}$	${\textstyle 0.3}$	${\textstyle 0.18}$	${\textstyle 0.1}$	${\textstyle 0.04}$	${\textstyle 0.02}$	${\textstyle 0.02}$	${\textstyle 1}$

Daraus berechnen Sie ${\overline {X}}=0.34\cdot 0+0.3\cdot 1+0.18\cdot 2+0.1\cdot 3+0.04\cdot 4+0.02\cdot 7+0.02\cdot 11=1.48$ und können dies als Schätzwert für ${\textstyle E(X)}$ nehmen.

Man interessiert sich für den Erwartungswert der Zufallsvariable ${\textstyle Z}$ , die die Anzahl der Jungtiere in einem Wurf einer Katze. Da man die Wahrscheinlichkeiten für die einzelnen Anzahlen nicht kennt, kann man diesen Erwatungswert nicht ausrechnen. Man hat daher nur die Möglichkeit, ihn mit Hilfe des Erwartungswerts einer Stichprobe zu schätzen.
Beispielsweise erhebt man die folgende Stichprobe: ${\begin{array}{|c||c|c|c|c|c|c|c|c|c|c|c|c|c|c|}\hline k&1&2&3&4&5&6&7&8&9&10&11&12&\ldots &{\text{gesamt}}\\\hline h_{k}&8&17&31&26&6&4&3&2&1&1&0&1&0&100\\\hline r_{k}&0.08&0.17&0.31&0.26&0.06&0.04&0.03&0.02&0.01&0.01&0&0.01&0&1\\\hline \hline {\text{Wahrsch.}}&{\text{unbekannt, kann durch rel. Häuf. geschätzt werden}}&&&&&&&&&&&&&1\\\hline \end{array}}$ Daraus ergibt sich der artithmetische Mittelwert der Stichprobe: ${\begin{aligned}{\overline {X}}&=&0.08\cdot 1+0.17\cdot 2+0.31\cdot 3+0.26\cdot 4+0.06\cdot 5+0.04\cdot 6+0.03\cdot 7+0.02\cdot 8+0.01\cdot 9\\&+&0.01\cdot 10+0\cdot 11+0.01\cdot 12=3.61\end{aligned}}$ Der Erwartungswert ${\textstyle E(X)}$ ist aber unbekannt, kann aber durch ${\textstyle {\overline {X}}}$ geschätzt werden.

Erwartungstreue, Varianzbetrachtung und Konsistenz obiger Schätzungen

Sei ${\textstyle X}$ eine endliche ZV, die die Werte ${\textstyle a_{1},\ldots ,a_{m}}$ mit den Wahrscheinlichkeiten ${\textstyle p_{k}=P(X=a_{k})\ (k=1,\ldots ,m)}$ annehmen kann und EW ${\textstyle E(X)}$ und Varianz ${\textstyle V(X)}$ hat.

Weiterhin seien ${\textstyle X_{1},\ldots ,X_{m}}$ unabhängige ZV, die identisch wie ${\textstyle X}$ verteilt sind (d.h. sie haben alle diesselbe W-Funktion wie ${\textstyle X}$ ). Wir betrachten außerdem die ZV: ${\begin{array}{rcl}H_{n}^{k}&=&\#\{j\in \{1,\ldots ,n\};\ X_{j}=a_{k}\}\quad (k=1,\ldots ,m)\\M_{n}&=&{\frac {1}{n}}\cdot \sum \limits _{j=1}^{n}X_{j}\\V_{n}&=&{\frac {1}{n-1}}\cdot \sum \limits _{j=1}^{n}\left(X_{j}-M_{n}\right)^{2}\end{array}}$

Die Schätzung von ${\textstyle p_{k}=P(X=a_{k})}$ ${\textstyle p_{k}=P(X=a_{k})}$ durch ${\textstyle {\frac {H_{n}^{k}}{n}}}$ ${\textstyle {\frac {H_{n}^{k}}{n}}}$
- ist erwartungstreu, das heißt, es gilt: ${\textstyle \quad E\left({\frac {H_{n}^{k}}{n}}\right)=p_{k}}$
- hat eine gegen ${\textstyle 0}$ konvergierende Varianz, also: ${\textstyle \quad V\left({\frac {H_{n}^{k}}{n}}\right){\stackrel {n\to \infty }{\longrightarrow }}0}$
- ist konsistent, d.h. für alle ${\textstyle c>0}$ ist: ${\textstyle \quad P\left(\left|{\frac {H_{n}^{k}}{n}}-p_{k}\right|<c\right){\stackrel {n\to \infty }{\longrightarrow }}1}$
Die Schätzung von ${\textstyle E(X)}$ ${\textstyle E(X)}$ durch ${\textstyle M_{n}}$ ${\textstyle M_{n}}$
- ist erwartungstreu, das heißt, es gilt: ${\textstyle \quad E(M_{n})=E(X)}$
- hat eine gegen ${\textstyle 0}$ konvergierende Varianz, also: ${\textstyle \quad V(M_{n}){\stackrel {n\to \infty }{\longrightarrow }}0}$
- ist konsistent, d.h. für alle ${\textstyle c>0}$ ist: ${\textstyle \quad P\left(\left|M_{n}-E(X)\right|<c\right){\stackrel {n\to \infty }{\longrightarrow }}1}$
Die Schätzung von ${\textstyle V(X)}$ ${\textstyle V(X)}$ durch ${\textstyle V_{n}}$ ${\textstyle V_{n}}$
- ist erwartungstreu, das heißt, es gilt: ${\textstyle \quad E(V_{n})=V(X)}$
- hat eine gegen ${\textstyle 0}$ konvergierende Varianz, also: ${\textstyle \quad V(V_{n}){\stackrel {n\to \infty }{\longrightarrow }}0}$
- ist konsistent, d.h. für alle ${\textstyle c>0}$ ist: ${\textstyle \quad P\left(\left|V_{n}-V(X)\right|<c\right){\stackrel {n\to \infty }{\longrightarrow }}1}$

Beispiel (zur Erwartungstreue)

Wir betrachten eine ZV ${\textstyle X}$ mit den folgenden möglichen Werten ${\textstyle 0,3,9,12}$ und den folgenden dazugeörenden Wahrscheinlichkeiten: $P(X=0)=0.1\quad \quad P(X=3)=0.2\quad \quad P(X=9)=0.3\quad \quad P(X=12)=0.4$ Daraus berechnet man EW und Varianz von ${\textstyle X}$ durch: $E(X)=0.1\cdot 0+0.2\cdot 3+0.3\cdot 9+0.4\cdot 12=8.1\quad {\text{und}}$ $V(X)=0.1\cdot (0-8.1)^{2}+0.2\cdot (3-8.1)^{2}+0.3\cdot (6-8.1)^{2}+0.4\cdot (9-8.1)^{2}=18.09$ Eine Person, die die oben angegebenen Wahrscheinlichkeiten nicht kennt, will Schätzungen für ${\textstyle E(X)}$ und ${\textstyle V(X)}$ vornehmen. Dazu führt sie eine Stichprobe der Länge ${\textstyle n=3}$ durch und berechnet daraus ${\textstyle {\overline {x}}}$ und ${\textstyle {s_{x}}^{2}}$ . Für die Stichprobe ${\textstyle x_{1},x_{2},x_{3}}$ gibt es ${\textstyle 64}$ Möglichkeiten. Diese haben bestimmte Wahrscheinlichkeiten und führen zu verschiedenen Werten für ${\textstyle {\overline {x}}}$ und ${\textstyle {s_{x}}^{2}}$ . ${\begin{array}{|c|c|c|c|}\hline {\text{mögliche Stichprobe}}&{\text{Wahrscheinlichkeit}}&{\text{ergibt}}&{\text{ergibt}}\\(x_{1},x_{2},Xx_{3})&{\text{zusammen}}&{\overline {x}}=&{s_{x}}^{2}=\\\hline (0,0,0)&0.001&0&0\\\hline (3,3,3)&0.008&3&0\\\hline (9,9,9)&0.027&9&0\\\hline (12,12,12)&0.064&12&0\\\hline (0,0,3),(0,3,0),(3,0,0)&0.006&1&3\\\hline (0,0,9),(0,9,0),(9,0,0)&0.009&3&27\\\hline (0,0,12),(0,12,0),(12,0,0)&0.012&4&48\\\hline (3,3,0),(3,0,3),(0,3,3)&0.012&2&3\\\hline (3,3,9),(3,9,3),(9,3,3)&0.036&5&12\\\hline (3,3,12),(3,12,3),(12,3,3)&0.048&6&27\\\hline (9,9,0),(9,0,9),(0,9,9)&0.027&6&27\\\hline (9,9,3),(9,3,9),(3,9,9)&0.054&7&12\\\hline (9,9,12),(9,12,9),(12,9,9)&0.108&10&3\\\hline (12,12,0),(12,0,12),(0,12,12)&0.048&8&48\\\hline (12,12,3),(12,3,12),(3,12,12)&0.096&9&27\\\hline (12,12,9),(12,9,12),(9,12,12)&0.144&11&3\\\hline (0,3,9),(0,9,3),(3,0,9),(3,9,0),(9,0,3),(9,3,0)&0.036&4&21\\\hline (0,3,12),(0,12,3),(3,0,12),(3,12,0),(12,0,3),(12,3,0)&0.048&5&39\\\hline (0,9,12),(0,12,9),(9,0,12),(9,12,0),(12,0,9),(12,9,0)&0.072&7&39\\\hline (3,9,12),(3,12,9),(9,3,12),(9,12,3),(12,3,9),(12,9,3)&0.144&8&21\\\hline \end{array}}$

Fasst man ${\textstyle {\overline {x}}\;{\hat {=}}\;M_{n}}$ als ZV auf, so kann diese also die folgenden Werte mit den angegebenen Wahrscheinlichkeiten annehmen: ${\begin{array}{|c||c|c|c|c|c|c|c|c|c|c|c|c|c|}\hline a&0&1&2&3&4&5&6&7&8&9&10&11&12\\\hline P\left(M_{n}=A\right)&0.001&0.006&0.012&0.017&0.048&0.084&0.075&0.126&0.192&0.123&0.108&0.144&0.064\\\hline \end{array}}$ Daraus ergibt sich ${\begin{aligned}E(M_{n})&=&0.001\cdot 0+0.006\cdot 1+0.012\cdot 2+0.017\cdot 3+0.048\cdot 4+0.084\cdot 5+0.075\cdot 6\\&&+0.126\cdot 7+0.192\cdot 8+0.123\cdot 9+0.108\cdot 10+0.144\cdot 11+0.064\cdot 12\\&=&8.1\quad =E(X)\end{aligned}}$
Fasst man ${\textstyle s_{x}^{2}\;{\hat {=}}\;V_{n}}$ als ZV auf, so kann diese also die folgenden Werte mit den angegebenen Wahrscheinlichkeiten annehmen: ${\begin{array}{|c||c|c|c|c|c|c|c|}\hline a&0&3&12&21&27&39&48\\\hline P\left(V_{n}=a\right)&0.100&0.270&0.090&0.180&0.180&0.120&0.060\\\hline \end{array}}$ Daraus ergibt sich ${\begin{aligned}E(V_{n})&=&0.100\cdot 0+0.270\cdot 3+0.090\cdot 12+0.180\cdot 21+0.180\cdot 27+0.120\cdot 39+0.060\cdot 48\\&=&18.08\quad =V(X)\end{aligned}}$

Damit haben wir die Erwartungstreue der beiden Schätzungen für diese spezielle ZV ${\textstyle X}$ nachgerechnet.

Binomialverteilte ZV

Wahrscheinlichkeitsrechnung

Wir betrachten ein (wiederholbares) ZE, das ${\textstyle n}$ -mal durchgeführt wird. Bei jeder Durchführung wird beobachtet, ob ein bestimmtes (vorher festgelegtes) Ereignis eintritt oder nicht. Abkürzend sagt man: ${\textbf {''Treffer''}}\ {\text{Das Ereignis tritt ein.}}\quad \quad {\textbf {''KeinTreffer''}}\ {\text{Das Ereignis tritt nicht ein.}}$ Wichtig ist dabei, dass die einzelnen Durchführungen

unabhängig voneinander sind
unter gleichen Bedingungen stattfinden

Man fasst den gesamten Vorgang nun als ein ZE auf. Die ZV ${\textstyle T}$ , die die Anzahl der Treffer beschreibt, nennt man dann binomialverteilt mit Versuchszahl ${\textstyle n\in \mathbb {N} }$ und Trefferwahrscheinlichkeit ${\textstyle p\in [0,1]}$ und es gilt: $P(T=k)={n \choose k}p^{k}(1-p)^{n-k}\quad {\text{für }}k\in \{0,\ldots ,n\}$ Dies lässt sich wie folgt begründen:
Für eine bestimmte Abfolge von ${\textstyle k}$ Treffern und ${\textstyle n-k}$ Nicht-Treffern ist die Wahrscheinlichkeit (entsprechend einem Pfad in einem Baumdiagramm) das Produkt aus ${\textstyle n}$ -Faktoren, von denen ${\textstyle k}$ Faktoren ${\textstyle p}$ sind und ${\textstyle n-k}$ Faktoren ${\textstyle 1-p}$ . Sie hat also den Wert ${\textstyle p^{k}\cdot (1-p)^{n-k}}$ .
Es gibt jedoch mehrere Pfade, in denen genau ${\textstyle k}$ Treffer vorkommen. Da diese Treffer an ${\textstyle k}$ von ${\textstyle n}$ Stellen vorkommen können, sind es insgesamt ${\textstyle {n \choose k}}$ Möglichkeiten.

Beispiel:

Für ${\textstyle n=5}$ und ${\textstyle p=0.7}$ ist ${\begin{array}{c||c|c|c|c|c|c}k&0&1&2&3&4&5\\\hline P(T=k)&0.002&0.028&0.132&0.309&0.360&0.168\end{array}}$
Für ${\textstyle n=50}$ und ${\textstyle p=0.3}$ ist beispielsweise: ${\begin{array}{rcccl}P(T=5)&=&{50 \choose 5}(0.3)^{5}(0.7)^{45}&=&0.0005509\\P(T=15)&=&{50 \choose 15}(0.3)^{15}(0.7)^{35}&=&0.1223469\\P(T=40)&=&{50 \choose 40}(0.3)^{40}(0.7)^{10}&<&10^{-12}\end{array}}$

Es folgt:

${\textstyle P(T\leq k)=\sum \limits _{j=0}^{k}{n \choose j}p^{j}(1-p)^{n-j}}$
${\textstyle P(T\geq k)=\sum \limits _{j=k}^{n}{n \choose j}p^{j}(1-p)^{n-j}}$
${\textstyle P(k\leq T\leq \ell )=\sum \limits _{j=k}^{\ell }{n \choose j}p^{j}(1-p)^{n-j}}$

Beispiel:

Für ${\textstyle n=5}$ und ${\textstyle p=0.7}$ ist beispielsweise: ${\begin{array}{rclcl}P(T\leq 3)&=&{5 \choose 0}(0.7)^{0}(0.3)^{5}+{5 \choose 1}(0.7)^{1}(0.3)^{4}+{5 \choose 2}(0.7)^{2}(0.3)^{3}+{5 \choose 3}(0.7)^{3}(0.3)^{2}\\&=&0.47148\\P(T\geq 4)&=&{5 \choose 4}(0.7)^{4}(0.3)^{1}+{5 \choose 5}(0.7)^{5}(0.3)^{0}\\&=&0.52852\\P(1\leq T\leq 4)&=&{5 \choose 1}(0.7)^{1}(0.3)^{4}+{5 \choose 2}(0.7)^{2}(0.3)^{3}+{5 \choose 3}(0.7)^{3}(0.3)^{2}+{5 \choose 4}(0.7)^{4}(0.3)^{1}\\&=&0.8295\end{array}}$
Für ${\textstyle n=50}$ und ${\textstyle p=0.3}$ ist beispielsweise: ${\begin{array}{rclcl}P(6\leq T\leq 9)&=&{50 \choose 6}(0.3)^{6}(0.7)^{44}+{50 \choose 7}(0.3)^{7}(0.7)^{43}+{50 \choose 8}(0.3)^{8}(0.7)^{42}+{50 \choose 9}(0.3)^{9}(0.7)^{41}\\&=&0.039509\\P(T\leq 16)&=&{50 \choose 0}(0.3)^{0}(0.7)^{50}+{50 \choose 1}(0.3)^{1}(0.7)^{49}+\quad \ldots \quad +{50 \choose 16}(0.3)^{16}(0.7)^{34}\\&=&0.683879\\P(T\geq 25)&=&{50 \choose 25}(0.3)^{25}(0.7)^{25}+{50 \choose 26}(0.3)^{26}(0.7)^{24}+\quad \ldots \quad +{50 \choose 50}(0.3)^{50}(0.7)^{0}\\&=&0.002370\end{array}}$

Hier einige weitere Beispiele:

image

In R:	dbinom( ${\textstyle k,n,p}$ )	ergibt:	${\textstyle P(T=k)}$	=	${\textstyle {n \choose k}p^{k}(1-p)^{n-k}}$
	pbinom( ${\textstyle k,n,p}$ )	ergibt:	${\textstyle P(T\leq k)}$	=	${\textstyle \sum \limits _{j=0}^{k}{n \choose j}p^{j}(1-p)^{n-j}}$
	${\textstyle 1-}$ pbinom( ${\textstyle k-1,n,p}$ )	ergibt:	${\textstyle P(T\geq k)}$	=	${\textstyle \sum \limits _{j=k}^{n}{n \choose j}p^{j}(1-p)^{n-j}}$
	pbinom( ${\textstyle \ell ,n,p}$ ) ${\textstyle -}$ pbinom( ${\textstyle k-1,n,p}$ )	ergibt:	${\textstyle P(k\leq T\leq \ell )}$	=	${\textstyle \sum \limits _{j=k}^{\ell }{n \choose j}p^{j}(1-p)^{n-j}}$

Aufgabe:

Berechnen Sie für eine binomialverteilte ZV ${\textstyle T}$ mit den jeweils angegebenen Werten für ${\textstyle n}$ und ${\textstyle p}$ die angegebenen Wahrscheinlichkeiten:

Für ${\textstyle n=8}$ und ${\textstyle p=0.46}$ : ${\textstyle \quad P(T=k)}$ für alle ${\textstyle k=0,\ldots ,8}$
Für ${\textstyle n=24}$ und ${\textstyle p=0.12}$ : ${\textstyle \quad P(T\leq 4),\ P(T\geq 6),\ P(2\leq T\leq 5)}$
Für ${\textstyle n=360}$ und ${\textstyle p=0.77}$ : ${\textstyle \quad P(T\leq 275),\ P(T\geq 280),\ P(276\leq T\leq 280)}$

Beispiel:

(Ziehen mit Zurücklegen) Aus einer Lostrommel, die ${\textstyle N}$ Kugeln enthält, von denen ${\textstyle K}$ rot sind, werden nacheinander mit Zurücklegen ${\textstyle n}$ Kugeln gezogen. Die ZV für die Anzahl roten Kugeln unter den Gezogenen ist binomialverteilt mit Versuchszahl ${\textstyle n}$ und Trefferwahrscheinlichkeit ${\textstyle p={\frac {K}{N}}}$ .
Wenn man ${\textstyle 1000}$ -mal würfelt, ist die ZV für die Zahl der gewürfelten ${\textstyle 6}$ -en binomialverteilt mit Versuchszahl ${\textstyle n=1000}$ und Trefferwahrscheinlichkeit ${\textstyle p={\frac {1}{6}}}$ .
Wenn ein Medikament, das mit einer Wahrscheinlichkeit von ${\textstyle 0.2\%}$ eine bestimmte Nebenwirkung verursacht, von ${\textstyle 300}$ Patienten eingenommen wird, ist die ZV für die Zahl der Patienten, bei denen die Nebenwirkung auftritt, binomialverteilt mit Versuchszahl ${\textstyle n=300}$ und Trefferwahrscheinlichkeit ${\textstyle p=0.002}$ .
Wenn ein Basketballspieler ${\textstyle n}$ ${\textstyle n}$ Freiwürfe macht, ist die ZV für die Zahl seiner Treffer nur unter folgenden Annahmen binomialverteilt:
- Es gibt eine Trefferwahrscheinlichkeit ${\textstyle p\in [0,1]}$ , die immer gleich groß ist.
- Treffer bzw. Nicht-Treffer bei bestimmten Würfen beeinflussen nicht die Trefferwahrscheinlichkeit für die anderen Würfe.
Die Wahrscheinlichkeit für eine Mädchengeburt betrage ${\textstyle 0.487}$ . Unter ${\textstyle 200}$ Neugeborenen ist dann die ZV für die Zahl der Mädchen binomialverteilt mit Versuchszahl ${\textstyle n=200}$ und Trefferwahrscheinlichkeit ${\textstyle p=0.486}$ .

Beispiel:

Bei einem Multiple-Choice Test gibt es bei jeder der 20 Fragen 4 Antwortmöglichkeiten, von denen genau eine Antwort richtig ist. Ein unvorbereiteter Teilnehmer kreuzt willkürlich jeweils eine Antwort an. Wie groß ist die Wahrscheinlichkeit, dass er ${\text{(i) mindestens 10 Fragen}}\quad \quad {\text{(ii) weniger als 8 Fragen}}\quad \quad {\text{(iii) zwischen 2 und 5 Fragen}}$ richtig beantwortet?
Wie groß ist die Wahrscheinlichkeit beim 10-maligen Werfen von 2 Würfeln ${\text{(i) genau 2-mal}}\quad \quad {\text{(ii) mindestens 4-mal}}\quad \quad {\text{(iii) weniger als 7-mal}}$ die Augensumme ${\textstyle 5}$ zu erzielen?
Auf dem Weg zur Arbeit ist eine Ampel jeden Tag mit der Wahrscheinlichkeit ${\textstyle p=0.4}$ rot. Berechnen Sie die Wahrscheinlichkeit, dass die Ampel an genau ${\textstyle k}$ von 7 Tagen Rot ist ${\textstyle (k=0,\ldots ,7)}$ .
Ein Bäcker knetet in einen Teig für 100 Rosinenbrötchen 200 Rosinen gut unter. Dann wird der Teig in 100 gleiche Teile geschnitten. Mit welcher Wahrscheinlichkeit enthält ein rein zufällig ausgewähltes Brötchen dieser Charge ${\text{(i)}}\ {\text{genau 2}}\quad \quad {\text{(ii)}}\ {\text{mehr als 3}}\quad \quad {\text{(iii)}}\ {\text{keine}}$ Rosinen?

Zusatzfrage: Wie viele Rosinen muss der Bäcker in den Teig für 100 Rosinenbrötchen kneten, damit ein auf gut Glück ausgewähltes Brötchen mit einer Mindestwahrscheinlichkeit von ${\textstyle 0.95}$ mindestens eine Rosine enthält?

Erwartungswert und Varianz einer binomialverteilten ZV

Für eine binomialverteilte ZV ${\textstyle T}$ mit Versuchszahl ${\textstyle n}$ und Trefferwahrsch. ${\textstyle p}$ gilt: $E(T)=n\cdot p\quad {\text{und}}\quad V(T)=n\cdot p\cdot (1-p)$

EW und Varianz der relativen Häufigkeit

Ist ${\textstyle T}$ eine binomialverteilte ZV mit Versuchszahl ${\textstyle n\in \mathbb {N} }$ und Trefferwahrscheinlichkeit ${\textstyle p\in [0,1]}$ , so beschreibt die ZV ${\textstyle R={\frac {T}{n}}}$ die relative Häufigkeit des Ereignisses Treffer" in der Versuchsserie.

Es gilt: ${\textstyle \quad E(R)=p\ {\text{und}}\ V(R)={\frac {p\cdot (1-p)}{n}}}$

Beispiel:

Für ${\textstyle n=5}$ und ${\textstyle p=0.7}$ haben wir oben bereits die Wahrscheinlichkeitsverteilung bestimmt. Daraus ergibt sich: ${\begin{array}{rcccl}E(T)&=&0.002\cdot 0+0.028\cdot 1+0.132\cdot 2+0.309\cdot 3+0.360\cdot 4+0.168\cdot 5\\&=&3.5\\V(T)&=&\left\{{\begin{array}{cc}0.002\cdot (0-3.5)^{2}+0.028\cdot (1-3.5)^{2}\\+0.132\cdot (2-3.5)^{2}+0.309\cdot (3-3.5)^{2}+0.360\cdot (4-3.5)^{2}+0.168\cdot (5-3.5)^{2}\end{array}}\right\}\\&=&1.05\end{array}}$ Tatsächlich ist ${\textstyle E(T)=5\cdot 0.7}$ und ${\textstyle V(T)=5\cdot 0.7\cdot (1-0.7)}$ .
Für ${\textstyle n=20}$ und ${\textstyle p=0.61}$ berechnen wir zunächst ${\textstyle P(T=k)={20 \choose k}(0.61)^{k}(0.39)^{20-k}}$ für alle möglichen Werte ${\textstyle k=0,\ldots ,20}$ : ${\begin{array}{|c||c|c|c|c|c|c|c|}\hline k&0&1&2&3&4&5&6\\\hline P(T=k)&<0.0001&<0.0001&<0.0001&<0.0001&0.0002&0.0010&0.0038\\\hline \hline k&7&8&9&10&11&12&13\\\hline P(T=k)&0.0118&0.0299&0.0624&0.1073&0.1526&0.1790&0.1722\\\hline k&14&15&16&17&18&19&20\\\hline P(T=k)&0.1347&0.0843&0.0412&0.0152&0.0040&0.0007&0.0001\\\hline \hline \end{array}}$

Daraus ergibt sich: ${\begin{array}{rclclccclcl}E(T)&=&P(Z=0)\cdot 0&+&P(Z=1)\cdot 1&+&\quad \ldots \quad &+&P(Z=20)\cdot 20\quad \\&=&12.2\\V(T)&=&P(Z=0)\cdot (0-12.2)^{2}&+&P(Z=1)\cdot (1-12.2)^{2}&+&\quad \ldots \quad &+&P(Z=20)\cdot (20-12.2)^{2}\\&=&4.758\end{array}}$ Tatsächlich ist ${\textstyle E(T)=20\cdot 0.61}$ und ${\textstyle V(T)=20\cdot 0.61\cdot (1-0.61)}$ .

Schätzungen für p

Problemstellung:

Bisher können wir die Wahrscheinlichkeit dafür berechnen, dass die Trefferzahl in einem bestimmten Bereich liegt, wenn wir die Trefferwahrscheinlichkeit ${\textstyle p}$ kennen. In der Praxis ist man häufig aber mit folgender Situation konfrontiert: ${\text{Es sind }}n{\text{ und }}k{\text{ bekannt, aber nicht }}p{\text{. Wie kann man }}p{\text{ sinnvoll schätzen?}}$

Genauer kann man unterscheiden:

Die Versuchszahl ${\textstyle n\in \mathbb {N} }$ steht fest und ist bekannt. (In vielen Fällen kann man ${\textstyle n}$ sogar selbst festlegen.)
Die Trefferwahrscheinlichkeit ${\textstyle p\in [0,1]}$ liegt fest, ist aber nicht bekannt.
Die Trefferzahl ist zufällig.

Sie wird vor Erhebung der Daten durch die ZV ${\textstyle T}$ beschrieben. Nach der Datenerhebung liegt dann eine Realisierung ${\textstyle T^{\ast }=k\in \{0,\ldots ,n\}}$ der ZV ${\textstyle T}$ vor.

Schätzungen für ${\textstyle p}$ können nur auf der konkreten Realisierung (Trefferzahl) ${\textstyle T^{\ast }=k}$ basieren. Da der Schätzung also die zufällige Trefferzahl ${\textstyle T}$ zugrunde liegt, ist folglich auch die Schätzung vom Zufall abhängig. ${\text{ZV mit Parameter p}}{\stackrel {\text{zufällig}}{\longrightarrow }}{\text{Daten k }}{\stackrel {\text{methodisch}}{\longrightarrow }}{\text{Schätzung für p}}$

Punktschätzung für p

Sei ${\textstyle T}$ eine binomialverteilte ZV mit (bekannter) Versuchszahl ${\textstyle n\in \mathbb {N} }$ und (unbekannter) Trefferwahrscheinlichkeit ${\textstyle p\in [0,1]}$ .

Eine Punktschätzfunktion für ${\textstyle p}$ ist eine Abbildung: ${\begin{array}{rccc}S:&\underbrace {\{0,\ldots ,n\}} _{\text{Menge der möglichen Werte für die ZV T}}&\to &\underbrace {\mathbb {R} } _{\text{(Ober-)Menge der in Frage kommenden Werte von p}}\\&\underbrace {k} _{\text{konkrete Trefferzahl}}&\mapsto &\underbrace {S(k)} _{\text{konkrete Schätzung für p}}\end{array}}$ Eine solche Punktschätzfunktion kann aus verschiedenen Blickwinkeln betrachtet werden:

Vor der Durchführung des ZE ist die Trefferzahl ${\textstyle T}$ eine ZV. Da die Trefferzahl in die Schätzfunktion eingesetzt werden soll, kann man so auch die Schätzung selbst als ZV ${\textstyle S\;{\hat {=}}\;S(T)}$ interpretieren.
Nach dem Feststellen einer konkreten Trefferzahl ${\textstyle T^{\ast }\;=\;k}$ kann man diese einfach in die Schätzfunktion einsetzen und erhält so in der Praxis eine konkrete Schätzung ${\textstyle S(k)}$ für ${\textstyle p}$ .

Beispiel:

(Relative Häufigkeit ist Punktschätzfunktion für ${\textstyle p}$ ) Die Abbildung: $R:\{0,\ldots ,n\}\to \mathbb {R} ,\ R(k)={\frac {k}{n}}$ ist eine Punktschätzfunktion für ${\textstyle p}$ .

Es stellt sich nun die Frage nach einer sinnvollen Punktschätzfunktion für ${\textstyle p}$ (es liegt nahe, die relative Häufigkeit ${\textstyle R}$ aus Beispiel [bsppsp] zu betrachten) bzw. allgemeiner was überhaupt sinnvolle ${\textstyle \;}$ Eigenschaften für eine solche Schätzfunktion sind. Um dies zu beurteilen, sollte man den Standpunkt vor der Datenerhebung einnehmen.

Die relative Häufigkeit ist erwartungstreu, effizient und konsistent:
Fasst man die relative Häufigkeit als Zufallsvariable auf, so gilt:

${\textstyle R}$ ist erwartungstreu für ${\textstyle p}$ , das hei"st es gilt: ${\textstyle \quad E_{p}(R)=p}$ für alle ${\textstyle p\in [0,1]}$

Dabei ist ${\textstyle E_{p}(R)}$ der (von ${\textstyle p}$ abhängige) EW von ${\textstyle R}$ .

Es gilt: ${\textstyle \quad V_{p}(R){\stackrel {n\to \infty }{\longrightarrow }}0}$ für alle ${\textstyle p\in [0,1]}$

Dabei ist ${\textstyle V_{p}(R)}$ die (von ${\textstyle p}$ abhängige) Varianz von ${\textstyle R}$ .

${\textstyle R}$ ist konsistent, das heißt für alle ${\textstyle p\in [0,1]}$ und alle ${\textstyle c>0}$ gilt: ${\textstyle \quad Pp\left(|R-p|<c\right){\stackrel {n\to \infty }{\longrightarrow }}1}$

Dabei bedeutet ${\textstyle P_{p}(\ldots )}$ das die Wahrscheinlichkeit in Abhängigkeit von ${\textstyle p}$ berechnet wurde.

Das Maximum-Likelihood-Prinzip

Neben den schon genannten Qualitätskriterien für Punktschätzfunktionen (Erwartungstreue, Effizienz und Konsistenz) gibt es noch einen anderen Zugang, die sogenannte Maximum-Likelihood-Methode. Dabei wird für den unbekannten Parameter (hier die Trefferwahrscheinlichkeit ${\textstyle p}$ ) der Wert geschätzt, für den die beobachteten Daten (hier die Trefferzahl ${\textstyle T^{\ast }=k}$ ) möglichst wahrscheinlich waren.

Die Maximum-Likelihood-Schätzung ${\textstyle S_{ML}:\{0,\ldots ,n\}\to [0,1]}$ ist also wie folgt definiert:

Für ${\textstyle k\in \{0,\ldots ,n\}}$ ist ${\textstyle S_{ML}(k)\in [0,1]}$ die (globale) Maximumstelle der Funktion $L:[0,1]\to [0,1],\ L(p)=\underbrace {{n \choose k}p^{k}(1-p)^{n-k}} _{=P(T=k)\ {\text{(abhängig von p)}}}$ ( ${\textstyle L}$ steht für Likelihood-Funktion)

Die Wahrscheinlichkeit ${\textstyle p}$ wird bei ${\textstyle k}$ Treffern in ${\textstyle n}$ Versuchen also als der Wert geschätzt, für den die Wahrscheinlichkeit ${\textstyle P(T=k)}$ für genau ${\textstyle k}$ Treffer maximal ist.

Man kann zeigen, (vergleiche die folgenden Beispiele) dass stets ${\textstyle S_{ML}(k)={\frac {k}{n}}=R(k)}$ gilt. Auch mit dieser Methode erhält man also die relative Häufigkeit als sinnvolle Schätzung für ${\textstyle p}$ .

Beispiel:

image

Intervallschätzungen für p

Ein (für die Praxis relevantes) Problem bei den bisher behandelten Punktschätzungen für ${\textstyle p}$ ist, dass es sich bei den Gütekriterien (Erwartungstreue, Effizienz und Konsistenz) für die Schätzfunktionen lediglich um qualitative Aussagen handelt.

Ziel ist es nun, Schätzungen für ${\textstyle p}$ zu formulieren, die man auch quantitativ beurteilen kann. Eine solche hat die Form: ${\text{Der unbekannte Wert}}\ p\ {\text{liegt in einem Intervall der Form}}\ [p_{U},p_{O}].$

Wir betrachten die folgende Situation:
Zu einer binomialverteilten ZV ${\textstyle T}$ ist die Versuchszahl ${\textstyle n\in \mathbb {N} }$ fest und bekannt und die Trefferwahrscheinlichkeit ${\textstyle p\in [0,1]}$ fest, aber unbekannt. Basierend auf der vom Zufall abhängigen Trefferzahl ${\textstyle T^{\ast }=k\in \{0,\ldots ,n\}}$ soll nun eine Intervallschätzung $p\in [p_{U},p_{O}]=[p_{U}(k),p_{O}(k)]$ für ${\textstyle p}$ vorgenommen werden.

Erneut nehmen wir die folgenden beiden Standpunkte ein:

Vor der Durchführung des ZE ist die Trefferzahl ${\textstyle T}$ eine ZV. Da die Trefferzahl in die Intervallschätzfunktion eingesetzt werden soll, hängt somit auch das berechnete Intervall ${\textstyle B(T)=[p_{U}(T),p_{O}(T)]}$ vom Zufall ab. Damit ist es auch vom Zufall abhängig, ob die resultierende Aussage wahr oder falsch sein wird.
Nach dem Feststellen einer konkreten Trefferzahl ${\textstyle T^{\ast }=k}$ kann man diese einfach in die Schätzfunktion einsetzen und erhält so in der Praxis eine konkrete Intervallschätzung ${\textstyle B(k)=[p_{U}(k),p_{O}(k)]}$ für ${\textstyle p}$ . Die Aussage ist dann nicht mehr vom Zufall abhängig, sondern entweder wahr oder falsch. (Leider weiß man nicht, welcher der beiden Fälle eingetreten ist, da man ${\textstyle p}$ nicht kennt.)

Sei ${\textstyle {\mathcal {I}}_{[0,1]}=\left\{[a,b];\ 0\leq a\leq b\leq 1\right\}}$ die Menge der abgeschlossenen Teilintervalle von ${\textstyle [0,1]}$ .

Eine Intervallschätzung (bzw. Bereichsschätzung) für ${\textstyle p}$ ist eine Abbildung: Fehler beim Parsen (SVG (MathML kann über ein Browser-Plugin aktiviert werden): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „http://localhost:6011/de.wikiversity.org/v1/“:): {\displaystyle \begin{array}{rccc} B : &\underbrace{\{ 0, \ldots ,n \}}_{\text{Menge der möglichen Werte für die ZV T}}&\to & \underbrace{\mathcal{I}_{[0,1]}}_{ \begin{array}{c} \text{Menge von Teilmengen der Menge}\\ \text{aller in Frage kommenden Werte von p}\end{array}} \\ & \underbrace{k}_{\text{konkrete Trefferzahl}} &\mapsto & \underbrace{B (k)= [p_U(k), p_O(k)]}_{\text{konkrete Intervallschätzung für $p$}} \end{array}}

Um Intervallschätzungen sinnvoll beurteilen zu können, untersuchen wir die (vom unbekannten Parameter ${\textstyle p}$ abhängige) Wahrscheinlichkeit dafür, dass man ein " korrektes Intervall" (also eines, dass ${\textstyle p}$ tatsächlich enthält) berechnet, wenn man die (vom Zufall abhängige) Trefferzahl einsetzt.

Überdeckungswahrscheinlichkeit und Konfidenzniveau

Gegeben sei eine Intervallschätzfunktion: $B:\{0,\ldots ,n\}\to {\mathcal {I}}_{[0,1]},\ B(k)=[p_{U}(k),p_{O}(k)]$

Für einen denkbaren Parameterwert p ∈ [ 0 , 1 ] {\textstyle p\in [0,1]} definiert man die Überdeckungswahr-scheinlichkeit von B {\textstyle B} an der Stelle p {\textstyle p} durch: P B ( p ) = P ( B ( T ) ∋ p ) = P ( [ p U ( T ) , p O ( T ) ] ∋ p ) = ∑ k ∈ { 0 , … , n } , B ( k ) ∋ p ( n k ) ⋅ p k ⋅ ( 1 − p ) n − k {\displaystyle P_{B}(p)=P(B(T)\ni p)=P\left([p_{U}(T),p_{O}(T)]\ni p\right)=\sum \limits _{k\in \{0,\ldots ,n\},B(k)\ni p}{n \choose k}\cdot p^{k}\cdot (1-p)^{n-k}}

Anmerkung:

Die Schreibweise B ( T ) ∋ p {\textstyle B(T)\ni p} ist mathematisch gleichbedeutend zu p ∈ B ( T ) {\textstyle p\in B(T)} , hat aber den Vorteil, dass dabei deutlich wird, dass B ( T ) {\textstyle B(T)} (und nicht p {\textstyle p} ) vom Zufall abhängt. Anstatt zu sagen: p {\textstyle p} ist in B ( T ) {\textstyle B(T)} enthalten." formuliert man daher auch B ( T ) {\textstyle B(T)} fängt p {\textstyle p} ein."
Gilt ${\textstyle P_{B}(p)\geq \delta }$ für eine feste Zahl ${\textstyle \delta \in [0,1]}$ , so sagt man auch:
Die Intervallschätzung ${\textstyle B}$ hält das Konfidenzniveau ${\textstyle \delta }$ ein."

Bedeutung:
Die Überdeckungswahrscheinlichkeit entspricht der Wahrscheinlichkeit dafür, dass man ein korrektes Intervall erhalten wird, wenn man die zufällige Trefferzahl ${\textstyle T}$ in die Intervallschätzung ${\textstyle B}$ einsetzt. Da die Überdeckungswahrscheinlichkeit vom unbekannten Parameter ${\textstyle p}$ abhängt, kann man sie in der Praxis nicht berechnen.
Weiß man aber (aufgrund theoretischer Überlegungen), dass eine Intervallschätzung ein bestimmtes Konfidenzniveau ${\textstyle \delta }$ einhält, so ist (unabhängig vom wahren Wert von ${\textstyle p}$ ) garantiert, dass man MINDESTENS mit der Wahrscheinlichkeit ${\textstyle \delta }$ ein korrektes Intervall erhalten wird, wenn man die zufällige Trefferzahl ${\textstyle T}$ in die Intervallschätzung ${\textstyle B}$ einsetzt.
In der Praxis sollte man nur Intervallschätzungen verwenden, von denen man weiß, dass sie ein hohes Konfidenzniveau (üblich sind ${\textstyle \delta =0.9}$ oder ${\textstyle \delta =0.95}$ oder ${\textstyle \delta =0.99}$ ) einhalten.

Ziel:

Wie findet man zu einem vorgegebenen Konfidenzniveau ${\textstyle \delta {\stackrel {\text{z.B.}}{=}}0.95}$ eine Intervallschätzung, die dieses Konfidenzniveau garantiert einhält.

Intervallschätzung nach Clopper-Pearson

Vorgegeben sei ${\textstyle \delta \in ]0,1[}$ .

Für ${\textstyle k\in \{0,\ldots ,n\}}$ bestimmt man ${\textstyle p_{U}=p_{U}(k)}$ und ${\textstyle p_{O}=p_{O}(k)}$ aus den Gleichungen: $\sum _{j=k}^{n}{n \choose j}{p_{U}}^{j}(1-p_{U})^{n-j}={\frac {1-\delta }{2}}$ $\sum _{j=0}^{k}{n \choose j}{p_{O}}^{j}(1-p_{O})^{n-j}={\frac {1-\delta }{2}}$ (Ausnahme sind folgende Sonderf"alle:
Für ${\textstyle k=0}$ setze ${\textstyle p_{U}=p_{U}(0)=0}$ , für ${\textstyle k=n}$ setze ${\textstyle p_{O}=p_{O}(n)=1}$ .)

Dann hält die Intervallschätzung ${\textstyle B:\{0,\ldots ,n\}\to {\mathcal {I}}_{[0,1]},\ B(k)=[p_{U}(k),p_{O}(k)]}$ garantiert das Konfidenzniveau ${\textstyle \delta }$ ein.

Anmerkung:

Obige Bestimmungsgleichungen für ${\textstyle p_{U}}$ und ${\textstyle p_{O}}$ sind ohne Computereinsatz kaum zu lösen. Konfidenzintervalle nach Clopper-Pearson können aber in R direkt berechnet werden. Der Befehl Fehler beim Parsen (Unbekannte Funktion „\textcolor“): {\displaystyle \textcolor{blue}{\text{binom.test(}k,n,\text{conf.level}=\delta \text{)\$conf.int[1:2]}}} ergibt das Konfidenzintervall zum Vertrauensniveau ${\textstyle \delta }$ bei ${\textstyle k}$ Treffern in ${\textstyle n}$ Versuchen.

Bemerkung:

(Obergrenzen für die Wahrsch. für Über- bzw. Unterschätzung von ${\textstyle p}$ ) Die Grenzen ${\textstyle p_{U}}$ und ${\textstyle p_{O}}$ der Intervallsch"atzung nach Clopper-Pearson aus Satz [cp] sind so gewählt, dass die Wahrscheinlichkeiten für Unterschätzung" und "Ubersch"atzung" von ${\textstyle p}$ durch dieselbe Grenze beschränkt sind. Genauer: Fehler beim Parsen (Syntaxfehler): {\displaystyle P \big( \underbrace{p > p_O(T)}_{\text{Untersch"atzung}} \big) \leq \frac{1-\delta}{2} \quad \text{und} \quad P \big( \underbrace{p < p_U(T)}_{\text{Unterschätzung}}\big) \leq \frac{1-\delta}{2}} Zusammen ergibt sich damit Fehler beim Parsen (Syntaxfehler): {\displaystyle P \big( \underbrace{p \notin [p_U(T),p_O(T)]}_{\text{falsche Sch"atzung}} \big) \leq 1-\delta \quad \text{und folglich} \quad P \big( \underbrace{p \in [p_U(T),p_O(T)]}_{\text{korrekte Schätzung}} \big) \geq \delta} Dass man diesen Aussagen überhaupt eine Wahrscheinlichkeit zuschreiben kann, liegt daran dass die Intervallgrenzen ${\textstyle p_{U}(T)}$ und ${\textstyle p_{O}(T)}$ zufällig sind (und nicht etwa der unbekannte, aber feste Wert ${\textstyle p}$ ).

Beispiel:

Für ${\textstyle n=100}$ und ${\textstyle k=71}$ ergeben sich die Intervallgrenzen als Lösungen der Gleichung ${\frac {1-\delta }{2}}=\sum _{j=71}^{100}{100 \choose j}{p_{U}}^{j}(1-p_{U})^{100-j}\quad {\text{und}}\quad {\frac {1-\delta }{2}}=\sum _{j=0}^{71}{100 \choose j}{p_{O}}^{j}(1-p_{O})^{100-j}$ Hierbei wären also Polynome vom Grad ${\textstyle n=100}$ aufzulösen. Mit R berechnen wir: Fehler beim Parsen (Unbekannte Funktion „\begin{array}“): {\displaystyle \begin{array}{l} \text{Für $\delta=0.6$ ist $[p_U,p_O] = [ 0.665, 0.751 ]$.}\\ \text{Für $\delta=0.8$ ist $[p_U,p_O] = [ 0.644 , 0.769]$.}\\ \text{Für $\delta=0.9$ ist $[p_U,p_O] = [ 0.626, 0.784]$.}\\ \text{Für $\delta=0.99$ ist $[p_U,p_O] = [ 0.580, 0.819]$.} \end{array}}
Für ${\textstyle n=20}$ erhält man zum Konfidenzniveau ${\textstyle \delta =0.8}$ mit der Clopper-Pearson-Methode abhängig von ${\textstyle k}$ die folgenden (mit R berechneten) Konfidenzintervalle ${\textstyle B(k)=[p_{U}(k),p_{O}(k)]}$ : ${\begin{array}{|c||c|c|c|c|c|c|c|}\hline k&0&1&2&3&4&5&6\\\hline B(k)&[0,0.109]&[0.005,0.181]&[0.027,0.245]&[0.056,0.304]&[0.090,0.361]&[0.127,0.415]&[0.166,0.467]\\\hline \hline k&7&8&9&10&11&12&13\\\hline B(k)&[0.207,0.518]&[0.249,0.567]&[0.292,0.615]&[0.338,0.662]&[0.385,0.707]&[0.433,0.751]&[0.482,0.793]\\\hline \hline k&14&15&16&17&18&19&20\\\hline B(k)&[0.533,0.834]&[0.585,0.873]&[0.639,0.910]&[0.696,0.944]&[0.755,0.973]&[0.819,0.995]&[0.891,1]\\\hline \end{array}}$

Wir berechnen für verschiedene denkbare Werte von ${\textstyle p}$ , die "Uberdeckungswahrscheinlichkeit (also die Wahrscheinlichkeit dafür, dass die Intervallschätzung korrekt ist):
- Angenommen, es ist ${\textstyle p=0.3}$ . Dann ist die Intervallschätzung für ${\textstyle T\in \{3,4,5,6,7,8,9\}}$ korrekt. Die Wahrscheinlichkeit dafür ist: $P_{B}(0.3)=P(B(T)\ni 0.3)=P(3\leq T\leq 9)=\sum _{k=3}^{9}{20 \choose k}(0.3)^{k}(1-0.3)^{20-k}=0.917$
- Angenommen, es ist ${\textstyle p=0.52}$ . Dann ist die Intervallschätzung für ${\textstyle T\in \{8,9,10,11,12,13\}}$ korrekt. Die Wahrscheinlichkeit dafür ist: $P_{B}(0.52)=P(B(T)\ni 0.52)=P(8\leq T\leq 13)=\sum _{k=8}^{13}{20 \choose k}(0.52)^{k}(1-0.52)^{20-k}=0.822$
- Angenommen, es ist ${\textstyle p=0.88}$ . Dann ist die Intervallschätzung für ${\textstyle T\in \{16,17,18,19\}}$ korrekt. Die Wahrscheinlichkeit dafür ist: $P_{B}(0.88)=P(B(T)\ni 0.88)=P(16\leq T\leq 19)=\sum _{k=16}^{19}{20 \choose k}(0.88)^{k}(1-0.88)^{20-k}=0.840$
- Angenommen, es ist ${\textstyle p=1}$ . Dann ist die Intervallschätzung für ${\textstyle k=20}$ korrekt. Die Wahrscheinlichkeit dafür ist: $P_{B}(1)=P(B(T)\ni 1)=P(T=20)={20 \choose 20}1^{20}(1-1)^{0}=1$
Es ist bewiesen, dass die Schätzung bei beliebigem ${\textstyle p}$ immer mindestens mit der Wahrscheinlichkeit ${\textstyle \delta }$ korrekt ist.
Bei fester relativer Häufigkeit werden die Konfidenzintervalle mit wachsender Versuchszahl kleiner (mit mehr Versuchen erreicht man eine höhere Genauigkeit) und mit wachsendem Konfidenzniveau größer (ein höheres Konfidenzniveau bezahltman mit einer ungenaueren Aussage). Man beachte die Gr"o"senordnungen dieser Ver"anderungen anhand der folgenden (mit R berechneten) Konfidenzintervalle:

${\begin{array}{|cc|c|c|c|c|c|}\hline &k/n&3/10&30/100&300/1000&3000/10000&30000/100000\\\delta &&&&&&\\\hline &&&&&&\\0.6&&\quad [0.157,0.484]\quad &\quad [0.258,0.346]\quad &\quad [0.287,0.313]\quad &\quad [0.296,0.304]\quad &\quad [0.298,0.302]\quad \\&&&&&&\\\hline &&&&&&\\0.8&&[0.115,0.552]&[0.239,0.367]&[0.281,0.320]&[0.294,0.306]&[0.298,0.302]\\&&&&&&\\\hline &&&&&&\\0.9&&[0.087,0.607]&[0.224,0.385]&[0.276,0.325]&[0.292,0.308]&[0.297,0.303]\\&&&&&&\\\hline &&&&&&\\0.95&&[0.066,0.653]&[0.212,0.400]&[0.271,0.330]&[0.291,0.310]&[0.297,0.303]\\&&&&&&\\\hline &&&&&&\\0.99&&[0.037,0.735]&[0.189,0.431]&[0.263,0.339]&[0.288,0.312]&[0.296,0.304]\\&&&&&&\\\hline \end{array}}$

Bemerkung:

(Verwendung von Intervallsch"atzungen in der Praxis)
In der Praxis ist bei der Verwendung von Intervallsch"atzungen wie folgt vorzugehen:

Zun"achst macht man sich die Situation klar: Die Trefferwahrscheinlichkeit ${\textstyle p}$ einer Binomialverteilung ist unbekannt (aber fest, d.h. nicht vom Zufall abh"angig).
Man legt fest:
- das Verfahren, mit dem man die Intervallsch"atzung berechnen wird. (z.B. zweiseitiger Test nach Clopper-Pearson).
- eine Versuchszahl ${\textstyle n\in \mathbb {N} }$

zu beachten:
Hohe Werte von ${\textstyle n}$ f"uhren zu einem engeren Konfidenzintervall.

- ein Konfidenzniveau ${\textstyle \delta \in ]0,1[}$

zu beachten:
Hohe Werte von ${\textstyle \delta }$ entsprechen einer h"oheren Untergrenze f"ur die Wahrscheinlichkeit einer korrekten Sch"atzung, f"uhren aber zu einem breiteren Konfidenzintervall. Sinnvoll ist z.B. ${\textstyle \delta =0.95}$ .

Man f"uhrt die Versuchsreihe durch und stellt die Trefferzahl ${\textstyle T^{\ast }=k}$ fest.

Zu beachten:
Wichtig bei einer Binomialverteilung ist, dass die einzelnen Versuche unabh"angig voneinander und immer unter den gleichen Bedingungen durchgef"uhrt werden.

Man berechnet das Konfidenzintervall ${\textstyle [p_{U}(k),p_{O}(k)]}$ mit der zuvor festgelegten Methode. (Dies kann der Computer erledigen.)
Man verk"undet das Ergebnis: Fehler beim Parsen (SVG (MathML kann über ein Browser-Plugin aktiviert werden): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „http://localhost:6011/de.wikiversity.org/v1/“:): {\displaystyle \fbox{$p \in [p_U(k), p_O(k)]$} \quad mit \; dem \; Zusatz: \quad \fbox{$ \glqq Das \; Konfidenzniveau \; \delta \; wurde \; eingehalten."$}} Damit ist klar: Vor Erhebung der Daten war die Wahrscheinlichkeit ein korrektes Intervall zu erhalten, mindestens ${\textstyle \delta }$ . Nach Berechnung des Intervalls kann man damit der Aussage ein gewisses Vertrauen entgegenbringen (aber keine Wahrscheinlichkeit zuweisen, sie ist entweder wahr oder falsch).

Bemerkung (Einseitig begrenzte Konfidenzintervalle)

In gewissen Situationen kann es Sinn machen, die Clopper-Pearson-Methode so zu modifizieren, dass man einseitig (statt wie bisher zweiseitig) begrenzte Konfidenzintervalle berechnet.

Beispiel:

Ist ${\textstyle p}$ beispielsweise die Wahrscheinlichkeit daf"ur, dass eine bestimmte Ma"snahme einen gew"unschten Erfolg erzielt, so k"onnte es wichtig sein, ${\textstyle p}$ (m"oglichst strikt) nach unten abzusch"atzen, aber eine Absch"atzung von ${\textstyle p}$ nach oben ist nicht notwendig.

Dazu kann man linkssseitig begrenzte Konfidenzintervalle verwenden.

Ist ${\textstyle p}$ beispielsweise die Wahrscheinlichkeit daf"ur, dass bei der Einnahme eines Medikaments eine (unerw"unschte) Nebenwirkung auftritt, so k"onnte es wichtig sein, ${\textstyle p}$ (m"oglichst strikt) nach oben abzusch"atzen, aber eine Absch"atzung von ${\textstyle p}$ nach unten ist nicht notwendig.

Dazu kann man rechtsseitig begrenzte Konfidenzintervalle verwenden.

Einseitig begrenze Konfidenzintervalle zu einem vorgegebenen Konfidenzniveau ${\textstyle \delta \in (0,1)}$ werden wie folgt berechnet.

Bei ${\textstyle k}$ Treffern aus ${\textstyle n}$ Versuchen bestimmt man das linksseitig begrenzte Konfidenzintervall ${\textstyle [p_{U},1]}$ zum Vertrauensniveau ${\textstyle \delta }$ durch $\sum _{j=k}^{n}{n \choose j}{p_{U}}^{j}(1-p_{U})^{n-j}=1-\delta$ (Sonderfall: Für ${\textstyle k=0}$ setze ${\textstyle p_{U}=0}$ .)
Bei ${\textstyle k}$ Treffern aus ${\textstyle n}$ Versuchen bestimmt man das rechtsseitig begrenzte Konfidenzintervall ${\textstyle [0,p_{O}]}$ zum Vertrauensniveau ${\textstyle \delta }$ durch $\sum _{j=0}^{k}{n \choose j}{p_{O}}^{j}(1-p_{O})^{n-j}=1-\delta$ (Sonderfall: Für ${\textstyle k=n}$ setze ${\textstyle p_{O}=1}$ .)

Linksseitig begrenzte Konfidenzintervalle d"urfen den Wert von ${\textstyle p}$ mit einer Wahrscheinlichkeit von bis zu ${\textstyle 1-\delta }$ "ubersch"atzen (statt ${\textstyle {\frac {1-\delta }{2}}}$ wie bei den zweiseitigen Intervallschätzungen). Um dies auszugleichen, unterschätzen sie den Wert von ${\textstyle p}$ nie (die obere Grenze ist ${\textstyle 1}$ ). Die untere Grenze kann daher im Vergleich zum zweiseitigen Test etwas besser (gr"o"ser) gew"ahlt werden.

Rechtsseitig begrenzte Konfidenzintervalle d"urfen den Wert von ${\textstyle p}$ mit einer Wahrscheinlichkeit von bis zu ${\textstyle 1-\delta }$ untersch"atzen (statt ${\textstyle {\frac {1-\delta }{2}}}$ wie bei den zweiseitigen Intervallschätzungen). Um dies auszugleichen, überschätzen sie den Wert von ${\textstyle p}$ nie (die untere Grenze ist ${\textstyle 0}$ ). Die obere Grenze kann daher im Vergleich zum zweiseitigen Test etwas besser (kleiner) gew"ahlt werden.

In R berechnet man einseitige Konfidenzintervalle nach Clopper-Pearson mit

Datei:R Konf.int.png

Beispiel:

Konfidenzintervalle im Vergleich: Fehler beim Parsen (SVG (MathML kann über ein Browser-Plugin aktiviert werden): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „http://localhost:6011/de.wikiversity.org/v1/“:): {\displaystyle \begin{array}{|r||c|c|c|} \hline \multicolumn{4}{|c|}{k= 112, \quad n=200 \quad \Rightarrow \quad \frac{k}{n} =0.56 }\\ \hline \delta & 0.8 & 0.9 & 0.95 \\ \hline \text{beidseitig begrenzt} & [0.512 , 0.607] & [0.499, 0.620] & [0.488, 0.630] \\ \hline \text{linksseitig begrenzt} & [0.527,1] & [0.512 ,1] & [0.499, 1] \\ \hline \text{rechtsseitig begrenzt} & [0,0.591] & [0 , 0.607] & [0, 0.620] \\ \hline \end{array}}

Allgemein bestimmt man aus den Gleichungen $\sum _{j=k}^{n}{n \choose j}{p_{U}}^{j}(1-p_{U})^{n-j}=\alpha _{U}\quad \left({\text{und}}\ p_{U}=0,\ {\text{falls}}\ k=0\right)$ $\sum _{j=0}^{k}{n \choose j}{p_{O}}^{j}(1-p_{O})^{n-j}=\alpha _{O}\quad \left({\text{und}}\ p_{O}=1,\ {\text{falls}}\ k=n\right)$ die Grenzen einer Intervallsch"atzung ${\textstyle [p_{U},p_{O}]}$ , die den Wert von ${\textstyle p}$ mit einer Wahrscheinlichkeit von h"ochstens ${\textstyle \alpha _{U}}$ "ubersch"atzt und mit einer Wahrscheinlichkeit von h"ochstens ${\textstyle \alpha _{O}}$ untersch"atzt. Das hei"st, es gilt $P(p<p_{U})\leq \alpha _{U}\quad {\text{und}}\quad P(p>p_{O})\leq \alpha _{O}$ und damit $P(p\in [p_{U},p_{O}])\geq 1-\alpha _{U}-\alpha _{O}$ Damit ist ${\textstyle \delta =1-\alpha _{U}-\alpha _{O}}$ das Konfidenzniveau der Sch"atzung.

Beispiel:

F"ur ${\textstyle \delta =0.95}$ hat man zum Beispiel folgende M"oglichkeiten:

				${\textstyle P(p<p_{U})}$	${\textstyle P(p>p_{O})}$	${\textstyle P(p\notin [p_{U},p_{O}])}$	${\textstyle P(p\in [p_{U},p_{O}])}$
${\textstyle \alpha _{U}=0.025}$	,	${\textstyle \alpha _{O}=0.025}$	zweiseitig, ${\textstyle \alpha _{U}=\alpha _{O}}$	${\textstyle \leq 0.025}$	${\textstyle \leq 0.025}$	${\textstyle \leq 0.05}$	${\textstyle \geq 0.95}$
${\textstyle \alpha _{U}=0.05}$	,	${\textstyle \alpha _{O}=0}$	linksseitig begrenzt	${\textstyle \leq 0.05}$	${\textstyle 0}$	${\textstyle \leq 0.05}$	${\textstyle \geq 0.95}$
${\textstyle \alpha _{U}=0}$	,	${\textstyle \alpha _{O}=0.05}$	rechtsseitig begrenzt	${\textstyle 0}$	${\textstyle \leq 0.05}$	${\textstyle \leq 0.05}$	${\textstyle \geq 0.95}$
${\textstyle \alpha _{U}=0.04}$	,	${\textstyle \alpha _{O}=0.01}$	zweiseitig, ${\textstyle \alpha _{U}\not =\alpha _{O}}$	${\textstyle \leq 0.04}$	${\textstyle \leq 0.01}$	${\textstyle \leq 0.05}$	${\textstyle \geq 0.95}$
${\textstyle \alpha _{U}=0.02}$	,	${\textstyle \alpha _{O}=0.03}$	zweiseitig, ${\textstyle \alpha _{U}\not =\alpha _{O}}$	${\textstyle \leq 0.02}$	${\textstyle \leq 0.03}$	${\textstyle \leq 0.05}$	${\textstyle \geq 0.95}$

Hypergeometrisch verteilte ZV

In einer Menge von ${\textstyle N\in \mathbb {N} }$ Objekten sind ${\textstyle K\in \{1,...,N\}}$ Objekte mit einer bestimmten Eigenschaft ausgezeichnet. Nun werden daraus ${\textstyle n\in \{1,...,n\}}$ Objekte zuf"allig ausgew"ahlt (gezogen). Wichtig ist dabei, dass die Ziehung zuf"allig und unabh"angig von der Eigenschaft ist, d.h. die ausgezeichneten Objekte haben dieselbe Chance gezogen zu werden, wie die anderen Objekte. Die ZV ${\textstyle A}$ beschreibt die Zahl ${\textstyle k\in \{1,...,n\}}$ der ausgezeichneten Objekte unter den Gezogenen.
Man sagt: ${\textstyle A}$ ist hypergeometrisch verteilt mit ${\textstyle K}$ Ausgezeichneten bei ${\textstyle N}$ Objekten insgesamt (bzw. mit ${\textstyle N-K}$ Nicht-Ausgezeichneten) und ${\textstyle n}$ Gezogenen.
Die m"oglichen Werte von ${\textstyle A}$ sind dann ${\textstyle 0,\ldots ,n}$ und es gilt: Fehler beim Parsen (Syntaxfehler): {\displaystyle P ( A=k) = \frac{{K \choose k} {N-K \choose n-k}}{{N \choose n}} \quad \text{f"ur $k \in \{0,\ldots , n \}$}}

Beispiel:

F"ur ${\textstyle N=70,\ K=12}$ und ${\textstyle n=20}$ ist beispielsweise: ${\begin{array}{rcccl}P(A=4)&=&{\frac {{12 \choose 4}{58 \choose 16}}{70 \choose 20}}&=&0.244497\\P(A=10)&=&{\frac {{12 \choose 10}{58 \choose 10}}{70 \choose 20}}&=&0.000021\\P(A=15)&=&{\frac {{12 \choose 15}{58 \choose 5}}{70 \choose 20}}&=&0\end{array}}$
F"ur ${\textstyle N=12,\ K=7,\ n=8}$ ist: ${\begin{array}{c||c|c|c|c|c|c|c|c|c}k&0&1&2&3&4&5&6&7&8\\\hline &&&&&&&&&\\P(A=k)&{\frac {{7 \choose 0}\cdot {5 \choose 8}}{12 \choose 8}}&{\frac {{7 \choose 1}\cdot {5 \choose 7}}{12 \choose 8}}&{\frac {{7 \choose 2}\cdot {5 \choose 6}}{12 \choose 8}}&{\frac {{7 \choose 3}\cdot {5 \choose 5}}{12 \choose 8}}&{\frac {{7 \choose 0}\cdot {5 \choose 4}}{12 \choose 4}}&{\frac {{7 \choose 5}\cdot {5 \choose 3}}{12 \choose 8}}&{\frac {{7 \choose 6}\cdot {5 \choose 2}}{12 \choose 8}}&{\frac {{7 \choose 7}\cdot {5 \choose 1}}{12 \choose 8}}&{\frac {{7 \choose 8}\cdot {5 \choose 0}}{12 \choose 8}}\\\parallel &\parallel &\parallel &\parallel &\parallel &\parallel &\parallel &\parallel &\parallel \\&0&0&0&0.071&0.354&0.424&0.141&0.010&0\end{array}}$

image
Hier einige weitere Beispiele:

image

Es folgt: $P(A\leq k)=\sum \limits _{j=0}^{k}{\frac {{K \choose j}{N-K \choose n-j}}{N \choose n}},\quad P(A\geq k)=\sum \limits _{j=k}^{n}{\frac {{K \choose j}{N-K \choose n-j}}{N \choose n}},\quad P(k\leq A\leq \ell )=\sum \limits _{j=k}^{\ell }{\frac {{K \choose j}{N-K \choose n-j}}{N \choose n}}$

Beispiel:

F"ur ${\textstyle N=70,\ K=12}$ und ${\textstyle n=20}$ ist beispielsweise: ${\begin{array}{rclcl}P(3\leq A\leq 5)&=&{\frac {{12 \choose 3}{58 \choose 17}}{70 \choose 20}}+{\frac {{12 \choose 4}{58 \choose 16}}{70 \choose 20}}+{\frac {{12 \choose 5}{58 \choose 15}}{70 \choose 20}}&=&0.658525\\&&&&\\P(A\leq 4)&=&{\frac {{12 \choose 0}{58 \choose 20}}{70 \choose 20}}+{\frac {{12 \choose 1}{58 \choose 19}}{70 \choose 20}}+{\frac {{12 \choose 3}{58 \choose 17}}{70 \choose 20}}+{\frac {{12 \choose 4}{58 \choose 16}}{70 \choose 20}}&=&0.778049\\&&&&\\P(A\geq 4)&=&{\frac {{12 \choose 4}{58 \choose 16}}{70 \choose 20}}+{\frac {{12 \choose 5}{58 \choose 15}}{70 \choose 20}}+\quad \ldots \quad +{\frac {{12 \choose 20}{58 \choose 0}}{70 \choose 20}}&=&0.466448\end{array}}$

In R:

dhyper( ${\textstyle k,K,N-K,n}$ )	ergibt	${\textstyle P(A=k)}$	${\textstyle =}$	${\textstyle {\frac {{K \choose k}{N-K \choose n-k}}{N \choose n}}}$
phyper( ${\textstyle k,K,N-K,n}$ )	ergibt	${\textstyle P(A\leq k)}$	${\textstyle =}$	${\textstyle \sum \limits _{j=0}^{k}{\frac {{K \choose j}{N-K \choose n-j}}{N \choose n}}}$
${\textstyle 1-}$ phyper( ${\textstyle k-1,K,N-K,n}$ )	ergibt	${\textstyle P(A\geq k)}$	${\textstyle =}$	${\textstyle \sum \limits _{j=k}^{n}{\frac {{K \choose j}{N-K \choose n-j}}{N \choose n}}}$
phyper( ${\textstyle \ell ,K,N-K,n}$ ) ${\textstyle -}$ phyper( ${\textstyle k-1,K,N-K,n}$ )	ergibt	${\textstyle P(k\leq A\leq \ell )}$	${\textstyle =}$	${\textstyle \sum \limits _{j=k}^{\ell }{\frac {{K \choose j}{N-K \choose n-j}}{N \choose n}}}$

Aufgabe:

Berechnen Sie f"ur eine hypergeometrisch verteilte ZV ${\textstyle A}$ mit den jeweils angegebenen Werten f"ur ${\textstyle N,K}$ und ${\textstyle n}$ die angegebenen Wahrscheinlichkeiten:

F"ur ${\textstyle N=14,\ K=4}$ und ${\textstyle n=7}$ : ${\textstyle \quad P(A=k)}$ f"ur alle ${\textstyle k=0,\ldots ,7}$
F"ur ${\textstyle N=25,\ K=8}$ und ${\textstyle n=8}$ : ${\textstyle \quad P(A\leq 2),\ P(A\geq 4),\ P(1\leq A\leq 3)}$
F"ur ${\textstyle N=140,\ K=30}$ und ${\textstyle n=20}$ : ${\textstyle \quad P(A\leq 7),\ P(A\geq 5),\ P(3\leq A\leq 6)}$

Beispiel:

(Ziehen ohne Zur"ucklegen) Aus einer Lostrommel, die ${\textstyle N}$ Kugeln enth"alt, von denen ${\textstyle K}$ rot sind, werden ohne Zur"ucklegen ${\textstyle n}$ Kugeln gezogen. Die ZV f"ur die Anzahl der roten Kugeln unter den Gezogenen ist hypergeometrisch verteilt.
In einem Teich befinden sich ${\textstyle 350}$ Fische einer Art, von denen ${\textstyle 80}$ markiert sind. Nun werden ${\textstyle 45}$ Fische gefangen. Die ZV f"ur die Zahl der markierten Fische unter den Gefangenen ist hypergeometrisch verteilt mit ${\textstyle N=350,\ K=80}$ und ${\textstyle n=45}$ . (Voraussetzung: Die markierten Fische sind "uber den See gleichm"a"sig verteilt und lassen sich genauso leicht fangen, wie die "Ubrigen.)
In einer Klasse befinden sich ${\textstyle 12}$ Jungen und ${\textstyle 15}$ M"adchen. Es werden ${\textstyle 10}$ Sch"uler/innen f"ur ein Projekt ausgelost. Die ZV, die die Zahl der Jungen unter den Ausgelosten angibt, ist hypergeometrisch verteilt mit ${\textstyle N=27,\ K=12}$ und ${\textstyle n=10}$ .

Aufgabe

Wie gro"s ist beim Lotto (6 aus 49) die Wahrscheinlichkeit, genau ${\textstyle k}$ Richtige zu haben ( ${\textstyle k=0,\ldots ,6}$ ).
Bei einem Multiple-Choice Test gibt es 20 Aussagen, von denen genau 10 richtig sind. Ein unvorbereiteter Teilnehmer kreuzt willk"urlich genau 10 Aussagen an. Wie gro"s ist die Wahrscheinlichkeit, dass dabei ${\text{(i)}}\ {\text{mindestens 6}}\quad \quad {\text{(ii)}}\ {\text{weniger als 4}}\quad \quad {\text{(iii)}}\ {\text{zwischen 1 und 5}}$ der angekreuzten Aussagen richtig sind?
Unter 500 Gl"uhbirnen in einem Karton befinden sich 35 defekte. Bei einer Qualit"atskontrolle werden 50 Birnen getestet. Wie groß ${\textstyle \;}$ ist die Wahrscheinlichkeit, dass ${\text{(i)}}\ {\text{mindestens 4}}\quad \quad {\text{(ii)}}\ {\text{zwischen 1 und 3}}\quad \quad {\text{(iii)}}\ {\text{keine}}$ der Birnen defekt ist?

F"ur eine hypergeometrisch verteilte ZV ${\textstyle A}$ mit ${\textstyle N,K,n}$ wie bisher gilt: $E(A)=n\cdot {\frac {K}{N}}\quad {\text{und}}\quad V(A)=n\cdot {\frac {K}{N}}\cdot \left(1-{\frac {K}{N}}\right)\cdot {\frac {N-n}{N-1}}$

Beispiel:

F"ur ${\textstyle N=9,\ K=4}$ und ${\textstyle n=6}$ haben wir oben bereits die Wahrscheinlichkeitsverteilung bestimmt. Daraus ergibt sich: ${\begin{array}{rcccl}E(A)&=&0\cdot 0+0.0476\cdot 1+0.357\cdot 2+0.476\cdot 3+0.119\cdot 4+0\cdot 5+0\cdot 6\\&=&2.667\\V(A)&=&\left\{{\begin{array}{cc}0\cdot (0-2.667)^{2}+0.0476\cdot (1-2.667)^{2}+0.357\cdot (2-2.667)^{2}+0.476\cdot (3-2.667)^{2}\\+0.119\cdot (4-2.667)^{2}+0\cdot (5-2.667)^{2}+0\cdot (6-2.667)^{2}\end{array}}\right\}\\&=&0.5556\end{array}}$ Tats"achlich ist ${\textstyle E(A)=6\cdot {\frac {4}{9}}}$ und ${\textstyle V(A)=6\cdot {\frac {4}{9}}\cdot \left(1-{\frac {4}{9}}\right)\cdot {\frac {9-6}{9-1}}}$ .
F"ur ${\textstyle N=30,\ K=18}$ und ${\textstyle n=12}$ berechnen wir zun"achst ${\textstyle P(A=k)={\frac {{18 \choose k}{12 \choose 12-k}}{30 \choose 12}}}$ f"ur alle m"oglichen Werte ${\textstyle k=0,\ldots ,12}$ : ${\begin{array}{|c||c|c|c|c|c|c|c|}\hline \hline k&0&1&2&3&4&5&6\\P(T=k)&<0.001&<0.001&0.0001&0.0021&0.0175&0.0785&0.1983\\\hline \hline k&7&8&9&10&11&12&\\P(A=k)&0.2914&0.2504&0.1237&0.0334&0.0044&0.0002&\\\hline \hline \end{array}}$ Daraus ergibt sich: ${\begin{array}{rclclccclcl}E(A)&=&P(A=0)\cdot 0&+&P(A=1)\cdot 1&+&\quad \ldots \quad &+&P(A=12)\cdot 12\quad \\&=&7.2\\V(A)&=&P(A=0)\cdot (0-7.2)^{2}&+&P(A=1)\cdot (1-7.2)^{2}&+&\quad \ldots \quad &+&P(A=12)\cdot (12-7.2)^{2}\\&=&1.7876\end{array}}$ Tats"achlich ist ${\textstyle E(A)=12\cdot {\frac {18}{30}}}$ und ${\textstyle V(A)=12\cdot {\frac {18}{30}}\cdot \left(1-{\frac {18}{30}}\right)\cdot {\frac {30-12}{30-1}}}$ .

Sch"atzung der Zahl der ausgezeichneten Objekte ${\textstyle K}$

Beispiel:

Von ${\textstyle N=1000}$ Gl"ubirnen einer Lieferung sind eine unbekannte Anzahl ${\textstyle K}$ defekt. Man testet ${\textstyle n=15}$ zuf"allig ausgew"ahlte Birnen und stellt fest, dass ${\textstyle k=2}$ davon defekt sind. Wie kann man daraus auf die Zahl ${\textstyle K}$ schlie"sen? Fehler beim Parsen (SVG (MathML kann über ein Browser-Plugin aktiviert werden): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „http://localhost:6011/de.wikiversity.org/v1/“:): {\displaystyle \fbox{{\textbf{Situation:}} Es sind $N,n$ und $k$ bekannt, aber nicht $K$. Wie kann man $K$ sinnvoll sch"atzen?}} Genauer:

${\textstyle N\in \mathbb {N} }$ und ${\textstyle n\in \{1,\ldots ,N\}}$ sind feststehend und bekannt. Oft kann man ${\textstyle n}$ selbst festlegen.
${\textstyle k\in \{0,\ldots ,n\}}$ entsteht zuf"allig, ist dann aber bekannt.
${\textstyle K\in \{0,\ldots ,N\}}$ steht fest, ist aber nicht bekannt.

Fehler beim Parsen (Unbekannte Funktion „\fbox“): {\displaystyle \fbox{System mit Parameter $K$} \stackrel{\text{zuf"allig}}{\longrightarrow} \fbox{Daten $k$ } \stackrel{\text{methodisch}}{\longrightarrow} \fbox{Sch"atzung $\hat{K}$ f"ur $K$}} Wiederum ist dabei folglich die Sch"atzung zuf"allig.

Erwartungstreue Punktsch"atzungen f"ur ${\textstyle K}$

Durch ${\textstyle {\hat {K}}={\frac {k\cdot N}{n}}}$ erh"alt man eine erwartungstreue Sch"atzung f"ur ${\textstyle K}$ .

Genauer: Die Zahl ${\textstyle k}$ h"angt vom Zufall ab und wird (vor der Datenerhebung) durch die ZV ${\textstyle A}$ beschrieben. Da die Sch"atzung f"ur (die feste aber unbekannte Zahl) ${\textstyle K}$ von ${\textstyle k}$ abh"angt, ist sie ebenfalls vom Zufall abh"angig. Die Sch"atzung ${\textstyle {\hat {K}}={\frac {A\cdot N}{n}}}$ kann somit als ZV beschrieben werden. Dabei gilt dann (unabh"angig vom unbekannten Wert ${\textstyle K\in \{0,\ldots ,N\}}$ ) stets ${\textstyle E({\hat {K}})=E\left({\frac {A\cdot N}{n}}\right)=K}$ .

Beispiel:

${\begin{array}{ccccrcccl}N=15&n=8&k=3&\Rightarrow &{\hat {K}}&=&{\frac {3\cdot 15}{8}}&=&5.625\\N=40&n=12&k=3&\Rightarrow &{\hat {K}}&=&{\frac {10\cdot 40}{12}}&=&33.33\\N=1000&n=15&k=2&\Rightarrow &{\hat {K}}&=&{\frac {2\cdot 1000}{15}}&=&133.33\end{array}}$

Das Maximum-Likelihood-Prinzip

Mit der Maximum-Likelihood-Methode wird ${\textstyle K\in \{0,\ldots ,N\}}$ (basierend auf der zuf"alligen Zahl ${\textstyle k}$ ) so gesch"atzt, dass die Wahrscheinlichkeit ${\textstyle P(A=k)}$ maximal wird. Wir suchen also die Maximumstelle der Likelihood-Funktion $L:\{0,\ldots ,N\}\to [0,1],\ L(K)={\frac {{K \choose k}\cdot {N-K \choose n-k}}{N \choose n}}$

Man stellt fest:
Die Maximumstelle(n) von ${\textstyle L}$ ist/sind: $\left\{{\begin{array}{lcc}{\hat {K}}_{1}={\frac {k\cdot (N+1)}{n}}-1\quad {\text{und}}\quad {\hat {K}}_{2}={\frac {k\cdot (N+1)}{n}}&,&{\text{falls}}\ {\frac {k\cdot (N+1)}{n}}\in \mathbb {N} \ {\text{ist.}}\\{\hat {K}}=\left\lfloor {\frac {k\cdot (N+1)}{n}}\right\rfloor &,&{\text{falls}}\ {\frac {k\cdot (N+1)}{n}}\notin \mathbb {N} \ {\text{ist.}}\end{array}}\right\}$ (dabei bezeichnet ${\textstyle \lfloor x\rfloor }$ die gr"o"ste ganze Zahl, die kleiner oder gleich ${\textstyle x}$ ist)

Beispiel:

image

Intervallsch"atzungen f"ur ${\textstyle K}$

Ziel:

Gib eine Methode an, mit der man aus ${\textstyle k}$ ein Intervall ${\textstyle [K_{U},K_{O}]}$ bestimmen kann, so dass die Wahrscheinlichkeit, dass sich ein Intervall ergibt, das ${\textstyle K}$ enth"alt, garantiert (also f"ur jeden denkbaren Wert von ${\textstyle K}$ ) gr"o"ser oder gleich einem vorgegebenen Konfidenzniveau ${\textstyle \delta }$ ist. Fehler beim Parsen (SVG (MathML kann über ein Browser-Plugin aktiviert werden): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „http://localhost:6011/de.wikiversity.org/v1/“:): {\displaystyle \fbox{System mit Parameter $K$} \stackrel{\text{zuf"allig}}{\longrightarrow} \fbox{Daten $k$ } \stackrel{\text{methodisch}}{\longrightarrow} \fbox{(Intervall-)Sch"atzung $[K_U, K_O]$ f"ur $K$}} Fehler beim Parsen (Unbekannte Funktion „\fbox“): {\displaystyle \fbox{$\text{\textbf{Ziel:} F"ur jeden m"oglichen Wert von $K$:} \quad P \left( [K_U, K_O] \ni K \right) \geq \delta$}} Eine sinnvolle M"oglichkeit wird im Folgenden beschrieben:

IVS f"ur ${\textstyle K}$ , die ein gegebenes Konfidenzniveau einh"alt

Gegeben seien ${\textstyle N\in \mathbb {N} }$ und ${\textstyle n\in \{1,\ldots ,n\}}$ . Unbekannt sei ${\textstyle K\in \{0,\ldots ,N\}}$ . Weiter sei ein Konfidenzniveau ${\textstyle \delta \in ]0,1[}$ vorgegeben.
Basierend auf der zuf"alligen Zahl ${\textstyle k}$ geht man nun wie folgt vor:

Man bestimmt ${\textstyle K_{U}}$ als die kleinstm"ogliche Zahl mit Fehler beim Parsen (Unbekannte Funktion „\textcolor“): {\displaystyle \textcolor{blue}{\text{phyper}(k-1, K_U, N-K_U, n)} = \sum\limits_{j=0}^{k-1} \frac{{K_U \choose j} \cdot {N-K_U \choose n-j}}{{N \choose n}} < \frac{1+ \delta}{2}}
Man bestimmt ${\textstyle K_{O}}$ als die gr"o"stm"ogliche Zahl mit Fehler beim Parsen (SVG (MathML kann über ein Browser-Plugin aktiviert werden): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „http://localhost:6011/de.wikiversity.org/v1/“:): {\displaystyle \textcolor{blue}{\text{phyper}(k, K_O, N-K_O, n)} = \sum\limits_{j=0}^k \frac{{K_O \choose j} \cdot {N-K_O \choose n-j}}{{N \choose n}} > \frac{1- \delta}{2}}

Ohne weiter in die mathematischen Hintergr"unde einzusteigen, halten wir fest, dass die folgende (bei Intervallsch"atzungen immer zu erreichende) Bedingung bei diesem Verfahren garantiert erf"ullt ist: Fehler beim Parsen (Unbekannte Funktion „\fbox“): {\displaystyle \fbox{$P \left( [K_U, K_O] \ni K \right) \geq \delta$} \quad \text{(D.h. das Konfidenzniveau $\delta$ wird eingehalten.)}} Man beachte, dass der Aussage ${\textstyle K\in [K_{U},K_{O}]}$ ${\textstyle \;}$ eine Wahrscheinlichkeit zugeschrieben werden kann, weil die Intervallgrenzen ${\textstyle K_{U}}$ und ${\textstyle K_{O}}$ zuf"allig sind (und nicht etwa der unbekannte Wert ${\textstyle K}$ ).

Beispiel:

Wir betrachten erneut den Fall ${\textstyle n=1000,n=15,k=2}$ und f"uhren eine Intervallsch"atzung zum Niveau ${\textstyle \delta =0.95}$ durch.

Wir suchen also zun"achst die kleinstm"ogliche Zahl ${\textstyle K_{U}}$ mit Fehler beim Parsen (Unbekannte Funktion „\textcolor“): {\displaystyle \textcolor{blue}{\text{phyper}(1, K_U, 1000-K_U, 15)} < 0.975} Durch Ausprobieren findet man: ${\textstyle \quad K_{U}=17}$
Analog suchen wir die gr"o"stm"ogliche Zahl mit Fehler beim Parsen (Unbekannte Funktion „\textcolor“): {\displaystyle \textcolor{blue}{\text{phyper}(2, K_O, 1000-K_O, 15)}> 0.025} Durch Ausprobieren findet man: ${\textstyle \quad K_{0}=402}$

Damit ist ${\textstyle [K_{U},K_{O}]=[17,402]}$ das gesuchte Konfidenzintervall zu ${\textstyle \delta =0.95}$ .

Beispiel:

F"ur ${\textstyle N=200}$ und ${\textstyle n=18}$ berechnet man abh"angig von ${\textstyle k}$ die folgenden ML-Sch"atzungen und Intervallsch"atzungen zum Vertrauensniveau ${\textstyle \delta =0.7}$ : Fehler beim Parsen (Unbekannte Funktion „\multicolumn“): {\displaystyle \begin{array}{|c||c|c|c|c|c|c|c|c|c|c|} \hline k & 0 & 1 & 2 & 3 & 4 & 5 & 6 & 7 & 8 & 9 \\ \hline \hat{K} & 0 & 11 &22 &33 &44 & 55 & 67 & 78 &89 &100 \\ \hline K \in & [0,19] & [2,34] & [8,47] & [16,60] & [24,72] & [33,84] & [43,95] & [52,106] & [62,117] & [73,127] \\ \hline \multicolumn{11}{|c|}{} \\ \hline k & 10 & 11 & 12 & 13 & 14 & 15 & 16 & 17 & 18 & \\ \hline \hat{K} & 111 &122 &134 &145& 156& 167 &178 &189 &201 & \\ \hline K \in & [83,138] & [94,148] & [105,157] & [116,167] & [128,176] & [140,184] & [153,192] & [166,198] & [181,200] & \\ \hline \end{array}}

Angenommen, es ist ${\textstyle K=120}$ . Dann ist die Intervallsch"atzung f"ur ${\textstyle k\in \{9,10,12,12,13\}}$ korrekt. Die Wahrscheinlichkeit daf"ur ist: $P(9\leq A\leq 13)=\sum _{k=9}^{13}{\frac {{120 \choose k}\cdot {80 \choose 18-k}}{200 \choose 18}}={\frac {{120 \choose 9}\cdot {80 \choose 9}}{200 \choose 18}}+{\frac {{120 \choose 10}\cdot {80 \choose 8}}{200 \choose 18}}+{\frac {{120 \choose 11}\cdot {80 \choose 7}}{200 \choose 18}}+{\frac {{120 \choose 12}\cdot {80 \choose 6}}{200 \choose 18}}+{\frac {{120 \choose 13}\cdot {80 \choose 5}}{200 \choose 18}}=0.792$
Angenommen, es ist ${\textstyle K=48}$ . Dann ist die Intervallsch"atzung f"ur ${\textstyle k\in \{3,4,5,6\}}$ korrekt. Die Wahrscheinlichkeit daf"ur ist: $P(3\leq A\leq 6)=\sum _{k=3}^{6}{\frac {{48 \choose k}\cdot {152 \choose 18-k}}{200 \choose 18}}={\frac {{48 \choose 3}\cdot {152 \choose 15}}{200 \choose 18}}+{\frac {{48 \choose 4}\cdot {152 \choose 14}}{200 \choose 18}}+{\frac {{48 \choose 5}\cdot {152 \choose 13}}{200 \choose 18}}+{\frac {{48 \choose 6}\cdot {152 \choose 12}}{200 \choose 18}}=0.749$
Angenommen, es ist ${\textstyle K=199}$ . Dann ist die Intervallsch"atzung nur f"ur ${\textstyle k=18}$ korrekt. Die Wahrscheinlichkeit daf"ur ist: $P(A=18)={\frac {{199 \choose 18}\cdot {1 \choose 0}}{200 \choose 18}}=0.91$

Das mathematische Modell garantiert, dass die Intervallsch"atzung bei beliebigem ${\textstyle K}$ immer mindestens mit der Wahrscheinlichkeit ${\textstyle \delta }$ korrekt ist.

Sch"atzung der Gesamtzahl der Objekte ${\textstyle N}$

Beispiel (Capture-Recapture)

In einem See befindet sich eine unbekannte Anzahl ${\textstyle N}$ von Fischen einer Art. Man m"ochte wissen, wie gro"s ${\textstyle N}$ in etwa ist. Dazu f"angt man eine (kleinere) Anzahl ${\textstyle K}$ von Fischen und markiert sie. Dann setzt man sie wieder aus und wartet einen angemessenen Zeitraum. Dann f"angt man in einem zweiten Fischzug ${\textstyle n}$ Fische und bestimmt die Anzahl ${\textstyle k}$ der markierten Fische unter ihnen.
Beispielsweise hat man ${\textstyle K=100}$ Fische markiert und unter ${\textstyle n=50}$ gefangenen Fischen ${\textstyle k=14}$ markierte Fische wiedergefunden.

Wie kann man daraus eine sinnvolle Sch"atzung f"ur ${\textstyle N}$ abgeben?

Fehler beim Parsen (Unbekannte Funktion „\fbox“): {\displaystyle \fbox{\textbf{Situation:} Es sind $K,n$ und $k$ bekannt, aber nicht $N$. Wie kann man $N$ sinnvoll sch"atzen?}} Genauer:

${\textstyle K\in \mathbb {N} }$ und ${\textstyle n\in \mathbb {N} }$ sind fest und bekannt. Manchmal kann man ${\textstyle K}$ und ${\textstyle n}$ selbst festlegen.
${\textstyle k\in \{0,\ldots ,n\}}$ entsteht zuf"allig, ist dann aber bekannt.
${\textstyle N\in \mathbb {N} }$ mit ${\textstyle N\geq \max(n,K)}$ steht fest, ist aber nicht bekannt.

Fehler beim Parsen (SVG (MathML kann über ein Browser-Plugin aktiviert werden): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „http://localhost:6011/de.wikiversity.org/v1/“:): {\displaystyle \fbox{System mit Parameter $N$} \stackrel{\text{zuf"allig}}{\longrightarrow} \fbox{Daten $k$ } \stackrel{\text{methodisch}}{\longrightarrow} \fbox{Sch"atzung $\hat{N}$ f"ur $N$}} Wiederum ist damit die Sch"atzung zuf"allig.

Erwartungstreue Punktsch"atzungen f"ur ${\textstyle N}$

Durch ${\textstyle {\hat {N}}={\frac {K\cdot n}{k}}}$ erh"alt man eine Sch"atzung f"ur ${\textstyle N}$ .

Dabei gilt: ${\textstyle {\frac {1}{\hat {N}}}={\frac {k}{K\cdot n}}}$ ist erwartungstreu f"ur ${\textstyle {\frac {1}{N}}}$ .

Genauer: Die Zahl ${\textstyle k}$ h"angt vom Zufall ab und wird (vor der Datenerhebung) durch die ZV ${\textstyle A}$ beschrieben. Da die Sch"atzung f"ur (die feste aber unbekannte Zahl) ${\textstyle N}$ von ${\textstyle k}$ abh"angt, ist sie ebenfalls vom Zufall abh"angig. Die Sch"atzung ${\textstyle {\hat {N}}={\frac {K\cdot n}{A}}}$ kann somit als ZV beschrieben werden. Dabei gilt dann (unabh"angig vom unbekannten Wert ${\textstyle N\in \mathbb {N} }$ ) stets ${\textstyle E\left({\frac {1}{\hat {N}}}\right)=E\left({\frac {A}{K\cdot n}}\right)={\frac {1}{N}}}$ .

Beispiel:

${\begin{array}{ccccrcccl}K=25&n=16&k=10&\Rightarrow &{\hat {N}}&=&{\frac {25\cdot 16}{10}}&=&40\\K=25&n=16&k=10&\Rightarrow &{\hat {N}}&=&{\frac {25\cdot 16}{3}}&=&133.33\\K=100&n=50&k=14&\Rightarrow &{\hat {N}}&=&{\frac {100\cdot 50}{14}}&=&357.14\end{array}}$

Sch"atzung f"ur ${\textstyle N}$ mit der Maximum-Likelihood-Methode

Mit der Maximum-Likelihood-Methode wird ${\textstyle N\in \{\max(K,n),\ldots \}}$ (basierend auf der zuf"alligen Zahl ${\textstyle k}$ ) so gesch"atzt, dass die Wahrscheinlichkeit ${\textstyle P(A=k)}$ maximal wird. Wir suchen also die Maximumstelle der Likelihood-Funktion $L:\{\max(K,n),\ldots \}\to [0,1],\ L(N)={\frac {{K \choose k}\cdot {N-K \choose n-k}}{N \choose n}}$

Man stellt fest:
Die Maximumstelle(n) ist/sind von ${\textstyle L}$ : $\left\{{\begin{array}{lcc}{\hat {N}}_{1}={\frac {K\cdot n}{k}}-1\quad {\text{und}}\quad {\hat {N}}_{2}={\frac {K\cdot n}{k}}&,&{\text{falls}}\ {\frac {K\cdot n}{k}}\in \mathbb {N} \ {\text{ist.}}\\{\hat {N}}=\left\lfloor {\frac {K\cdot n}{k}}\right\rfloor &,&{\text{falls}}\ {\frac {K\cdot n}{k}}\notin \mathbb {N} \ {\text{ist.}}\end{array}}\right\}$ (dabei bezeichnet ${\textstyle \lfloor x\rfloor }$ die gr"o"ste ganze Zahl, die kleiner oder gleich ${\textstyle x}$ ist)

Beispiel:

image

Intervallsch"atzungen f"ur ${\textstyle N}$

Ziel:

Gib eine Methode an, mit der man aus ${\textstyle k}$ ein Intervall ${\textstyle [N_{U},N_{O}]}$ bestimmen kann, so dass die Wahrscheinlichkeit, dass sich ein Intervall ergibt, das ${\textstyle N}$ enth"alt, auf jeden Fall (also f"ur jeden denkbaren Wert von ${\textstyle N}$ ) mindestens ein vorgegebenes Konfidenzniveau ${\textstyle \delta }$ ist. Fehler beim Parsen (SVG (MathML kann über ein Browser-Plugin aktiviert werden): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „http://localhost:6011/de.wikiversity.org/v1/“:): {\displaystyle \fbox{System mit Parameter $N$} \stackrel{\text{zuf"allig}}{\longrightarrow} \fbox{Daten $k$ } \stackrel{\text{methodisch}}{\longrightarrow} \fbox{(Intervall-)Sch"atzung $[N_U, N_O]$ f"ur $N$}} Fehler beim Parsen (Unbekannte Funktion „\fbox“): {\displaystyle \fbox{$\text{\textbf{Ziel:} F"ur jeden m"oglichen Wert von $N$:} \quad P \left( [N_U, N_O] \ni N \right) \geq \delta$}} Eine sinnvolle M"oglichkeit wird im Folgenden beschrieben.

IVS f"ur ${\textstyle N}$ , die ein gegebenes Konfidenzniveau einh"alt

Gegeben seien ${\textstyle K,n\in \{1,\ldots ,n\}}$ . Unbekannt sei ${\textstyle N\in \{\max(K,n),\ldots ,N\}}$ . Weiter sei ein Konfidenzniveau ${\textstyle \delta \in ]0,1[}$ vorgegeben.
Basierend auf der zuf"alligen Zahl ${\textstyle k}$ geht man nun wie folgt vor:

Man bestimmt ${\textstyle N_{U}}$ als die kleinstm"ogliche Zahl mit Fehler beim Parsen (Unbekannte Funktion „\textcolor“): {\displaystyle \textcolor{blue}{\text{phyper}(k, K, N_U-K, n)} = \sum\limits_{j=0}^k \frac{{K \choose j} \cdot {N_U-K \choose n-j}}{{N_U \choose n}} > \frac{1- \delta}{2}}
Man bestimmt ${\textstyle N_{O}}$ als die gr"o"stm"ogliche Zahl mit Fehler beim Parsen (Unbekannte Funktion „\textcolor“): {\displaystyle \textcolor{blue}{\text{phyper}(k-1, K, N_O-K, n)} = \sum\limits_{j=0}^{k-1} \frac{{K \choose j} \cdot {N_O-K \choose n-j}}{{N_O \choose n}} < \frac{1+ \delta}{2}}

Wir halten fest, dass die folgende (bei Intervallsch"atzungen immer zu erreichende) Bedingung bei diesem Verfahren garantiert erf"ullt ist: Fehler beim Parsen (Unbekannte Funktion „\fbox“): {\displaystyle \fbox{$P \left( [N_U, N_O] \ni N \right) \geq \delta$} \quad \text{(D.h. das Konfidenzniveau $\delta$ wird eingehalten.)}} Man beachte, dass der Aussage ${\textstyle N\in [N_{U},N_{O}]}$ ${\textstyle \;}$ eine Wahrscheinlichkeit zugeschrieben werden kann, weil die Intervallgrenzen ${\textstyle N_{U}}$ und ${\textstyle N_{O}}$ zuf"allig sind (und nicht etwa der unbekannte Wert ${\textstyle N}$ ).

Beispiel:

Wir betrachten erneut den Fall ${\textstyle K=100,n=50,k=14}$ und f"uhren eine Intervallsch"atzung zum Niveau ${\textstyle \delta =0.8}$ durch.

Wir suchen also zun"achst die kleinstm"ogliche Zahl ${\textstyle N_{U}}$ mit Fehler beim Parsen (Unbekannte Funktion „\textcolor“): {\displaystyle \textcolor{blue}{\text{phyper}(14, 100, N_U-100, 50)} > 0.1} Durch Ausprobieren findet man: ${\textstyle \quad N_{U}=272}$
Analog suchen wir die gr"o"stm"ogliche Zahl mit Fehler beim Parsen (SVG (MathML kann über ein Browser-Plugin aktiviert werden): Ungültige Antwort („Math extension cannot connect to Restbase.“) von Server „http://localhost:6011/de.wikiversity.org/v1/“:): {\displaystyle \textcolor{blue}{\text{phyper}(13,100,N_O-100,50)}< 0.9} Durch Ausprobieren findet man: ${\textstyle \quad N_{0}=499}$

Damit ist ${\textstyle [N_{U},N_{O}]=[272,499]}$ das gesuchte Konfidenzintervall zu ${\textstyle \delta =0.8}$ .

Weitere diskrete ZV

Die nachfolgenden ZV werden hier kurz vorgestellt. Selbstverständlich können auch für die Parameter dieser Verteilungen Punkt- und Intervallschätzungen vorgenommen werden, es soll hier jedoch nicht weiter darauf eingegangen werden.

Poisson-verteilte ZV

Die Zufallsvariable ${\textstyle X}$ heißt Poisson-verteilt mit der durch Beobachtung zu erwartenden Ereignishäufigkeit ${\textstyle \lambda }$ , wenn ihre Wahrscheinlichkeitsfunktion gegeben ist durch $P(X=x)={\frac {\lambda ^{x}}{x!}}e^{-\lambda }$ für ${\textstyle x\in \mathbb {N} }$ .
Die Poissonverteilung gibt die Wahrscheinlichkeit für die Anzahl von Ereignissen an, die unabhängig voneinander in einem räumlichen Gebiet oder zeitlichen Intervall auftreten. Ist ${\textstyle X}$ Poisson-verteilt mit Parameter ${\textstyle \lambda }$ , so gilt $E(X)=\lambda$ und $Var(X)=\lambda$

Beispiele:

image mit ${\textstyle \lambda =1}$ (blau), ${\textstyle \lambda =5}$ (grün) und ${\textstyle \lambda =10}$ (rot). Bildquelle: https://commons.wikimedia.org/wiki/File:Poisson-Verteilung.PNG; Lizenz: CC-BY-3.0 & GDFL 1.2; Beschreibung: Poisson-Verteilung; Autor: Schlurcher; Datum: 5. September 2009 (Upload)
Für die Poissonverteilung gilt die Rekursionsformel $P(X=x)={\frac {\lambda }{k}}\cdot P(X=x-1)$ für ${\textstyle x\in \mathbb {N} \setminus \{0\}}$ und es gilt ${\textstyle P(X=0)=e^{-\lambda }}$ .

Es folgt wie zuvor für $P(X\leq x)=\sum \limits _{j=0}^{x}{\frac {\lambda ^{j}}{j!}}e^{-\lambda }$ und für $P(x\leq X\leq \ell )=\sum \limits _{j=x}^{\ell }{\frac {\lambda ^{j}}{j!}}e^{-\lambda }$ Da bei der Poissonverteilung jedoch theoretisch gesehen unendlich viele Ereignisse in dem betrachteten Intervall auftreten können, wird die kumulierte Verteilung für ${\textstyle P(X\geq x)}$ mittels einer unendlichen Summe dargestellt: $P(X\geq x)=\sum \limits _{j=x}^{\infty }{\frac {\lambda ^{j}}{j!}}e^{-\lambda }.$

Anmerkung:

Dennoch gilt die Normierbarkeit, da die Wahrschienlichkeiten für ${\textstyle x>\lambda }$ abnehmen und sich beliebig nahe an die ${\textstyle 0}$ annähern. Somit liegt zwar eine unendliche Summe vor, diese konvergiert jedoch, d.h. hat einen endlichen Wert, nämlich $P(x\in \Omega )=\sum _{x=0}^{\infty }P(X=x)=1$

Beispiel:

An einer radioaktiven Probe aus Uran werden pro Sekunde im Mittel ${\textstyle \lambda =4.5}$ Zerfälle gemessen. Die Zufallsvariable ${\textstyle X}$ , welche die Anzahl der Zerfälle pro Sekunde angibt, ist somit Poissonverteilt und es ergibt sich die folgende Wahrscheinlichkeitsverteilung: $P(X=x)={\frac {4.5^{x}}{x!}}e^{-4.5}$ Daraus resultieren die folgenden Wahrscheinlichkeiten für ${\textstyle x=0,...10}$ :

${\textstyle x}$	0	1	2	3	4	5	6	7	8	9	10
${\textstyle P(X=x)}$	0.0111	0.05	0.1125	0.1687	0.1898	0.1708	0.1281	0.0824	0.0463	0.0232	0.0104

$P(X\geq 3)=\sum _{j=3}^{\infty }{\frac {4.5^{j}}{j!}}e^{-4.5}=1-\sum _{j=0}^{2}{\frac {4.5^{j}}{j!}}e^{-4.5}=1-0.1736=0.8264$ $P(X\leq 5)=\sum _{j=0}^{5}{\frac {4.5^{j}}{j!}}e^{-4.5}=0.7029$ $P(3\leq X\leq 6)=\sum _{j=3}^{6}{\frac {4.5^{j}}{j!}}e^{-4.5}=0.6574$ Kommentar: ${\textstyle \sum _{x=0}^{10}P(X=x)=0.9928}$ , andere Zerfälle sind auch möglich, aber die Wahrscheinlichkeiten sind so gering, dass sie nicht weiter aufgeführt werden.

In R:	dpois( ${\textstyle x,\lambda }$ )	ergibt:	${\textstyle P(X=x)}$	=	${\textstyle {\frac {\lambda ^{x}}{x!}}e^{-\lambda }}$
	ppois( ${\textstyle x,\lambda }$ )	ergibt:	${\textstyle P(X\leq x)}$	=	${\textstyle \sum \limits _{j=0}^{x}{\frac {\lambda ^{j}}{j!}}e^{-\lambda }}$
	${\textstyle 1-}$ ppois( ${\textstyle x-1,\lambda }$ )	ergibt:	${\textstyle P(X\geq x)}$	=	${\textstyle \sum \limits _{j=x}^{\infty }{\frac {\lambda ^{j}}{j!}}e^{-\lambda }}$
	ppois( ${\textstyle \ell ,\lambda }$ ) ${\textstyle -}$ ppois( ${\textstyle x-1,\lambda }$ )	ergibt:	${\textstyle P(x\leq X\leq \ell )}$	=	${\textstyle \sum \limits _{j=x}^{\ell }{\frac {\lambda ^{j}}{j!}}e^{-\lambda }}$

Die Poissonverteilung stellt den Grenzwert für eine binomialverteilte ZV mit unendlich vielen Versuchen dar.

Geometrisch verteilte ZV

Zufallsexperimente mit geometrisch verteilten ZV können als Spezialfälle binomialverteilter ZV betrachtet werden, wobei hier zwischen zwei Varianten unterschieden wird:

Durchführen eines binomialverteilten Zufallsexperiemnt, bis ein Treffer

,grqq erzielt wird und die ZV ${\textstyle X}$ gibt die Anzahl der Versuche an.

Durchführen eines binomailverteilten Zufallsexperiment, bis ein Treffer erzielt wird und die ZV ${\textstyle Y}$ gibt die Anzahl der Fehlversuche an.

Beispiele:

image
mit ${\textstyle p=0.2}$ (blau), ${\textstyle p=0.5}$ (grün) und ${\textstyle p=0.8}$ (rot).
Bildquelle: https://de.wikipedia.org/wiki/Datei:Geometrische_Verteilung2.PNG; Lizenz: CC-BY-3.0 & GDFL 1.2; Beschreibung: Geometrische Verteilung; Autor: Schlurcher; Datum: 5. September 2009 (Upload)
image
mit ${\textstyle p=0.2}$ (blau), ${\textstyle p=0.5}$ (grün) und ${\textstyle p=0.8}$ (rot).
Bildquelle: https://de.wikipedia.org/wiki/Datei:Geometrische_Verteilung.PNG; Lizenz: CC-BY-3.0 & GDFL 1.2; Beschreibung: Geometrische Verteilung; Autor: Schlurcher; Datum: 5. September 2009 (Upload)
Die beiden Varianten stehen in der Beziehung ${\textstyle X=Y+1}$ . Somit ergeben sich die beiden folgenden Formeln für die Bestimmung der Wahrscheinlichkeit mit

Für die ZV ${\textstyle X}$ gilt: $P(X=n)=p\cdot (1-p)^{n-1}\quad (n=1,2,...)$ $P(X\leq n)=p\cdot \sum _{i=1}^{n}(1-p)^{i-1}=1-(1-p)^{n}$ $P(X\geq n)=p\cdot \sum _{i=n}^{\infty }(1-p)^{i-1}=1-(1-(1-p)^{n})=(1-p)^{n}$ $E(X)={\frac {1}{p}}$ $Var(X)={\frac {1}{p^{2}}}-{\frac {1}{p}}$
Für die ZV ${\textstyle Y}$ gilt: $P(Y=n)=p\cdot (1-p)^{n}\quad (n=0,1,2,...)$ $P(Y\leq n)=p\cdot \sum _{i=1}^{n}(1-p)^{i}=1-(1-p)^{n+1}$ $P(Y\geq n)=p\cdot \sum _{i=n}^{\infty }(1-p)^{i}=1-(1-(1-p)^{n+1})=(1-p)^{n+1}$ $E(Y)={\frac {1-p}{p}}$ $Var(Y)=Var(X)$

Beispiele:

Werfen einer Münze bis zum Eintreten von Kopf . $P(X\leq 3)=1-(1-0.5)^{3}=1-0.5^{3}=1-0.125=0.875$ $P(Y\leq 3)=1-(1-0.5)^{3+4}=1-0.5^{4}=1-0.0625=0.9375$ $P(X=5)=0.5\cdot (1-0.5)^{5-1}=0.5\cdot 0.5^{4}=0.5^{5}=0.0313$ $P(Y=5)=0.5\cdot (1-0.5)^{5}=0.5\cdot 0.5^{5}=0.5^{6}=0.0156$

In R:	dgeom( ${\textstyle n,p}$ )	ergibt:	${\textstyle P(Y=n)}$	=	${\textstyle p\cdot (1-p)^{n-1}}$
	pgeom( ${\textstyle n,p}$ )	ergibt:	${\textstyle P(Y\leq n)}$	=	${\textstyle p\cdot \sum \limits _{i=1}^{n}(1-p)^{i-1}}$
	${\textstyle 1-}$ pgeom( ${\textstyle n-1,p}$ )	ergibt:	${\textstyle P(Y\geq n)}$	=	${\textstyle p\cdot \sum \limits _{i=n}^{\infty }(1-p)^{i-1}}$
	pgeom( ${\textstyle \ell ,p}$ ) ${\textstyle -}$ pgeom( ${\textstyle n-1,p}$ )	ergibt:	${\textstyle P(n\leq Y\leq \ell )}$	=	${\textstyle p\cdot \sum \limits _{i=n}^{\ell }(1-p)^{i-1}}$

In R wird die zweite Varainte betrachtet, welche die Anzahl der Fehlversuche zählt, https://stat.ethz.ch/R-manual/R-devel/library/stats/html/Geometric.html

Zufallsvariablen

Anmerkung:

Beispiel

Erwartungswert und Standardabweichung einer diskreten ZV

Verschiebungssatz

Beispiel:

Verknüpfung diskreter ZV

Gemeinsame Verteilung zweier endlicher ZV und Unabhängigkeit

Beispiel:

Beispiel:

Linearkombinationen und Verknüpfungen von ZV

Beispiel:

Beispiel:

Rechenregeln für Erwartungswert und Varianz

Vergleich von Erwartungswert und arithmetischem Mittelwert

Beispiel:

Beispiel:

Erwartungstreue, Varianzbetrachtung und Konsistenz obiger Schätzungen

Beispiel (zur Erwartungstreue)

Binomialverteilte ZV

Wahrscheinlichkeitsrechnung

Beispiel:

Beispiel:

Aufgabe:

Beispiel:

Beispiel:

Erwartungswert und Varianz einer binomialverteilten ZV

EW und Varianz der relativen Häufigkeit

Beispiel:

Schätzungen für p

Problemstellung:

Punktschätzung für p

Beispiel:

Das Maximum-Likelihood-Prinzip

Beispiel:

Intervallschätzungen für p

Überdeckungswahrscheinlichkeit und Konfidenzniveau

Anmerkung:

Ziel:

Intervallschätzung nach Clopper-Pearson

Anmerkung:

Bemerkung:

Beispiel:

Bemerkung:

Bemerkung (Einseitig begrenzte Konfidenzintervalle)

Beispiel:

Beispiel:

Beispiel:

Hypergeometrisch verteilte ZV

Beispiel:

Beispiel:

Aufgabe:

Beispiel:

Aufgabe

Beispiel:

Sch"atzung der Zahl der ausgezeichneten Objekte K {\textstyle K}

Beispiel:

Erwartungstreue Punktsch"atzungen f"ur K {\textstyle K}

Beispiel:

Das Maximum-Likelihood-Prinzip

Beispiel:

Intervallsch"atzungen f"ur K {\textstyle K}

Ziel:

IVS f"ur K {\textstyle K} , die ein gegebenes Konfidenzniveau einh"alt

Beispiel:

Beispiel:

Sch"atzung der Gesamtzahl der Objekte N {\textstyle N}

Beispiel (Capture-Recapture)

Erwartungstreue Punktsch"atzungen f"ur N {\textstyle N}

Beispiel:

Sch"atzung f"ur N {\textstyle N} mit der Maximum-Likelihood-Methode

Beispiel:

Intervallsch"atzungen f"ur N {\textstyle N}

Ziel:

IVS f"ur N {\textstyle N} , die ein gegebenes Konfidenzniveau einh"alt

Beispiel:

Weitere diskrete ZV

Poisson-verteilte ZV

Beispiele:

Anmerkung:

Sch"atzung der Zahl der ausgezeichneten Objekte ${\textstyle K}$

Erwartungstreue Punktsch"atzungen f"ur ${\textstyle K}$

Intervallsch"atzungen f"ur ${\textstyle K}$

IVS f"ur ${\textstyle K}$ , die ein gegebenes Konfidenzniveau einh"alt

Sch"atzung der Gesamtzahl der Objekte ${\textstyle N}$

Erwartungstreue Punktsch"atzungen f"ur ${\textstyle N}$

Sch"atzung f"ur ${\textstyle N}$ mit der Maximum-Likelihood-Methode

Intervallsch"atzungen f"ur ${\textstyle N}$

IVS f"ur ${\textstyle N}$ , die ein gegebenes Konfidenzniveau einh"alt