Vergleich von Erwartungswert und arithmetischem Mittelwert[Bearbeiten]
Erwartungswert einer ZV[Bearbeiten]
Wir betrachten eine (diskrete) ZV
, mit ihrer Wahrscheinlichkeitsverteilung:
![{\displaystyle {\begin{array}{|c|c|c|c|c|c|}\hline {\text{mögl. Wert}}&x_{1}&x_{2}&\ldots &x_{m}&{\text{gesamt}}\\\hline {\text{Wahrsch.}}&P(X=x_{1})=w_{1}&P(X=x_{2})=w_{2}&\ldots &P(X=x_{m})=w_{m}&w_{1}+w_{2}+\ldots +w_{m}=1\\\hline \end{array}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/e73d46ca8cf6a9be61d21ae4a3aaa4bf81ec4fd0)
Der Erwartungswert der ZV
ergibt sich dann als:
![{\displaystyle E(X)=x_{1}\cdot w_{1}+x_{2}\cdot w_{2}+\ldots +x_{m}\cdot w_{m}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/c8f14cc8492e0739d277157bbad46158819efae2)
Durchführung des zugehörigen Zufallsexperiments und Mittelwert[Bearbeiten]
Führt man das zugehörige ZE
-mal durch, so erhält man eine Stichprobe mit absoluten und relativen Häufigkeiten:
![{\displaystyle {\begin{array}{|c|c|c|c|c|c|}\hline {\text{Wert}}&x_{1}&x_{2}&\ldots &x_{m}&{\text{gesamt}}\\\hline {\text{abs. Häuf.}}&h(x_{1})=h_{1}&h(x_{2})=h_{2}&\ldots &h(x_{m})=h_{m}&h_{1}+h_{2}+\ldots +h_{m}=n\\\hline {\text{rel. Häuf.}}&r(x_{1})={\frac {h_{1}}{n}}&r(x_{2})={\frac {h_{2}}{n}}&\ldots &r(x_{m})={\frac {h_{m}}{n}}&r_{1}+r_{2}+\ldots +r_{m}=1\\\hline \end{array}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/264dfbfd2cd904cb323239be2ca757c15f6194af)
Der arithmetischen Mittelwert des Merkmals
ergibt sich dann als:
![{\displaystyle {\overline {X}}=x_{1}\cdot r_{1}+x_{2}\cdot r_{2}+\ldots +x_{m}\cdot r_{m}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/c81e43c332c9cd48f254568880970e8717bcfa99)
Vergleich Erwartungswert und Arithmetisches Mittel[Bearbeiten]
Allerdings stimmen die relativen Häufigkeiten
(normalerweise) nicht exakt mit den Wahrscheinlichkeiten
überein und folglich ist (normalerweise)
.
Folgendes ist erkennbar:
- Die relative Häufigkeit
ist eine Schätzung für die Wahrscheinlichkeit
.
- Der arithmetische Mittelwert
ist eine Schätzung für den EW
der ZV.
- Die empirische Varianz
ist eine Schätzung für die Varianz
der ZV.
Es ist wichtig, eine Unterscheidung zwischen
und
bzw. zwischen
und
bzw. zwischen
und
vorzunehmen. Zu beachten ist dabei:
und
sind der ZV
zugeordnet. Sie sind durch das Zufallsexperiment eindeutig festgelegt und hängen nicht von der Stichprobe ab. Leider sind sie in vielen in der Praxis relevanten Situationen nicht bekannt.
und
sind der Stichprobe zugeordnet. Sie können aus ihr leicht berechnet werden und sind somit bekannt. Allerdings hängen Sie (wie auch die Stichprobe) vom Zufall ab. Erhebt man eine neue Stichprobe, so erhält man andere Werte für
und
.
Zwei unterschiedliche Betrachtungsweisen[Bearbeiten]
Es gibt nun zwei typische Situationen, die völlig unterschiedliche Blickwinkel bieten:
Betrachtungsweise 1: Mögliche Werte und Wahrscheinlichkeiten sind bekannt[Bearbeiten]
Die möglichen Werte und die zugehörigen Wahrscheinlichkeiten sind bekannt. Man kann dann einfach
berechnen, die Erhebung einer Stichprobe und die Bestimmung des arithmetischen Mittelwerts
sind zwar möglich, bringen aber nichts ein.
Beim Würfelwurf sind die Werte
möglich (alle mit Wahrscheinlichkeit
) und daraus bestimmt man
. Man könnte nun mehrmals werfen und erhält (zum Beispiel) die folgenden Häufigkeiten:
![{\displaystyle {\begin{array}{|c|c|c|c|c|c|}\hline k&1&2&3&4&5&6&{\text{gesamt}}\\\hline h_{k}&h(1)=5&h(2)=1&h(3)=4&h(4)=4&h(5)=2&h(6)=4&n=20\\\hline r_{k}&r(1)=0.25&r(2)=0.05&r(3)=0.2&r(4)=0.2&r(5)=0.1&r(6)=0.2&1\\\hline \end{array}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/b1d958c9087a373032faf76a3f97923f67e4123d)
Daraus lässt sich
![{\displaystyle {\overline {X}}=0.25\cdot 1+0.05\cdot 2+0.2\cdot 3+0.2\cdot 4+0.1\cdot 5+0.2\cdot 6=3.45}](https://wikimedia.org/api/rest_v1/media/math/render/svg/51207b2e93fdb3d320d562ef2d5a76dbd83220f6)
bestimmen. Dabei liegt
![{\textstyle {\overline {X}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/5cfb1d8fff1fc6375238139c8e40e63b90eae4eb)
nahe bei
![{\textstyle E(X)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/bfebae52fdee57f8b810c645508c75f36ec195f6)
. Dies ist wahrscheinlich, muss aber nicht so sein (im Extremfall wäre auch
![{\textstyle {\overline {X}}=1}](https://wikimedia.org/api/rest_v1/media/math/render/svg/1f76fe3a63009357eb1b1955d46b5f754dce505f)
oder
![{\textstyle {\overline {X}}=6}](https://wikimedia.org/api/rest_v1/media/math/render/svg/e53ffe1a33100e2901d9a0b7e86611ecde7f67ad)
möglich gewesen).
Betrachtungsweise 2: Mögliche Werte und Wahrscheinlichkeiten sind unbekannt[Bearbeiten]
Man kennt die möglichen Werte und die zugehörigen Wahrscheinlichkeiten nicht, möchte aber gerne etwas über
wissen. Daher erhebt man eine Stichprobe. Dann kann man
als Schätzwert für
nehmen. Man weiß dann aber im konkreten Fall nicht, wie gut diese Schätzung ist. In der schließenden Statistik (siehe Vorlesung ’Statistik für Anwender II’) untersucht man Methoden zur Beurteilung solcher Schätzungen.
In einer Lostrommel befinden sich viele Kugeln mit Zahlen darauf. Sie wissen nicht, welche Zahlen daraufstehen und mit welcher Häufigkeit sie vertreten sind. Bei
-maligem Ziehen erhalten Sie die folgenden absoluten Häufigkeiten:
![{\displaystyle {\begin{array}{|c|c|c|c|c|c|}\hline k&0&1&2&3&4&7&11&{\text{gesamt}}\\\hline h_{k}&17&15&9&5&2&1&1&n=50\\\hline r_{k}&0.34&0.3&0.18&0.1&0.04&0.02&0.02&1\\\hline \end{array}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/6c627af84ab7a34a6f51d21f0be9a20929635041)
Daraus berechnen Sie
![{\displaystyle {\overline {X}}=1.48}](https://wikimedia.org/api/rest_v1/media/math/render/svg/4c6d43fba729245bd9fdbf2cae55a8280fb1cd78)
und können dies als Schätzwert für
![{\textstyle E(X)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/bfebae52fdee57f8b810c645508c75f36ec195f6)
nehmen.
Man interessiert sich für den Erwartungswert der Zufallsvariable
, die die Anzahl der Jungtiere in einem Wurf einer Katze. Da man die Wahrscheinlichkeiten für die einzelnen Anzahlen nicht kennt, kann man diesen Erwatungswert nicht ausrechnen. Man hat daher nur die Möglichkeit, ihn mit Hilfe des Erwartungswerts einer Stichprobe zu schätzen.
Beispielsweise erhebt man die folgende Stichprobe:
![{\displaystyle {\begin{array}{|c||c|c|c|c|c|c|c|c|c|c|c|c|c|c|}\hline k&1&2&3&4&5&6&7&8&9&10&11&12&\ldots &{\text{gesamt}}\\\hline h_{k}&8&17&31&26&6&4&3&2&1&1&0&1&0&100\\\hline r_{k}&0.08&0.17&0.31&0.26&0.06&0.04&0.03&0.02&0.01&0.01&0&0.01&0&1\\\hline \end{array}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/f794a92afcf5d405d7a7bff9105d1668322632c3)
Anmerkung: Wahrscheinlichkeiten sind unbekannt, können durch relative Häufigkeit geschätzt werden.
Daraus ergibt sich der artithmetische Mittelwert der Stichprobe:
![{\displaystyle {\begin{aligned}{\overline {X}}=3.61\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/b28f459c48da1fc8aa628f263b00c702a25eb6e8)
Der Erwartungswert
![{\textstyle E(X)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/bfebae52fdee57f8b810c645508c75f36ec195f6)
ist aber unbekannt, kann aber durch
![{\textstyle {\overline {X}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/5cfb1d8fff1fc6375238139c8e40e63b90eae4eb)
geschätzt werden.
Erwartungstreue, Varianzbetrachtung und Konsistenz obiger Schätzungen[Bearbeiten]
Sei
eine endliche ZV, die die Werte
mit den Wahrscheinlichkeiten
annehmen kann und EW
und Varianz
hat.
Weiterhin seien
unabhängige ZV, die identisch wie
verteilt sind (d.h. sie haben alle diesselbe W-Funktion wie
). Wir betrachten außerdem die ZV:
![{\displaystyle {\begin{array}{rcl}H_{n}^{k}&=&\#\{j\in \{1,\ldots ,n\};\ X_{j}=a_{k}\}\quad (k=1,\ldots ,m)\\M_{n}&=&{\frac {1}{n}}\cdot \sum \limits _{j=1}^{n}X_{j}\\V_{n}&=&{\frac {1}{n-1}}\cdot \sum \limits _{j=1}^{n}\left(X_{j}-M_{n}\right)^{2}\end{array}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/12ceb3f546f88f2cfae3e91e20a425bcb14c8f9f)
Die Schätzung von
durch
- ist erwartungstreu, das heißt, es gilt:
![{\textstyle \quad E\left({\frac {H_{n}^{k}}{n}}\right)=p_{k}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/2add7ee2cd7569c87e67492c136fbc791ceff886)
- hat eine gegen
konvergierende Varianz, also: ![{\textstyle \quad V\left({\frac {H_{n}^{k}}{n}}\right){\stackrel {n\to \infty }{\longrightarrow }}0}](https://wikimedia.org/api/rest_v1/media/math/render/svg/661a4c501f83074bf496097865bd974b1d7c75e8)
- ist konsistent, d.h. für alle
ist: ![{\textstyle \quad P\left(\left|{\frac {H_{n}^{k}}{n}}-p_{k}\right|<c\right){\stackrel {n\to \infty }{\longrightarrow }}1}](https://wikimedia.org/api/rest_v1/media/math/render/svg/dd9d6945d98d608b08124f80d773d04da71f213b)
Die Schätzung von
durch
- ist erwartungstreu, das heißt, es gilt:
![{\textstyle \quad E(M_{n})=E(X)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/65e63a2b497e71bc0009e1f932b3ef7d3019649f)
- hat eine gegen
konvergierende Varianz, also: ![{\textstyle \quad V(M_{n}){\stackrel {n\to \infty }{\longrightarrow }}0}](https://wikimedia.org/api/rest_v1/media/math/render/svg/c45dee9eccac270ace5934a29e60fffb891b389f)
- ist konsistent, d.h. für alle
ist: ![{\textstyle \quad P\left(\left|M_{n}-E(X)\right|<c\right){\stackrel {n\to \infty }{\longrightarrow }}1}](https://wikimedia.org/api/rest_v1/media/math/render/svg/af89c6b5de1ed1307ba4b96c6c688093fd0e04fe)
Die Schätzung von
durch
- ist erwartungstreu, das heißt, es gilt:
![{\textstyle \quad E(V_{n})=V(X)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/99a1402d1c0e0aae2609c359eebf1b95970ea13b)
- hat eine gegen
konvergierende Varianz, also: ![{\textstyle \quad V(V_{n}){\stackrel {n\to \infty }{\longrightarrow }}0}](https://wikimedia.org/api/rest_v1/media/math/render/svg/98d2a4a1b4b555685ef853ee8a2e1cc1116c434c)
- ist konsistent, d.h. für alle
ist: ![{\textstyle \quad P\left(\left|V_{n}-V(X)\right|<c\right){\stackrel {n\to \infty }{\longrightarrow }}1}](https://wikimedia.org/api/rest_v1/media/math/render/svg/e8df1e3a6561d245ee12683396e402393ed820e2)
Wir betrachten eine ZV
mit den folgenden möglichen Werten
und den folgenden dazugeörenden Wahrscheinlichkeiten:
![{\displaystyle P(X=0)=0.1\quad P(X=3)=0.2\quad P(X=9)=0.3\quad P(X=12)=0.4}](https://wikimedia.org/api/rest_v1/media/math/render/svg/967b6a2ce27ea4d00a44fb5a1bcea96742f19d81)
Daraus berechnet man EW und Varianz von
![{\textstyle X}](https://wikimedia.org/api/rest_v1/media/math/render/svg/8d80c41192705e1a6c6de1d65e16d7f70fbac391)
durch:
![{\displaystyle E(X)=8.1\quad {\text{und}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/a2efe107423383add28459bd0e63f365943499ba)
![{\displaystyle V(X)=18.09}](https://wikimedia.org/api/rest_v1/media/math/render/svg/a5a195de8b9317044ede2400317fa6521d0c137a)
Eine Person, die die oben angegebenen Wahrscheinlichkeiten nicht kennt, will Schätzungen für
und
vornehmen. Dazu führt sie eine Stichprobe der Länge
durch und berechnet daraus
und
. Für die Stichprobe
gibt es
Möglichkeiten. Diese haben bestimmte Wahrscheinlichkeiten und führen zu verschiedenen Werten für
und
.
![{\displaystyle {\begin{array}{|c|c|c|c|}\hline {\text{mögliche Stichprobe}}&{\text{Wahrscheinlichkeit}}&{\text{ergibt}}&{\text{ergibt}}\\(x_{1},x_{2},Xx_{3})&{\text{zusammen}}&{\overline {x}}=&{s_{x}}^{2}=\\\hline (0,0,0)&0.001&0&0\\\hline (3,3,3)&0.008&3&0\\\hline (9,9,9)&0.027&9&0\\\hline (12,12,12)&0.064&12&0\\\hline (0,0,3),(0,3,0),(3,0,0)&0.006&1&3\\\hline (0,0,9),(0,9,0),(9,0,0)&0.009&3&27\\\hline (0,0,12),(0,12,0),(12,0,0)&0.012&4&48\\\hline (3,3,0),(3,0,3),(0,3,3)&0.012&2&3\\\hline (3,3,9),(3,9,3),(9,3,3)&0.036&5&12\\\hline (3,3,12),(3,12,3),(12,3,3)&0.048&6&27\\\hline (9,9,0),(9,0,9),(0,9,9)&0.027&6&27\\\hline \end{array}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/9311f1e0c6cbad574e64c227eb1c763ddf44e801)
![{\displaystyle {\begin{array}{|c|c|c|c|}\hline {\text{mögliche Stichprobe}}&{\text{Wahrscheinlichkeit}}&{\text{ergibt}}&{\text{ergibt}}\\(x_{1},x_{2},Xx_{3})&{\text{zusammen}}&{\overline {x}}=&{s_{x}}^{2}=\\\hline (9,9,3),(9,3,9),(3,9,9)&0.054&7&12\\\hline (9,9,12),(9,12,9),(12,9,9)&0.108&10&3\\\hline (12,12,0),(12,0,12),(0,12,12)&0.048&8&48\\\hline (12,12,3),(12,3,12),(3,12,12)&0.096&9&27\\\hline (12,12,9),(12,9,12),(9,12,12)&0.144&11&3\\\hline (0,3,9),(0,9,3),(3,0,9),(3,9,0),(9,0,3),(9,3,0)&0.036&4&21\\\hline (0,3,12),(0,12,3),(3,0,12),(3,12,0),(12,0,3),(12,3,0)&0.048&5&39\\\hline (0,9,12),(0,12,9),(9,0,12),(9,12,0),(12,0,9),(12,9,0)&0.072&7&39\\\hline (3,9,12),(3,12,9),(9,3,12),(9,12,3),(12,3,9),(12,9,3)&0.144&8&21\\\hline \end{array}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/bafc6b82e7b76db2ca480f7c71d2736b2e09d404)
Fasst man
als ZV auf, so kann diese also die folgenden Werte mit den angegebenen Wahrscheinlichkeiten annehmen: ![{\displaystyle {\begin{array}{|c||c|c|c|c|c|c|c|c|c|c|c|c|c|}\hline a&0&1&2&3&4&5&6&7&8&9&10&11&12\\\hline P\left(M_{n}=A\right)&0.001&0.006&0.012&0.017&0.048&0.084&0.075&0.126&0.192&0.123&0.108&0.144&0.064\\\hline \end{array}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/e533f9d7060384a71e3a693afb5e20c5e287967d)
Daraus ergibt sich
![{\displaystyle {\begin{aligned}E(M_{n})&=&8.1\quad =E(X)\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/86e717b6e86b330e5163fe902d6543fa5ce2c034)
Fasst man
als ZV auf, so kann diese also die folgenden Werte mit den angegebenen Wahrscheinlichkeiten annehmen:
![{\displaystyle {\begin{array}{|c||c|c|c|c|c|c|c|}\hline a&0&3&12&21&27&39&48\\\hline P\left(V_{n}=a\right)&0.100&0.270&0.090&0.180&0.180&0.120&0.060\\\hline \end{array}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/24677d12492c4f5816016874225692a3d047bbe0)
Daraus ergibt sich
![{\displaystyle {\begin{aligned}E(V_{n})&=&18.08\quad =V(X)\end{aligned}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/29943acd371eb75fcf397467756ebebf37af6d70)
Damit haben wir die Erwartungstreue der beiden Schätzungen für diese spezielle ZV
nachgerechnet.
Diese Lernresource können Sie als Wiki2Reveal-Foliensatz darstellen.
Dieser Wiki2Reveal Foliensatz wurde für den Lerneinheit Kurs:Statistik für Anwender' erstellt der Link für die Wiki2Reveal-Folien wurde mit dem Wiki2Reveal-Linkgenerator erstellt.