Tests für normalverteilte Zufallsvariablen[Bearbeiten]
Einstichprobentests[Bearbeiten]
Bei Einstichprobentests werden Hypothesen über die Parameter einer normalverteilten ZV mit Hilfe einer Stichprobe (der Länge
) getestet.
Situation: Es sei bekannt, dass eine ZV
normalverteilt ist. Allerdings sind
und
nicht bekannt. Es liegt eine Stichprobe
der Länge
von
vor.
Daraus kann man zunächst den arithmetischen Mittelwert und die empirische Standardabweichung berechnen, also:
Wiederholung Hypothesentest I[Bearbeiten]
Bei einem Hypothesentest ist wie folgt vorzugehen: Zunächst stellt man eine Nullhypothese auf (hier eine Aussage, die
oder
betrifft) und legt das Signifikanzniveau
sowie die Methode zur Berechnung des p-Werts fest. Dann erst sichtet man die Daten der Stichprobe und kommt anhand dieser Daten mit dem zuvor festgelegten Verfahren zu einer Entscheidung:
Wiederholung Hypothesentest II[Bearbeiten]
Somit hängt auch die Entscheidung bzgl.
vom Zufall ab und es kann daher zu Fehlern kommen. Wie bei allen Hypothesentests ist aber immer garantiert:
![{\displaystyle \quad {\text{Falls }}H_{0}{\text{ gilt}}\quad \Rightarrow \quad P\left({\text{Ablehnung von }}H_{0}\right)\leq \alpha }](https://wikimedia.org/api/rest_v1/media/math/render/svg/6d58af875dcdd5b92e476c496ba50e5fc7a65749)
(Wir werden dies nicht immer wieder begründen. Bei allen Verfahren ist dies aber stets garantiert.)
Linksseitiger t-Test[Bearbeiten]
Voraussetzung und Hypothesenpaar[Bearbeiten]
Voraussetzung:
normalverteilt mit EW
und Standardabweichung ![{\textstyle \sigma =?}](https://wikimedia.org/api/rest_v1/media/math/render/svg/40115f05693b34411b75f9c38ba2327732ef5c10)
Hypothesenpaar:
und ![{\textstyle H_{1}:\mu <\mu _{0}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/8a7af30f9ed4de03e4d92c09cdee7f72ff1125b7)
(Dabei ist
vorgegeben.)
Vorliegende Daten: Stichprobe ![{\textstyle x_{1},\ldots ,x_{n}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/3e9531d09966e9ceeb357705fc047d0c907d3841)
Teststatistik und p-Wert[Bearbeiten]
Teststatistik:
(niedrige Werte von
sprechen gegen
)
-Wert zu konkreter Teststatistik
: ![{\textstyle \quad {\mathfrak {p}}^{\ast }=T_{n-1}\left(T^{\ast }\right)=\color {blue}{pt(T^{\ast },n-1)}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/f84c992481503b8b96df781a7bcbc7cab694ee40)
Dabei bezeichnet
die Verteilungsfunktion einer
-Verteilung mit
FG.
Durchführung mit R:
" less ",
)
(Dabei muss
ein Vektor mit den Daten
sein.)
Beispiel linksseitiger t-Test:[Bearbeiten]
Beim Testen der Nullhypothese
zu einer (normalverteilten) ZV
erhält man die folgende Stichprobe
:
![{\displaystyle {\begin{array}{c}17.49,\ 14.22,\ 13.56,\ 14.48,\ 13.14,\ 16.44,\ 11.66,\ 17.02,\ 13.39,\ 14.66,\\14.79,\ 15.99,\ 15.50,\ 16.66,\ 14.02,\ 15.60,\ 13.62,\ 14.42,\ 16.10,\ 18.48\end{array}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/7ccc3395f17f3399fb85401cf6ca20166eaaf7ca)
Daraus dann
Rechtsseitiger t-Test[Bearbeiten]
Voraussetzung und Hypothesenpaar[Bearbeiten]
Voraussetzung:
normalverteilt mit EW
und Standardabweichung ![{\textstyle \sigma =?}](https://wikimedia.org/api/rest_v1/media/math/render/svg/40115f05693b34411b75f9c38ba2327732ef5c10)
Hypothesenpaar:
und
(Dabei ist
vorgegeben.)
Vorliegende Daten: Stichprobe ![{\textstyle x_{1},\ldots ,x_{n}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/3e9531d09966e9ceeb357705fc047d0c907d3841)
Teststatistik und p-Wert[Bearbeiten]
Teststatistik:
(hohe Werte von
sprechen gegen
)
-Wert zu konkreter Teststatistik
:
![{\displaystyle \quad {\mathfrak {p}}^{\ast }=1-T_{n-1}\left(T^{\ast }\right)=\color {blue}{1-{pt}(T^{\ast },n-1)}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/db04a62e128ee9f829c3da85be015374df3622fa)
Dabei bezeichnet
![{\textstyle T_{n-1}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/ef26ab805c6df2b5916149fa9f89ef80dc6b2590)
die Verteilungsfunktion einer
![{\textstyle t}](https://wikimedia.org/api/rest_v1/media/math/render/svg/b2bc926f90178739fccd01a96c6fa778ab3535d6)
-Verteilung mit
![{\textstyle n-1}](https://wikimedia.org/api/rest_v1/media/math/render/svg/960c88fa1831b7505d9672de66058532fa5d4053)
FG.
Durchführung mit R:
" greater ",
)
(Dabei muss
ein Vektor mit den Daten
sein.)
Beispiel rechtsseitiger t-Test:[Bearbeiten]
Beim Testen der Nullhypothese
zu einer (normalverteilten) ZV
erhält man die folgende Stichprobe
:
![{\displaystyle 160.0,\ 154.7,\ 182.8,\ 181.4,\ 165.3,\ 181.0,\ 176.5,\ 182.9,\ 187.1,\ 168.4}](https://wikimedia.org/api/rest_v1/media/math/render/svg/9e5c78a1d874d3c6d6006353309ff894885a2dc7)
Daraus ergibt sich
Zweiseitiger t-Test[Bearbeiten]
Voraussetzung und Hypothesenpaar[Bearbeiten]
Voraussetzung:
normalverteilt mit EW
und Standardabweichung ![{\textstyle \sigma =?}](https://wikimedia.org/api/rest_v1/media/math/render/svg/40115f05693b34411b75f9c38ba2327732ef5c10)
Hypothesenpaar:
und ![{\textstyle H_{1}:\mu \not =\mu _{0}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/e3625fccc846e2aacd9e5ab24a33690a1482aec2)
(Dabei ist
vorgegeben.)
Vorliegende Daten: Stichprobe ![{\textstyle x_{1},\ldots ,x_{n}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/3e9531d09966e9ceeb357705fc047d0c907d3841)
Teststatistik und p-Wert[Bearbeiten]
Teststatistik:
(hohe Werte von
sprechen gegen
)
-Wert zu konkreter Teststatistik
:
![{\displaystyle \quad {\mathfrak {p}}^{\ast }=2\cdot \left(1-T_{n-1}\left(T^{\ast }\right)\right)=\color {blue}{2\ast (1-{\text{pt}}(T^{\ast },n-1))}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/63a08429ed93fc137c02fd4e2abd4251a5e48ee1)
Dabei bezeichnet
![{\textstyle T_{n-1}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/ef26ab805c6df2b5916149fa9f89ef80dc6b2590)
die Verteilungsfunktion einer
![{\textstyle t}](https://wikimedia.org/api/rest_v1/media/math/render/svg/b2bc926f90178739fccd01a96c6fa778ab3535d6)
-Verteilung mit
![{\textstyle n-1}](https://wikimedia.org/api/rest_v1/media/math/render/svg/960c88fa1831b7505d9672de66058532fa5d4053)
FG.
Durchführung mit R:
" two.sided ",
)
(Dabei muss
ein Vektor mit den Daten
sein.)
Beispiel zweiseitiger t-Test[Bearbeiten]
Beim Testen der Nullhypothese
zu einer (normalverteilten) ZV
erhält man die folgende Stichprobe
:
![{\displaystyle 68.6,\ 72.8,\ 66.6,\ 67.7,\ 62.1,\ 75.9,\ 74.4,\ 69.8,\ 76.1,\ 70.1,\ 68.4,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/a5a19178e20844389b38c09ae7548efb0d2cba26)
![{\displaystyle \ 65.2,\ 72.1,\ 68.7,\ 69.4}](https://wikimedia.org/api/rest_v1/media/math/render/svg/a822c8c9fff2d771cf1dae3904e49c2d80d66f0c)
Daraus ergibt sich
Linksseitiger Test zur Standardabweichung[Bearbeiten]
Voraussetzung und Hypothesenpaar[Bearbeiten]
Voraussetzung:
normalverteilt mit EW
und Standardabweichung ![{\textstyle \sigma =?}](https://wikimedia.org/api/rest_v1/media/math/render/svg/40115f05693b34411b75f9c38ba2327732ef5c10)
Hypothesenpaar:
und ![{\textstyle H_{1}:\sigma <\sigma _{0}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/cfa20c7aba1a17287cdc2bc4e02b9d1e1595947c)
(Dabei ist
vorgegeben.)
Vorliegende Daten: Stichprobe ![{\textstyle x_{1},\ldots ,x_{n}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/3e9531d09966e9ceeb357705fc047d0c907d3841)
Teststatistik und p-Wert[Bearbeiten]
Teststatistik:
(niedrige Werte von
sprechen gegen
)
-Wert zu konkreter Teststatistik
: ![{\textstyle \quad {\mathfrak {p}}^{\ast }=S_{n-1}\left(T^{\ast }\right)=\color {blue}{{\text{pchisq}}(T^{\ast },n-1)}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/a625eb3334d520f929d8ed1b2cb79a0977945144)
Dabei bezeichnet
die Verteilungsfunktion einer
-Verteilung mit
FG.
Beispiel: Linksseitiger Test zur Standardabweichung[Bearbeiten]
Für eine (normalverteilte) ZV
betrachtet man die Nullhypothese
und testet diese mit Hilfe der folgenden Stichprobe
:
![{\displaystyle {\begin{array}{c}51.4,\ 38.8,\ 57.7,\ 41.3,\ 37.9,\ 50.6,\ 32.4,\ 53.9,\ 54.6,\ 56.9,\\52.8,\ 64.6,\ 42.2,\ 60.3,\ 42.0,\ 69.4,\ 44.4,\ 55.1,\ 68.8,\ 39.4,\\36.6,\ 44.9,\ 48.7,\ 56.9,\ 57.1,\ 44.6,\ 54.7,\ 54.2,\ 50.3,\ 59.6\end{array}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/c8740a8ad4346002e65b2a7272aa524da7d9254e)
Daraus ergibt sich
![{\displaystyle \quad {\mathfrak {p}}^{\ast }=0.0575}](https://wikimedia.org/api/rest_v1/media/math/render/svg/1fd3e92646f29bbe995e5730d323cac3d2851fcb)
Rechtsseitiger Test zur Standardabweichung[Bearbeiten]
Voraussetzung und Hypothesenpaar[Bearbeiten]
Voraussetzung:
normalverteilt mit EW
und Standardabweichung ![{\textstyle \sigma =?}](https://wikimedia.org/api/rest_v1/media/math/render/svg/40115f05693b34411b75f9c38ba2327732ef5c10)
Hypothesenpaar:
und ![{\textstyle H_{1}:\sigma >\sigma _{0}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/f843ea60c3cce9586d30ca9928fd7bbca822a0a2)
(Dabei ist
vorgegeben.)
Vorliegende Daten: Stichprobe ![{\textstyle x_{1},\ldots ,x_{n}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/3e9531d09966e9ceeb357705fc047d0c907d3841)
Teststatistik und p-Wert[Bearbeiten]
Teststatistik:
(hohe Werte von
sprechen gegen
)
-Wert zu konkreter Teststatistik
:
![{\displaystyle \quad {\mathfrak {p}}^{\ast }=1-S_{n-1}\left(T^{\ast }\right)=\color {blue}{1-{\text{pchisq}}(T^{\ast },n-1)}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/a3ed4f3eac03e2d23a516f40e23ac28d62b25771)
Dabei bezeichnet
![{\textstyle S_{n-1}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/57cbf7e86519e80b3813a489ffc171ea27a3a20c)
die Verteilungsfunktion einer
![{\textstyle \chi ^{2}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/c300b17568b2d26b926c6d83699ae7431b318009)
-Verteilung mit
![{\textstyle n-1}](https://wikimedia.org/api/rest_v1/media/math/render/svg/960c88fa1831b7505d9672de66058532fa5d4053)
FG.
Beispiel: Rechtsseitiger Test zur Standardabweichung[Bearbeiten]
Für eine (normalverteilte) ZV
betrachtet man die Nullhypothese
und testet diese mit Hilfe der folgenden Stichprobe
:
![{\displaystyle {\begin{array}{c}8.888,\ 8.620,\ 8.843,\ 7.890,\ 8.354,\ 8.048,\ 8.225,\ 7.957,\\7.701,\ 8.690,\ 8.133,\ 8.246,\ 8.519,\ 8.616,\ 8.521,\ 8.150,\\8.682,\ 8.733,\ 8.449,\ 8.024,\ 8.685,\ 8.198\end{array}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/3976375e87b8ed5098e5d68383ff11c7b2ac2a90)
Daraus ergibt sich dann
Zweiseitiger Test zur Standardabweichung[Bearbeiten]
Voraussetzung und Hypothesenpaar[Bearbeiten]
Voraussetzung:
normalverteilt mit EW
und Standardabweichung ![{\textstyle \sigma =?}](https://wikimedia.org/api/rest_v1/media/math/render/svg/40115f05693b34411b75f9c38ba2327732ef5c10)
Hypothesenpaar:
und ![{\textstyle H_{0}:\sigma \not =\sigma _{0}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/e8357f7a6183086a0636d8346d11a001875c3f79)
(Dabei ist
vorgegeben.)
Vorliegende Daten: Stichprobe ![{\textstyle x_{1},\ldots ,x_{n}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/3e9531d09966e9ceeb357705fc047d0c907d3841)
Teststatistik und p-Wert[Bearbeiten]
Teststatistik:
(hohe Werte von
sprechen gegen
)
-Wert:
![{\displaystyle {\begin{array}{c}{\mathfrak {p}}^{\ast }&=&2\cdot \min \left(S_{n-1}\left(T^{\ast }\right),\ 1-S_{n-1}\left(T^{\ast }\right)\right)\\&=&\color {blue}{2\cdot \min({\text{pchisq}}(T^{\ast },n-1),1-{\text{pchisq}}(T^{\ast },n-1))}\end{array}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/2ef070ca286170f44f0a73e074c857f70d9521d3)
Dabei bezeichnet
![{\textstyle S_{n-1}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/57cbf7e86519e80b3813a489ffc171ea27a3a20c)
die Verteilungsfunktion einer
![{\textstyle \chi ^{2}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/c300b17568b2d26b926c6d83699ae7431b318009)
-Verteilung mit
![{\textstyle n-1}](https://wikimedia.org/api/rest_v1/media/math/render/svg/960c88fa1831b7505d9672de66058532fa5d4053)
FG.
Beispiel: Zweiseitiger Test zur Standardabweichung[Bearbeiten]
Für eine (normalverteilte) ZV
betrachtet man die Nullhypothese
und testet diese mit Hilfe der folgenden Stichprobe
:
![{\displaystyle 29.23,\ 32.36,\ 30.13,\ 30.38,\ 27.20,\ 30.27,\ 34.45,\ 37.90,\ 26.93,\ 31.57,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/ec160866a1f5e88dc8fec1475e801a8cbd229b9e)
![{\displaystyle \ 32.58,\ 30.54,\ 29.62,\ 32.50}](https://wikimedia.org/api/rest_v1/media/math/render/svg/c4de5331a1eca8496fc54773389bd360c5eeaa35)
Daraus ergibt sich
Anmerkungen zu den t-Tests I[Bearbeiten]
- Würde man die Standardabweichung
(aber nicht den EW
) der Normalverteilung kennen, so könnte man
durch
ersetzen und statt der
-Verteilung
die Standardnormverteilung
benutzen. Dies könnte man näherungsweise auch dann tun, wenn
groß ist, da sich dann die
-Verteilung der Standardnormalverteilung annähert. Benutzt man
statt
, so spricht man von einem Gauß-Test.
Anmerkungen zu den t-Tests II[Bearbeiten]
- Grundsätzlich sind bei einer ZV
, die nicht normalverteilt ist, sondern eine beliebige (unbekannte) Verteilung hat, die in diesem Kapitel vorgestellten t-Tests (und auch die Tests zur Standardabweichung
) mathematisch nicht exakt. Falls aber
groß genug ist (eine Faustregel besagt
, im allgemeinen hängt dies aber von der unbekannten Verteilung ab), so funktionieren die
-Tests (wie auch die entsprechenden Gauß-Tests) näherungsweise immer noch und liefern gute Ergebnisse. Man sagt: Die Tests sind robust gegenüber Verletzungen der Normalverteilungsannahme.
Gegeben ist eine Stichprobe
(die Sie als Vektor daten
in der Datei datenUEB7.R auf GitHub finden) zu einer normalverteilten Größe
mit unbekannten Parametern
und
.
Bestimmen Sie anhand dieser Daten zu den folgenden Nullhypothesen jeweils den p-Wert:
;
;
;
;
;
(Verwenden Sie die in der Vorlesung behandelten Tests).
Eine Firma füllt maschinell Saft in 1,5-Liter-Flaschen ab. Sie behauptet dabei die folgenden Standards einzuhalten:
Die durchschnittliche (zu erwartende) Füllmenge beträgt mindestens
Liter.
Die Standardabweichung der Füllmenge beträgt nicht mehr als
Liter.
Mindestens
aller Flaschen enthalten mindestens
Liter.
Verwenden Sie die Daten aus dem R-Skript datenUEB7.r unter GitHub.
Wie verändert sich bei den Nullhypothesen für den Erwartungswert
einer Normalverteilung
jeweils der p-Wert des entsprechenden t-Tests, wenn:
und
unverändert bleiben und
größer wird?
und
unverändert bleiben und
größer wird?
und
unverändert bleiben und
größer wird?
Erklären Sie Ihre Antworten (kurz).
Zweistichprobentests[Bearbeiten]
Wir untersuchen nun den Fall, dass zwei (normalverteilte) ZV
vorliegen, deren Erwartungswerte
wir vergleichen wollen. Dazu werden zwei unabhängige Stichproben
und
erhoben, anhand derer man dann Hypothesentests durchführen kann.
Beispiel Anwendung Zweistichprobentest I[Bearbeiten]
Das Gewicht von Afrikanischen (ZV
) und Indischen Elefantenkühen (ZV
) wird untersucht. Für die Erwartungswerte
bzw.
kann man (z.B.) folgende Hypothesen aufstellen:
Es ergeben sich folgende Stichproben (Werte in kg):
Stichprobe für
:
![{\displaystyle 2835,\ 3979,\ 3012,\ 2548,\ 2213,\ 3094,\ 2225,\ 2006,\ 2554,\ 2921,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/a27c29e3cccd41ca98c4c3c4c6d8fd7d26c44640)
![{\displaystyle 2876,\ 2855,\ 3294,\ 3481,\ 3186,\ 2280,\ 3755,\ 2432}](https://wikimedia.org/api/rest_v1/media/math/render/svg/22b3eaa08c928aeb120981e6f334ed52f007fada)
Stichprobe für
:
![{\displaystyle 2567,\ 2833,\ 2425,\ 2754,\ 2499,\ 2529,\ 2438,\ 2863,\ 2850,\ 2574,}](https://wikimedia.org/api/rest_v1/media/math/render/svg/6f8f1da0c540b78d57ddfa2bb16db5312dff6800)
![{\displaystyle 2665,\ 2771,\ 2829,\ 2161,\ 2919}](https://wikimedia.org/api/rest_v1/media/math/render/svg/e9e2e21baad103758351f243ec52a1a1d2b28fbb)
Beispiel Anwendung Zweistichprobentest II[Bearbeiten]
Möchte man einen "empirischen Nachweis"
erbringen, dass Afrikanische Elefantenkühe (im erwarteten Durchschnitt) schwerer sind als Indische, so kann man die Nullhypothese
einem Test unterziehen. Bei einem signifikanten Ergebnis wird
abgelehnt und folglich die Gegenhypothese
bestätigt (
könnte trotzdem gelten, allerdings hat eine Ablehnung dann maximal Wahrscheinlichkeit
).
Zweistichproben-t-Test[Bearbeiten]
Man spricht dabei von Zweistichprobentests, d.h. es werden Hypothesen über die Parameter zweier ZV mit Hilfe zweier (unabhängiger) Stichprobe (der Längen
und
) getestet.
Man bezeichnet diese Tests als Zweistichproben-t-Test bzw. Welch-Test.
Voraussetzung:
normalverteilt mit EW
und
und Standardabweichungen
und ![{\textstyle \sigma _{Y}=?}](https://wikimedia.org/api/rest_v1/media/math/render/svg/59b626b04f87e03f2290992a2257459eb2c52d88)
Beachte dazu: Für eine exakte Vorgehensweise muss vorausgesetzt werden, dass
und
normalverteilt sind. Allerdings erzielt man mit den hier vorgestellten
-Tests (für genügend große Stichprobenumfänge, Faustregel:
) auch dann gute Resultate, wenn
und
nicht normalverteilt sind.
-
und
(
vorgegeben)
-
und
(
vorgegeben)
-
und
(
vorgegeben)
(Man beachte insbesondere den Fall
.)
Vorliegende Daten: Unabhängige Stichproben:
![{\textstyle \quad T^{\ast }={\frac {{\overline {x}}-{\overline {y}}-d}{\sqrt {{\frac {{s_{x}}^{2}}{n}}+{\frac {{s_{y}}^{2}}{m}}}}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/32f1d40e24c90db7c3eb7f9cec12e59aa3f75c0c)
Je nach Variante gilt dabei:
- Hohe Werte von
sprechen gegen
.
- Niedrige Werte von
sprechen gegen
.
- Hohe Werte von
sprechen gegen
.
Zahl der Freiheitsgrade und p-Wert[Bearbeiten]
Zahl der Freiheitsgrade:
-Wert zu konkreter Teststatistik: (je nach Variante)
-
![{\textstyle {\mathfrak {p}}^{\ast }=1-T_{k}\left(T^{\ast }\right)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/1eaf38c2c186a6ceaec571235c1c961ce1376218)
-
![{\textstyle {\mathfrak {p}}^{\ast }=T_{k}\left(T^{\ast }\right)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/f06f706a8209b590ddc6f241f1d613fe942e51b0)
-
![{\textstyle {\mathfrak {p}}^{\ast }=2\cdot \left(1-T_{k}\left(\left|T^{\ast }\right|\right)\right)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/67ddcfad272fd26be7d70d60665f662a72f7d716)
Dabei ist
die
-Verteilung mit
Freiheitsgrade. (Man beachte, dass die
-Verteilung auch für nicht-ganzzahlige Freiheitsgrade definiert werden kann.)
Beispiel Anwendung Zweistichprobentest III[Bearbeiten]
In obigem Beispiel (Gewicht der Elefanten) testen wir die Nullhypothese
. Dies entspricht Fall (i) mit
. Mit den oben angegebenen Daten berechnet man
![{\displaystyle p{\text{-Wert}}:\ {\mathfrak {p}}^{\ast }=0.0662}](https://wikimedia.org/api/rest_v1/media/math/render/svg/2c83aa9979ed9e797a4130453461411885d9b1ce)
Der kleine
![{\textstyle p}](https://wikimedia.org/api/rest_v1/media/math/render/svg/ad87bd7009e2a5c52bd0fb5a9bda9d8c1c23a79b)
-Wert spricht gegen
![{\textstyle H_{0}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/82fffd241f243d717de36a5249c7da3cde17c35a)
und damit für die Gegenhypothese
![{\textstyle H_{1}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/270892f17e932b300175cff972f41ddeb5f9b7a3)
, die besagt, dass Afrikanische Elefantenkühe im Schnitt schwerer sind als Indische. Ob man dies als (empirischen) Nachweis von
![{\textstyle H_{1}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/270892f17e932b300175cff972f41ddeb5f9b7a3)
akzeptiert, hängt von der Wahl des Signifikanzniveaus ab (für
![{\textstyle \alpha =0.1}](https://wikimedia.org/api/rest_v1/media/math/render/svg/ba58a83b479d71d8e2bfb7c8b49844231306dcac)
kann
![{\textstyle H_{0}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/82fffd241f243d717de36a5249c7da3cde17c35a)
abgelehnt werden, nicht jedoch für
![{\textstyle \alpha =0.05}](https://wikimedia.org/api/rest_v1/media/math/render/svg/67649b65687799b821b45674d4ac2d5ded345c28)
).
Beispiel Anwendung Zweistichprobentest IV[Bearbeiten]
Man könnte dies variieren, indem man (z.B.) die Nullhypothese
betrachtet, die besagt, dass Afrikanische Elefantenkühe im Schnitt nicht mehr als 100kg schwerer sind als Indische. Dies entspricht Fall (i) mit
. Es ergeben sich die Teststatistik
mit dem Freiheitsgrad
. Daraus resultiert der
-Wert von
. Damit kann
also (zu üblichen Signifikanzniveaus) nicht abgelehnt werden.
Hypothesentests anhand verbundener Stichproben[Bearbeiten]
Verbundene Stichproben[Bearbeiten]
Eine sogenannte verbundene Stichprobe für zwei ZV
und
erhält man, wenn man die einzelnen Werte der Stichproben für
und
einander eindeutig zuordnen kann. Dies ist meist dann der Fall, wenn man die Stichproben für
und
an den gleichen ’Untersuchungseinheiten’ erhebt.
Die Daten liegen dabei in Form von Paaren
vor (dabei können
und
jeweils einander zugeordnet werden). Die beiden einzelnen Stichproben
und
haben die gleiche Länge
und müssen nicht unabhängig voneinander sein.
Falls
und
außerdem ZV bezeichnen, die in derselben Einheit angegeben werden können, so kann man die Differenz
bilden. Für
liegt dann eine Stichprobe
vor, die sich wie folgt ergibt:
Beispiel verbundene Stichproben[Bearbeiten]
- Schadstoffkonzentrationen an
verschiedenen Orten zu zwei Zeitpunkten
- Blutwerte von
Personen vor und nach Einnahme eines Medikaments
- Temperaturen an zwei Orten
und
zu
verschiedenen Zeitpunkten
- Leistung einer Gruppe von
Schülern in Mathematik und Physik
Zusammenhang zum Einstichprobentest[Bearbeiten]
Wir betrachten nun einige Hypothesenpaare, die sich auf Vergleiche der EW von
und
beziehen. Da diese auch mit dem EW von
formuliert werden können, können hier die Einstichproben-t-Tests auf
angewendet werden.
Die Idee dabei ist, dass EW und empirischer Mittelwert linear sind, also:
normalverteilt mit
und ![{\textstyle \sigma _{Z}=?}](https://wikimedia.org/api/rest_v1/media/math/render/svg/53d3d0be57907de633dc3214eaca2b1da886324f)
Beachte dazu: Für eine exakte Vorgehensweise muss vorausgesetzt werden, dass
normalverteilt ist. Allerdings erzielt man mit den hier vorgestellten
-Tests (für genügend große Stichprobenumfänge, Faustregel:
) auch dann gute Resultate, wenn
nicht normalverteilt ist.
-
und
(
vorgegeben)
Äquivalent ist:
und ![{\textstyle H_{1}:\mu _{Z}>d}](https://wikimedia.org/api/rest_v1/media/math/render/svg/a78932cff5a203341e2f2fb187ade2c691fb1600)
-
und
(
vorgegeben)
Äquivalent ist:
und ![{\textstyle H_{1}:\mu _{Z}<d}](https://wikimedia.org/api/rest_v1/media/math/render/svg/5e96464762fa157107004319f8bd008ef4e3ba44)
-
und
(
vorgegeben)
Äquivalent ist:
und ![{\textstyle H_{1}:\mu _{Z}\not =d}](https://wikimedia.org/api/rest_v1/media/math/render/svg/a2e6a180257958766c67c9702288e542e53bbcc6)
(Man beachte insbesondere den Fall
.)
Vorliegende Daten und p-Wert[Bearbeiten]
Vorliegende Daten: Verbundene Stichproben: ![{\textstyle \quad (x_{1},y_{1}),\ldots ,(x_{n},y_{n})\ {\text{für}}\ X\ {\text{und}}\ Y}](https://wikimedia.org/api/rest_v1/media/math/render/svg/cd09293d1e5bbdc6859963ce1392def4073d8ded)
Daraus ergibt sich eine Stichprobe für
: ![{\textstyle \quad z_{1}=x_{1}-y_{1},\ z_{2}=x_{2}-y_{2},\ \ldots ,\ z_{n}=x_{n}-y_{n}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/ff85fecc152c827e08f382ca37344a4afc80fd38)
p-Wert: (vgl. die Einstichproben-t-Tests,
angewendet auf
)
-
-
-
![{\textstyle {\mathfrak {p}}^{\ast }=2\cdot \left(1-T_{n-1}\left({\sqrt {n}}\cdot {\frac {\left|{\overline {z}}-d\right|}{s_{z}}}\right)\right)}](https://wikimedia.org/api/rest_v1/media/math/render/svg/5447881a1f7b27332c006de59abba676c91421e8)
Es gilt
. Die empirische Standardabweichung
kann aber im Allgemeinen nicht aus
und
bestimmt werden, wenn
und
nicht unabhängig sind.
Man bestimmt an 40 zufällig über mehrere Jahre verteilten Tagen die Tageshöchsttemperatur
und
an zwei Orten und erhält folgende Werte:
![{\displaystyle {\begin{array}{|c|c|c|c|}\hline {\text{Tag }}j&1&2&3&4&5&6&7&8&9&10\\\hline {\text{Temperatur }}x_{j}&29.9&20.8&7.5&20.7&32.7&15.0&16.0&24.4&29.3&23.7\\\hline {\text{Temperatur }}y_{j}&28.9&17.4&9.5&22.2&25.5&16.2&12.0&20.4&25.9&24.4\\\hline {\text{Differez }}z_{j}=x_{j}-y_{j}&1.0&3.4&-2.0&-1.5&7.2&-1.2&4.0&4.0&3.4&-0.7\\\hline {\text{Tag }}j&11&12&13&14&15&16&17&18&19&20\\\hline {\text{Temperatur }}x_{j}&1.7&20.7&13.8&-4.7&28.5&15.6&13.3&-1.4&32.3&22.7\\\hline {\text{Temperatur }}y_{j}&-3.6&12.7&11.2&-5.9&30.3&12.1&16.0&-2.0&33.1&17.4\\\hline {\text{Differenz }}z_{j}=x_{j}-y_{j}&5.3&8.0&2.6&1.2&-1.8&3.5&-2.7&0.6&-0.8&5.3\\\hline {\text{Tag }}j&21&22&23&24&25&26&27&28&29&30\\\hline {\text{Temperatur }}x_{j}&4.9&12.8&14.7&-1.1&4.1&2.0&10.8&12.9&-5.2&7.9\\\hline {\text{Temperatur }}y_{j}&2.2&12.8&10.7&-4.7&-2.7&-1.9&7.7&13.8&-7.5&0.0\\\hline {\text{Differenz }}z_{j}=x_{j}-y_{j}&2.7&0.0&4.0&3.6&6.8&3.9&3.1&-0.9&2.3&7.9\\\hline {\text{Tag }}&31&32&33&34&35&36&37&38&39&40\\\hline {\text{Temperatur }}x_{j}&11.1&27.6&15.5&11.7&17.5&21.5&17.0&13.5&24.6&0.8\\\hline {\text{Temperatur }}y_{j}&10.3&25.3&14.2&5.8&10.3&17.5&17.8&4.2&20.5&-1.0\\\hline {\text{Differenz }}z_{j}=x_{j}-y_{j}&0.8&2.3&1.3&5.9&7.2&4.0&-0.8&9.3&4.1&1.8\\\hline \end{array}}}](https://wikimedia.org/api/rest_v1/media/math/render/svg/885f6876e0bf73262b7b258799402876e3fce746)
Zum Testen der Nullhypothese
("Die erwarteten Tageshöchsttemperaturen
am ersten Ort sind um mindestens 4 Grad höher als die erwarteten Tageshöchsttemperaturen
am zweiten Ort.") kann man nun einfach die Differenz
betrachten und die äquivalente Nullhypothese
mit einem
-Test untersuchen.
Dieses Vorgehen ist wegen
näherunsgweise gerechtfertigt, für kleine
müsste man zunächst prüfen, ob die Temperaturdifferenzen
normalverteilt sind.
Mit dem arithmetischen Mittel und der Standardabweichung erhält man mit
einen sehr geringen
-Wert und kann daher die Nullhypothese ablehnen. Also ist davon auszugehen, dass es am ersten Ort (im zu erwartenden Mittel) weniger als
Grad wärmer ist als am zweiten Ort.
Stellen Sie in den folgenden Situationen eine passende Nullhypothese auf, berechnen Sie mit einem geeigneten Test den p-Wert und interpretieren Sie das Ergebnis:
Ein Dünger soll getestet werden. Die Ernteerträge werden bei einer Reihe von ungedüngten (Test-)Feldern und einer Reihe gedüngter Felder bestimmt. Man erhält die Daten (in Tonnen/Hektar), die in den Vektoren ohne
(Erträge der Felder ohne Dünger) und mit
(Erträge der Felder mit Dünger) gespeichert sind (siehe Datei DatenUEB8.r auf GitHub).
Kann dadurch (zum Signifikanzniveau
) empirisch belegt werden, dass
der Dünger eine Zunahme des (erwarteten) Ertrags bewirkt?
der Dünger eine Zunahme des (erwarteten) Ertrags um mindestens eine halbe Tonne pro Hektar bewirkt?
der Dünger dazu führt, dass die gedüngten Felder einen (erwarteten) Ertrag von mehr als 9.6t / h erzielen?
Die Mitglieder eines Sportvereins machen zusammen ein Ausdauertraining über mehrere Wochen. Vor und nach dem Training machen alle jeweils einen 1000m Testlauf. Die Zeiten werden festgehalten. Die Daten (in Sekunden) sind in den Vektoren vor
(vor dem Training) und nach
(nach dem Training) gespeichert. (Dabei sind gleiche Stellen der beiden Vektoren jeweils derselben Person zuzuordnen.)
Kann dadurch (zum Signifikanzniveau
) empirisch belegt werden, dass
Diese Lernresource können Sie als Wiki2Reveal-Foliensatz darstellen.
Dieser Wiki2Reveal Foliensatz wurde für den Lerneinheit Kurs:Statistik für Anwender' erstellt der Link für die Wiki2Reveal-Folien wurde mit dem Wiki2Reveal-Linkgenerator erstellt.