Zum Inhalt springen

Kurs:Statistik für Anwender/Chi-Quadrat-Tests

Aus Wikiversity

Verschiedene Χ²-Tests

[Bearbeiten]

Arten des Χ²-Tests

[Bearbeiten]

Vom -Test existieren verschiedene Varianten, mit denen man die folgenden Arten von Nullhypothesen untersuchen kann:

  • Anpassungstest bzw. Test auf Verteilung:
    : Für eine ZV liegt eine bestimmte (angegebene) Verteilung vor.
  • Homogenitätstest:
    : Zwei (oder mehr) unabhängige ZV haben dieselbe Verteilung.
  • Unabhängigkeitstest:
    : Zwei (verbundene) ZV sind unabhängig voneinander.


Χ²-Anpassungstest:

[Bearbeiten]

Mit einem -Anpassungstest kann für eine diskrete oder stetige ZV getestet werden, ob eine ganz bestimmte (vermutete oder zu widerlegende) Verteilung vorliegen könnte.

Χ²-Anpassungstest für diskrete Verteilung

[Bearbeiten]
Voraussetzung, Hypothesenpaar und Daten
[Bearbeiten]

Voraussetzung: diskrete ZV mit den möglichen Werten

Hypothesenpaar:
(Hierbei sind bestimmte (zu prüfende) Werte für die Wahrscheinlichkeiten vorgegeben. Dabei muss natürlich gelten.)

Vorliegende Daten: Stichprobe der Länge
Daraus ermittelt man die absoluten Häufigkeiten

Teststatistik und p-Wert
[Bearbeiten]

Teststatistik: (hohe Werte von sprechen gegen )
Idee: Falls gilt, so erwartet man, dass nahe bei ist (man bezeichnet auch als erwartete absolute Häufigkeit) und dass sich somit ein niedriger Wert für ergibt. Folglich sprechen hohe Werte von gegen , niedrige Werte von sind mit vereinbar.

-Wert zu konkreter Teststatistik :
Dabei bezeichnet die Verteilungsfunktion einer -Verteilung mit FG.

Durchführung mit R
[Bearbeiten]


Dabei müssen die beobachteten absoluten Häufigkeiten in einem Vektor h zusammengefasst sein.

Beispiel 1.1
[Bearbeiten]

Ein Würfel soll überprüft werden, ob er alle Augenzahlen mit der gleichen Wahrscheinlichkeit zeigt. Man betrachtet also die ZV ’Augenzahl’ . Diese kann nur die Werte annehmen. Zu prüfen ist, ob diesen Werten die Wahrscheinlichkeiten zugeordnet sind. Wir testen dazu die Nullhypothese
Zur Überprüfung von wird der Würfel -mal geworfen. Es ergeben sich die folgenden (absoluten) Häufigkeiten der Augenzahlen:

Beispiel 1.2
[Bearbeiten]

(Kann man anhand dieser Beobachtungen davon ausgehen, dass bei diesem Würfel alle Augenzahlen mit der gleichen Wahrscheinlichkeit auftreten?)


Ausgehend davon, dass der Würfel tatsächlich alle Zahlen mit gleicher Wahrscheinlichkeit zeigt (dass also gilt), ist die Wahrscheinlichkeit für die gefundenen (oder noch stärkere) Abweichungen der absoluten Häufigkeiten von den erwarteten absoluten Häufigkeiten (gemessen mit der Teststatistik ) also und ist damit so groß, dass man (zu üblichen Signifikanzniveaus) nicht ablehnen kann.

Beispiel 2
[Bearbeiten]

Ein Händler möchte wissen, ob die Verteilung seines Absatzes der Verteilung der Marken im Gesamtmarkt entspricht. Eine Untersuchung ergibt:


-Wert .
Falls gilt, ist die Wahrscheinlichkeit für das beobachtete Ergebnis (oder eines mit einer noch höheren Teststatistik) sehr gering, nämlich nur . Dies spricht sehr stark gegen . (Etwa zum Signifikanzniveau kann abgelehnt werden.)

Anmerkungen 1
[Bearbeiten]

Erhält man bei einem -Anpassungstest ein signifikantes Ergebnis (kleiner p-Wert bzw. Ablehung von ), so kann man schließen, dass (vermutlich) eine Abweichung von der in der Nullhypothese angegebenen Verteilung vorliegt. Der Test macht aber zunächst keine Aussage darüber, auf welche der einzelnen Wahrscheinlichkeiten sich diese Abweichung bezieht. (Die Daten geben jedoch Hinweise darauf.)

Anmerkungen 2
[Bearbeiten]

Der -Anpassungstest ist kein exakter Test. Das bedeutet, dass der p-Wert durch die oben angegebenen Formel näherungsweise (und nicht exakt) berechnet wird. Dieser Test sollte nur verwendet werden, wenn gewisse Mindestgrößen für die erwarteten absoluten Häufigkeiten vorliegen (dann sind die Näherungen gut genug). Als Faustregel findet man (unter anderem), dass alle größer oder gleich und mindestens 80% der größer oder gleich sein müssen.

Anmerkungen 3
[Bearbeiten]

Die Funktion chisq.test gibt eine Warnung aus, wenn nicht alle größer oder gleich sind. In diesem Fall sollte man also dem Testergebnis nicht zu sehr vertrauen (selbst bei einem signifikanten Ergebnis). Es bieten sich dann etwa folgende Möglichkeiten:

  • erhöhen und damit erreichen, dass für alle ist
  • mehrere Werte von zusammenfassen, dies entspricht der Bildung von ’Klassen’ (s.u.), dabei gehen allerdings Teile der Informationen verloren
  • ein anderes (exaktes) Testverfahren benutzen
Aufgabe 1
[Bearbeiten]

An einer Uni gibt es die vier Fächer A, B, C und D. Insgesamt studieren der Studierenden Fach A, der Studierenden Fach B, der Studierenden Fach C und der Studierenden Fach D. An einem Sportkurs nehmen Studierende teil, davon mit Fach A, mit Fach B, mit Fach C und mit Fach D. Überprüfen Sie anhand dieser Daten die Nullhypothese, dass das Interesse an dem Sportkurs bei den Studierenden der verschiedenen Fächer gleich groß  ist.

Aufgabe 2
[Bearbeiten]

Ein Tierbestand wird auf Präverenzen hinsichtlich der Aufenthaltswahrscheinlichkeit untersucht. Dazu wurde ein Gebiet in 6 unterschiedlich große Bereiche, in denen eine unterschiedliche Nahrungszusammensetzung für die Tiere gegeben sind, aufgeteilt und die Tiere in jedem der Bereiche gezählt. Man erhält:

Untersuchen Sie, ob die Daten belegen, dass die Nahrungszusammensetzung dafür sorgt, dass sich die Tiere in manchen Bezirken grundsätzlich gerner aufhalten als in anderen.

Variante des Χ²-Anpassungstest für stetige Verteilungen:

[Bearbeiten]

Für eine ZV, bei der unendlich viele reelle Zahlen als Werte möglich sind, kann man auch einen -Anpassungstest verwenden. Man muss allerdings vorab den Bereich der möglichen Werte (recht willkürlich) in verschiedene Klassen unterteilen. Getestet werden können Nullhypothesen, die besagen, dass eine bestimmte (vollständig festgelegte) Verteilung vorliegt.

Voraussetzung und Hypothesenpaar
[Bearbeiten]

Voraussetzung: eine beliebige (diskrete oder) stetige ZV

Hypothesenpaar: ist nach -verteilt ist nicht nach -verteilt
(Hierbei ist eine bestimmte (zu prüfende) Verteilung mit bestimmten vorgegebenen Parametern.)

Beispiel
[Bearbeiten]

Mögliche Nullhypothesen könnten sein:

  • ist normalverteilt mit und
  • ist exponentialverteilt mit
Vorüberlegung
[Bearbeiten]

Vorüberlegung: Man teilt (vor einem Blick auf die Daten) den Bereich der möglichen Werte von in verschiedene (überschneidungsfreie) Klassen ein und berechnet für jede der Klassen die sogenannte Klassenwahrscheinlichkeit , dass einen Wert aus dieser Klasse annimmt, falls gilt. (Dazu benötigt man theoretische Kenntnisse über die Verteilung und verwendet Methoden aus der Wahrscheinlichkeitsrechnung, siehe Kapitel 4.)

Vorliegende Daten und Teststatistik
[Bearbeiten]

Vorliegende Daten: Stichprobe der Länge
Daraus ermittelt man die absoluten Klassenhäufigkeiten

Teststatistik: (hohe Werte von sprechen gegen )


-Wert zu konkreter Teststatistik :
Dabei bezeichnet die Verteilungsfunktion einer -Verteilung mit FG.

Beispiel 1.1
[Bearbeiten]

Man möchte testen, ob eine ZV normalverteilt mit und sein könnte und betrachtet dazu die Nullhypothese: ist normalverteilt mit und
Der Bereich der möglichen Werte (also ) wird wie folgt in Klassen eingeteilt:

Die Klassenwahrscheinlichkeiten berechnen sich nun wie folgt (vergleiche Normalverteilte ZV ):

Beispiel 1.2
[Bearbeiten]

Beispiel 1.3
[Bearbeiten]

Nun wird die folgende Stichprobe ermittelt ():

104.0, 98.6, 125.4, 127.1, 125.4, 70.9, 96.1, 80.6, 92.3, 97.3, 73.4, 102.7, 134.5, 87.4,
120.1, 95.0, 89.7, 116.1, 119.1, 107.6, 103.8, 99.3, 138.7, 60.8, 77.5, 93.3, 95.9, 89.3,
146.2, 73.5, 100.5, 104.7, 47.7, 93.1, 113.6, 89.0, 122.5, 51.0, 88.0, 99.6, 98.3, 98.2,
86.1, 115.1, 103.4, 73.8, 77.2, 118.2, 78.9, 130.7, 112.5, 88.5, 115.8, 116.3, 107.7, 118.3,
128.7, 114.9, 95.7, 131.1, 111.0, 72.1, 113.3, 84.4, 82.6, 86.6, 106.2, 148.0, 110.3, 108.5,
96.7, 125.6, 71.1, 97.0, 114.9, 56.8, 74.3, 98.9, 104.9, 122.0

-Wert .
Die Daten sind also mit der Nullhypothese vereinbar. (Es liegt kein signifikantes Ergebnis vor.)

Anmerkungen 1
[Bearbeiten]

Die Wahl der Klassen kann das Testergebnis beeinflussen. Daher müssen die Klassen schon vor der Datenerhebung festgelegt werden. Darüber hinaus gibt es keine festen Regeln für die Einteilung der Klassen. Es macht meist Sinn, die Klassen als Intervalle zu wählen und darauf zu achten, dass die unter erwarteten Klassenhäufigkeiten in etwa gleich groß und allesamt größer oder gleich sind. Auf jeden Fall sollte man vor der Durchführung eines Tests sorgfältig über die Wahl der Klassen nachdenken.

Anmerkungen 2
[Bearbeiten]

Bei dem angegebenen Verfahren wird das Testergebnis durch die exakten Werte der Stichprobe nicht beeinflusst, lediglich die Klassenhäufigkeiten sind von Bedeutung (Teile der vorhanden Informationen werden nicht genutzt). Genau genommen entspricht dies nicht einem Test der Nullhypothese
ist nach verteilt ( bezeichne eine bestimmte Verteilung)
sondern von

Anmerkungen 3
[Bearbeiten]

Damit kann der Test Abweichungen von der hypothetischen Verteilung , die die Klassenwahrscheinlichkeiten nicht beeinflussen, nicht aufdecken.

Variante des Χ²-Anpassungstest zum Testen auf die Art der Verteilung:

[Bearbeiten]

Will man lediglich testen, dass eine bestimmte Verteilungsart vorliegt, so kann man den oder die unbekannten Parameter schätzen und dann einen Anpassungstest wie oben durchführen. In diesem Fall verringert sich die Zahl der Freiheitsgrade um die Anzahl der geschätzten Parameter, man benutzt also die -Verteilung , wobei die Zahl der Klassen und die Zahl der geschätzten Parameter ist.

Beispiel 1.1
[Bearbeiten]

Es soll überprüft werden, ob die ’Lebensdauer’ von Seifenblasen (in Sekunden) exponentialverteilt ist (das hieße, die Wahrscheinlichkeit, dass eine Blase im kommenden Zeitraum platzt, ändert sich nicht, wenn die Blase eine Zeitlang ’überlebt’ hat). Man formuliert dazu die Nullhypothese
ist exponentialverteilt (mit irgendeinem Parameter )
und legt die Klassen wie folgt fest: Zur Berechnung der Klassenwahrscheinlichkeiten unter (und damit der erwarteten Klassenhäufigkeiten) muss der Parameter geschätzt werden.

Beispiel 1.2
[Bearbeiten]

Man testet nun Seifenblasen und bestimmt die folgenden Zeiten bis zum Zerplatzen: 16.2 , 7.5 , 13.0 , 7.4, 13.8 , 6.0 , 52.8 , 6.7, 35.1 , 6.5 , 3.5 , 8.1, 15.2 , 14.0 , 47.0, 2.7 , 10.4 , 11.5 ,
24.8 , 5.6 , 34.1, 17.2 , 19.3 , 13.6, 12.9 , 12.7, 25.6, 24.3 , 0.4 , 10.8, 28.1, 25.2 , 11.6, 5.2 , 4.5 , 3.7,
4.2 , 7.9, 6.9 , 25.8

Die Zahl der Freiheitsgrade für die -Verteilung ergibt sich als


und somit ergibt sich der -Wert als

Aufgabe
[Bearbeiten]

An einer Kreuzung wird mehrfach die Zeit zwischen zwei Unfällen festgestellt. Es ergeben sich die folgenden Daten (gemessen in Tagen):
Führen Sie einen -Anpassungstest erst für vermutete (aufgrund theoretischer Üerlegungen) und dann für geschätze Paramter durch. Wählen Sie die Klassengrenzen und selbst.
Anmerkung: Diese Aufgabe ist bewusst sehr offen gestellt - entscheiden Sie selbst!

Χ²-Homogenitätstest:

[Bearbeiten]

Mit einem -Homogenitätstest kann für zwei diskrete oder stetige ZV getestet werden, ob sie diesselbe Verteilung haben könnten.

Χ²-Homogenitätstest für diskrete Verteilungen

[Bearbeiten]
Voraussetzung und Hypothesenpaar
[Bearbeiten]

Voraussetzung: diskrete ZV mit denselben möglichen Werten

Hypothesenpaar:

oder


Vorliegende Daten
[Bearbeiten]

Vorliegende Daten: Unabhängige Stichproben
Daraus ermittelt man die absoluten Häufigkeiten
für . Oft fasst man diese in einer sogenannten Kontingenztabelle zusammen, dabei entspricht der absoluten Häufigkeit aller Ausprägungen der Stichprobe von , was gerade die Stichprobenlänge von ist:

Teststatistik
[Bearbeiten]

Teststatistik:
(hohe Werte von sprechen gegen )
Idee: Die Idee dabei ist, dass man im Falle der Gültigkeit von annehmen kann, dass die relativen Häufigkeiten von bei und nahe bei der gesamten relativen Häufigkeit von sind, das heißt dass
zu erwarten ist, wenn gilt. Dies hätte dann zur Folge, dass die bei der Berechnung von auftretenden Quadrate (und damit auch selbst) eher kleine Werte annimmt, wenn gilt. Also spricht ein hoher Wert von gegen .

p-Wert
[Bearbeiten]

-Wert zu konkreter Teststatistik :
Dabei bezeichnet die Verteilungsfunktion einer -Verteilung mit FG.

Durchführung mit R
[Bearbeiten]

Man kann diesen Test in R mit chisq.test(h) durchführen. Dabei muss eine Matrix (mit 2 Zeilen und Spalten) sein, deren Einträge mit denen der Kontingenztabelle übereinstimmen (d.h. in der ersten Zeile von befinden sich die Werte und in der zweiten Zeile die Werte .)
Man erreicht dies zum Beispiel mit:

Beispiel 1.1
[Bearbeiten]

Es soll untersucht werden, ob Frauen und Männer das gleiche Wahlverhalten zeigen. Zu den 5 zur Auswahl stehenden Parteien wurden 120 Frauen und 100 Männer befragt. Es ergab sich folgende Kontingenztabelle:

Beispiel 1.2
[Bearbeiten]

Man berechnet nun die Teststatistik und den -Wert . Dies ist also ein signifikantes Ergebnis (zum Signifikanzniveau ) und damit ist die Gegenhypothese

mit den Daten vereinbar.

Anmerkungen I
[Bearbeiten]

Falls und stetige ZV sind, kann man den -Homogenitätstest immer noch durchführen, wenn man die Menge der möglichen Werte der beiden ZV vor der Datenerhebung in Klassen aufteilt und dann die absoluten Klassenhäufigkeiten

für in die Kontingenztabelle einträgt.

Anmerkungen II
[Bearbeiten]

Man beachte dabei, dass die Wahl der Klassen das Testergebnis beeinflussen kann und dass der Test bestimmte Unterschiede in den Verteilungen von und nicht mehr aufdecken kann, genau genommen untersucht man nun statt der Nullhypothese
die veränderte Nullhypothese

Beispiel 1.1
[Bearbeiten]

Zwei Maschinen und sollen Kaffee in Päckchen mit je 500 g abfüllen. Es soll festgestellt werden, ob beide Maschinen gleich arbeiten, dazu sollen 60 Päckchen von und 40 Päckchen von untersucht werden. Man bildet (zum Beispiel) die folgenden Klassen und betrachtet dann die Stichproben. Es ergeben sich die folgenden Werte für die Gewichte der einzelnen Päckchen:

Beispiel 1.2
[Bearbeiten]















Die Nullhypothese: : und sind identisch verteilt. kann also zum Signifikanzniveau abgelehnt werden, nicht jedoch für .

Beispiel 1.3
[Bearbeiten]

Ein zweiseitiger Zwei-Stichproben--Test (Welch-Test) zur Nullhypothese

liefert einen -Wert von . (Die empirischen Mittelwerte und unterscheiden sich auch nicht sehr stark.) Der Unterschied zwischen den beiden Verteilungen scheint also eher nicht an ihren Erwartungswerten zu liegen.

Anwendbarkeit
[Bearbeiten]

Da die Teststatistik nur approximativ -verteilt ist, kann der Test nur angewendet werden, wenn die unter erwarteten absoluten Häufigkeiten und groß genug sind (Regel: alle und mindestens 80% davon ). Sind sie nicht alle , so erhält man bei Anwendung der Funktion chisq.test eine Warnung.

Aufgabe 1
[Bearbeiten]

In einer Studie soll auf Unterschiede in zwei Habitaten und in Bezug auf die Zusammensetzung der Ameisenpopulation untersucht werden. Dazu wird in beiden Habitaten eine Falle aufgestellt und die Anzahl der darin gefangenen Individuen der jeweiligen Ameisenarten gezählt:

Untersuchen Sie mit einem - Homogenitätstest, ob die Habitate einen Einfluss auf die Zusammensetzung der Ameisenpopulationen haben.

Aufgabe 2
[Bearbeiten]

Kuss et al. (The fouled player should not take the penalty himself: An empirical investigation of an old German football myth, J. Sports Sciences 25, no. 9, 963967, 2007) berichten über die Elfmeter in der 1. Fußballbundesliga (der Herren) von August 1993 bis Februar 1995. Es wurde festgestellt, dass von 92 Elfmetern, bei denen der Gefoulte selbst geschossen hatte, 74 verwandelt wurden. Von 733 Elfmetern, bei denen der Gefoulte nicht selbst geschossen hatte, wurden 547 verwandelt. Stützen diese Daten die These, dass der Gefoulte den Elfmeter nicht selbst schießen sollte ?

Aufgabe 3
[Bearbeiten]

Betrachten Sie erneut die beiden Abfüllanlagen für Kaffee mit den ZV und . Prüfen Sie erneut mit vier Klassen, ob die gleiche Verteilung vor liegt. Verwenden Sie die Daten aus dem R-Skript datenUEB10.r von GitHub.

Verfahren für mehrere ZV 1
[Bearbeiten]

Das Verfahren lässt sich leicht für drei oder mehr ZV verallgemeinern. Liegen Stichproben vor, anhand derer man eine Kontingenztabelle

aufstellen kann, so testet man die Nullhypothese

Verfahren für mehrere ZV 2
[Bearbeiten]

mit der Teststatistik

Diese ist -verteilt mit Freiheitsgraden, man berechnet den -Wert durch .

Man kann dies in R (wie im Fall , siehe oben) mit chisq.test() tun, wobei die Matrix , die der Kontingenztabelle entspricht, diesmal eine Matrix mit Zeilen und Spalten sein muss.

Aufgabe
[Bearbeiten]

An drei Schulen wird eine Vergleichsarbeit geschrieben. Dabei ergeben sich die folgenden Notenspiegel:

Untersuchen Sie mit einem - Homogenitätstest, ob diese Daten belegen, dass es an den Schulen signifikante Unterschiede bezüglich der Wahrscheinlichkeitsverteilung für die verschiedenen Noten gibt.

Χ²-Unabhängigkeitstest für diskrete oder stetige Verteilungen

[Bearbeiten]

Mit einem -Unabhängigkeitstest kann für zwei diskrete oder stetige ZV anhand verbundener Stichproben getestet werden, ob sie unabhängig voneinander sein könnten.
(Mathematisch unterscheidet sich diese Variante nicht von dem zuvor behandelten Homogenitätstest für zwei oder mehr unabhängige ZV. In Bezug auf Anwendungsbezug, Formulierung und Interpretation bestehen aber Unterschiede, die wir hier behandeln wollen.)

Voraussetzung und Hypothesenpaar

[Bearbeiten]

Voraussetzung:
diskrete oder stetige ZV mit den möglichen Werten oder den Klassen
diskrete oder stetige ZV mit den möglichen Werten oder den Klassen
Hypothesenpaar:

Vorliegende Daten

[Bearbeiten]

Vorliegende Daten: Verbundene Stichproben

Daraus bestimmt man die gemeinsamen absoluten Häufigkeiten

und trägt sie in eine Kontingenztabelle ein:

Teststatistik

[Bearbeiten]

Teststatistik: (hohe Werte von sprechen gegen )
Idee: Falls gilt, erwartet man, dass die entsprechende Tabelle der relativen Häufigkeiten mit hoher Wahrscheinlichkeit in etwa eine Multiplikationstabelle ist, d.h. dass

für alle auftretenden Paare gilt. (Man schreibt manchmal auch und nennt dies die unter erwartete absolute Häufigkeit von für und für .)

p-Wert

[Bearbeiten]

-Wert zu konkreter Teststatistik :

Dabei bezeichnet die Verteilungsfunktion einer -Verteilung mit FG.

Durchführung mit R

[Bearbeiten]

Dies geht völlig analog zum Fall der Homogenitätshypothese (siehe oben) mit , falls die Matrix entsprechend der Kontingenztabelle ( Zeilen, Spalten) ist.

Beispiel 1.1

[Bearbeiten]

In einem Leichtathletikverein werden die Leistungen im Kugelstoßen und im 100 Meter-Lauf untersucht. Man teilt die möglichen Zeiten und Weiten in Klassen ein, erfasst die Leistungen von Sportlern und stellt die absoluten Klassenhäufigkeiten in der Kontingenzabelle zusammen:

Beispiel 1.2

[Bearbeiten]

Also ergibt sich der -Wert zur Unabhängigkeitshypothese als und damit kann sie nicht abgelehnt werden. Allerdings sind hier einige (3 von 12) erwartete absolute Häufigkeiten kleiner als 5 und damit ist die Approximation der Verteilung von durch die -Verteilung möglicherweise zu ungenau.

Abschließende Bemerkungen zu den Χ²-Tests

[Bearbeiten]

Zum Abschluss dieses Abschnitts noch einige Anmerkungen zu Vor- und Nachteilen von -Tests.

Vorteile:

[Bearbeiten]
  • Die Tests sind vielseitig einsetzbar (viele verschiedenartige Nullhypothesen können damit getestet werden).
  • Die Idee ist (relativ) leicht verständlich.
  • Die Tests sind verteilungsfrei, d.h. es muss nicht vorausgesetzt werden, dass eine bestimmte Verteilungsart vorliegt. Insbesondere bei diskreten Verteilungen werden diese Tests daher oft verwendet.
  • R (und andere Statistik-Software-Pakete) haben die Tests implementiert.

Nachteile 1

[Bearbeiten]
  • Bei stetigen ZV beeinflusst die (willkürliche) Bildung der Klassen das Testergebnis. Diese kann auch dazu führen, dass bestimmte Abweichungen von der Nullhypothese vom Test nicht mehr aufgedeckt werden können.
  • Für zu kleine Stichproben (genauer: für zu kleine erwartete absolute Häufigkeiten) können die Tests nicht angewendet werden, da dann die näherungsweise Berechnung des p-Werts nicht genau genug ist. Man sollte dann auf ’exakte’ Tests zurückgreifen (z.B. Fisher-Test auf Unabhängigkeit).

Nachteile 2

[Bearbeiten]
  • Ein direkter Vergleich mehrerer Testverfahren bezüglich der Güte (Teststärke) liefert meist kein eindeutiges Ergebnis, da verschiedene Abweichungen von der Nullhypothese denkbar sind und mit bestimmten Tests manche davon ’besser’ und andere ’schlechter’ vom Test angezeigt werden, d.h. die Wahrscheinlichkeit eines signifikanten Ergebnisses ist je nach Wahl des Testverfahrens in manchen Situationen (in denen vorliegt) größer und in anderen kleiner. Es gibt jedoch (je nach Nullhypothese) insbesondere für stetige Verteilungen sinnvolle Alternativen zum -Test, die ’in den meisten Fällen’ mit höherer Wahrscheinlichkeit ein signifikantes Ergebnis liefern (also eine bessere Güte bzw. höhere Teststärke haben).

Seiteninformation

[Bearbeiten]

Diese Lernresource können Sie als Wiki2Reveal-Foliensatz darstellen.

Wiki2Reveal

[Bearbeiten]

Dieser Wiki2Reveal Foliensatz wurde für den Lerneinheit Kurs:Statistik für Anwender' erstellt der Link für die Wiki2Reveal-Folien wurde mit dem Wiki2Reveal-Linkgenerator erstellt.