Kurs:Statistik für Anwender/Tests zur Binomialverteilung

Aus Wikiversity

Tests zur Binomialverteilung[Bearbeiten]

Situation[Bearbeiten]

Die Trefferwahrscheinlichkeit einer Binomialverteilung ist unbekannt.
Wir betrachten in diesem Kapitel einige Nullhypothesen bezüglich (einseitige und zweiseitige Tests) und erklären jeweils die Berechnung des p-Werts. Alle Verfahren basieren dabei auf der Trefferzahl bei Versuchen.

Linksseitiger Test[Bearbeiten]

Voraussetzung, Hypothesenpaar, Teststatistik[Bearbeiten]

Voraussetzung: binomialverteilt mit Versuchszahl und Trefferwahrscheinlichkeit

Hypothesenpaar: und (linksseitiger Test)
(Dabei ist vorgegeben.)

Vorliegende Daten: Trefferzahl

Teststatistik: Trefferzahl (niedrige Werte von sprechen gegen )

p-Wert und Ablehnbereich[Bearbeiten]

-Wert zu konkreter Trefferzahl  :

Ablehnbereich bei gegebenem Signifikanzniveau :

Durchführung mit R: "less ")

Beispiel linksseitiger Test I[Bearbeiten]

Die Nullhypothese besagt, dass ein Medikament in mindestens 70% aller Fälle eine Nebenwrkung auftritt, also

  • Um die Nullhypothese zu testen, legt man ein Signifikanzniveau fest und beobachtet 100 Patienten, die das Medikament einnehmen. Die Wirkung tritt in 64 Fällen ein. Reicht dies aus, um die Nullhypothese abzulehnen?


    Folglich kann die Nullhypothese nicht abgelehnt werden. (Sie könnte allerdings trotzdem falsch sein, allerdings rechtfertigen die Daten keine Ablehnung zum gegebenen Signifikanzniveau.)

Beispiel linksseitiger Test II[Bearbeiten]
  • Angenommen die Nebenwirkung wäre bei nur 59 Patienten eingetreten. In diesem Fall


    Die Nullhypothese kann nun also abgelehnt werden. Sie könnte dennoch gelten, aber wir wissen: Wenn gilt, ist eine Ablehnung unwahrscheinlich (genauer: ). Eine Ablehung spricht daher gegen .

  • Man stellt bei fest:

Rechtsseitiger Test[Bearbeiten]

Voraussetzung, Hypothesenpaar, Teststatistik[Bearbeiten]

Voraussetzung: binomialverteilt mit Versuchszahl und Trefferwahrscheinlichkeit

Hypothesenpaar: und (rechtsseitiger Test)
(Dabei ist vorgegeben.)

Vorliegende Daten: Trefferzahl

Teststatistik: Trefferzahl (hohe Werte von sprechen gegen )

p-Wert und Ablehnbereich[Bearbeiten]

-Wert zu konkreter Trefferzahl  :

Ablehnbereich bei gegebenem Signifikanzniveau :

Durchührung mit R: " greater ")

Beispiel rechtsseitiger Test I[Bearbeiten]

Die Nullhypothese besagt, dass nach Kalkeinsatz mit einer Wahrscheinlichkeit von höchstens 80% eine bestimmte Verbesserung des Waldbodens eintritt, also:

  • Um die Nullhypothese zu testen, legt man ein Signifikanzniveau fest und führt Kalkeinsätze durch. Die Wirkung tritt in Fällen ein. Es gilt:


  • Also gilt zum Signifikanzniveau :

Beispiel rechtsseitiger Test II[Bearbeiten]

  • Hätte man das Signifikanzniveau auf festgelegt, so hätte dieser Nachweis selbst bei 20 (von 20) Treffern nicht gelingen können, denn es gilt


Beispiel rechtsseitiger Test III[Bearbeiten]

  • Man hätte auch die Nullhypothese betrachten können:

    Hierbei hätte man (wie in 1.) erklärt) zum Signifikanzniveau erhalten:

  • Wir haben festgestellt: Liegt die Trefferzahl zwischen 14 und 18, so kann man weder die Nullhypothese noch die Nullhypothese (zum Signifikanzniveau ) ablehnen. In diesem Fall reichen die Daten (Trefferzahl) nicht aus, um (mit einer Irrtumswahrscheinlichkeit von nicht mehr als ) zu entscheiden, ob oder ist.

Zweiseitiger Test[Bearbeiten]

Wir betrachten nun das Hypothesenpaar:

An diesem Fall soll verdeutlicht werden, dass es bisweilen mehrere sinnvolle Testverfahren gibt, die unterschiedliche Ergebnisse liefern können.

Klar ist hier: Die Nullhypothese sollte sowohl für zu kleine und auch für zu große beobachtete Trefferzahlen abgelehnt werden.

Anmerkung[Bearbeiten]

Zu einer seriösen Vorgehensweise gehört es, sich vor der Datenerhebung auf ein Testverfahren festzulegen (und nicht im Nachhinein ein Testverfahren auszuwählen, dass bei den vorliegenden Daten einen möglichst kleinen -Wert hat, um so ein signifikantes Ergebnis zu erhalten).

1. Methode:[Bearbeiten]

Voraussetzung und Hypothesenpaar[Bearbeiten]

Voraussetzung: binomialverteilt mit Versuchszahl und Trefferwahrscheinlichkeit

Hypothesenpaar: und

Vorliegende Daten: Trefferzahl

Teststatistik und p-Wert[Bearbeiten]

Teststatistik: (hohe Werte von sprechen gegen )
Idee: Falls gilt, ist und damit ist . Die Teststatistik gibt die Abweichung der Trefferzahl von ihrem Erwartungswert (unter ) an.

-Wert zu konkreter Teststatistik  :

ist dabei ebenfalls eine Zufallsvariable, welche mit konkrete Realisierungen für jede mögliche Trefferzahl annimmt.

Beispiel 1. Methode I[Bearbeiten]

Wir führen dies am Beispiel durch. Die verschiedenen Trefferzahlen haben die folgenden Teststatistiken:

Beispiel 1. Methode II[Bearbeiten]

Damit erhält man (exemplarisch) die folgenden -Werte:

  • Angenommen es ergibt sich die Trefferzahl . Dann ist . Der -Wert berechnet sich als Wahrscheinlichkeit (unter der Annahme, dass wahr ist, also tatsächlich gilt):

  • Angenommen es ergibt sich die Trefferzahl . Dann ist . Der -Wert berechnet sich als Wahrscheinlichkeit (unter der Annahme, dass wahr ist, also tatsächlich gilt):

Beispiel 1. Methode III[Bearbeiten]
  • Angenommen es ergibt sich die Trefferzahl . Dann ist . Der -Wert berechnet sich als Wahrscheinlichkeit (unter der Annahme, dass wahr ist, also tatsächlich gilt):

  • Angenommen es ergibt sich die Trefferzahl . Dann ist . Der -Wert berechnet sich als Wahrscheinlichkeit (unter der Annahme, dass wahr ist, also tatsächlich gilt):

Beispiel 1. Methode IV[Bearbeiten]

Mit dieser Methode kann zu jeder Trefferzahl der -Wert bestimmt werden.

wird genau dann abgelehnt, wenn der -Wert ist. Bei ist dies für der Fall.


Der -Wert entspricht damit der Wahrscheinlichkeit (bei Gültigkeit von ), dass beobachtete Ergebnis oder ein im Hinblick auf noch extremeres Ergebnis zu erhalten. Bei dieser Methode wurde eine Trefferzahl als extrem angesehen, wenn sie stark vom Erwartungswert (unter ) abweicht.

2. Methode:[Bearbeiten]

Voraussetzung und Hypothesenpaar[Bearbeiten]

Voraussetzung: binomialverteilt mit Versuchszahl und Trefferwahrscheinlichkeit

Hypothesenpaar: und

Vorliegende Daten: Trefferzahl

Teststatistik und p-Wert[Bearbeiten]

Teststatistik: (niedrige Werte von sprechen gegen )
Idee: Falls gilt, ist und damit ist . Die Teststatistik gibt an, wie wahrscheinlich die beobachtete Trefferzahl ist, falls gilt.

-Wert zu konkreter Teststatistik  :

ist dabei ebenfalls eine Zufallsvariable, welche mit konkrete Realisierungen für jede mögliche Trefferzahl annimmt.

Durchführung mit R:

Beispiel 2. Methode I[Bearbeiten]
  • Betrachte: (also ) im Fall

    Wir berechnen zunächst zu jeder möglichen Trefferzahl den Wert ( Wahrscheinlichkeit für die Trefferzahl , falls die Nullhypothese gilt):

Beispiel 2. Methode II[Bearbeiten]

Wir berechnen nun für alle möglichen Trefferzahlen den -Wert:

Beispiel 2. Methode III[Bearbeiten]
  • Betrachtet man wieder das Beispiel, dass wir mit Methode 1 schon behandelt hatten (also ), so kommt man mit Methode 2 zu einer Ablehnung von , falls . (An diesem Beispiel sieht man also, dass man mit den beiden Methoden zu verschiedenen -Werten und verschiedenen Ablehnbereichen kommen kann.)

Der -Wert entspricht damit der Wahrscheinlichkeit (bei Gültigkeit von ), dass beobachtete Ergebnis oder ein im Hinblick auf noch extremeres Ergebnis zu erhalten. Bei diesem Test wurde eine Trefferzahl als extrem angesehen, wenn sie unwahrscheinlich ist, falls gilt.

Aufgabe 1.1[Bearbeiten]

Bestimmen Sie für die folgenden Nullhypothesen (bezüglich der Trefferwahrscheinlichkeit einer Binomialverteilung) jeweils die Ablehnbereiche zu den angegebenen Versuchszahlen und Signifikanzniveaus .
Wie wirkt es sich auf die Teststärke aus, wenn man die Versuchszahl erhöht bzw. das Signifikanzniveau verringert?
(Hinweis: Geben Sie den p-Wert zuerst als Formel an, in die Sie alle bekannten Werte einsetzen.)

Nullhypothese .

Aufgabe 1.2[Bearbeiten]

Nullhypothese .

Aufgabe 2.1[Bearbeiten]

Berechnen Sie zu den angegebenen Nullhypothesen zur Trefferwahrscheinlichkeit einer Binomialverteilung bei Versuchen den p-Wert aller möglichen Trefferzahlen und daraus den Ablehnbereich für die angegebenen Signifikanzniveaus. Verwenden Sie den links- und rechtsseitigen Binomialtest aus der Vorlesung.
(Hinweis: Geben Sie den p-Wert zuerst als Formel an, in die Sie alle bekannten Werte einsetzen und bestimmen Sie dann (z.B. mit R) die konkreten Werte.)

Aufgabe 2.2[Bearbeiten]

Nullhypothese , .


Aufgabe 2.3[Bearbeiten]

Nullhypothese , .


Aufgabe 3.1[Bearbeiten]

Berechnen Sie zu der angegebenen Nullhypothese zur Trefferwahrscheinlichkeit einer Binomialverteilung bei Versuchen den p-Wert aller möglichen Trefferzahlen und daraus den Ablehnbereich für die angegebenen Signifikanzniveaus. Verwenden Sie den beidseitigen (Methode 1 und Methode 2) Binomialtest aus der Vorlesung. Vergleichen Sie die Ergebnisse.

(Hinweis: Geben Sie den p-Wert zuerst als Formel an, in die Sie alle bekannten Werte einsetzen und bestimmen Sie dann (z.B. mit R) die konkreten Werte.)

Aufgabe 3.2[Bearbeiten]

Nullhypothese , .


Seiteninformation[Bearbeiten]

Diese Lernresource können Sie als Wiki2Reveal-Foliensatz darstellen.

Wiki2Reveal[Bearbeiten]

Dieser Wiki2Reveal Foliensatz wurde für den Lerneinheit Kurs:Statistik für Anwender' erstellt der Link für die Wiki2Reveal-Folien wurde mit dem Wiki2Reveal-Linkgenerator erstellt.