Zum Inhalt springen

Kurs:Stochastik/hypergeometrische Verteilung

Aus Wikiversity

Einführung

[Bearbeiten]

Die hypergeometrische Verteilung ist eine Wahrscheinlichkeitsverteilung in der Stochastik. Sie ist univariat und zählt zu den diskreten Wahrscheinlichkeitsverteilungen. In Abgrenzung zur allgemeinen hypergeometrischen Verteilung wird sie auch klassische hypergeometrische Verteilung genannt.[1]

Dichotomie: Fehlerhaft, in Ordnung

[Bearbeiten]

Einer dichotomen Grundgesamtheit werden in einer Stichprobe zufällig Elemente ohne Zurücklegen entnommen. Die hypergeometrische Verteilung gibt dann Auskunft darüber, mit welcher Wahrscheinlichkeit in der Stichprobe eine bestimmte Anzahl von Elementen vorkommt, die die gewünschte Eigenschaft haben. Bedeutung kommt dieser Verteilung daher etwa bei Qualitätskontrollen zu.

Rückführung auf Urnenmodell

[Bearbeiten]

Die hypergeometrische Verteilung wird modellhaft dem Urnenmodell ohne Zurücklegen zugeordnet (siehe auch Kombination ohne Wiederholung). Man betrachtet speziell in diesem Zusammenhang eine Urne mit zwei Sorten Kugeln. Es werden Kugeln ohne Zurücklegen entnommen. Die Zufallsvariable ist die Zahl der Kugeln der ersten Sorte in dieser Stichprobe.

Anwendungskontext

[Bearbeiten]

Die hypergeometrische Verteilung beschreibt also die Wahrscheinlichkeit dafür, dass bei gegebenen Elementen („Grundgesamtheit des Umfangs “), von denen die gewünschte Eigenschaft besitzen, beim Herausgreifen von Probestücken („Stichprobe des Umfangs “) genau Treffer erzielt werden, d. h. die Wahrscheinlichkeit für Erfolge in Versuchen.

Beispiel

[Bearbeiten]

In einer Urne befinden sich 45 Kugeln, 20 davon sind gelb. Wie hoch ist die Wahrscheinlichkeit, bei einer Stichprobe von zehn Kugeln genau vier gelbe Kugeln zu ziehen? Das Beispiel wird unten durchgerechnet.

Variablen

[Bearbeiten]

Die hypergeometrische Verteilung ist abhängig von drei Parametern:

  • der Anzahl der Elemente einer Grundgesamtheit.
  • der Anzahl der Elemente mit einer bestimmten Eigenschaft in dieser Grundmenge (die Anzahl möglicher Erfolge).
  • der Anzahl der Elemente in einer Stichprobe.

Beschreibung des Zufallsexperiments

[Bearbeiten]

Die Verteilung gibt nun Auskunft darüber, wie wahrscheinlich es ist, dass sich Elemente mit der zu prüfenden Eigenschaft (Erfolge bzw. Treffer) in der Stichprobe befinden. Der Ergebnisraum ist daher .


Berechnung der Wahrscheinlichkeit

[Bearbeiten]

Eine diskrete Zufallsgröße unterliegt der hypergeometrischen Verteilung mit den Parametern , und , wenn sie die Wahrscheinlichkeiten

für besitzt. Dabei bezeichnet den BinomialkoeffizientenN über n“. Man schreibt dann oder .

Verteilungsfunktion

[Bearbeiten]

Die Verteilungsfunktion gibt dann die Wahrscheinlichkeit an, dass höchstens Elemente mit der zu prüfenden Eigenschaft in der Stichprobe sind. Diese kumulierte Wahrscheinlichkeit ist die Summe bis zur obere Summationsgrenze , die über die Gaußklammer berechnet wird.

Beispiele - Hypergeometrische Verteilung

[Bearbeiten]
  • Beispiel Urnenmodell
  • Lotto

Beispiel - Urnemodell

[Bearbeiten]

In einem Behälter befinden sich Kugeln, davon sind gelb. Es werden Kugeln ohne Zurücklegen entnommen.

  • Die hypergeometrische Verteilung gibt die Wahrscheinlichkeit dafür an, dass genau der entnommenen Kugeln gelb sind.
  • gibt die Wahrscheinlichkeit dafür an, dass 4 der gezogenen Kugel gelb sind.

Ausführliches Rechenbeispiel für die Kugeln (1)

[Bearbeiten]

Die Wahrscheinlichkeit ergibt sich aus:

  • Anzahl der Möglichkeiten, genau 4 gelbe (und damit genau 6 violette) Kugeln auszuwählen
  • geteilt durch Anzahl der Möglichkeiten, genau 10 Kugeln beliebiger Farbe auszuwählen


Ausführliches Rechenbeispiel für die Kugeln (2)

[Bearbeiten]

Die Anzahl der Möglichkeiten gelbe Kugel aus der Gesamtzahl von möglichen gelben Kugel auszuwählten ergibt

Ausführliches Rechenbeispiel für die Kugeln (3)

[Bearbeiten]

Für die violetten Kugeln ergibt sich analog:

Möglichkeiten, genau 6 violette Kugeln auszuwählen.

Ausführliches Rechenbeispiel für die Kugeln (4)

[Bearbeiten]

Da jede „gelbe Möglichkeit“ mit jeder „violetten Möglichkeit“ kombiniert werden kann, ergeben sich insgesamt

Möglichkeiten für genau 4 gelbe und 6 violette Kugeln auszuwählen.

Ausführliches Rechenbeispiel für die Kugeln (5)

[Bearbeiten]

Es gibt insgesamt

Möglichkeiten, 10 Kugeln zu ziehen.

Man erhält also die Wahrscheinlichkeit

das heißt, in rund 27 Prozent der Fälle werden genau 4 gelbe (und 6 violette) Kugeln entnommen.

Ausführliches Rechenbeispiel für die Kugeln (6)

[Bearbeiten]

Alternativ kann das Ergebnis auch mit folgender Gleichung gefunden werden

Es befinden sich in der Stichprobe vom Umfang nämlich 4 gelbe Kugeln. Die restlichen gelben Kugeln (16) befinden sich in den 35 übriggebliebenen Kugeln, die nicht zur Stichprobe gehören.

Beispiel - Lotto

[Bearbeiten]

Ein Beispiel für die praktische Anwendung der hypergeometrischen Verteilung ist das Lotto: Beim Zahlenlotto gibt es 49 nummerierte Kugeln; davon werden bei der Auslosung 6 gezogen; auf dem Lottoschein werden 6 Zahlen angekreuzt.

gibt die Wahrscheinlichkeit dafür an, genau x = 0, 1, 2, 3, …, 6 „Treffer“ zu erzielen.

Also .


Alternative Parametrisierung

[Bearbeiten]

Gelegentlich wird auch als Wahrscheinlichkeitsfunktion

verwendet. Diese geht mit und in die obige Variante über.

Eigenschaften der hypergeometrischen Verteilung

[Bearbeiten]

Neben den zentralen Eigenschaften, wie

werden Symmetrieeigenschaften, Modus, charakteristische Funktion, ... für die hypergeometrische Verteilung angegeben

Erwartungswert

[Bearbeiten]

Der Erwartungswert der hypergeometrisch verteilten Zufallsvariable ist

Varianz

[Bearbeiten]

Die Varianz der hypergeometrisch verteilten Zufallsvariable ist

wobei der letzte Bruch der so genannte Korrekturfaktor (Endlichkeitskorrektur) beim Modell ohne Zurücklegen ist.

Modus

[Bearbeiten]

Der Modus oder Modalwert der hypergeometrischen Verteilung gibt an, bei welchem Wert der Zufallsvariable die induzierte Wahrscheinlichkeitsverteilung ein lokales Maximum annimmt. Der Modus liegt für die hypergeometrische Verteilung bei

Dabei ist die Gaußklammer.

Schiefe

[Bearbeiten]

Die Schiefe der hypergeometrischen Verteilung ist

Charakteristische Funktion

[Bearbeiten]

Die charakteristische Funktion hat die folgende Form:

Wobei die gaußsche hypergeometrische Funktion bezeichnet.

Momenterzeugende Funktion

[Bearbeiten]

Auch die momenterzeugende Funktion lässt sich mittels der hypergeometrischen Funktion ausdrücken:

Wahrscheinlichkeitserzeugende Funktion

[Bearbeiten]

Die wahrscheinlichkeitserzeugende Funktion ist gegeben als

Beziehung zu anderen Verteilungen

[Bearbeiten]

Beziehung zur Binomialverteilung

[Bearbeiten]

Im Gegensatz zur Binomialverteilung werden bei der hypergeometrischen Verteilung die Stichproben nicht wieder in das Reservoir zur erneuten Auswahl zurückgelegt. Ist der Umfang der Stichprobe relativ klein (etwa ) im Vergleich zum Umfang der Grundgesamtheit, unterscheiden sich die durch die Binomialverteilung bzw. die hypergeometrische Verteilung berechneten Wahrscheinlichkeiten nicht wesentlich voneinander. In diesen Fällen wird dann oft die Approximation durch die mathematisch einfacher zu handhabende Binomialverteilung vorgenommen.

Beziehung zur Pólya-Verteilung

[Bearbeiten]

Die hypergeometrische Verteilung ist ein Spezialfall der Pólya-Verteilung (wähle ).

Beziehung zum Urnenmodell

[Bearbeiten]

Die hypergeometrische Verteilung entsteht aus der diskreten Gleichverteilung durch das Urnenmodell. Aus einer Urne mit insgesamt Kugeln sind eingefärbt und es werden Kugeln gezogen. Die hypergeometrische Verteilung gibt für die Wahrscheinlichkeit an, dass gefärbte Kugeln gezogen werden. Siehe hierzu auch das Beispiel.

Beziehung zur multivariaten hypergeometrischen Verteilung

[Bearbeiten]

Die multivariate hypergeometrische Verteilung ist eine Verallgemeinerung der hypergeometrischen Verteilung. Sie beantwortet die Frage nach der Anzahl der gezogenen Kugeln einer Farbe aus einer Urne, wenn diese mehr als zwei unterscheidbare Farben von Kugeln enthält. Für zwei Farben stimmt sie mit der hypergeometrischen Verteilung überein.

[Bearbeiten]

Wikibooks  Wikibooks: Hypergeometrische Verteilung – Lern- und Lehrmaterialien

Einzelnachweise

[Bearbeiten]
  1. Hans-Otto Georgii: Stochastik. Einführung in die Wahrscheinlichkeitstheorie und Statistik. 4. Auflage. Walter de Gruyter, Berlin 2009, ISBN 978-3-11-021526-7, S. 36, doi:10.1515/9783110215274

Seiten-Information

[Bearbeiten]

Dieser Wiki2Reveal Foliensatz wurde für den Lerneinheit Kurs:Stochastik' erstellt der Link für die Wiki2Reveal-Folien] wurde mit dem Wiki2Reveal-Linkgenerator erstellt.

Diese Seite wurde auf Basis der folgenden Wikipedia-Quelle erstellt: