Kurs:Stochastik/Normalverteilung
Einführung
[Bearbeiten]Die Normal- oder Gauß-Verteilung (nach Carl Friedrich Gauß) ist in der Stochastik ein wichtiger Typ stetiger Wahrscheinlichkeitsverteilungen. Ihre Wahrscheinlichkeitsdichte wird auch Gauß-Funktion, Gaußsche Normalverteilung, Gaußsche Verteilungskurve, Gauß-Kurve, Gaußsche Glockenkurve, Gaußsche Glockenfunktion, Gauß-Glocke oder schlicht Glockenkurve genannt.
Bedeutung der Normalverteilung
[Bearbeiten]Die besondere Bedeutung der Normalverteilung beruht unter anderem auf dem zentralen Grenzwertsatz, dem zufolge Verteilungen, die durch additive Überlagerung einer großen Zahl von unabhängigen Einflüssen entstehen, unter schwachen Voraussetzungen annähernd normalverteilt sind.
Normalverteilte Abweichung vom Erwartungswert
[Bearbeiten]Die Abweichungen der Messwerte vieler natur-, wirtschafts- und ingenieurwissenschaftlicher Vorgänge vom Erwartungswert lassen sich durch die Normalverteilung (bei biologischen Prozessen oft logarithmische Normalverteilung) entweder exakt oder zumindest in sehr guter Näherung beschreiben (vor allem Prozesse, die in mehreren Faktoren unabhängig voneinander in verschiedene Richtungen wirken).
Beispiele für die Beschreibung zufälliger Vorgänge
[Bearbeiten]Zufallsvariablen mit Normalverteilung benutzt man zur Beschreibung zufälliger Vorgänge wie:
- (Messung fehlerhaft) zufällige Messfehler,
- (Werkstücke fehlerhaft)zufällige Abweichungen vom Sollmaß bei der Fertigung von Werkstücken,
- (Bewegung zufällig) Beschreibung der brownschen Molekularbewegung.
Versicherungsmathematik - Schadensdaten
[Bearbeiten]In der Versicherungsmathematik wird die Normalverteilung zur Modellierung von Schadensdaten im Bereich mittlerer Schadenshöhen verwenden. Dabei ist allerdings zu berücksichtigten, dass die Normalverteilung als Ergebnisraum
Interpretation Erwartungswert und Standardabweichung
[Bearbeiten]Somit kann neben dem Erwartungswert , der als Schwerpunkt der Verteilung interpretiert werden kann, auch der Standardabweichung eine einfache Bedeutung im Hinblick auf die Größenordnungen der auftretenden Abweichungen der normalverteilten Messwerte vom Erwartungswert zugeordnet werden.
Glockenkurve
[Bearbeiten]Der Graph dieser Dichtefunktion hat eine „glockenförmige Gestalt“ und ist symmetrisch mit dem Parameter als Symmetriezentrum, der auch den w:de:ErwartungswertErwartungswert und den Median der Verteilung darstellt. Die Varianz von ist der Parameter . Weiterhin hat die Wahrscheinlichkeitsdichte Wendepunkte bei .
Graph der Dichtefunktion
[Bearbeiten]
Definition - Normalverteilung
[Bearbeiten]Eine stetige Zufallsvariable hat eine (Gauß- oder) Normalverteilung mit Erwartungswert und Varianz (), oft geschrieben als , wenn die folgende Wahrscheinlichkeitsdichte hat:[1][2]
Alternative Notation der Dichtefunktion
[Bearbeiten]Die Transformation der Standardnormalverteilung in die Normalverteilung mit dem Verteilungsparameter und erfolgt über den Term . Wenn man diese Transformation in der Dichtefunktion sichtbar machen möchte, eignet sich die folgende Umformung der obigen Dichtefunktion:
Verteilungsfunktion - Normalverteilung
[Bearbeiten]Bei integrablen Wahrscheinlichkeitsdichten ist die eindimensionale Verteilungsfunktion wie folgt definiert:
Die Reihendarstellung ergibt sich durch summandenweise Intergration der Taylorreihe für die Dichtefunktion der Standardnormalverteilung und der Transformation in eine Normalverteilung mit Erwartungswert und Varianz .
Graph der Verteilungsfunktion
[Bearbeiten]
Numerische Berechnung von Wahrscheinlichkeiten
[Bearbeiten]Die Funktionswert der Verteilungsfunktion kann man über die Potenzreihendarstellung der Verteilungsfunktion numerisch berechnen.
Standardnormalverteilungstabelle
[Bearbeiten]Die Wahrscheinlichkeiten können mithilfe einer Standardnormalverteilungstabelle berechnet werden, die eine Standardform verwendet. Um das zu sehen, benutzt man die Tatsache, dass eine lineare Funktion einer normalverteilten Zufallsvariablen selbst wieder normalverteilt ist.
Lineare Transformation normalverteilter Zufallsvariablen
[Bearbeiten]Konkret heißt das, wenn und , wobei und Konstanten sind mit , dann gilt .
Als Folgerung daraus ergibt sich die Zufallsvariable[3]
die auch standardnormalverteilte Zufallsvariable genannt wird.
Definition - Standardnormalverteilung
[Bearbeiten]Die Standardnormalverteilung ist also die Normalverteilung mit Parametern und . Die Dichtefunktion der Standardnormalverteilung ist gegeben durch
Ihr Verlauf ist nachfolgend graphisch dargestellt.
Mehrdimensionale Normalverteilung
[Bearbeiten]Die mehrdimensionale Verallgemeinerung ist im Artikel mehrdimensionale Normalverteilung zu finden.

Normalverteilung in der Funktionentheorie
[Bearbeiten]Die Dichte der Normalverteilung kann man als ganze Funktion in der Funktionen in der Funktionentheorie behandeln und dann mit den allgemeinen Eigenschaften einer Verteilungsfunktion mit dem Identitätssatz und der gleichmäßigen Konvergenz auf Kreisscheiben in die Reihendarstellung der Verteilungsfunktion herleiten. Mit erhält man damit auch eine Reihendarstellung der Verteilungsfunktion auf .
Taylorentwicklung der Verteilungsfunktion
[Bearbeiten]Zunächst betrachtet man die Reihendarstellung der Standardnormalverteilung als komplexe holomorphe Funktion, wobei man den Definitionsbereich von auf erweitert. Dieser Schritt erfolgt, um Sätze aus der Funktionentheorie für die Verteilungsfunktion verwenden zu können.
Voraussetzung
[Bearbeiten]Um die Resultate aus der komplexen Analysis verwenden zu können betrachtet man die Dichtefunktion mit der Erweiterung des Definitionsbereiches auf .
Dichtefunktion als holomorphe Funktion
[Bearbeiten]ist als Verkettung von zwei auf ganz holomorphen Funktion und wieder eine ganze Funktion , die eine Reihendarstellung für alle besitzt und damit insbesondere für alle . Der Konvergenzradius der Taylorreihe von ganzen Funktion ist unendlich.
Partialsummen der Potenzreihe
[Bearbeiten]Man betrachtet nun die Funktionenfolge der Partialsummen mit:
Die Funktionenfolge konvergiert auf jeder abgeschlossenen Einheitskreisscheibe gleichmäßig gegen .
Gleichmäßige Konvergenz auf Kreisscheiben
[Bearbeiten]Da die Partialsummenfolgen der Potenzreihe gleichmäßig auf abgeschlossenen Kreisscheiben für beliebige gegen die konvergieren, kann man Integration und Grenzwertprozess der Funktionenfolge vertauschen. und bei der Integration summandenweise integrieren.
Stammfunktion auf Kreisscheiben
[Bearbeiten]Damit erhält man eine Stammfunktion von auf der abgeschlossenen Kreisscheibe mit:
Stammfunktion der Dichtefunktion
[Bearbeiten]Nach dem Identitätssatz stimmt die Potenzreihe auf einer nicht diskreten Teilmenge mit auf überein, damit muss die ganze Funktion auf ganz mit übereinstimmen. Damit erhält man folgende Stammfunktion von :
Weitere Stammfunktionen von unterscheiden sich von lediglich um eine Konstante mit .
Eigenschaften der Verteilungsfunktion
[Bearbeiten]Die gesuchte Potenzreihe der Verteilungsfunktion ist insbesondere eine Stammfunktion der Dichte , aber nicht jede Stammfunktion ist auch eine Verteilungsfunktion, da eine Verteilungsfunktion weitere Eigenschaften folgende charakterisierende erfüllen muss:
- und .
Grenzwerteigenschaften der komplexwertigen Einbettung der Verteilungsfunktion
[Bearbeiten]Für die Stammfunktion müsste daher auf der reellen Achse das folgende Grenzwertverhalten gelten:
- und
Um die nun weitere in den reellen Zahlen die Eigenschaften der Stammfunktion untersuchen zu können, betrachtet man nun noch die Einschränkung der Potenzreihe auf die reellen Zahlen.
Stammfunktion auf den reellen Zahlen
[Bearbeiten]Wenn eine Stammfunktion von auf ist, dann ist insbesondere eine Stammfunktion von auf :
Funktionswert der Stammfunktion in 0
[Bearbeiten]Man betrachtet nun den Funktionswert der Stammfunktion in 0 und nutzt die Achsensymmetrie der Standardnormalverteilung zur -Achse aus.
Gleichzeitig gilt , weil die Potenzreihe nur ungerade Exponenten besitzt.
Uneigentliches Integral und Normierung
[Bearbeiten]Weil die Standardnormalverteilung eine Wahrscheinlichkeitsverteilung ist, gilt für das uneigentliche Integral und der Normierung der Wahrscheinlichkeitsmaßes:
Zerlegung des uneigentlichen Integrals
[Bearbeiten]Man zerlegt nun das uneigentlichen Integral in zwei Teilintegrale nutzt dann die Symmetrie von mit aus.
Damit muss bei der Verteilungsfunktion der Standardnormalverteilung gelten.
Konstante für die Verteilungsfunktion
[Bearbeiten]Damit ist die Konstante der Verteilungsfunktion festgelegt und man erhält:
Die darstellende Potenzreihe der Verteilungsfunktion ist damit:
Alternative Taylorentwicklung der Verteilungsfunktion
[Bearbeiten]Über partielle Integration erhält man die folgende Darstellung der Verteilungsfunktion:
Dabei bezeichnet die Doppelfakultät von .
Bemerkung zur Taylordarstellung
[Bearbeiten]Die Addition von sorgt dafür, dass die Verteilungsfunktion für jeweils gegen 0 bzw. 1 konvergiert. Der Vorfaktor sorgt für die Normierung des Flächeninhaltes und damit auf für das Grenzwertverhalten gegen 1.
Eigenschaften
[Bearbeiten]Verteilungsfunktion
[Bearbeiten]Die Verteilungsfunktion der Normalverteilung ist durch
gegeben.
Symmetrie Standardnormalverteilung
[Bearbeiten]- Die Dichtefunktion der Standardnormalverteilung ist symmetrisch zur -Achse und
- die Verteilungsfunktion ist punktsymmetrisch zum Punkt
Verteilungsfunktion der Standardnormalverteilung
[Bearbeiten]Betrachtet man die Verteilungsfunktion für die Dichte der Standardnormalverteilung mit und erhält man die folgende mit bezeichnete Verteilungsfunktion der Standardnormalverteilung:
Transformation - Integral Standardnormalverteilung
[Bearbeiten]Wenn man durch die Substitution statt eine neue Integrationsvariable einführt, ergibt sich ein Integral über die Dichtefunktion der Standardnormalverteilung:
Symmetrie
[Bearbeiten]Der Graph der Wahrscheinlichkeitsdichte ist eine Gaußsche Glockenkurve, deren Höhe und Breite von abhängt. Sie ist achsensymmetrisch zur Geraden mit der Gleichung und somit eine symmetrische Wahrscheinlichkeitsverteilung um ihren Erwartungswert. Der Graph der Verteilungsfunktion ist punktsymmetrisch zum Punkt Für gilt insbesondere und für alle .
Maximalwert und Wendepunkte der Dichtefunktion
[Bearbeiten]Mit Hilfe der ersten und zweiten Ableitung lassen sich der Maximalwert und die Wendepunkte bestimmen. Die erste Ableitung ist
Das Maximum der Dichtefunktion der Normalverteilung liegt demnach bei und beträgt dort .
Die zweite Ableitung lautet
Somit liegen die Wendestellen der Dichtefunktion bei . Die Dichtefunktion hat dort den Wert .
Normierung der Normalverteilung
[Bearbeiten]Um nachzuweisen das die Verteilung mit der obigen Dichtefunktion tatsächlich ein Wahrscheinlichkeitsverteilung ist, muss man das Axiom der Normiertheit für das Wahrscheinlichkeitmaß zeigen. Dies wird für die Standardnormalverteilung umgesetzt.
Normierung (1)
[Bearbeiten]Wichtig ist, dass die gesamte Fläche unter der Kurve gleich , also gleich der Wahrscheinlichkeit des sicheren Ereignisses, ist. Somit folgt, dass, wenn zwei Gaußsche Glockenkurven dasselbe , aber unterschiedliches haben, die Kurve mit dem größeren breiter und niedriger ist (da ja beide zugehörigen Flächen jeweils den Wert haben und nur die Standardabweichung größer ist). Zwei Glockenkurven mit gleichem aber unterschiedlichem haben kongruente Graphen, die um die Differenz der -Werte parallel zur -Achse gegeneinander verschoben sind.
Normierung (2)
[Bearbeiten]Jede Normalverteilung ist tatsächlich normiert, denn mit Hilfe der linearen Substitution erhalten wir
Normierung (3)
[Bearbeiten]Um die Normiertheit nachzuweisen, berechnet man das Quadrat des folgenden
Da die Dichtefunktion im Integranden eine positive Funktion ist, muss . Daher kann man aus auch auf
Normierung (4) - Lösungsansätze zur Berechnung des Integrals
[Bearbeiten]Man kann die Stammfunktion des Integranden als elementare Funktion angeben, gibt es trotzdem mehr als ein halbes Dutzend Lösungswege, seinen Wert zu bestimmen, angefangen bei ersten Näherungen De Moivres aus dem Jahr 1733 über die Arbeiten von Laplace und Poisson aus der Zeit um 1800 bis hin zu einem gänzlich neuen Lösungsansatz S. P. Evesons aus dem Jahr 2005.[4]
Normierung (5) - Lösungsansätze zur Berechnung des Integrals
[Bearbeiten]Einer der entscheidenden Tricks für seine Berechnung (angeblich von Poisson[5]) ist es, auf eine höhere Dimension auszuweichen und das resultierende 2D-Integrationsgebiet über Polarkoordinaten zu parametrisieren.
Normierung (6) - Lösungsansätze zur Berechnung des Integrals
[Bearbeiten]Grundlage für die erste Umformung ist die Linearität des Integrals.
Normierung (7) - Verwendung der Parametertransformation in Polarkoordinaten
[Bearbeiten]Statt längs kartesischer Koordinaten wird über nun längs Polarkoordinaten integriert, was der Substitution und daraus entspricht.
Normierung (8) - Verwendung der Parametertransformation in Polarkoordinaten
[Bearbeiten]Nun erhält man das Integral über die Verwendung der Transformationssatz
Normierung (9) - Verwendung der Parametertransformation in Polarkoordinaten
[Bearbeiten]Damit erhält man das gesuchte Integral mit der Voraussetzung :
Berechnung
[Bearbeiten]Da sich nicht auf eine elementare Stammfunktion zurückführen lässt, wurde für die Berechnung früher meist auf Tabellen zurückgegriffen (siehe Standardnormalverteilungstabelle). Heutzutage sind in statistischen Programmiersprachen wie zum Beispiel R Funktionen verfügbar, die auch die Transformation auf beliebige und beherrschen.
Erwartungswert
[Bearbeiten]Der Erwartungswert der Standardnormalverteilung ist . Es sei , so gilt
da der Integrand integrierbar und punktsymmetrisch ist.
Stammfunktion des Integranden
[Bearbeiten]Der Integrand beim Erwartungswert besitzt eine Stammfunktion , denn es gilt:
Mit dieser kleinen Transformation ist die innere Ableitung von . Mit der Anwendung der Substitutionregel in der Integralrechnung erhält man eine Stammfunktion .
Lineare Transformation - Linearität des Erwartungswertes
[Bearbeiten]Ist nun , so gilt ist standardnormalverteilt, und somit kann man mit der Linearität des Erwartungswertes
Varianz
[Bearbeiten]Die Varianz der -normalverteilten Zufallsvariablen entspricht dem Parameter
Berechnung der Varianz (1)
[Bearbeiten]Die Berechnung der Varianz erfolgt über partielle Integration für den Integranden der Standardnormalverteilung . Für die Varianz gilt:
Also muss man für die Berechnung der Varianz nur das zweite Moment berechnen.
Berechnung der Varianz (2)
[Bearbeiten]Die Berechnung des zweiten Momentes nutzt die partielle Integration und die Kettenregel für die Verkettung von Funktionen bei der Berechnung von
Berechnung der Varianz (2)
[Bearbeiten]Mit der obigen Definition der Funktionen und erhält man mit der partiellen Integrationregel
für uneigentliche Integral.
Berechnung der Varianz (3)
[Bearbeiten]Die Berechnung des 2. Momentes ergibt daher über:
Berechnung der Varianz (4)
[Bearbeiten]Insgesamt ergibt sich damit die Berechnung der Varianz für die Standardnormalverteilung . :
Wahrscheinlichkeitsdichte als Taylorreihe
[Bearbeiten]Für Taylorreihen kann man für Wert aus dem Konvergenzbereich die Dichtefunktion als Potenzreihe darstellen und von Potenzreihen kann man eine Stammfunktion direkt über die Integration der Summanden der Taylorreihe (Polynome -ten Grades) bilden. Dazu muss man die Taylorkoeffizienten berechnen.
Taylorkoeffizienten der Standardnormalverteilungsdichte
[Bearbeiten]Zunächst müssen die Ableitungen der Dichtefunktion mit der mit der Produktregel gebildet werden.
ist ein Polynom -ten Grades. Siehe auch Maxima CAS/Taylorkoeffizienten
Aufgabe für Studierende
[Bearbeiten]- Bestimmen Sie die Ableitungen der Dichtefunktion in einer expliziten Form für das führende Polynom
- Zeigen Sie, dass für ungeradzahlige Ableitungen gilt!
- Berechnen Sie explizit für geradzahlige Ableitungen!
Entwicklungspunkt 0
[Bearbeiten]Mit dem Entwicklungspunkt 0 verschwindet viele Summand aus dem vorangestellten ersten Polynom. Insbesondere sind die Koeffizienten mit ungeradem Summanden 0. Die fortgesetzten Ableitung wurden mit der Produktregel berechnet.
Charakteristische Funktion
[Bearbeiten]Die charakteristische Funktion für eine standardnormalverteilte Zufallsvariable ist
Für eine Zufallsvariable erhält man daraus mit :
Faltung von Wahrscheinlichkeitsdichten
[Bearbeiten]Die Faltung von Wahrscheinlichkeitsdichten , für zwei normalverteilten stochastisch unabhängigen Zufallfallsgrößen liefert die Wahrscheinlichkeitsdichte der Summenverteilung .
Invarianz gegenüber Faltung (1)
[Bearbeiten]Die Normalverteilung ist invariant gegenüber der Faltung, d. h., die Summe unabhängiger normalverteilter Zufallsvariablen ist wieder normalverteilt (siehe dazu auch unter stabile Verteilungen bzw. unter unendliche teilbare Verteilungen). Eine veranschaulichende Formulierung dieses Sachverhaltes lautet: Die Faltung einer Gaußkurve der Halbwertsbreite mit einer Gaußkurve der Halbwertsbreite ergibt wieder eine Gaußkurve mit der Halbwertsbreite
Invarianz gegenüber Faltung (2)
[Bearbeiten]Sind also zwei unabhängige Zufallsvariablen mit
so ist deren Summe ebenfalls normalverteilt:
Das kann beispielsweise mit Hilfe von charakteristischen Funktionen gezeigt werden, indem man verwendet, dass die charakteristische Funktion der Summe das Produkt der charakteristischen Funktionen der Summanden ist (vgl. Faltungssatz der Fouriertransformation).
Invarianz gegenüber Faltung (3)
[Bearbeiten]Gegeben seien allgemeiner unabhängige und normalverteilte Zufallsvariablen .
Dann ist deren Summe wieder normalverteilt
und das arithmetische Mittel ebenfalls
Nach dem Satz von Cramér gilt sogar die Umkehrung.
Beziehungen zu anderen Verteilungsfunktionen
[Bearbeiten]Transformation zur Standardnormalverteilung (1)
[Bearbeiten]Eine Normalverteilung mit beliebigen und und der Verteilungsfunktion hat, wie oben erwähnt, die nachfolgende Beziehung zur -Verteilung:
Darin ist die Verteilungsfunktion der Standardnormalverteilung.
Transformation zur Standardnormalverteilung (2)
[Bearbeiten]Wenn , dann führt die Z-Transformation
zu einer standardnormalverteilten Zufallsvariablen , denn
Geometrisch betrachtet entspricht die durchgeführte Substitution einer flächentreuen Transformation der Glockenkurve von zur Glockenkurve von .
Approximation der Binomialverteilung durch die Normalverteilung (1)
[Bearbeiten]Die Normalverteilung kann zur Approximation der Binomialverteilung verwendet werden, wenn der Stichprobenumfang hinreichend groß und in der Grundgesamtheit der Anteil der gesuchten Eigenschaft weder zu groß noch zu klein ist (Satz von Moivre-Laplace, zentraler Grenzwertsatz, zur experimentellen Bestätigung siehe auch unter Galtonbrett).
Approximation der Binomialverteilung durch die Normalverteilung (2)
[Bearbeiten]Ist ein Bernoulli-Versuch mit voneinander unabhängigen Stufen (bzw. Zufallsexperimenten) mit einer Erfolgswahrscheinlichkeit gegeben, so lässt sich die Wahrscheinlichkeit für Erfolge allgemein berechnen mittels
Diese Binomialverteilung kann durch eine Normalverteilung approximiert werden, wenn hinreichend groß und weder zu groß noch zu klein ist. Als Faustregel dafür gilt . Für den Erwartungswert und die Standardabweichung gilt dann:
Approximation der Binomialverteilung durch die Normalverteilung (3)
[Bearbeiten]- und .
Damit gilt für die Standardabweichung .
Falls diese Bedingung nicht erfüllt sein sollte, ist die Ungenauigkeit der Näherung immer noch vertretbar, wenn gilt: und zugleich .
Approximation der Binomialverteilung durch die Normalverteilung (4)
[Bearbeiten]Folgende Näherung ist dann brauchbar:
Approximation der Binomialverteilung durch die Normalverteilung (5)
[Bearbeiten]Bei der Normalverteilung wird die untere Grenze um 0,5 verkleinert und die obere Grenze um 0,5 vergrößert, um eine bessere Approximation gewährleisten zu können. Dies nennt man auch „Stetigkeitskorrektur“. Nur wenn einen sehr hohen Wert besitzt, kann auf sie verzichtet werden.
Da die Binomialverteilung diskret ist, muss auf einige Punkte geachtet werden:
Approximation der Binomialverteilung durch die Normalverteilung (6)
[Bearbeiten]- Der Unterschied zwischen oder (sowie zwischen größer und größer gleich) muss beachtet werden (was ja bei der Normalverteilung nicht der Fall ist). Deshalb muss bei die nächstkleinere natürliche Zahl gewählt werden, d. h.
- bzw. ,
- damit mit der Normalverteilung weitergerechnet werden kann.
- Zum Beispiel:
Approximation der Binomialverteilung durch die Normalverteilung (7)
[Bearbeiten]Außerdem ist
- (unbedingt mit Stetigkeitskorrektur)
und lässt sich somit durch die oben angegebene Formel berechnen.
Der große Vorteil der Approximation liegt darin, dass sehr viele Stufen einer Binomialverteilung sehr schnell und einfach bestimmt werden können.
Beziehung zur logarithmischen Normalverteilung
[Bearbeiten]Ist die Zufallsvariable normalverteilt mit , dann ist die Zufallsvariable logarithmisch-normalverteilt, also .
Die Entstehung einer logarithmischen Normalverteilung ist auf multiplikatives, die einer Normalverteilung auf additives Zusammenwirken vieler Zufallsvariablen zurückführen.
Rechnen mit der Standardnormalverteilung (1)
[Bearbeiten]Bei Aufgabenstellungen, bei denen die Wahrscheinlichkeit für --normalverteilte Zufallsvariablen durch die Standardnormalverteilung ermittelt werden soll, ist es nicht nötig, die oben angegebene Transformation jedes Mal durchzurechnen. Stattdessen wird einfach die Transformation
verwendet, um eine -verteilte Zufallsvariable zu erzeugen.
Rechnen mit der Standardnormalverteilung (2)
[Bearbeiten]Die Wahrscheinlichkeit für das Ereignis, dass z. B. im Intervall liegt, ist durch folgende Umrechnung gleich einer Wahrscheinlichkeit der Standardnormalverteilung:
.
Grundlegende Fragestellungen (1)
[Bearbeiten]Allgemein gibt die Verteilungsfunktion die Fläche unter der Glockenkurve bis zum Wert an, d. h., es wird das bestimmte Integral von bis berechnet. Dies entspricht in Aufgabenstellungen einer gesuchten Wahrscheinlichkeit, bei der die Zufallsvariable kleiner oder nicht größer als eine bestimmte Zahl ist. Wegen der Stetigkeit der Normalverteilung macht es keinen Unterschied, ob nun oder verlangt ist, weil z. B.
- und somit .
Analoges gilt für „größer“ und „nicht kleiner“.
Grundlegende Fragestellungen (2)
[Bearbeiten]Dadurch, dass nur kleiner oder größer als eine Grenze sein (oder innerhalb oder außerhalb zweier Grenzen liegen) kann, ergeben sich für Aufgaben bei Wahrscheinlichkeitsberechnungen zu Normalverteilungen zwei grundlegende Fragestellungen:
- Wie groß ist die Wahrscheinlichkeit, dass bei einem Zufallsexperiment die standardnormalverteilte Zufallsvariable höchstens den Wert annimmt?
In der Schulmathematik wird für diese Aussage gelegentlich auch die Bezeichnung linker Spitz verwendet, da die Fläche unter der Gaußkurve von links bis zur Grenze verläuft. Für sind auch negative Werte erlaubt.
Grundlegende Fragestellungen (3)
[Bearbeiten]Allerdings haben viele Tabellen der Standardnormalverteilung nur positive Einträge – wegen der Symmetrie der Kurve und der Negativitätsregel
- des „linken Spitzes“ stellt dies aber keine Einschränkung dar.
Grundlegende Fragestellungen (4)
[Bearbeiten]Wie groß ist die Wahrscheinlichkeit, dass bei einem Zufallsexperiment die standardnormalverteilte Zufallsvariable mindestens den Wert annimmt?
Hier wird gelegentlich die Bezeichnung rechter Spitz verwendet, mit
gibt es auch hier eine Negativitätsregel.
Da jede Zufallsvariable mit der allgemeinen Normalverteilung sich in die Zufallsvariable mit der Standardnormalverteilung umwandeln lässt, gelten die Fragestellungen für beide Größen gleichbedeutend.
Streubereich und Antistreubereich (1)
[Bearbeiten]Häufig ist die Wahrscheinlichkeit für einen Streubereich von Interesse, d. h. die Wahrscheinlichkeit, dass die standardnormalverteilte Zufallsvariable Werte zwischen und annimmt:
Beim Sonderfall des symmetrischen Streubereiches (, mit ) gilt:
Streubereich und Antistreubereich (2)
[Bearbeiten]Für den entsprechenden Antistreubereich ergibt sich die Wahrscheinlichkeit, dass die standardnormalverteilte Zufallsvariable Werte außerhalb des Bereichs zwischen und annimmt, zu:
Somit folgt bei einem symmetrischen Antistreubereich
Streubereiche am Beispiel der Qualitätssicherung (1)
[Bearbeiten]Besondere Bedeutung haben beide Streubereiche z. B. bei der Qualitätssicherung von technischen oder wirtschaftlichen Produktionsprozessen. Hier gibt es einzuhaltende Toleranzgrenzen und , wobei es meist einen größten noch akzeptablen Abstand vom Erwartungswert (= dem optimalen Sollwert) gibt. Die Standardabweichung kann hingegen empirisch aus dem Produktionsprozess gewonnen werden.
Wurde als einzuhaltendes Toleranzintervall angegeben, so liegt (je nach Fragestellung) ein symmetrischer Streu- oder Antistreubereich vor.
Streubereiche am Beispiel der Qualitätssicherung (2)
[Bearbeiten]Im Falle des Streubereiches gilt:
Der Antistreubereich ergibt sich dann aus
Streubereiche am Beispiel der Qualitätssicherung (3)
[Bearbeiten]Wenn kein Streubereich berechnet wurde durch
Das Ergebnis ist also die Wahrscheinlichkeit für verkaufbare Produkte, während die Wahrscheinlichkeit für Ausschuss bedeutet, wobei beides von den Vorgaben von , und abhängig ist.
Ist bekannt, dass die maximale Abweichung symmetrisch um den Erwartungswert liegt, so sind auch Fragestellungen möglich, bei denen die Wahrscheinlichkeit vorgegeben und eine der anderen Größen zu berechnen ist.
Testen auf Normalverteilung (1)
[Bearbeiten]
Die Abbildung zeigt die Quantile einer Normalverteilung und einer Chi-Quadrat-Verteilung.
Testen auf Normalverteilung (2)
[Bearbeiten]
Eine χ²-verteilte Zufallsvariable mit 5 Freiheitsgraden wird auf Normalverteilung getestet. Für jeden Stichprobenumfang werden 10.000 Stichproben simuliert und anschließend jeweils 5 Anpassungstests zu einem Niveau von 5 % durchgeführt.
Testen auf Normalverteilung (3)
[Bearbeiten]Überprüfungen auf Normalverteilungen sind möglich mittels:
- Chi-Quadrat-Test
- Kolmogorow-Smirnow-Test
- Anderson-Darling-Test (Modifikation des Kolmogorow-Smirnow-Tests)
- Lilliefors-Test (Modifikation des Kolmogorow-Smirnow-Tests)
- Cramér-von-Mises-Test
- Shapiro-Wilk-Test
- Jarque-Bera-Test
- Q-Q-Plot (deskriptive Überprüfung)
- Maximum-Likelihood-Methode (deskriptive Überprüfung)
Testen auf Normalverteilung (4)
[Bearbeiten]Die Tests haben unterschiedliche Eigenschaften hinsichtlich der Art der Abweichungen von der Normalverteilung, die sie erkennen. So erkennt der Kolmogorov-Smirnov-Test Abweichungen in der Mitte der Verteilung eher als Abweichungen an den Rändern, während der Jarque-Bera-Test ziemlich sensibel auf stark abweichende Einzelwerte an den Rändern („heavy tails“) reagiert.
Testen auf Normalverteilung (5)
[Bearbeiten]Beim Lilliefors-Test muss im Gegensatz zum Kolmogorov-Smirnov-Test nicht standardisiert werden, d. h., und der angenommenen Normalverteilung dürfen unbekannt sein.
Mit Hilfe von Quantil-Quantil-Plots (auch Normal-Quantil-Plots oder kurz Q-Q-Plots) ist eine einfache grafische Überprüfung auf Normalverteilung möglich.
Mit der Maximum-Likelihood-Methode können die Parameter und der Normalverteilung geschätzt und die empirischen Daten mit der angepassten Normalverteilung grafisch verglichen werden.
Parameterschätzung, Konfidenzintervalle und Tests (1)
[Bearbeiten]Viele der statistischen Fragestellungen, in denen die Normalverteilung vorkommt, sind gut untersucht. Wichtigster Fall ist das sog. Normalverteilungsmodell, in dem man von der Durchführung von unabhängigen und normalverteilten Versuchen ausgeht. Es existieren drei Fälle:
- der Erwartungswert ist unbekannt und die Varianz bekannt
- die Varianz ist unbekannt und der Erwartungswert ist bekannt
- Erwartungswert und Varianz sind unbekannt.
Parameterschätzung, Konfidenzintervalle und Tests (2)
[Bearbeiten]Je nachdem, welcher dieser Fälle auftritt, ergeben sich verschiedene Schätzfunktionen, Konfidenzbereiche oder Tests. Diese sind detailliert im Hauptartikel Normalverteilungsmodell zusammengefasst.
Dabei kommt den folgenden Schätzfunktionen eine besondere Bedeutung zu:
Parameterschätzung, Konfidenzintervalle und Tests (3)
[Bearbeiten]ist ein erwartungstreuer Schätzer für den unbekannten Erwartungswert sowohl für den Fall einer bekannten als auch einer unbekannten Varianz. Er ist sogar der beste erwartungstreue Schätzer, d. h. der Schätzer mit der kleinsten Varianz. Sowohl die Maximum-Likelihood-Methode als auch die Momentenmethode liefern das Stichprobenmittel als Schätzfunktion.
Parameterschätzung, Konfidenzintervalle und Tests (4)
[Bearbeiten]Die unkorrigierte Stichprobenvarianz
ist ein erwartungstreuer Schätzer für die unbekannte Varianz bei gegebenem Erwartungswert . Auch sie kann sowohl aus der Maximum-Likelihood-Methode als auch aus der Momentenmethode gewonnen werden.
Parameterschätzung, Konfidenzintervalle und Tests (5)
[Bearbeiten]Die korrigierte Stichprobenvarianz
ist ein erwartungstreuer Schätzer für die unbekannte Varianz bei unbekanntem Erwartungswert.
Erzeugung normalverteilter Zufallszahlen
[Bearbeiten]Alle folgenden Verfahren erzeugen standardnormalverteilte Zufallszahlen. Durch lineare Transformation lassen sich hieraus beliebige normalverteilte Zufallszahlen erzeugen: Ist die Zufallsvariable -verteilt, so ist schließlich -verteilt.
Box-Muller-Methode
[Bearbeiten]Nach der Box-Muller-Methode lassen sich zwei unabhängige, standardnormalverteilte Zufallsvariablen und aus zwei unabhängigen, gleichverteilten Zufallsvariablen , sogenannten Standardzufallszahlen, simulieren:
und
Polar-Methode
[Bearbeiten]Die Polar-Methode von George Marsaglia ist auf einem Computer noch schneller, da sie keine Auswertungen von trigonometrischen Funktionen benötigt:
- Erzeuge zwei voneinander unabhängige, im Intervall gleichverteilte Zufallszahlen und
- Berechne . Falls oder , gehe zurück zu Schritt 1.
- Berechne .
- für liefert zwei voneinander unabhängige, standardnormalverteilte Zufallszahlen und .
Zwölferregel (1)
[Bearbeiten]Der zentrale Grenzwertsatz besagt, dass sich unter bestimmten Voraussetzungen die Verteilung der Summe unabhängig, identisch verteilter Zufallszahlen einer Normalverteilung nähert.
Ein Spezialfall ist die Zwölferregel, die sich auf die Summe von zwölf Zufallszahlen aus einer Gleichverteilung auf dem Intervall [0,1] beschränkt und bereits zu passablen Verteilungen führt.
Zwölferregel (2)
[Bearbeiten]Allerdings ist die geforderte Unabhängigkeit der zwölf Zufallsvariablen bei den immer noch häufig verwendeten Linearen Kongruenzgeneratoren (LKG) nicht garantiert. Im Gegenteil wird vom Spektraltest für LKG meist nur die Unabhängigkeit von maximal vier bis sieben der garantiert. Für numerische Simulationen ist die Zwölferregel daher sehr bedenklich und sollte, wenn überhaupt, dann ausschließlich mit aufwändigeren, aber besseren Pseudo-Zufallsgeneratoren wie z. B. dem Mersenne-Twister (Standard in Python, GNU R) oder WELL genutzt werden. Andere, sogar leichter zu programmierende Verfahren, sind daher i. d. R. der Zwölferregel vorzuziehen.
Verwerfungsmethode
[Bearbeiten]Normalverteilungen lassen sich mit der Verwerfungsmethode (siehe dort) simulieren.
Anwendungen außerhalb der Wahrscheinlichkeitsrechnung
[Bearbeiten]Die Normalverteilung lässt sich auch zur Beschreibung nicht direkt stochastischer Sachverhalte verwenden, etwa in der Physik für das Amplitudenprofil der Gauß-Strahlen und andere Verteilungsprofile.
Zudem findet sie Verwendung in der Gabor-Transformation.
Siehe auch
[Bearbeiten]- Additives weißes gaußsches Rauschen
- Lineare Regression
- Normalverteilung
- Produktregel
- Taylorreihe
- Kurs:Funktionentheorie
Literatur
[Bearbeiten]- Stephen M. Stigler: The history of statistics: the measurement of uncertainty before 1900. Belknap Series. Harvard University Press, 1986. ISBN 9780674403413.
Weblinks
[Bearbeiten]
Wikibooks: Anschauliche Darstellung der Normalverteilung – Lern- und Lehrmaterialien
- Anschauliche Erklärung der Normalverteilung mit interaktivem Graphen
- Darstellung mit Programmcode in Visual Basic
- Online-Rechner Normalverteilung
Einzelnachweise
[Bearbeiten]- ↑ Bei handelt es sich um die Exponentialfunktion mit der Basis
- ↑ George G. Judge, R. Carter Hill, W. Griffiths, Helmut Lütkepohl, T. C. Lee: Introduction to the Theory and Practice of Econometrics. 1988, S. 47.
- ↑ George G. Judge, R. Carter Hill, W. Griffiths, Helmut Lütkepohl, T. C. Lee: Introduction to the Theory and Practice of Econometrics. 1988, S. 48.
- ↑ Peter M. Lee: The probability integral; University of York, Department of Mathematics, 2011, zuletzt abgerufen am 14. Mai 2016.
- ↑ Denis Bell: Poisson’s remarkable calculation - a method or a trick?; Elemente der Mathematik 65, 2010 (PDF; 248 kB)
Seiteninformation
[Bearbeiten]Diese Lernresource können Sie als Wiki2Reveal-Foliensatz darstellen.
Wiki2Reveal
[Bearbeiten]Dieser Wiki2Reveal Foliensatz wurde für den Lerneinheit Kurs:Stochastik' erstellt der Link für die Wiki2Reveal-Folien wurde mit dem Wiki2Reveal-Linkgenerator erstellt.
- Die Seite wurde als Dokumententyp PanDocElectron-SLIDE erstellt.
- Link zur Quelle in Wikiversity: https://de.wikiversity.org/wiki/Kurs:Stochastik/Normalverteilung
- siehe auch weitere Informationen zu Wiki2Reveal und unter Wiki2Reveal-Linkgenerator.
Wikipedia2Wikiversity
[Bearbeiten]Diese Seite wurde auf Basis der folgenden Wikipedia-Quelle erstellt: