Kurs:Statistik für Anwender/Varianzanalyse

Aus Wikiversity

Varianzanalyse[Bearbeiten]

Einfaktorielle Varianzanalyse[Bearbeiten]

Situation und Hypothesenpaar[Bearbeiten]

Situation: Gegeben sind normalverteilte ZV deren Standardabweichungen (bzw. Varianzen) gleich sind.

Hypothesenpaar:


Äquivalent dazu (unter obigen Voraussetzungen):



Benötigte Daten[Bearbeiten]

unabhängige Stichproben

Mittelwerte[Bearbeiten]

Man berechnet aus den Stichproben:

  • die Gruppenmittelwerte (’mean of groups’):
  • den Gesamtmittelwert (’grand mean’):

Beachte: Es gilt:

Streumaße I[Bearbeiten]

  • Die Summe der quadratischen Abweichungen aller Stichprobenwerte vom Gesamtmittelwert bezeichnet man mit:
  • Weiterhin bezeichnet man die Summe der quadratischen Abweichungen aller Stichprobenmittelwerte vom Gesamtmittelwert mit:


    SST ist ein Maß für die Unterschiede zwischen den verschiedenen Stichproben.

Streumaße II[Bearbeiten]

  • Schließlich bezeichnet man die Summe der quadratischen Abweichungen aller Stichprobenwerte vom jeweiligen Stichprobenmittelwerte mit:
    SSE ist ein Maß für die Unterschiede innerhalb der einzelnen Stichproben.
    Man beachte, dass gilt:

Streumaße III[Bearbeiten]

Man teilt nun SST und SSE durch die Zahl der jeweiligen Freiheitsgrade (falls gilt, sind und jeweils -verteilt mit bzw. FG) und erhält die sogenannten ’mittleren quadratischen Abweichungen’

Teststatistik[Bearbeiten]

Aus SST und SSE berechnet man nun die Teststatistik wie folgt:


Idee: MSE stellt eine Schätzung für die Streuung innerhalb der einzelnen Stichproben dar. Im Gegensatz dazu schätzt MST die Streuung der verschiedenen Stichprobenmittelwerte um den Gesamtmittelwert. Nimmt man an, dass gilt, sollte MST (im Vergleich zu MSE) klein sein, folglich ist eine Teststatistik, bei der man eher kleine Werte erwartet, falls gilt.

p-Wert[Bearbeiten]

Zur Berechung wird die F-Verteilung (bzw. Fisher-Verteilung) mit den ’Freiheitsgraden’ und benötigt. Es gilt:
(Dies geht in R mit .)

Durchführung in R[Bearbeiten]

Einlesen der Stichproben in einen gemeinsamen Vektor x zusammen mit einem Faktor g (gleicher Länge), der angibt, zu welcher Größe die jeweiligen Komponenten von x gehören. Dann:

Beispiel 1.1[Bearbeiten]

Verschiedene Drahtsorten () werden auf Zugfestigkeit untersucht. Dabei soll zu geprüft werden, ob die verschiedenen Drahtsorten (oder einige der Sorten) im erwarteten Mittel unterschiedliche Zugfestigkeiten aufweisen. Dazu nimmt man an, dass die ZV , die die Zugfestigkeiten der verschiedenen Sorten beschreiben, normalverteilt mit gleicher Varianz sind und formuliert die Nullhypothese:

Beispiel 1.2[Bearbeiten]

Man erhält folgende Daten (in ):


Daraus berechnet sich:
und


Folglich zeigen die Daten keine siginifikanten Unterschiede zwischen den Zugfestigkeiten der verschiedenen Drahtsorten. Die Nullhypothese ist mit den Daten vereinbar.

Beispiel 1.3[Bearbeiten]

Man kann obige Rechnungen auch in R durchführen lassen. Dies geht etwa mit

Anmerkungen I[Bearbeiten]

  • Die oben genannten Voraussetzungen für die Varianzanalyse mit dem F-Test können (und sollten) mit Hilfe von Vortests empirisch geprüft werden. Die Normalverteilungsannahme kann mit Shapiro-Wilks-Tests für jede der ZV getestet werden. Die Annahme der Varianzgleichheit kann man dann mit einem sogenannten Bartlett-Test prüfen. Liefert einer der Vortests ein signifikantes Ergebnis (bzw. einen kleinen -Wert), so kann der F-Test nicht verwendet werden. Man muss dann auf andere Testverfahren zurückgreifen. Beispielsweise kann dann der Test von Kruskal und Wallis verwendet werden.

Anmerkungen II[Bearbeiten]

  • Falls die Varianzanalyse ein signifikantes Ergebnis liefert, wird dadurch lediglich angezeigt, dass nicht alle gleich sind. Zur Klärung der Frage,welche der signifikant als verschieden angesehen werden können, stehen weitere Testverfahren zur Verfügung, bespielsweise der Scheffé-Test oder der Tukey-Test.

Aufgabe 1.1[Bearbeiten]

In einer Studie soll untersucht werden, wie sich die Wildschweinpopulationsdichte auf den Traubenertrag im Weinbau auswirkt. Für die Studie wurden 3 Gebiete identifiziert, in denen Weinbau betrieben wird, die jedoch unterschiedliche Populationsdichten an Wildschweinen aufweißen. In jedem Gebiet befinden sich unterschiedlich viele Versuchsflächen, die jeweils gleich bewirtschaftet werden. Bei jeder Testfläche wurde am Ende der Traubensaison der Ertrag an Trauben in Tonnen pro Hektar ermittelt. Es ergeben sich folgende Daten:

Aufgabe 1.2[Bearbeiten]

  • Worauf sollte bei der Auswahl der Testgebiete geachtet werden? (Stichwort Randeffekte)
  • Überprüfen Sie mit dem Shapiro-Wilks- und dem Bartlett-Test (in R - keine Rechnung notwendig), ob die Voraussetzungen für die Einfaktorielle Varianzanalyse gegeben sind.

Der Tukey-Test (bzw. die Tukey-Methode)[Bearbeiten]

Situation, Signifikanzniveau und Nullhypothese[Bearbeiten]

Situation: Gegeben sind normalverteilte ZV deren Standardabweichungen (bzw. Varianzen) gleich sind.

Signifikanzniveau: Es muss ein Signifikanzniveau festgelegt werden.

Nullhypothesen: für mit
Alle diese Nullhypothesen werden gemeinsam getestet. Das bedeutet: Falls alle wahr sind, erhält man höchstens mit Wahrscheinlichkeit mindestens ein signifikantes Ergebnis.

Benötigte Daten und Teststatistik[Bearbeiten]

benötigte Daten: unabhängige Stichproben gleicher Länge


Die Gesamtlänge ergibt sich dann offenbar als .

Teststatistik: Man berechnet zunächst paarweise die (betragsmäßigen) Differenzen der empirischen Mittelwerte, also
und die mittlere quadratische Abweichung der Fehler
Daraus berechnen sich die Teststatistiken als


Offenbar sprechen hohe Werte dieser Statistik gegen .

p-Werte[Bearbeiten]

-Werte: Zur Berechung wird die studentisierte Spannweite mit den ’Freiheitsgraden’ und benötigt. Zur Nullhypothese ist der -Wert gegeben durch:

(Dies geht in R mit ptukey(x,m,n-m).)

Für die Paare , deren -Wert kleiner oder gleich sind, kann also die entsprechende Nullhypothese verworfen werden. Man hat dann ein oder mehrere signifikante Ergebnisse zum gemeinsamen Niveau , d.h. es wurde berücksichtigt, dass man mehrere Nullhypothesen getestet hat.

Durchführung in R[Bearbeiten]

Einlesen der Stichproben in einen gemeinsamen Vektor x zusammen mit einem Faktor g (gleicher Länge), der angibt, zu welcher Größe die jeweiligen Komponenten von x gehören. Dann:

Zur Ausgabe gehören neben den -Werten der einzelnen Nullhypothesen auch Konfidenzintervalle zum (gemeinsamen) Niveau für die Differenzen der wahren Erwartungswerte . Diese Intervalle lassen sich mit auch graphisch darstellen.

Das bedeutet, dass (falls alle gelten) die Wahrscheinlichkeit, dass alle berechneten Konfidenzintervalle die entsprechende wahre Erwartungswertdifferenz enthalten, mindestens ist.

Variante[Bearbeiten]

Für unterschiedliche Stichprobenlänge von berechnet man die Teststatistiken wie folgt (Tukey-Kramer-Methode):

Beispiel 1.1[Bearbeiten]

Wir betrachten die folgenden Stichproben () zum Signifikantsniveau .

Man berechnet und . Damit ergibt sich der -Wert einer Varianzanalyse mit einem -Tests zur Nullhypothese als . Man kann also davon ausgehen, dass sich Erwartungswerte einiger der Größen unterscheiden.

Beispiel 1.2[Bearbeiten]

Man möcht nun genauer wissen, welche der Erwartungswerte sich im einzelnen unterscheiden. Dazu führt man einen Tukey-Test durch. Insgesamt werden dabei 10 Vergleiche durchgeführt:


Damit wird also signifikant angezeigt, dass sich die Großen und und auch die Großen und hinsichtlich ihrer Erwartungswerte unterscheiden.

Beispiel 1.3[Bearbeiten]

Legt man ein Signifikanzniveau fest, so kann man mit TukeyHSD eine Graphik erzeugen, die Konfidenzintervalle zum gemeinsamen Niveau zeigt:

image

Aufgabe[Bearbeiten]

Nehmen Sie nun an, dass Sie in der vorherigen Aufgabe ein Signifikantes Ergebnis erhalten hätten. Berechnen Sie nun mithilfe der Tukey-Methode, zwischen welchen Gruppen signifikante Unterschiede existieren.

Zweifaktorielle Varianzanalyse[Bearbeiten]

Es soll untersucht werden, ob eine ZV (Zielvariable) durch zwei vorliegende Faktoren und beeinflusst wird. Die Faktoren und nehmen dabei nur endlich viele Werte (bzw. Ausprägungen) an ( Möglichkeiten für und Möglichkeiten für ).

Betrachtung als Zufallsvariablen[Bearbeiten]

Man unterscheidet nun ZV


wobei die Größe für die -te Ausprägung von und die -te Ausprägung von ist .

Voraussetzung und Nullhypothese[Bearbeiten]

Vorausgesetzt für den folgenden Test wird, dass alle normalverteilt mit gleicher Varianz sind.
Man untersucht dabei die Nullhypothesen




Stichproben[Bearbeiten]

Zu jeder der vielen Größen benötigt man nun eine Stichprobe


(Wir gehen der Einfachheit halber davon aus, dass alle Stichproben die gleiche Länge haben. Für ungleiche Stichprobenlängen wird es nochmals erheblich komplizierter.)

Zu berechnende Werte und Parameter I[Bearbeiten]

Daraus berechnet man nun die folgenden Mittelwerte und Stichprobenlängen:

  • Einzelne Stichprobe ( fest):

Zu berechnende Werte und Parameter II[Bearbeiten]

  • Mit festem Wert für zusammengefasste Stichprobe ( fest):

Zu berechnende Werte und Parameter III[Bearbeiten]

  • Mit festem Wert für zusammengefasste Stichprobe ( fest):

Zu berechnende Werte und Parameter IV[Bearbeiten]

  • Gesamte Stichprobe:

Quadratsummenzerlegung I[Bearbeiten]

Es gilt die folgende Quadratsummenzerlegung:

Quadratsummenzerlegung II[Bearbeiten]

Dabei ist:

Teststatistik[Bearbeiten]

Zu den oben angegebenen Nullhypothesen berechnet man nun Teststatistik und -Wert wie folgt:

Durchführung in R[Bearbeiten]

Man kann diese auch mit R durchführen. Man trägt dazu in einen Vektor x die Daten ein und in zwei Faktoren a und b (beide haben die gleiche Länge wie x) die Information, zu welcher Ausprägung von bzw. die Daten gehören. Dann erhält man mit:


die benötigten Werte (Freiheitsgrade, Quadratsummen, mittlere Quadratsummen, Teststatistiken, -Werte).

Beispiel 1.1[Bearbeiten]

Gegeben seien die Faktoren und mit den Ausprägungen und , dem Signifikanzniveau und der folgenden Stichprobe:

Beispiel 1.2[Bearbeiten]

Es ergibt sich:


Somit kann die Nullhypothese, dass unabhängig von ist, verworfen werden.
Weiterhin ergibt sich:


Somit kann auch diese Nullhypothese, dass unabhängig von ist, verworfen werden.
Weiterhin ergibt sich:

Die Nullhypothese, dass es keine Wechselwirkung zwischen und im Hinblick auf gibt, kann nicht wiederlegt werden, somit ist es anzunehmen, dass es keine Wechselwirkung gibt.

Seiteninformation[Bearbeiten]

Diese Lernresource können Sie als Wiki2Reveal-Foliensatz darstellen.

Wiki2Reveal[Bearbeiten]

Dieser Wiki2Reveal Foliensatz wurde für den Lerneinheit Kurs:Statistik für Anwender' erstellt der Link für die Wiki2Reveal-Folien wurde mit dem Wiki2Reveal-Linkgenerator erstellt.