Kurs:Statistik für Anwender/Lagemaße

Aus Wikiversity

Lagemaße[Bearbeiten]

Ein Lagemaß eines Merkmals ist ein Kennwert, der in einer bestimmten Form ’typisch’ für das Merkmal ist. In diesem Abschnitt führen wir verschiedene Lagemaße ein und untersuchen ihre Eigenschaften. Dabei wollen wir auch der Frage nachgehen, in welchen Situationen die Betrachtung dieser Werte überhaupt sinnvoll ist.

Modalwert (Modus)[Bearbeiten]

Ist ein Merkmal, so heißt die Ausprägung mit der größten absoluten (bzw. relativen) Häufigkeit Modalwert (oder Modus) von . Ein Merkmal kann einen oder mehrere Modalwerte haben.

Beispiele Modalwert[Bearbeiten]

Beispiel I[Bearbeiten]

100 Angestellte der RPTU Kaiserslautern-Landau werden befragt, wie sie zur Arbeit kommen:


Der Modalwert ist hier die Merkmalsausprägung ’Bus/Bahn’.

Beispiel II[Bearbeiten]

Bei einer Gruppe von Versuchspflanzen der selben Art wird das Wachstum der Sprossachse (in cm) gemessen, man erhält folgende Urliste:

110, 124, 120, 118, 111, 124, 128, 115, 119, 122, 106, 114, 108, 117, 124, 117, 115, 109, 114, 114, 123, 112, 116

Modalwerte sind hier und .

Beispiel III[Bearbeiten]

Bei 50 Daphnien wird die Anzahl der Nachkommen erhoben. Man erhält die folgenden absoluten Häufigkeiten:


Modalwert ist hier .

Anmerkungen zum Modalwert[Bearbeiten]

Modalwerte sind schon (und insbesondere) bei Merkmalen interessant, die nach einer Nominalskala verteilt sind. Falls sehr viele Merkmalsausprägungen (im Vergleich zur Zahl der Daten) möglich sind, haben Modalwerte oft wenig Aussagekraft.

Aufgabe[Bearbeiten]

Bei einer Umfrage konnten Personen jeweils genau eine der Antwortmöglichkeiten A, B, C, D wählen.

  1. Ersetzen Sie in der folgenden Tabelle alle ’?’ durch die richtigen Zahlen.



  2. Bestimmen Sie den Modalwert.

  3. Erstellen Sie in Bezug auf die absolute Häufigkeit ein Balken- und ein Kreisdiagramm.

Median[Bearbeiten]

Ist ein mindestens nach einer Ordinalskala verteiltes Merkmal mit der geordneten Datenreihe , so definiert man den Median wie folgt:

  • Ist ungerade, so ist .
  • Ist gerade, so .
    (Manchmal bezeichnet man auch und beide als Mediane. Dies macht insbesondere Sinn, wenn ordinalskaliert ist.)


Beispiel Median[Bearbeiten]

(vergleiche Beispiele Modalwert)

  • Beispiel I: Bildung des Medians macht hier keinen Sinn
  • Beispiel II: Die geordnete Datenreihe ist:



Bei 23 Werten ist der 12.Wert der Median, also .

  • Beispiel III: Bei 50 Werten ergibt sich der Median aus dem 25. und dem 26-ten Wert, also .

Weitere Anmerkungen[Bearbeiten]

  • Es ist klar, dass der Median für nach einer Nominalskala verteilte Merkmale keinen Sinn macht.
  • Der Median besitzt (insbesondere im Vergleich zum noch folgenden arithmetischen Mittelwert) die Eigenschaft, dass er stabil gegenüber sogenannten ’Ausreißern’ ist, das heißt einzelne sehr große oder sehr kleine Beobachtungswerte haben nur geringe (oder keine) Auswirkungen auf den Median. Dies ist in vielen Situationen (aber nicht immer) ein Vorteil.

Berechnung Median in R[Bearbeiten]

  • In R: Man erstellt einen Vektor daten mit den Daten der Urliste, also z.B.


    und kann dann mit median(daten) den Median berechnen.

Arithmetischer Mittelwert[Bearbeiten]

Den wohl bekanntesten Mittelwert einer Reihe von (Beobachtungs-)Werten erhält man, indem man alle Werte addiert und dann durch die Anzahl der Werte teilt. Dies ist nur bei quantitativen Merkmalen sinnvoll. Man definiert:
Ist ein quantitatives Merkmal, so heißt


arithmetischer Mittelwert
des Merkmals . Oft ersetzt man hierbei durch und schreibt .


Der arithmetische Mittelwert kann auch wie folgt berechnet werden:

Beispiel arithmetischer Mittelwert[Bearbeiten]

(vergleiche Beispiele Modalwert)

  • Beispiel I: Bildung des arithmetischen Mittelwerts macht hier keinen Sinn
  • Beispiel II: Der arithmetische Mittelwert ist
  • Beispiel III: Der arithmetische Mittelwert ist

Linearität des Mittelwerts[Bearbeiten]

Ist ein quantitatives Merkmal und sind , so ist


ebenfalls ein quantitatives Merkmal mit derselben Skala und es gilt:

Beispiel Linearität des Mittelwerts[Bearbeiten]

Gegeben sei ein Merkmal , das Temperaturen in Grad Celsius angibt. Ein weiteres Merkmal soll nun (für dieselbe Grundgesamtheit) die entsprechenden Temperaturen in Grad Fahrenheit angeben. Damit gilt . Es ergeben sich folgende Urlisten:

Additivität des Mittelwerts[Bearbeiten]

Sind quantitative Merkmale mit derselben Grundgesamtheit, die nach derselben Skala verteilt sind. Dann ist


ebenfalls ein quantitatives Merkmal mit dieser Skala und es gilt:

Beispiel Additivität des Mittelwerts[Bearbeiten]

Gegeben sei die Grundgesamtheit , die die Werktage einer bestimmten Woche enthält. Ein Schüler bestimmt an allen Tagen, die Zeit (jeweils in Minuten), die er für die Hausaufgaben in Mathematik (Merkmal ) und in Deutsch (Merkmal ) benötigt. Das Merkmal beschreibt die Gesamtzeit für beide Fächer. Es ergibt sich:

Man berechnet:

Anmerkung zur Verknüpfung durch Multiplikation[Bearbeiten]

Im Allgemeinen gilt nicht bzw. .

Beispiel I[Bearbeiten]

quadratische Grundstücke haben die Seitenlängen (in Metern):

Man berechnet daraus .
Die Flächeninhalte der Grundstücke werden durch beschrieben, es ist:


Man berechnet daraus . Also hier:

Beispiel II[Bearbeiten]

Ein Wanderer geht an 4 Tagen jeweils eine bestimmte Zeit (in Stunden) mit konstanter Geschwindigkeit (in Kilometer pro Sunde). Daraus ergibt sich die zurückgelegte Strecke (in km):

Daraus berechnet man: Also hier:

Berechnung Arithmetischer Mittelwert in R[Bearbeiten]

In R: Man erstellt einen Vektor daten mit den Daten der Urliste und kann dann mit mean(daten) den arithmetischen Mittelwert berechnen.

Weitere Anmerkungen zum Arithmetischen Mittelwert[Bearbeiten]

  • Zur Bildung des arithmetischen Mittelwerts ist auf jeden Fall eine Intervallskala nötig. Umgekehrt ist auch nicht bei jeder Intervallskala auch die Bildung des arithmetischen Mittelwerts sinnvoll.
  • Ergänzend zum arithmetischen Mittelwert gibt es auch den gleitenden Mittelwert, welcher insbesondere bei unregelmäßigen Datenreihen Anwendung findet. Mit

    wird der -te Mittelwert über Daten erhoben. Auf diese Art können die Daten "geglättet" werden.

.

Seiteninformation[Bearbeiten]

Diese Lernresource können Sie als Wiki2Reveal-Foliensatz darstellen.

Wiki2Reveal[Bearbeiten]

Dieser Wiki2Reveal Foliensatz wurde für den Lerneinheit Kurs:Statistik für Anwender' erstellt der Link für die Wiki2Reveal-Folien wurde mit dem Wiki2Reveal-Linkgenerator erstellt.