Ad Hominem Info

Irrtümer und Trugschlüsse en gros und en detail

Benutzer-Werkzeuge

Webseiten-Werkzeuge


statistik:begriffe:mittelwerte:modus

Modus

Derjenige Wert, der in einer Stichprobe am häufigsten vorkommt. Er ist kein echter Mittelwert, da er die Daten nicht teilt, ist aber konzeptuell mit diesen verwandt und wird daher hier aufgeführt.

Der Modus is der höchste Wert einer Stichprobe

Andere Namen

  • Modalwert

Beschreibung

Als „Modus“ bezeichnet man in der Statistik den höchsten in einer Stichprobe vorkommenden Wert. Dies kann, muss aber nicht ein Mittelwert sein.

Der Modus ist meist trivial zu ermitteln und hat keine besonderen Anforderungen an das Skalenniveau der Daten. Da es noch nicht einmal nötig ist, die Werte irgendwie zu sortieren, kann er problemlos selbst aufgrund von Daten in der Nominalskala ermittelt werden.

Probleme bei der Ermittlung

So trivial es erscheint, einfach den am häufigsten vorkommenden Wert auszuwählen, so komplex kann diese Prozedur werden, wenn man mit der schnöden Realität konfrontiert ist.

Ein häufiges Problem ist ironischerweise zuviel Präzission in der Datenerhebung. Wenn z.B. die Zeitnahme von Rennläufern bis auf die Hundertstelsekunde genau durchgeführt wurde, kann es leicht passieren, dass es überhaupt keine doppelt vorkommenden Werte gibt, also dass jeder Wert genau einmal vorliegt. In diesem Fall kann kein Modus gebildet werden.

Eine ähnliche Situation hat man, wenn zwar tatsächlich doppelte Werte hat, aber davon gleich zwei oder noch mehr. Wenn diese nicht auf verstecken Variablen zurückzuführen sind (etwa das Geschlecht der Läufer – siehe dazu auch unten), macht es wenig Sinn, hier mehrere Modi anzugeben.

Die Lösung in diesem Fall wäre es, die Ergebnisse zu gruppieren und dann aus diesen Gruppen den Modus zu nehmen. Allerdings ist so eine Gruppierung immer auf die eine oder andere Weise willkürlich und kann Anlass bieten, die Analyse zurückzuweisen.

Bimodale/Multimodale Verteilung

Bimodale Verteilung von Daten

In sortierten Daten kann es auch lokale Maxima (Höchstwerte innerhalb eines Unterbereiches) geben, die dann ebenfalls als „Modi“ bezeichnet werden.

Man spricht in diesem Fall von einer „multimodalen“ Verteilung. Gibt es genau zwei solche lokalen Modi, wird auch der Begriff „bimodal“ dafür verwendet.

Hinweis: um Daten sortieren zu können, müssen diese mindestens Ordinalskalen-Niveau haben.

Bedeutung

Haben die Daten eine bi- oder multimodalen Verteilung kann dies ein Zeichen dafür sein, dass einer oder mehrere wichtige Parameter nicht berücksichtigt wurden.

Zum Beispiel könnte eine bimodale Verteilung der Zeiten bei einem Marathonlauf daher rühren, dass die Zeiten für männliche und weibliche Läufer gemeinsam betrachtet wurden.

Treten solche bi- oder multimodalen Verteilungen auf, sollte man zunächst versuchen, den zugrunde liegenden Faktor (im Beispiel: das Geschlecht der Läufer) zu finden und die entsprechenden Daten zu isolieren (z.B. durch das Erstellen von zwei Statistiken: einem für die weiblichen und einem für die männlichen Läufer).

Gelingt dies nicht, sollte diese Besonderheit zumindest dokumentiert werden, da dadurch die eventuell gebildeten Mittelwerte eine andere Bedeutung bekommen.

Siehe auch

Weitere Informationen

statistik/begriffe/mittelwerte/modus.txt · Zuletzt geändert: 2019/01/07 15:11 von Sascha