Ad Hominem Info

Irrtümer und Trugschlüsse en gros und en detail

Benutzer-Werkzeuge

Webseiten-Werkzeuge


statistik:begriffe:quantile

Quantile

Bezeichnet eine Reihe von Maßzahlen, durch welche eine Folge von Daten in einem bestimmten Verhältnis geteilt werden.

Das bekannteste und am häufigsten benutzte Quantil ist der Median, der die Daten in zwei gleich große Gruppen teilt.

Der Begriff „Quantil“ selbst wird selten gebraucht und dient v.a. der Zusammenfassung der verschiedenen Aufteilungen, die jeweils eigene Namen haben:

Gebräuchliche Maße

Perzentile

Die Perzentile teilen die Daten in 100 Teile, auf die man sich dann nach ihrer Nummerierung beziehen kann – so entspricht etwa das 42. Perzentil dem Wert, der größer oder gleich 42 % der Daten ist und kleiner oder gleich 58 %.

Perzentile werden gewöhnlich mit einem P gefolgt von der tief gestellten Prozentzahl bezeichnet (z.B. P12 oder P34)

Dezile

Die Dezile (von Lat. decem = zehn) teilen die Daten in 10 Teile auf, dabei entspricht das erste Dezil dem 10. Perzentil und das neunte dem 90.

Quartile

Die Quartile teilen die Daten in 4 gleich große Gruppen. Dabei entspricht das erste Quartil dem 25. Perzentil und das dritte Quartil dem 75. Perzentil. Das zweite Quartil wird selten gebraucht, da dies genau dem Median entspricht (s.u.).

Median

Der Median ist der Wert, der die Daten in zwei gleich große Teilmengen teilt. Er entspricht dem 50. Perzentil und dem zweiten Quartil.

Er hat eine besondere Bedeutung als Mittelwert, weswegen ihm dort ein eigener Artikel gewidmet ist (→ Median).

Quintile

Seltener in Gebrauch sind Quintile, welche die Daten in fünf gleiche Teile untergliedern (je 20 % der Daten)

Terzile

Noch seltener findet man Terzile, welche drei Gruppen mit jeweils 33,3̅ % der Daten bilden.

Quantile

Gelegentlich benutzt man auch direkt die Bezeichnung Quantil zusammen mit einer Komma­zahl, welche den Teiler bezeichnet (z.B. das „0,34-Quantil“). In dieser Schreib­weise bezeichnen z.B. das 12. Perzentil (P12) und das 0,12-Quantil (Q 0,12) beide die gleiche Unterteilung.

Möglicherweise wegen der häufig an­zu­treffenden amerikanische Nummern­schreib­weise mit Dezimalpunkt und ohne voran­gestellte Null (z.B. als „Q.12“) werden die Begriffe Quantil und Perzentil auch gelegent­lich für Syno­nyme gehalten.

Tatsächlich sind Quantile in diesem Format flexibler anzuwenden als Perzentile. Sinnvoll sind sie allerdings nur, wenn man Teil­mengen bezeichnen muss, die klein­teiliger sind, als es eine Darstellung mit Perzentilen erlauben würde. Dies dürfte eher selten der Fall sein.

Berechnung

Je kleinteiliger die Quantile sind und je weniger Datenpunkte zur Verfügung stehen, desto schwieriger wird es, einen sinnvollen Wert zu bestimmen. Schon beim Median hat man bei einer geraden Anzahl von Werten das Problem, dass sich der korrekte Median irgendwo zwischen den beiden befindet (übliche­rweise nimmt man das arithmetische Mittel aus den beiden Werten, auch wenn dies streng mathematisch eigentlich nicht möglich wäre).

Bei Perzentilen (mit 100 Unterteilungen) kann es leicht passieren, dass nicht genügend Datenpunkte vorliegen, um zwischen zwei aufeinanderfolgenden Werten zu unterscheiden (z.B. wenn sowohl das 42. als auch das 43. Perzentil zwischen den selben zwei Datenpunkten zu finden wären).

Aber auch schon bei Terzilen kann dies problematisch sein. Hat man z.B. genau 5 Daten­punkte, ist es praktisch unmöglich, diese gleichmäßig auf die drei Bereiche aufzuteilen. Das gleiche gilt auch für andere Quantile – prinzipiell umso stärker, je klein­teiliger die Auf­teilung ist.

Da es außer beim Median keine allgemein anerkannte Vorgehensweise gibt, kann man, wenn dieses Problem auftritt, nur eine pragmatische Lösung suchen, die dann natürlich sauber dokumentiert werden muss.

Siehe auch

Weitere Informationen

statistik/begriffe/quantile.txt · Zuletzt geändert: 2019/09/03 20:59 von Sascha