Der Median! Einer dieser Werte in der Statistik, den jeder kennt und den jeder ziemlich einfach und meistens auch richtig bestimmen kann. Aber mehr meistens auch nicht, dabei steckt hinter dem Median mehr als nur grade „der Wert, der in der Mitte liegt“. Aber dazu kommen wir gleich. Median und Zentralwert sind übrigens Synonyme und bedeuten exakt das Gleiche. Zusammen mit dem arithmetischen Mittel und dem Modus bildet der Median quasi die Dreifaltigkeit der Lagemaße oder Lagewerte. Ausserdem ist der Median ein spezielles Quantil, nämich das ½-Quantil. Schadet auch nichts, das zu wissen.
Erläuterung
Zuerst einfach: der Median (aus dem lateinischen: medius = Zentrum) teilt einen Datensatz, eine Stichprobe oder eine Verteilung in zwei gleich große Teile: links stehen die kleineren Werte, rechts die größeren – dazwischen, in der Mitte eben, liegt (daher: Lagewert) der Median. Damit das funktioniert, muss man die Liste allerdings ein wenig aufbereiten, und zwar, in dem man sie aufsteigend sortiert. Eine der Stärken des Medians ist, dass er auch für ordinal skalierte Variablen eingesetzt werden kann (zum Beispiel für Notenstufen) und auch bei intervall- und verhältnisskalierten Daten kann man den Median einsetzen. Für Nominalskalen kann ein Median natürlich NICHT eingesetzt werden, wie wollen Sie auch Geschlecht, Haarfarbe, Kantone oder Tiere in eine „aufsteigende“ Reihenfolge bringen!
Hinweis: Schulnoten sind Ordinalzahlen. Das heißt, sie haben zwar eine Reihenfolge (die 2 ist schlechter als die 3, die schlechter als die 4 usw.), allerdings sind die Abstände nicht regelmässig verteilt (die Note 6 wird zum Beispiel erreicht, wenn 95% – 100% der Aufgabe richtig erfüllt sind, eine 5 dagegen, wenn 80%-94% richtig sind – nur mal als Beispiel). Darum kann man mit Orinialzahlen auch nicht „normal rechnen“: zwei 3er geben noch lange keinen 6er und wenn ich von einem 5er einen 1er abziehe, erhalte ich keinen 4er. Wenn man Zahlen allerdings nicht addieren oder subtrahieren kann, dann kann man – großer Tusch! – damit auch kein arithmetisches Mittel berechnen. Denn dafür muss man addieren!. Fakt: Aus Schulnoten darf aus statistischer Sicht kein arithmetisches Mittel gebildet werden. Grund: Noten sind Ordinalzahlen.
Weshalb eigentlich der Median?
Eine aufsteigene Reihe von Daten zu halbieren ist ja jetzt keine wahnsinnige Leistung. Da stellt sich natürlich die Frage, wozu man das eigentlich benötigt und was der Sinn eines Medians ist. Und wo seine Stärken und Schwächen liegen. Eine der Stärken des Medians ist seine „Robustheit“ (das nennt sich tatsächlich in der Statistik so) gegenüber so genannten Ausreißern, sprich Extremwerten. Nehmen wir als Beispiel 7 Werte. Zugegeben, das ist eine sehr kleine Liste.
4,6,9,0,5,6,3
Hübsch aufgereiht:
0,3,4,5,6,6,9
Der Median ist 5. Klar. Liegt ja in der Mitte
Wenn jetzt ein Ausreißer hinzukommt, sagen wir statt einer 6 taucht eine 120 auf, dann bleibt der Median stur bei 5 stehen.
0,3,4,5,6,9,120
Würde man hier das arithmetische Mittel ausrechnen, so sieht man, dass dieses viel weniger „robust“ ist gegenüber einem einzelnen Wert der aus der Reihe tanzt. Im ersten Fall kommen wir auf ein arithmetisches Mittel von x(quer) = 4,7, im zweiten Fall auf x(quer) = 21.
Wozu das wichtig ist? Zum Beispiel dann, wenn wir Einkommen berechnen. Ein stinkreicher Oligarch könnte das Ergebnis ziemlich verfälschen, wenn wir das arithmetische Mittel anwenden: Plötzlich liegt das durchschnittliche Gehalt über dem faktischen Gehalt von 6 von 7 „Testpersonen“. DAFÜR ist der Median da, damit sowas nicht passiert!
Darüber hinaus können wir den Median auch in der Wahrscheinlichkeitstheorie nutzen, hier stellt er eine gute Alternative zum Erwartungswert für die Angabe eines mittleren Wertes dar.
Besonderheiten
Gerade Anzahl von Daten
Der Klassiker: Die Datenmenge ist hübsch sortiert und wir stellen fest: Mist! Eine gerade Anzahl von Werten. Was nun? In diesem Fall nehmen wir die beiden Werte links und rechts der „Mitte“ (die es ja nicht gibt) und bilden daraus das arithmetische Mittel. Das ist dann der Median.
0,2,4,5,6,6
Die Werte 4 und 5 liegen links und rechts der Mitte, daraus also das arithmetische Mittel bilden -> Ergebnis x(quer) = 4,5 und voilà: 4,5 ist der Median dieser Liste.
Gruppierte Daten
Der Median wird sehr oft bei Statistiken eingesetzt, bei denen nicht alle (oder fast keine) Daten genau und explizit gegeben sind. Das ist zum Beispiel bei Umfragen der Fall, bei denen nach Intervallen gruppiert wird und entsprechend Klassen gebildet werden, also zum Beispiel: „Wie viel verdienen Sie?“
a) 0 bis 2500 CHF/Monat -> 150 Antworten (= Gruppengröße oder Klassengrösse)
b) mehr als 2500 bis 5000 CHF/Monat -> 250 Antworten
c) mehr als 5000 bis 7500 CHF/Monat -> 340 Antworten
d) mehr als 7500 bis 10000 CHF/Monat -> 100 Antworten
Wir berechnen als erstes, wo der Median liegt. Also quasi wo die Mitte der Antworten ist. Kleine Sache:
(150 + 250 +340 + 100)/2 = 420
Die Antwort liegt also „an der 420sten Stelle“, in unserem Fall also in Klasse c (Klasse a und b zusammen haben 400 Antworten).
Wir können den Median nun schätzen (mit einer Berechnung, es bleibt aber eine Schätzung):
X(med) = 5000 + ((420-400/340) x (7500-5000)) = 5125
Da wir nicht wissen, wie innerhalb der Klassen die Werte verteilt sind, ist das eine Schätzung. Im Prinzip könnte der Median jeden anderen Wert innerhalb der 3. Klasse annehmen. Unser Beispiel von 5125 kann also 125 zu gross oder aber 2375 zu klein sein.
Der Median ist also ein sehr sinnvolles Tool, um Mittelwerte zu bestimmen, ohne sich von Ausreissern blenden zu lassen.