Zufallsauswahl, geschichtete

Die geschichtete Zufallsauswahl – oder Zufallsstichprobe – ist eine taugliche Methode, eine Grundgesamtheit zu befragen, wenn diese nach bestimmten, relevanten Kriterien unterteilt werden kann – wenn sie also geschichtet (oder geclustert) werden kann.

Man nennt die geschichtete Zufallsauswahl auch gerne mal geclusterte Zufallsauswahl oder stratifizerte Zufallsauswahl (oder jeweils Zufallsstichprobe). Stratifiziert deshalb, weil „stratifizieren“ nichts anderes heisst als „in Schichten einordnen“ (Wortstamm: stratum (lat.) = die Decke und facere (lat.) = machen). Stratifikation als Begriff kennt man auch in der Botanik, der Geologie und der Archäologie – und immer geht es um Schichten.

In der geschichteten Zufallsauswahl geht man nun so vor, dass man zuerst den Stichprobenumfang (n) pro Schicht vorgibt und danach innerhalb dieser Schicht eine einfache Zufallsauswahl trifft. Der Nutzen: die Varianz der Zufallsauswahl wird kleiner.

Schwierigkeiten bei der geschichteten Zufallsauswahl

DasHauptproblem ist die Festlegung der Anzahl Schichten und die Abgrenzung der Schichten gegeneinander. Auf der einen Seite will man möglichst wenig Schichten (sonst wird die Stichprobe irgendwann zu gross). Die Schichtung und die Abgrenzung haben ja das Ziel, die Schätzung genauer zu machen – in vielen Fällen braucht es dazu aber mehr Informationen (zum Beispiel Sekundärdaten) oder aber vorgängige, abklärende Untersuchungen oder Befragungen (zum Beispiel eine Split-Befragung).

Geschichtete Zufallsauswahl vs. Quotenstichprobe

Die beiden Methoden dürfen nicht miteinander verwechselt werden – werden sie aber dennoch häufig. Auch in Lehrbüchern. Was natürlich schlecht ist. Sehr schlecht sogar. Falsch!

Also: Bei einer Quotenstichprobe wird nach bestimmten Merkmalen so lange aus einer Grundgesamtheit gezogen, bis eine Quote erreicht ist. Bei einer geschichteten Auswahl werden die Merkmale und die Anteile der Ziehungen im Voraus festgelegt und dann erfolgt eine Zufallsauwahl. Die Quotenstichprobe hat somit keine Ziehungswahrscheinlichkeit für die Quotenmerkmale, die geschichtete Zufallsauwahl aber schon. Sprich: Ein grundlegender Unterschied!

Sinnvolle Schichtstärken kann man berechnen – ist aber komplex. Ähnlich wie man sinnvolle Klassenbreiten berechnen kann (das ist allerdings einfacher).