Ich behaupte jetzt schlicht mal folgendes: in ¾ der Fälle ist auch nach einer Erklärung nicht klar, was „repräsentativ“ eigentlich bedeutet. Der Begriff ist deshalb so schwierig zu fassen, weil in unserem allgemeinen Sprachgebrauch „repräsentativ“ positiv besetzt ist – wenn wir 100 Personen nach einem entsprechenden Synonym fragen würden, würden schätzungsweise 80 mit „wahr“ antworten, oder mit „richtig“ oder etwas ähnlichem. Repräsentativität hat aber mit Richtigkeit und Wahrheit absolut nichts zu tun. Gar nichts. Nicht die Bohne.
Mit Repräsentativität bezeichnen wir eine Eigenschaft einer bestimmten (relativ kleinen) Datenmenge, die es ermöglicht, Rückschlüsse auf eine viel grössere Menge an Daten zu ziehen. Damit dies der Fall ist, muss die kleine Datenmenge bei den Kriterien, die uns interessieren, möglichst exakt der grossen Datenmenge entsprechen. Meistens sprechen wir diesbezüglich von einer „verkleinerte Abbildung der Grundgesamtheit“.
Anmerkung: Alleine schon aus dieser Definition wird klar, dass eine Stichprobe (denn genau das ist eine „kleine Datenmenge“, die einer Grundgesamtheit (das ist die „grosse Datenmenge“) entsprechen soll möglichst genau definiert und bestimmt werden muss. Folglich ist sie das genaue Gegenteil einer Zufalls-Stichprobe.
Um eine Repräsentativität zu gewährleisten, ist es erstmal vollkommen egal, wie gross diese „kleine Datenmenge“ im Vergleich zur „grossen Datenmenge ist“ – man kann auch vom Kleinsten aufs Grösste schliessen, wenn das Kleinste dem Grössten entspricht. Nur ist das Ergebnis dann halt wahrscheinlich nicht so genau. Aber trotzdem repräsentativ. Klingt kompliziert? Ist es auch – darum vor allen Berechnungen erst mal ein Beispiel. Ein blödes Beispiel, aber eines, das die Problematik rund um den Begriff „Repräsentativität“ aufzeigt.
Wir treffen – der Einfachheit halber – folgende Annahmen:
- a) Die Grundgesamtheit („grosse Datenmenge“) bestehe aus 50% Männern und 50% Frauen und die Anzahl betrage 100.000 Menschen, mehr Kriterien interessieren uns vorerst mal nicht.
- b) Wir wollen herausfinden: „Würden Sie diesen neuen Staubsauber xy zum Preis von CHF xyz kaufen? (eher) Ja oder (eher) nein?
So. Wie gross muss nun theoretisch die „kleine Datenmenge“ sein, um der Zusammesetzung der grossen Datenmenge zu entsprechen? Genau! 2! Einen Mann und eine Frau. Es ist jedem klar, dass mit dieser kleinen Datenmenge kein taugliches Resultat bei der Befragung entstehen kann. ABER: dennoch ist diese Datenmenge repräsentativ, weil sie eben die Forderung erfüllt, in relevanten Bereichen ein verkleinertes Abbild der Grundgesamtheit zu sein. Die Befragung von diesen beiden Menschen der Stichprobe lässt also Rückschlüsse auf die Grundgesamtheit zu – aber leider nur unglaublich ungenaue und damit wertlose. Das ändert aber an der Theorie nichts.