Die deskriptive, also beschreibende, Statistik ist eigentlich der erste Schritt, die Grundlage, für alle weiteren statistischen und/oder mathematischen Schritte. Sie – die deskriptive Statistik – macht nämlich folgendes:
Sie sammelt (empirische, heisst: erhobene) Daten, ordnet diese, führt sie zusammen, verdichtet sie und stellt sie so dar, dass ihr Inhalt leichter erfassbar ist – dazu nutzt sie Tabellen, Grafiken/Diagramme, Kennzahlen bzw. Parameter oder andere, ähnliche Tools (ich überlege grade: so viel anderes als die drei genannten gibt’s gar nicht).
Folgendes ist wichtig: Ob die Daten, die von der deskriptiven Statistik zusammengefasst werden, relevant und sinnvoll sind, steht gar nicht zur Diskussion. Es können auch vollkommen sinnlose Daten verdichtet werden. Wenn diese sinnlosen Daten dann ausgewertet werden, in der -> explorativen Statistik) dann kommt es zu den krudesten Aussagen, die auf den ersten Blick logisch erscheinen, in Wahrheit aber vollkommener Bullshit sind. Mehr dazu im Beitrag: -> Lügen mit Statistik.
Die Tools der deskriptiven Statistik
Die drei Tools oder Anwendungen, derer sich die deskriptive Statistik bedient sind folgende:
Tabellen
Eine Tabelle besteht IMMER aus einer Matrix mit Zeilen und Spalten (mindestens von jedem eine, sonst ist es keine Tabelle). Normalerweise wird auf der Zeile die Beobachtung eingetragen und in der Spalte die Variablen, also zum Beispiel die Anzahl. Die Tabelle ist der erste Schritt nach der reinen Datenerfassung, mit einer Tabelle bringt man Daten in eine – wie auch immer geartete – Beziehung zueinander. Der Nachteil: Schon bei relativ wenig Werten wird eine Tabelle unglaublich komplex und unübersichtlich.
Grafiken / Diagramme
Um die Unübersichtlichkeit von Tabellen etwas zu mildern, greift man auf Grafiken oder eben Diagramme zurück (Der Unterschied? Eine Grafik bildet Zusammenhänge oder Aussagen mit zeichnerischen Methoden ab, ein Diagramm ist die optische Aufbereitung von Zahlen oder Vorgängen, macht also im weitesten Sinne Entwicklungen sichtbar).
Ob das nun Balken-, Säulen-, Linien-, Streu- oder andere Diagramme sind, welche Darstellungsform für eine Grafik gewählt wird, ist erst Mal zweitrangig und abhängig davon, was und wie man etwas darstellen möchte und welche Aussage gewünscht wird (auch hier sei auf -> Lügen mit Statistik verwiesen).
Kennzahlen und Parameter
Diese beiden Begriffe bedeuten, dass mehrere Daten oder Aspekte in eine Beziehung oder ein Verhältnis zueinander gesetzt werden. Die Folge: Aus einer Vielzahl von Zahlen und Daten entsteht eine einzige Zahl oder ein einzelner Wert. Das Verfahren nennt man übrigens: aggregieren.
Je höher der Aggregationsgrad (also die Verdichtung) einzelner Werte, desto niedriger wird deren Informationsgehalt.
((Kasten oder ähnliches))
Grundsätzlich gilt: Mit jedem Verdichtungsschritt, den man an Daten vornimmt, steigt deren Übersichtlichkeit, im gleichen Mass nimmt aber der Informationsgehalt ab.
Tabelle | Diagramm | Parameter | |
Aggregationsgrad | Sehr niedrig | Mittel | Hoch |
Übersichtlichkeit | Niedrig | Mittel | Hoch |
Informationsgehalt | Hoch | Mittel | Niedrig |
Volià: eine Tabelle.