Kategoriale Variable

Kategoriale Variable Definition

Eine kategoriale Variable hat nur eine begrenzte Anzahl von Kategorien als Ausprägung.

Beispiele

Die in einem Laden zulässige Zahlungsmethode mit den Ausprägungen 1) Bar, 2) auf Rechnung, 3) EC-Karte und 4) Kreditkarte wäre eine kategoriale Variable mit 4 Kategorien.

Augenfarbe.

Geschlecht.

Ja, Nein oder Vielleicht (bei Befragungen).

Nominalskalierte und ordinalskalierte Variablen

Kategoriale Variablen umfassen nominalskalierte Variablen (wie in den Beispielen oben), aber auch ordinalskalierte Variablen, die eine Rangfolge abbilden (zum Beispiel die Plätze 1 bis 3 – oder Gold bis Bronze – bei Sportwettkämpfen oder die Kundenzufriedenheit auf einer Skala von "sehr gut" bis "sehr schlecht").

Der Begriff kategoriale Variable wird auch verwendet, um von stetigen / metrischen Variablen mit vielen Ausprägungen (zum Beispiel Wartezeit bei einer Hotline in Sekunden) abzugrenzen.

Teilweise werden auch metrische Variablen mit wenigen Ausprägungen in den Begriff einbezogen (aber eher nicht).

Ebenso metrische Variablen, die in Kategorien eingeteilt werden (Beispiel: die drei Kategorien niedriges, mittleres und hohes Einkommen, hinter denen jeweils viele ganz unterschiedliche Einkommen stehen).

Darstellung

Absolute Häufigkeiten (Beispiel: Anzahl der Barzahlungen) bzw. relative Häufigkeiten (Beispiel: Prozentualer Anteil der Barzahlungen an allen Zahlungsmethoden) für kategoriale Variablen lassen sich gut mit Balkendiagrammen bzw. Kreisdiagrammen darstellen.

Analysen

Möchte man Zusammenhänge bzw. Abhängigkeiten zwischen zwei kategorialen Variablen untersuchen, eignen sich Kreuztabellen dafür (ein unsinniges Beispiel wäre: Gibt es einen Zusammenhang zwischen der Augenfarbe der Kunden und der von diesen gewählten Zahlungsmethode?); bei nur jeweils 2 Merkmalsausprägungen der beiden kategorialen Variablen läge eine Vierfeldertafel vor.