Regressionsanalyse

Regressionsanalyse Definition

Ausgangspunkt einer Regressionsanalyse ist folgender: man hat mehrere Merkmale bzw. deren Merkmalsausprägungen erfasst / gemessen und interessiert sich für einen funktionalen Zusammenhang zwischen den Merkmalswerten.

Beispiel

Es wurde für 100 Personen die Schuhgröße und die Körpergröße erfasst. Gibt es einen Zusammenhang zwischen den beiden?

Bei 2 Merkmalen spricht man von einfacher Regression (univariate Regression). Hätte man zusätzlich zu Schuhgröße und Körpergröße noch die Hutgröße erfasst, könnte man eine multiple Regression vornehmen.

Ein Ziel der Regressionsanalyse ist es, auf Basis des einen Werts (der sog. unabhängigen Variablen bzw. erklärenden Variablen, z.B. Körpergröße) eine Vorhersage für den anderen Wert (die sog. abhängige Variable, z.B. Schuhgröße) zu treffen. Grund dafür kann z.B. sein, dass die Verteilung der Körpergrößen in der Bevölkerung durch eine Erhebung bekannt ist, die Verteilung der Schuhgrößen jedoch nicht (und die Schuhbranche würde für die Absatzplanung die Verteilung gerne kennen).

Regression vs. Korrelation

Während die Korrelation misst, ob ein Zusammenhang zwischen 2 Variablen besteht und wie stark dieser Zusammenhang ist, möchte die Regression die Art des Zusammenhangs verstehen und bestenfalls in einer Formel zusammenfassen.

Es gibt verschiedene Regressionsmodelle, die wichtigste ist die lineare Regression.