Standardfehler

Standardfehler Definition

Der Standardfehler des Mittelwerts (engl. standard error of the mean, kurz: SEM) gibt an, welchen Fehler der gesuchte Parameter (Stichprobenmittelwert) im Vergleich zum tatsächlichen Parameterwert (Mittelwert der Grundgesamtheit) hat bzw. wie weit der Schätzwert um den tatsächlichen Wert streut.

Die Berechnung des Standardfehlers erfolgt mit der Formel:

Standardfehler = Standardabweichung der Stichprobe / √ Stichprobenumfang.

Kurz (mit s als Standardabweichung und n als Stichprobenumfang):

$$SEM = \frac{s}{\sqrt{n}}$$

Anmerkung: eigentlich wird für die Berechnung des Standardfehlers die Standardabweichung der Grundgesamtheit im Zähler der Formel verwendet; diese ist jedoch meist nicht bekannt, deshalb verwendet man stattdessen die Schätzung mittels der Standardabweichung der Stichprobe.

Der Standardfehler hängt davon ab,

wie groß die Stichprobe ist (je größer, desto kleiner der Standardfehler) sowie
wie weit die Messwerte in der Grundgesamtheit streuen (je mehr sie streuen, desto größer der Standardfehler).

Der Standardfehler wird in derselben Einheit angegeben, wie die Messwerte (im Beispiel unten: Jahre).

Den Standardfehler kann man nicht nur für den Mittelwert, sondern auch für andere Statistiken wie den Anteilswert oder die Odds Ratio berechnen.

Alternative Begriffe: standard error of the mean (kurz: SEM), Stichprobenfehler.

Beispiel

Beispiel: Standardfehler berechnen

Es gibt 10 Personen im Alter von 2, 4, 6, 8, 10, 12, 14, 16, 18, 20 Jahren und man möchte per Stichprobe das Durchschnittsalter ermitteln; in der Grundgesamtheit ist der Mittelwert: (2 + 4 + 6 + 8 + 10 + 12 + 14 + 16 + 18 + 20) / 10 = 110 / 10 = 11 Jahre.

Angenommen, man zieht als Zufallsstichprobe 2 Personen (immerhin 20 %), nämlich die 3. und 5. Person im Alter von 6 und 10 Jahren; dann wäre der Durchschnitt aus der Stichprobe: (6 + 10) / 2 = 16 / 2 = 8 Jahre (3 Jahre vom tatsächlichen Mittelwert der Grundgesamtheit entfernt).

Standardfehler berechnen

Die Varianz der Stichprobe ist: [ (6 - 8)² + (10 - 8)²) ] / (2 - 1) = (4 + 4) / 1 = 8.

Die Standardabweichung der Stichprobe ist gleich der Wurzel aus der Varianz = √ 8 (gerundet 2,83).

Der Standardfehler ist: √ 8 / √ 2 = 2.

Größere Stichprobe

Angenommen, man zieht eine größere Stichprobe von 4 Personen, nämlich die 3. und 5. sowie die 8. und 10. Person im Alter von 6 und 10 und 16 und 20 Jahren; dann wäre der Durchschnitt aus der Stichprobe: (6 + 10 + 16 + 20) / 4 = 52 / 4 = 13 Jahre (schon besser; aber immer noch 2 Jahre vom tatsächlichen Mittelwert der Grundgesamtheit entfernt). Extrembeispiel: würde man eine 100%-Stichprobe ziehen, wären natürlich Stichprobenmittelwert und Mittelwert der Grundgesamtheit identisch.

Da im Nenner der Formel die Wurzel aus dem Stichprobenumfang steht, müsste man z.B. für eine gezielte Halbierung des Standardfehlers den Stichprobenumfang vervierfachen.

Größere Streuung

Angenommen, die 10 Personen streuen weiter bzgl. des Alters: 2, 5, 8, 11, 14, 17, 20, 23, 26, 29 Jahre; in der Grundgesamtheit ist der Mittelwert: (2 + 5 + 8 + 11 + 14 + 17 + 20 + 23 + 26 + 29) / 10 = 155 / 10 = 15,5 Jahre.

Zieht man als Stichprobe wieder 2 Personen, nämlich wieder die 3. und 5. Person im Alter von 8 und 14 Jahren, dann wäre der Durchschnitt aus der Stichprobe: (8 + 14) / 2 = 22 / 2 = 11 Jahre (und damit 4,5 Jahre vom tatsächlichen Mittelwert der Grundgesamtheit entfernt).

Würden die Daten gar nicht streuen – alle 10 Personen wären gleich alt – wären Standardabweichung und Standardfehler 0.

Der Standardfehler wird bei einer breiteren Streuung der Daten in der Grundgesamtheit größer und bei zunehmendem Stichprobenumfang kleiner.