Die empirische Regel und andere Regeln in der Statistik
In jeder Statistikklasse werden Sie sehr häufig feststellen, dass häufig auf bestimmte "Regeln" verwiesen wird. Diese Regeln sollen normalerweise Ihr Leben vereinfachen und Ihnen dabei helfen, einige Berechnungen zu vereinfachen. Aber nicht alle diese Regeln sind gleich. In der Tat sind nicht alle dieser Regeln tatsächliche "Regeln", da einige nur Annäherungen sind und als solche nur eine bestimmte Verwendung haben können oder manchmal sogar eine begrenzte Verwendung.
In den folgenden Abschnitten werden einige der häufig verwendeten Statistikregeln und -näherungen erläutert. Diese sind im Allgemeinen recht einfach, aber Sie müssen genau wissen, wie Sie sie in der beabsichtigten Weise verwenden.
Empirische Regel für die Normalverteilung
Dies ist bei weitem eine der bekanntesten "Regeln" in der Statistik. Ich schreibe immer wieder "Regel" mit Anführungszeichen, weil dies nicht wirklich eine Regel, sondern eine Annäherung ist. Die empirische Regel besagt, dass bei einer Normalverteilung einer Variablen ungefähr 68% der Verteilung innerhalb einer Standardabweichung des Mittelwerts liegen, 95% der Verteilung innerhalb von zwei Standardabweichungen des Mittelwerts und 99,7% der Verteilung innerhalb von drei Standardabweichungen des Mittelwerts.
Lassen Sie uns zunächst sehen, warum dies sinnvoll ist. Das Ereignis, das den Werten entspricht, die innerhalb einer Standardabweichung vom Mittelwert liegen, ist . Wenn wir normalisieren (durch subtrahieren und durch dividieren), erhalten wir die folgenden äquivalenten Ereignisse:
Wenn jedoch normalerweise mit dem Mittelwert und der Standardabweichung verteilt ist, wissen wir, dass die Variable eine Standardnormalverteilung hat (dies ist eine Normalverteilung mit dem Mittelwert 0 und der Standardabweichung 1). In der Regel wird die Variable als geschrieben
Dabei hat eine Standardnormalverteilung. Wenn wir einen Taschenrechner oder ein Tabellenkalkulationsprogramm wie Excel verwenden, stellen wir fest, dass die Wahrscheinlichkeit des Ereignisses, das den Werten entspricht, die innerhalb einer Standardabweichung vom Mittelwert liegen, beträgt
Der wahre Prozentsatz der Werte innerhalb einer Standardabweichung des Mittelwerts beträgt ungefähr 68,26989492%, was immer noch nur eine Annäherung ist, aber diese Annäherung ist viel besser als die in der empirischen Regel angegebenen 68%.
Ebenso können wir das berechnen
Der wahre Prozentsatz der Werte innerhalb von zwei Standardabweichungen des Mittelwerts beträgt ungefähr 95,4499736% (ungefähr), aber diese Annäherung ist viel besser als die 95%, die durch die empirische Regel angegeben werden.
Schließlich können wir das berechnen
Der wahre Prozentsatz der Werte innerhalb von zwei Standardabweichungen des Mittelwerts beträgt ungefähr 99,7300204%, aber diese Annäherung ist immer noch genauer als die in der empirischen Regel angegebenen 99,7%.
Vorsicht: Einige Lehrbücher werden nicht einmal sagen, dass dies eine Annäherung ist, und sie können sagen, dass "68% der Verteilung innerhalb einer Standardabweichung des Mittelwerts liegen, 95% der Verteilung innerhalb von zwei Standardabweichungen des Mittelwerts und 99,7% von Die Verteilung liegt innerhalb von drei Standardabweichungen vom Mittelwert ", als wäre das eine exakte Zahl. Dies kann zu Verwirrung führen, da Sie bei der Berechnung in Excel (oder bei Verwendung normaler Wahrscheinlichkeitstabellen am Ende Ihres Buches) feststellen, dass 68%, 95% und 99,7% nicht genau sind. Stellen Sie sicher, dass Sie es in Ihren Tests oder Hausaufgaben genau so verwenden, wie es Ihnen Ihr Lehrer gesagt hat. Vergessen Sie jedoch nicht, dass es sich nur um eine Annäherung handelt.
Die Faustregel für die Standardabweichung
Diese Regel ist eine weitere grobe Näherung, mit der die Standardabweichung unter Verwendung des Bereichs geschätzt wird. Die Regel besagt, dass die Standardabweichung mit der folgenden Formel angenähert werden kann:
Einfach. In einigen Fällen oder Anwendungen haben Sie keinen Zugriff auf die Daten selbst, kennen jedoch den Bereich. Wenn dies der Fall ist, müssen Sie nur den Bereich nehmen und durch 4 teilen.
Chebyshevs Regel
Dies ist eine sehr gute Regel. Nun, es ist tatsächlich eine Ungleichung. Es ist eine Art empirische Regel, aber sie gilt für ALLE Distributionen (ja, Sie haben richtig gehört), nicht nur für die Normalverteilung. Chebyshevs Regel sieht eine Untergrenze für den Prozentsatz der Verteilung vor, der innerhalb liegen wird k Standardabweichungen vom Mittelwert. In der Tat haben wir das
Was sagt Chebyshevs Regel für ? Es sagt
Das ist: Mindestens 75% der Verteilung liegen innerhalb von 2 Standardabweichungen vom Mittelwert . Richtig, sagst du. Wofür ist das gut? Sie denken vielleicht, dass Sie etwas viel Besseres aus der empirischen Regel wussten. Ja, Sie wussten, dass 95% (oder etwa 95%) der Verteilung innerhalb von 2 Standardabweichungen vom Mittelwert liegen. Was sagen diese stinkenden 75% hier? Ja, die 95% sind richtig, aber es funktioniert NUR für Normalverteilungen. Die Aussage, dass mindestens 75% der Verteilung innerhalb von 2 Standardabweichungen des Mittelwerts liegen, der mit Chebyshevs Regelarbeit für ALLE Verteilungen erhalten wurde ...... Genug gesagt.