Ausreißerrechner
Anweisungen: Nutzen Sie diesen Ausreißerrechner, indem Sie Ihre Beispieldaten eingeben. Er zeigt Ihnen alle Schritte zur Anwendung der „1,5 x IQR“-Regel zur Erkennung von Ausreißern. Diese Ausreißer werden in einem Boxplot dargestellt. Geben Sie unten Ihre Stichprobe ein:
Ausreißerrechner und wie man ausreißer erkennt
Was ist ein ausreißer?
Ein Ausreißer ist ein zu extremer Wert in einer Stichprobe. Diese Definition erfordert eine Präzisierung: Was bedeutet „zu extrem“? Es gibt unterschiedliche Interpretationen dieses Begriffs.
Eine allgemeine Regel zur Entscheidung, ob ein Wert in einer Stichprobe zu extrem ist, ist, ob der Wert über dem 1,5-fachen Interquartilsabstand vom ersten oder dritten Quartil liegt
Dieser Ausreißerrechner zeigt Ihnen alle Schritte und den Arbeitsaufwand, die zum Erkennen der Ausreißer erforderlich sind: Zuerst werden die Quartile berechnet, dann wird der Interquartilsabstand verwendet, um die im unteren und oberen Rand für Ausreißer verwendeten Schwellenwerte zu ermitteln.
Wie berechnet man ausreißer?
Was ist die Ausreißerformel? Mathematisch gesehen ist ein Wert \(X\) in einer Stichprobe ein Ausreißer, wenn:
\[X < Q_1 - 1.5 \times IQR \, \text{ or } \, X > Q_3 + 1.5 \times IQR\]wobei \(Q_1\) das erste Quartil, \(Q_3\) das dritte Quartil und \(IQR = Q_3 - Q_1\) ist
Warum sind ausreißer wichtig?
Ausreißer müssen analysiert werden, da ihr Vorhandensein die Ergebnisse vieler statistischer Verfahren ungültig machen kann. Ausreißer müssen auch analysiert werden, da sie häufig auf Tippfehler zurückzuführen sind.
Die Erkennung von Ausreißern ist von entscheidender Bedeutung, denn wenn ein klarer Ausreißer nicht erkannt und eliminiert wird, weicht die Wertteststatistik wahrscheinlich um eine gewisse Spanne ab, was durchaus zu falschen Schlussfolgerungen führen kann.
Wenn Ausreißer also nicht erkannt und korrigiert werden:
- Eine falsche Darstellung der Verteilung kann gegeben werden
- Ein verzerrter Wert der Maße für zentrale Tendenz und Streuung.
- Der Test kann zu einer falschen Schlussfolgerung führen (oftmals die falsche Ablehnung der Nullhypothese
Anderer rechner für beschreibende statistiken
Erhalten Sie eine vollständige Berechnung mit unserem vollständigen Beschreibender Statistikrechner Oder nutzen Sie doch einfach unsere Interquartilrechner , die direkt zur Erkennung von Ausreißern verwendet wird. Tatsächlich werden Ausreißer typischerweise mit der Regel berechnet, die allgemein als „1,5-facher IQR“-Regel bekannt ist.
Manchmal werden Ausreißer auch mit Z-Scores berechnet, wobei jeder Rohwert mit einem Z-Score das einen absoluten Wert größer als 2 hat, ist ein Ausreißer.
Beispiel: ausreißererkennung
Frage : Betrachten Sie die folgenden Beispieldaten: 10, 10, 8, 9, 12, 34, 23, 22, 11, 1, 1, 1, 2, 3, 5, 14, 12, 12, 45. Erkennen Sie das Vorhandensein von Ausreißern, falls vorhanden.
Lösung:
Wir müssen den Interquartilsabstand (IQR) für die bereitgestellte Stichprobe berechnen. In diesem Fall beträgt die Stichprobengröße \(n = 19\). Dies sind die bereitgestellten Stichprobendaten:
| Beobachtung: | \(X\) |
| 1 | 10 |
| 2 | 10 |
| 3 | 8 |
| 4 | 9 |
| 5 | 12 |
| 6 | 34 |
| 7 | 23 |
| 8 | 22 |
| 9 | 11 |
| 10 | 1 |
| 11 | 1 |
| 12 | 1 |
| 13 | 2 |
| 14 | 3 |
| 15 | 5 |
| 16 | 14 |
| 17 | 12 |
| 18 | 12 |
| 19 | 45 |
Um nun die Quartile zu berechnen, müssen die Daten in aufsteigender Reihenfolge angeordnet werden, wie in der folgenden Tabelle gezeigt
| Position | X (Aufsteigende Reihenfolge) |
| 1 | 1 |
| 2 | 1 |
| 3 | 1 |
| 4 | 2 |
| 5 | 3 |
| 6 | 5 |
| 7 | 8 |
| 8 | 9 |
| 9 | 10 |
| 10 | 10 |
| 11 | 11 |
| 12 | 12 |
| 13 | 12 |
| 14 | 12 |
| 15 | 14 |
| 16 | 22 |
| 17 | 23 |
| 18 | 34 |
| 19 | 45 |
Quartile
Für \(Q_1\) müssen wir folgende Position berechnen:
Da \(5\) eine Ganzzahl ist, wird \(Q_1\) berechnet, indem einfach der Wert gesucht wird, der sich an der Position \(5^{th}\) in der Tabelle mit den Daten in aufsteigender Reihenfolge befindet. Das bedeutet, dass in diesem Fall
\[Q_1 = 5\]
Für \(Q_3\) müssen wir folgende Position berechnen:
Da (15\) eine Ganzzahl ist, wird \(Q_3\) berechnet, indem der Wert an der Position \(15^{th}\) in der Tabelle mit aufsteigender Datenreihenfolge gesucht wird. Das bedeutet, dass in diesem Fall
\[Q_3 = 22\]Daher ist der Interquartilsabstand (IQR)
\[ \begin{array}{ccl} IQR & = & Q_3 - Q_1 \\\\ \\\\ & = & 22 - 5 \\\\ \\\\ & = & 17 \end{array}\]Jetzt können wir die Unter- und Obergrenzen für Werte berechnen, die als Ausreißer betrachtet werden:
\[Lower = Q_1 - 1.5 \times IQR = 5 - 1.5 \times 17 = -20.5 \]\[Upper = Q_3 + 1.5 \times IQR = 22 + 1.5 \times 17 = 47.5 \]und dann ist ein Ergebnis \(X\) ein Ausreißer, wenn \(X < -20.5\) oder wenn \(X > 47.5\).
Die Schlussfolgerung in diesem Fall, da alle Ergebnisse \(X\) innerhalb der Werte von \(Lower = -20.5\) und \(Upper = 47.5\) liegen, dann
Es gibt keine Ausreißer
.