Калькулятор выбросов


Инструкции: Используйте этот калькулятор выбросов, введя данные вашего образца. Этот калькулятор покажет вам все шаги для применения правила "1,5 x IQR" для обнаружения выбросов. Эти выбросы будут показаны на диаграмме ящиков. Пожалуйста, нажмите введите свой образец ниже:

Название образца (необязательно)



Калькулятор выбросов и как их обнаружить

Что такое выброс?

Выброс — это значение в выборке, которое слишком экстремально. Такое определение требует большей точности: Что мы подразумеваем под "слишком экстремальным"? Существуют различные интерпретации этого понятия "слишком экстремальный".

Одно из общих правил для определения того, является ли значение в выборке слишком экстремальным, заключается в том, выходит ли значение за пределы 1,5-кратного межквартильного размаха от первого или третьего квартиля

Этот калькулятор выбросов покажет вам все шаги и работу, необходимые для обнаружения выбросов: сначала будут вычислены квартили, а затем будет использован межквартильный размах для оценки пороговых точек, используемых в нижнем и верхнем хвосте для выбросов.

Как вы рассчитываете выбросы?

Что такое формула выброса? Ну, математически, значение \(X\) в выборке является выбросом, если:

\[X < Q_1 - 1.5 \times IQR \, \text{ or } \, X > Q_3 + 1.5 \times IQR\]

где \(Q_1\) — первый квартиль, \(Q_3\) — третий квартиль, а \(IQR = Q_3 - Q_1\)

Почему выбросы важны?

Выбросы необходимо анализировать, поскольку их наличие может сделать результаты многих статистических процедур недействительными. Выбросы также необходимо анализировать, поскольку зачастую они возникают из-за опечаток.

Обнаружение выбросов имеет решающее значение, поскольку если явный выброс не обнаружен и не устранен, статистика критерия значения, скорее всего, выйдет за пределы нормы, что может привести к неверным выводам.

Итак, если выбросы не обнаружены и не исправлены:

  • Может быть дано неверное изображение распределения
  • Искаженное значение мер центральной тенденции и дисперсии.
  • Тест может привести к неверному выводу (часто к неверному отклонению нулевой гипотезы)

Калькулятор другой описательной статистики

Получите полный расчет с нашей полной калькулятор описательной статистики . Или вы также можете использовать наш Калькулятор интерквартильного размаха , который напрямую используется для обнаружения выбросов. Действительно, выбросы обычно вычисляются с использованием правила, широко известного как правило "1,5 раза IQR".

Кроме того, иногда выбросы вычисляются с использованием z-оценок, где любая исходная оценка с z-оценка , абсолютный показатель которого больше 2, является выбросом.

Расчет Выбросов

Пример: обнаружение выбросов

Вопрос : Рассмотрим следующие образцы данных: 10, 10, 8, 9, 12, 34, 23, 22, 11, 1, 1, 1, 2, 3, 5, 14, 12, 12, 45. Определите наличие выбросов, если таковые имеются.

Решение:

Нам необходимо вычислить межквартильный размах (IQR) для предоставленной выборки. В этом случае размер выборки равен \(n = 19\). Это предоставленные данные выборки:

Наблюдение: \(X\)
1 10
2 10
3 8
4 9
5 12
6 34
7 23
8 22
9 11
10 1
11 1
12 1
13 2
14 3
15 5
16 14
17 12
18 12
19 45

Теперь, чтобы вычислить квартили, данные необходимо расположить в порядке возрастания, как показано в таблице ниже

Позиция X (Порядок Возр.)
1 1
2 1
3 1
4 2
5 3
6 5
7 8
8 9
9 10
10 10
11 11
12 12
13 12
14 12
15 14
16 22
17 23
18 34
19 45

Квартили

Для \(Q_1\) нам необходимо вычислить следующую позицию:

\[pos(Q_1) = (n+1) \frac{25}{100} = (19+1) \frac{25}{100} = 5\]

Поскольку \(5\) — целое число, \(Q_1\) вычисляется простым поиском значения, которое находится на позиции \(5^{th}\) в таблице с данными в порядке возрастания, что означает, что в этом случае

\[Q_1 = 5\]

Для \(Q_3\) нам необходимо вычислить следующую позицию:

\[pos(Q_3) = (n+1) \frac{75}{100} = (19+1) \frac{75}{100} = 15\]

Поскольку (15\) — целое число, \(Q_3\) вычисляется путем нахождения значения, которое является позицией \(15^{th}\) в таблице с данными в порядке возрастания, что означает, что в этом случае

\[Q_3 = 22\]

Таким образом, межквартильный размах (IQR) равен

\[ \begin{array}{ccl} IQR & = & Q_3 - Q_1 \\\\ \\\\ & = & 22 - 5 \\\\ \\\\ & = & 17 \end{array}\]

Теперь мы можем вычислить нижние и верхние пределы для значений, которые будут считаться выбросами:

\[Lower = Q_1 - 1.5 \times IQR = 5 - 1.5 \times 17 = -20.5 \]\[Upper = Q_3 + 1.5 \times IQR = 22 + 1.5 \times 17 = 47.5 \]

и тогда результат \(X\) является выбросом, если \(X < -20.5\), или если \(X > 47.5\).

Вывод в этом случае, поскольку все результаты \(X\) находятся в пределах значений \(Lower = -20.5\) и \(Upper = 47.5\), то нет никаких выбросов .

Войдите в свою учетную запись

У вас нет учетной записи?
зарегистрироваться

Сброс пароля

Вернуться к
авторизоваться

зарегистрироваться