Calculadora de outliers
Instruções: Use esta calculadora de outliers inserindo os dados da sua amostra. Esta calculadora mostrará todos os passos para aplicar a regra "1,5 x IQR" para detectar outliers. Esses outliers serão exibidos em um gráfico de caixa. Pressione "Insira sua amostra" abaixo:
Calculadora de outliers e como detectar outliers
O que é um outlier?
Um valor discrepante é um valor em uma amostra que é muito extremo. Essa definição exige mais precisão: o que queremos dizer com "muito extremo"? Existem diversas interpretações para essa noção de ser muito extremo.
Uma regra comum para decidir se um valor em uma amostra é muito extremo é se o valor está ou não além de 1,5 vezes o intervalo interquartil do primeiro ou terceiro quartis
Esta calculadora de outliers mostrará todas as etapas e o trabalho necessários para detectar outliers: primeiro, os quartis serão calculados e, em seguida, o intervalo interquartil será usado para avaliar os pontos de limite usados na cauda inferior e superior para outliers.
Como você calcula outliers?
O que é a fórmula de Outlier? Bem, matematicamente, um valor \(X\) em uma amostra é um outlier se:
\[X < Q_1 - 1.5 \times IQR \, \text{ or } \, X > Q_3 + 1.5 \times IQR\]onde \(Q_1\) é o primeiro quartil, \(Q_3\) é o terceiro quartil e \(IQR = Q_3 - Q_1\)
Por que os valores discrepantes são importantes?
Valores discrepantes precisam ser analisados porque sua presença pode invalidar os resultados de muitos procedimentos estatísticos. Valores discrepantes também precisam ser analisados porque, muitas vezes, surgem devido a erros de digitação.
A detecção de valores discrepantes é crucial, porque se um valor discrepante claro não for detectado e eliminado, a estatística do teste de valor provavelmente será diferente, o que pode levar a conclusões totalmente erradas.
Portanto, se outliers não forem detectados e corrigidos:
- Uma representação errada da distribuição pode ser dada
- Um valor distorcido de medidas de tendência central e dispersão.
- O teste pode levar a uma conclusão errada (muitas vezes a rejeição incorreta da hipótese nula
Outra calculadora de estatísticas descritivas
Obtenha um cálculo completo com nosso completo calculadora estatística descritiva . Ou você também pode querer usar nosso Calculadora Interquartil , que é usado diretamente na detecção de outliers. De fato, os outliers são normalmente calculados usando a regra comumente conhecida como "1,5 vezes IQR".
Além disso, às vezes os valores discrepantes são calculados usando pontuações z, onde qualquer pontuação bruta com um pontuação z que tem um valor absoluto maior que 2 é um outlier.
Exemplo: detecção de outliers
Pergunta : Considere os seguintes dados de amostra: 10, 10, 8, 9, 12, 34, 23, 22, 11, 1, 1, 1, 2, 3, 5, 14, 12, 12, 45. Detecte a existência de outliers, se houver.
Solução:
Precisamos calcular o intervalo interquartil (IQR) para a amostra fornecida. Neste caso, o tamanho da amostra é \(n = 19\). Estes são os dados da amostra fornecidos:
| Observação: | \(X\) |
| 1 | 10 |
| 2 | 10 |
| 3 | 8 |
| 4 | 9 |
| 5 | 12 |
| 6 | 34 |
| 7 | 23 |
| 8 | 22 |
| 9 | 11 |
| 10 | 1 |
| 11 | 1 |
| 12 | 1 |
| 13 | 2 |
| 14 | 3 |
| 15 | 5 |
| 16 | 14 |
| 17 | 12 |
| 18 | 12 |
| 19 | 45 |
Agora, para calcular os quartis, os dados precisam ser colocados em ordem crescente, conforme mostrado na tabela abaixo
| Posição | X (Ordem Ascendente) |
| 1 | 1 |
| 2 | 1 |
| 3 | 1 |
| 4 | 2 |
| 5 | 3 |
| 6 | 5 |
| 7 | 8 |
| 8 | 9 |
| 9 | 10 |
| 10 | 10 |
| 11 | 11 |
| 12 | 12 |
| 13 | 12 |
| 14 | 12 |
| 15 | 14 |
| 16 | 22 |
| 17 | 23 |
| 18 | 34 |
| 19 | 45 |
Quartis
Para \(Q_1\) temos que calcular a seguinte posição:
Como \(5\) é um número inteiro, \(Q_1\) é calculado simplesmente localizando o valor que é a posição \(5^{th}\) na tabela com dados em ordem crescente, o que significa que neste caso
\[Q_1 = 5\]
Para \(Q_3\) temos que calcular a seguinte posição:
Como (15\) é um número inteiro, \(Q_3\) é calculado localizando o valor que é a posição \(15^{th}\) na tabela com dados em ordem crescente, o que significa que neste caso
\[Q_3 = 22\]Portanto, o intervalo interquartil (IQR) é
\[ \begin{array}{ccl} IQR & = & Q_3 - Q_1 \\\\ \\\\ & = & 22 - 5 \\\\ \\\\ & = & 17 \end{array}\]Agora, podemos calcular os limites inferior e superior para valores que serão considerados outliers:
\[Lower = Q_1 - 1.5 \times IQR = 5 - 1.5 \times 17 = -20.5 \]\[Upper = Q_3 + 1.5 \times IQR = 22 + 1.5 \times 17 = 47.5 \]e então, um resultado \(X\) é um outlier se \(X < -20.5\), ou se \(X > 47.5\).
A conclusão neste caso, uma vez que todos os resultados \(X\) estão dentro dos valores de \(Lower = -20.5\) e \(Upper = 47.5\), então
não há outliers
.