Calculateur de valeurs aberrantes


Instructions : Utilisez ce calculateur de valeurs aberrantes en saisissant vos données d'échantillon. Il vous montrera toutes les étapes pour appliquer la règle « 1,5 x IQR » afin de détecter les valeurs aberrantes. Ces valeurs seront représentées sous forme de boîte à moustaches. Veuillez saisir votre échantillon ci-dessous :

Nom de l'échantillon (facultatif)



Calculateur de valeurs aberrantes et comment les détecter

Qu'est-ce qu'une valeur aberrante ?

Une valeur aberrante est une valeur d'un échantillon qui est trop extrême. Cette définition mérite d'être plus précise : qu'entendons-nous par « trop extrême » ? Cette notion d'« extrême » est interprétée de diverses manières.

Une règle courante pour décider si une valeur dans un échantillon est trop extrême est de savoir si la valeur est ou non supérieure à 1,5 fois l'écart interquartile du premier ou du troisième quartile

Ce calculateur de valeurs aberrantes vous montrera toutes les étapes et le travail nécessaires pour détecter les valeurs aberrantes : tout d'abord, les quartiles seront calculés, puis l'écart interquartile sera utilisé pour évaluer les points de seuil utilisés dans la queue inférieure et supérieure pour les valeurs aberrantes.

Comment calculez-vous les valeurs aberrantes ?

Quelle est la formule des valeurs aberrantes ? Mathématiquement, une valeur \(X\) dans un échantillon est une valeur aberrante si :

\[X < Q_1 - 1.5 \times IQR \, \text{ or } \, X > Q_3 + 1.5 \times IQR\]

où \(Q_1\) est le premier quartile, \(Q_3\) est le troisième quartile et \(IQR = Q_3 - Q_1\)

Pourquoi les valeurs aberrantes sont-elles importantes ?

Les valeurs aberrantes doivent être analysées, car leur présence peut invalider les résultats de nombreuses procédures statistiques. Elles doivent également être analysées, car elles sont souvent dues à des erreurs de frappe.

La détection des valeurs aberrantes est cruciale, car si une valeur aberrante claire n'est pas détectée et éliminée, la statistique du test de valeur sera probablement erronée, ce qui pourrait absolument conduire à des conclusions erronées.

Donc, si les valeurs aberrantes ne sont pas détectées et corrigées :

  • Une représentation erronée de la distribution peut être donnée
  • Une valeur déformée des mesures de tendance centrale et de dispersion.
  • Le test peut conduire à une conclusion erronée (souvent le rejet incorrect de l'hypothèse nulle)

Autres statistiques descriptives calculatrice

Obtenez un calcul complet avec notre calculatrice de statistiques descriptives . Ou vous pouvez également utiliser notre Calculateur d'interquartiles , qui est directement utilisée pour la détection des valeurs aberrantes. En effet, ces valeurs sont généralement calculées selon la règle communément appelée « 1,5 fois l'IQR ».

De plus, les valeurs aberrantes sont parfois calculées à l'aide de scores z, où tout score brut avec un score z qui a un absolu supérieur à 2 est une valeur aberrante.

Calcul Des Valeurs Aberrantes

Exemple : détection des valeurs aberrantes

Question :Considérez les exemples de données suivants : 10, 10, 8, 9, 12, 34, 23, 22, 11, 1, 1, 1, 2, 3, 5, 14, 12, 12, 45. Détectez l’existence de valeurs aberrantes, le cas échéant.

Solution :

Nous devons calculer l'écart interquartile (EI) pour l'échantillon fourni. Dans ce cas, la taille de l'échantillon est \(n = 19\). Voici les données de l'échantillon fournies :

Observation: \(X\)
1 10
2 10
3 8
4 9
5 12
6 34
7 23
8 22
9 11
10 1
11 1
12 1
13 2
14 3
15 5
16 14
17 12
18 12
19 45

Maintenant, pour calculer les quartiles, les données doivent être classées par ordre croissant, comme indiqué dans le tableau ci-dessous

Position X (Ordre Croissant)
1 1
2 1
3 1
4 2
5 3
6 5
7 8
8 9
9 10
10 10
11 11
12 12
13 12
14 12
15 14
16 22
17 23
18 34
19 45

Quartiles

Pour \(Q_1\) nous devons calculer la position suivante :

\[pos(Q_1) = (n+1) \frac{25}{100} = (19+1) \frac{25}{100} = 5\]

Étant donné que \(5\) est un nombre entier, \(Q_1\) est calculé en localisant simplement la valeur qui est la position \(5^{th}\) dans le tableau avec les données dans l'ordre croissant, ce qui signifie que dans ce cas

\[Q_1 = 5\]

Pour \(Q_3\) nous devons calculer la position suivante :

\[pos(Q_3) = (n+1) \frac{75}{100} = (19+1) \frac{75}{100} = 15\]

Étant donné que (15\) est un nombre entier, \(Q_3\) est calculé en localisant la valeur qui est la position \(15^{th}\) dans le tableau avec les données dans l'ordre croissant, ce qui signifie que dans ce cas

\[Q_3 = 22\]

Par conséquent, l'écart interquartile (IQR) est

\[ \begin{array}{ccl} IQR & = & Q_3 - Q_1 \\\\ \\\\ & = & 22 - 5 \\\\ \\\\ & = & 17 \end{array}\]

Nous pouvons maintenant calculer les limites inférieures et supérieures des valeurs qui seront considérées comme des valeurs aberrantes :

\[Lower = Q_1 - 1.5 \times IQR = 5 - 1.5 \times 17 = -20.5 \]\[Upper = Q_3 + 1.5 \times IQR = 22 + 1.5 \times 17 = 47.5 \]

et ensuite, un résultat \(X\) est une valeur aberrante si \(X < -20.5\), ou si \(X > 47.5\).

La conclusion dans ce cas étant donné que tous les résultats \(X\) sont compris entre les valeurs de \(Lower = -20.5\) et \(Upper = 47.5\), alors il n'y a pas de valeurs aberrantes .

s'identifier

Vous n'avez pas de compte de membre?
s'inscrire

réinitialiser le mot de passe

Retour à
s'identifier

s'inscrire

Retour à
s'identifier