Calcolatore anomalo


Istruzioni: Utilizza questo calcolatore di valori anomali inserendo i dati del tuo campione. Questo calcolatore ti mostrerà tutti i passaggi per applicare la regola "1,5 x IQR" per rilevare i valori anomali. Questi valori anomali saranno visualizzati in un box plot. Premi Invio per inserire il tuo campione qui sotto:

Nome del campione (facoltativo)



Calcolatore dei valori anomali e come rilevarli

Che cosa è un valore anomalo?

Un valore anomalo è un valore in un campione che risulta troppo estremo. Questa definizione richiede una maggiore precisione: cosa intendiamo per "troppo estremo"? Esistono diverse interpretazioni di questo concetto.

Una regola comune per decidere se un valore in un campione è troppo estremo è se il valore è superiore o inferiore a 1,5 volte l'intervallo interquartile dal primo o dal terzo quartile

Questo calcolatore di valori anomali ti mostrerà tutti i passaggi e il lavoro necessari per individuare i valori anomali: prima verranno calcolati i quartili, quindi verrà utilizzato l'intervallo interquartile per valutare i punti soglia utilizzati nella coda inferiore e superiore per i valori anomali.

Come si calcolano i valori anomali?

Qual è la formula del valore anomalo? Beh, matematicamente, un valore \(X\) in un campione è un valore anomalo se:

\[X < Q_1 - 1.5 \times IQR \, \text{ or } \, X > Q_3 + 1.5 \times IQR\]

dove \(Q_1\) è il primo quartile, \(Q_3\) è il terzo quartile e \(IQR = Q_3 - Q_1\)

Perché i valori anomali sono importanti?

I valori anomali devono essere analizzati perché la loro presenza può invalidare i risultati di molte procedure statistiche. I valori anomali devono essere analizzati anche perché spesso si verificano a causa di errori di battitura.

L'individuazione dei valori anomali è fondamentale, perché se un valore anomalo chiaro non viene individuato ed eliminato, è probabile che la statistica del test del valore non sia corretta, il che potrebbe portare a conclusioni errate.

Quindi, se i valori anomali non vengono rilevati e corretti:

  • Potrebbe essere data una rappresentazione errata della distribuzione
  • Un valore distorto delle misure di tendenza centrale e di dispersione.
  • Il test può portare a una conclusione errata (spesso il rifiuto errato dell'ipotesi nulla)

Altra calcolatrice statistica descrittiva

Ottieni un calcolo completo con il nostro completo calcolatore di statistiche descrittive Oppure potresti anche voler usare il nostro Calcolatrice interquartile , che viene utilizzato direttamente per l'individuazione dei valori anomali. Infatti, i valori anomali vengono in genere calcolati utilizzando la regola comunemente nota come regola "1,5 volte IQR".

Inoltre, a volte i valori anomali vengono calcolati utilizzando i punteggi z, in cui qualsiasi punteggio grezzo con un punteggio z che ha un valore assoluto maggiore di 2 è un valore anomalo.

Calcolo Dei Valori Anomali

Esempio: rilevamento di valori anomali

Domanda : Considera i seguenti dati campione: 10, 10, 8, 9, 12, 34, 23, 22, 11, 1, 1, 1, 2, 3, 5, 14, 12, 12, 45. Rileva l'eventuale presenza di valori anomali.

Soluzione:

Dobbiamo calcolare l'intervallo interquartile (IQR) per il campione fornito. In questo caso, la dimensione del campione è \(n = 19\). Questi sono i dati del campione forniti:

Osservazione: \(X\)
1 10
2 10
3 8
4 9
5 12
6 34
7 23
8 22
9 11
10 1
11 1
12 1
13 2
14 3
15 5
16 14
17 12
18 12
19 45

Ora, per calcolare i quartili, i dati devono essere messi in ordine crescente, come mostrato nella tabella sottostante

Posizione X (Ordine Ascendente)
1 1
2 1
3 1
4 2
5 3
6 5
7 8
8 9
9 10
10 10
11 11
12 12
13 12
14 12
15 14
16 22
17 23
18 34
19 45

Quartili

Per \(Q_1\) dobbiamo calcolare la seguente posizione:

\[pos(Q_1) = (n+1) \frac{25}{100} = (19+1) \frac{25}{100} = 5\]

Poiché \(5\) è un numero intero, \(Q_1\) viene calcolato semplicemente individuando il valore che si trova nella posizione \(5^{th}\) nella tabella con i dati in ordine crescente, il che significa che in questo caso

\[Q_1 = 5\]

Per \(Q_3\) dobbiamo calcolare la seguente posizione:

\[pos(Q_3) = (n+1) \frac{75}{100} = (19+1) \frac{75}{100} = 15\]

Poiché (15\) è un numero intero, \(Q_3\) viene calcolato individuando il valore che si trova nella posizione \(15^{th}\) nella tabella con i dati in ordine crescente, il che significa che in questo caso

\[Q_3 = 22\]

Pertanto, l'intervallo interquartile (IQR) è

\[ \begin{array}{ccl} IQR & = & Q_3 - Q_1 \\\\ \\\\ & = & 22 - 5 \\\\ \\\\ & = & 17 \end{array}\]

Ora possiamo calcolare i limiti inferiore e superiore per i valori che saranno considerati anomali:

\[Lower = Q_1 - 1.5 \times IQR = 5 - 1.5 \times 17 = -20.5 \]\[Upper = Q_3 + 1.5 \times IQR = 22 + 1.5 \times 17 = 47.5 \]

e quindi, un risultato \(X\) è un valore anomalo se \(X < -20.5\), o se \(X > 47.5\).

La conclusione in questo caso poiché tutti i risultati \(X\) rientrano nei valori di \(Lower = -20.5\) e \(Upper = 47.5\), allora non ci sono valori anomali .

Non hai un account di iscrizione?
Iscriviti

Resetta la password

Torna a
accesso

Iscriviti

Torna a
accesso