In questo tutorial, tratteremo l'argomento di Test non parametrici . Vedere di seguito un elenco di problemi di esempio rilevanti, con soluzioni passo passo.
Domanda 1: Un ricercatore medico ritiene che il numero di infezioni alle orecchie nei nuotatori possa essere ridotto se il i nuotatori usano i tappi per le orecchie. È stato selezionato un campione di dieci persone ed è stato registrato il numero di infezioni all'orecchio per un periodo di quattro mesi. Durante i primi due mesi i nuotatori non hanno utilizzato i tappi per le orecchie; durante i secondi due mesi, lo fecero. All'inizio del secondo periodo di due mesi, ogni nuotatore è stato esaminato per assicurarsi che non siano presenti infezioni. I dati sono riportati di seguito. A \(\alpha = 0.05\), il ricercatore può concludere che l'uso di tappi per le orecchie influisce sul numero di infezioni all'orecchio?
Soluzione: Dobbiamo testare le ipotesi
\[\begin{aligned} & {{H}_{0}}:\text{ ear infections are the same with or without the ear plugs} \\ &{{H}_{A}}:\text{ swimmers get less ear infections with ear plugs} \\ \end{aligned}\]
Usiamo un Sign-Test. Usiamo Statdisk per ottenere il seguente output:
La statistica \(x\) è uguale a 2 (il numero di segni meno frequente). Il valore critico è 1. Poiché \(x\) non è minore o uguale al valore critico, non riusciamo a rifiutare l'ipotesi nulla. Ciò significa che non abbiamo prove sufficienti per sostenere l'affermazione che il numero di infezioni dell'orecchio nei nuotatori può essere ridotto se i nuotatori usano i tappi per le orecchie.
Domanda 2: La ricerca indica che le persone che si offrono volontariamente per partecipare a studi di ricerca tendono ad avere un'intelligenza superiore rispetto ai non volontari. Per testare questo fenomeno, un ricercatore ottiene un campione di 200 studenti delle scuole superiori. Agli studenti viene fornita una descrizione di uno studio di ricerca psicologica e viene chiesto se si offrono volontari per partecipare. Il ricercatore ottiene anche un punteggio QI per ogni studente e classifica gli studenti in gruppi di QI alto, medio e basso. I dati seguenti indicano una relazione significativa tra QI e volontariato? Test a livello di significatività 0,05.
Soluzione: La tabella seguente mostra la tabella di contingenza corrispondente:
Osservato |
Alto |
medio |
Basso |
Totale |
Volontario |
43 |
73 |
34 |
150 |
Non volontario |
7 |
27 |
16 |
50 |
Totale |
50 |
100 |
50 |
200 |
Siamo interessati a testare le seguenti ipotesi nulle e alternative:
\[\begin{aligned}{{H}_{0}}:\,\,\, \text{Volunteer Status}\text{ and }\text {IQ}\text{ are independent} \\ {{H}_{A}}:\,\,\,\text{Volunteer Status}\text{ and }\text {IQ}\text{ are NOT independent} \\ \end{aligned}\]
Dalla tabella sopra calcoliamo la tabella con i valori attesi
Previsto |
Alto |
medio |
Basso |
Volontario |
37.5 |
75 |
37.5 |
Non volontario |
12.5 |
25 |
12.5 |
Il modo in cui vengono calcolate le frequenze previste è mostrato di seguito:
\[{E}_{{1},{1}}= \frac{ {R}_{1} \times {C}_{1} }{T}= \frac{{150} \times {50}}{{200}}={37.5},\,\,\,\, {E}_{{1},{2}}= \frac{ {R}_{1} \times {C}_{2} }{T}= \frac{{150} \times {100}}{{200}}={75},\,\,\,\, {E}_{{1},{3}}= \frac{ {R}_{1} \times {C}_{3} }{T}= \frac{{150} \times {50}}{{200}}={37.5}\]
\[,\,\,\,\, {E}_{{2},{1}}= \frac{ {R}_{2} \times {C}_{1} }{T}= \frac{{50} \times {50}}{{200}}={12.5},\,\,\,\, {E}_{{2},{2}}= \frac{ {R}_{2} \times {C}_{2} }{T}= \frac{{50} \times {100}}{{200}}={25},\,\,\,\, {E}_{{2},{3}}= \frac{ {R}_{2} \times {C}_{3} }{T}= \frac{{50} \times {50}}{{200}}={12.5}\]
Infine, usiamo la formula \(\frac{{{\left( O-E \right)}^{2}}}{E}\) per ottenere
(fo - fe) ² / fe |
Alto |
medio |
Basso |
Volontario |
0.8067 |
0.0533 |
0.3267 |
Non volontario |
2.42 |
0.16 |
0.98 |
Di seguito sono riportati i calcoli richiesti:
\[\frac{ {\left( {43}-{37.5} \right)}^{2} }{{37.5}} ={0.8067},\,\,\,\, \frac{ {\left( {73}-{75} \right)}^{2} }{{75}} ={0.0533},\,\,\,\, \frac{ {\left( {34}-{37.5} \right)}^{2} }{{37.5}} ={0.3267},\,\,\,\, \frac{ {\left( {7}-{12.5} \right)}^{2} }{{12.5}} ={2.42}\]
\[,\,\,\,\, \frac{ {\left( {27}-{25} \right)}^{2} }{{25}} ={0.16},\,\,\,\, \frac{ {\left( {16}-{12.5} \right)}^{2} }{{12.5}} ={0.98}\]
Quindi, il valore delle statistiche del chi quadrato è
\[{{\chi }^{2}}=\sum{\frac{{{\left( {{O}_{ij}}-{{E}_{ij}} \right)}^{2}}}{{{E}_{ij}}}}={0.8067} + {0.0533} + {0.3267} + {2.42} + {0.16} + {0.98} = 4.747\]
Il valore chi quadrato critico per \(\alpha =0.05\) e \(\left( 3-1 \right)\times \left( 2-1 \right)=2\) gradi di libertà è \(\chi _{C}^{2}= {5.991}\). Poiché \({{\chi }^{2}}=\sum{\frac{{{\left( {{O}_{ij}}-{{E}_{ij}} \right)}^{2}}}{{{E}_{ij}}}}= {4.747}\) <\(\chi _{C}^{2}= {5.991}\), non riusciamo a rifiutare l'ipotesi nulla, il che significa che non abbiamo prove sufficienti per rifiutare l'ipotesi nulla di indipendenza.
Domanda 3: Di seguito sono elencati i numeri di anni vissuti dai presidenti degli Stati Uniti, dai papi dal 1690 e dai monarchi britannici dopo essere stati inaugurati, eletti o incoronati. Al momento della stesura, l'ultimo presidente è Gerald Ford e l'ultimo papa è Giovanni Paolo II. I tempi si basano sui dati di Computer Interactive Data Analysis, di Lunn e McNeil, John Wiley & Son. Utilizzare un livello di significatività 0,05 per verificare l'affermazione che i 2 campioni di dati sulla longevità di papi e monarchi provengono da popolazioni con la stessa mediana.
Presidenti
10 29 26 28 15 23 17 25 0 20 4 1 24 16 12 4 10 17 16 0 7 24 12 4
18 21 11 2 9 36 12 28 3 16 9 25 23 32
Papi
2 9 21 3 6 10 18 11 6 25 23 6 2 15 32 25 11 8 17 19 5 15 0 26
I monarchi 17 6 13 12 13 33 59 10 7 63 9 25 36 15
Soluzione: Dobbiamo utilizzare un test di Wilcoxon per valutare l'affermazione che i 2 campioni provengono da testati con la stessa mediana. Si ottengono i seguenti risultati:
Wilcoxon - Mann / Whitney Test |
||||
n |
somma dei ranghi |
|||
24 |
416 |
Papi |
||
14 |
325 |
Monarchi |
||
38 |
741 |
totale |
||
468.00 |
valore atteso |
|||
33.00 |
deviazione standard |
|||
-1.56 |
z, corretto per i legami |
|||
.1186 |
valore p (a due code) |
|||
No. |
Etichetta |
Dati |
Rango |
|
1 |
Papi |
2 |
2.5 |
|
2 |
Papi |
9 |
12.5 |
|
3 |
Papi |
21 |
28 |
|
4 |
Papi |
3 |
4 |
|
5 |
Papi |
6 |
7.5 |
|
6 |
Papi |
10 |
14.5 |
|
7 |
Papi |
18 |
26 |
|
8 |
Papi |
11 |
16.5 |
|
9 |
Papi |
6 |
7.5 |
|
10 |
Papi |
25 |
31 |
|
11 |
Papi |
23 |
29 |
|
12 |
Papi |
6 |
7.5 |
|
13 |
Papi |
2 |
2.5 |
|
14 |
Papi |
15 |
22 |
|
15 |
Papi |
32 |
34 |
|
16 |
Papi |
25 |
31 |
|
17 |
Papi |
11 |
16.5 |
|
18 |
Papi |
8 |
11 |
|
19 |
Papi |
17 |
24.5 |
|
20 |
Papi |
19 |
27 |
|
21 |
Papi |
5 |
5 |
|
22 |
Papi |
15 |
22 |
|
23 |
Papi |
0 |
1 |
|
24 |
Papi |
26 |
33 |
|
25 |
Monarchi |
17 |
24.5 |
|
26 |
Monarchi |
6 |
7.5 |
|
27 |
Monarchi |
13 |
19.5 |
|
28 |
Monarchi |
12 |
18 |
|
29 |
Monarchi |
13 |
19.5 |
|
30 |
Monarchi |
33 |
35 |
|
31 |
Monarchi |
59 |
37 |
|
32 |
Monarchi |
10 |
14.5 |
|
33 |
Monarchi |
7 |
10 |
|
34 |
Monarchi |
63 |
38 |
|
35 |
Monarchi |
9 |
12.5 |
|
36 |
Monarchi |
25 |
31 |
|
37 |
Monarchi |
36 |
36 |
|
38 |
Monarchi |
15 |
22 |
Dal momento che stiamo confrontando due gruppi indipendenti (Papi e monarchi), possiamo usare Wilcoxon Rank Sum Test.
Il ipotesi nulla testato è
H0: I due campioni provengono da popolazioni con la stessa mediana.
Il ipotesi alternativa è
H1: I due campioni provengono da popolazioni con mediana diversa.
Livello di significatività = 0,05
Statistica del test: I valori osservati dai risultati del campione aggregato sono classificati dal più piccolo al più grande. Dopo aver ottenuto le classifiche, i campioni vengono separati e per ciascuno viene calcolata la somma delle classifiche.
Il statistica del test usato è
\[Z=\frac{{{T}_{A}}-\frac{{{n}_{2}}\left( {{n}_{1}}+{{n}_{2}}+1 \right)}{2}}{\sqrt{\frac{{{n}_{1}}{{n}_{2}}\left( {{n}_{1}}+{{n}_{2}}+1 \right)}{12}}}\]
,
dove UN è la somma dei ranghi del campione più piccolo. Qui n 1 = 24, n 2 = 14, T UN = 416.
Therefore,\[Z=\frac{416-\frac{24\left( 14+24+1 \right)}{2}}{\sqrt{\frac{14*24\left( 14+24+1 \right)}{12}}}=-1.57\]
Criteri di rifiuto: Rifiuta l'ipotesi nulla, se il valore assoluto della statistica del test è maggiore del valore critico al livello di significatività 0,05.
Valore critico inferiore = -1,96
Valore critico superiore = 1,96
Conclusione: Non rifiuta l'ipotesi nulla, poiché il valore assoluto della statistica del test è inferiore al valore critico. Il campione non fornisce prove sufficienti per respingere l'affermazione che i due campioni provengono da popolazioni con la stessa mediana.
In caso di suggerimenti o se desideri segnalare un risolutore / calcolatore non funzionante, non esitare a farlo Contattaci .