Dans ce tutoriel, nous allons couvrir le sujet de Tests non paramétriques . Voir ci-dessous une liste d'exemples de problèmes pertinents, avec des solutions étape par étape.
Question 1: Un chercheur médical estime que le nombre d'infections de l'oreille chez les nageurs peut être réduit si le les nageurs utilisent des bouchons d'oreille. Un échantillon de dix personnes a été sélectionné et le nombre d’otites sur une période de quatre mois a été enregistré. Au cours des deux premiers mois, les nageurs n'ont pas été utilisés de bouchons d'oreille; pendant les deux mois suivants, ils ont fait. Au début de la deuxième période de deux mois, chaque nageur a été examiné pour vérifier qu'une infection n'était présente. Les données sont présentées ci-dessous. À \(\alpha = 0.05\), le chercheur peut-il conclure que l'utilisation de bouchons d'oreille affecte le nombre d'infections de l'oreille?
Solution: Nous devons tester les hypothèses
\[\begin{aligned} & {{H}_{0}}:\text{ ear infections are the same with or without the ear plugs} \\ &{{H}_{A}}:\text{ swimmers get less ear infections with ear plugs} \\ \end{aligned}\]
Nous utilisons un test de signe. Nous utilisons Statdisk pour obtenir la sortie suivante:
La statistique \(x\) est égale à 2 (le nombre de signes le moins fréquent). La valeur critique est 1. Puisque \(x\) n'est pas inférieur ou égal à la valeur critique, nous ne parvenons pas à rejeter l'hypothèse nulle. Cela signifie que nous n'avons pas suffisamment de preuves pour soutenir l'affirmation selon laquelle le nombre d'infections de l'oreille chez les nageurs peut être réduit si les nageurs utilisent des bouchons d'oreille.
Question 2: Les recherches indiquent que les personnes qui se portent volontaires pour participer à des études de recherche ont tendance à avoir une intelligence plus élevée que les non-volontaires. Pour tester ce phénomène, un chercheur obtient un échantillon de 200 lycéens. Les étudiants reçoivent une description d'une étude de recherche psychologique et on leur demande s'ils seraient volontaires pour y participer. Le chercheur obtient également un score de QI pour chaque élève et classe les étudiants en groupes de QI élevé, moyen et faible. Les données suivantes indiquent-elles une relation significative entre le QI et le volontariat? Test au niveau de signification de 0,05.
Solution: Le tableau suivant présente le tableau de contingence correspondant:
Observé |
Haute |
Moyen |
Faible |
Total |
Bénévole |
43 |
73 |
34 |
150 |
Pas bénévole |
7 |
27 |
16 |
50 |
Total |
50 |
100 |
50 |
200 |
Nous souhaitons tester les hypothèses nulles et alternatives suivantes:
\[\begin{aligned}{{H}_{0}}:\,\,\, \text{Volunteer Status}\text{ and }\text {IQ}\text{ are independent} \\ {{H}_{A}}:\,\,\,\text{Volunteer Status}\text{ and }\text {IQ}\text{ are NOT independent} \\ \end{aligned}\]
À partir du tableau ci-dessus, nous calculons le tableau avec les valeurs attendues
Attendu |
Haute |
Moyen |
Faible |
Bénévole |
37,5 |
75 |
37,5 |
Pas bénévole |
12,5 |
25 |
12,5 |
La façon dont ces fréquences attendues sont calculées est indiquée ci-dessous:
\[{E}_{{1},{1}}= \frac{ {R}_{1} \times {C}_{1} }{T}= \frac{{150} \times {50}}{{200}}={37.5},\,\,\,\, {E}_{{1},{2}}= \frac{ {R}_{1} \times {C}_{2} }{T}= \frac{{150} \times {100}}{{200}}={75},\,\,\,\, {E}_{{1},{3}}= \frac{ {R}_{1} \times {C}_{3} }{T}= \frac{{150} \times {50}}{{200}}={37.5}\]
\[,\,\,\,\, {E}_{{2},{1}}= \frac{ {R}_{2} \times {C}_{1} }{T}= \frac{{50} \times {50}}{{200}}={12.5},\,\,\,\, {E}_{{2},{2}}= \frac{ {R}_{2} \times {C}_{2} }{T}= \frac{{50} \times {100}}{{200}}={25},\,\,\,\, {E}_{{2},{3}}= \frac{ {R}_{2} \times {C}_{3} }{T}= \frac{{50} \times {50}}{{200}}={12.5}\]
Enfin, nous utilisons la formule \(\frac{{{\left( O-E \right)}^{2}}}{E}\) pour obtenir
(fo - fe) ² / fe |
Haute |
Moyen |
Faible |
Bénévole |
0.8067 |
0,0533 |
0,3267 |
Pas bénévole |
2,42 |
0,16 |
0,98 |
Les calculs nécessaires sont indiqués ci-dessous:
\[\frac{ {\left( {43}-{37.5} \right)}^{2} }{{37.5}} ={0.8067},\,\,\,\, \frac{ {\left( {73}-{75} \right)}^{2} }{{75}} ={0.0533},\,\,\,\, \frac{ {\left( {34}-{37.5} \right)}^{2} }{{37.5}} ={0.3267},\,\,\,\, \frac{ {\left( {7}-{12.5} \right)}^{2} }{{12.5}} ={2.42}\]
\[,\,\,\,\, \frac{ {\left( {27}-{25} \right)}^{2} }{{25}} ={0.16},\,\,\,\, \frac{ {\left( {16}-{12.5} \right)}^{2} }{{12.5}} ={0.98}\]
Par conséquent, la valeur des statistiques du chi carré est
\[{{\chi }^{2}}=\sum{\frac{{{\left( {{O}_{ij}}-{{E}_{ij}} \right)}^{2}}}{{{E}_{ij}}}}={0.8067} + {0.0533} + {0.3267} + {2.42} + {0.16} + {0.98} = 4.747\]
La valeur critique du chi carré pour les degrés de liberté \(\alpha =0.05\) et \(\left( 3-1 \right)\times \left( 2-1 \right)=2\) est \(\chi _{C}^{2}= {5.991}\). Puisque \({{\chi }^{2}}=\sum{\frac{{{\left( {{O}_{ij}}-{{E}_{ij}} \right)}^{2}}}{{{E}_{ij}}}}= {4.747}\) <\(\chi _{C}^{2}= {5.991}\), nous ne parvenons pas à rejeter l'hypothèse nulle, ce qui signifie que nous n'avons pas suffisamment de preuves pour rejeter l'hypothèse nulle d'indépendance.
Question 3: Vous trouverez ci-dessous le nombre d'années pendant lesquelles les présidents américains, les papes depuis 1690 et les monarques britanniques ont vécu après leur inauguration, leur élection ou leur couronnement. Au moment de la rédaction de cet article, le dernier président est Gerald Ford et le dernier pape est Jean-Paul II. Les heures sont basées sur les données de l'analyse de données interactive par ordinateur, par Lunn et McNeil, John Wiley & Son. Utilisez un niveau de signification de 0,05 pour tester l'affirmation selon laquelle les 2 échantillons de données sur la longévité des papes et des monarques proviennent de populations ayant la même médiane.
Présidents
10 29 26 28 15 23 17 25 0 20 4 1 24 16 12 4 10 17 16 0 7 24 12 4
18 21 11 2 9 36 12 28 3 16 9 25 23 32
Les papes
2 9 21 3 6 10 18 11 6 25 23 6 2 15 32 25 11 8 17 19 5 15 0 26
Monarques 17 6 13 12 13 33 59 10 7 63 9 25 36 15
Solution: Nous devons utiliser un test de Wilcoxon afin d'écrire l'affirmation selon laquelle les 2 échantillons provenant de populations de même médiane. Les résultats suivants sont obtenus:
Wilcoxon - Test de Mann / Whitney |
||||
n |
somme des rangs |
|||
24 |
416 |
Les papes |
||
14 |
325 |
Monarques |
||
38 |
741 |
total |
||
468,00 |
valeur attendue |
|||
33,00 |
écart-type |
|||
-1,56 |
z, corrigé pour les liens |
|||
.1186 |
valeur p (bilatérale) |
|||
Non. |
Étiquette |
Les données |
Rang |
|
1 |
Les papes |
2 |
2,5 |
|
2 |
Les papes |
9 |
12,5 |
|
3 |
Les papes |
21 |
28 |
|
4 |
Les papes |
3 |
4 |
|
5 |
Les papes |
6 |
7,5 |
|
6 |
Les papes |
dix |
14,5 |
|
7 |
Les papes |
18 |
26 |
|
8 |
Les papes |
11 |
16,5 |
|
9 |
Les papes |
6 |
7,5 |
|
dix |
Les papes |
25 |
31 |
|
11 |
Les papes |
23 |
29 |
|
12 |
Les papes |
6 |
7,5 |
|
13 |
Les papes |
2 |
2,5 |
|
14 |
Les papes |
15 |
22 |
|
15 |
Les papes |
32 |
34 |
|
16 |
Les papes |
25 |
31 |
|
17 |
Les papes |
11 |
16,5 |
|
18 |
Les papes |
8 |
11 |
|
19 |
Les papes |
17 |
24,5 |
|
20 |
Les papes |
19 |
27 |
|
21 |
Les papes |
5 |
5 |
|
22 |
Les papes |
15 |
22 |
|
23 |
Les papes |
0 |
1 |
|
24 |
Les papes |
26 |
33 |
|
25 |
Monarques |
17 |
24,5 |
|
26 |
Monarques |
6 |
7,5 |
|
27 |
Monarques |
13 |
19,5 |
|
28 |
Monarques |
12 |
18 |
|
29 |
Monarques |
13 |
19,5 |
|
30 |
Monarques |
33 |
35 |
|
31 |
Monarques |
59 |
37 |
|
32 |
Monarques |
dix |
14,5 |
|
33 |
Monarques |
7 |
dix |
|
34 |
Monarques |
63 |
38 |
|
35 |
Monarques |
9 |
12,5 |
|
36 |
Monarques |
25 |
31 |
|
37 |
Monarques |
36 |
36 |
|
38 |
Monarques |
15 |
22 |
Puisque nous comparons deux groupes indépendants (papes et monarques), nous pouvons utiliser Test de la somme des rangs de Wilcoxon.
le hypothèse nulle testé est
H0: Les deux échantillons proviennent de populations de même médiane.
le hypothèse alternative est
H1: Les deux échantillons proviennent de populations de médiane différente.
Niveau de signification = 0,05
Statistique de test: Les valeurs observées à partir des résultats de l'échantillon groupé sont classées du plus petit au plus grand. Une fois les classements obtenus, les échantillons sont séparés et la somme des classements est calculée pour chacun.
le statistique de test utilisé est
\[Z=\frac{{{T}_{A}}-\frac{{{n}_{2}}\left( {{n}_{1}}+{{n}_{2}}+1 \right)}{2}}{\sqrt{\frac{{{n}_{1}}{{n}_{2}}\left( {{n}_{1}}+{{n}_{2}}+1 \right)}{12}}}\]
,
où T UNE est la somme des rangs du plus petit échantillon. Ici n 1 = 24, n 2 = 14, T UNE = 416.
Therefore,\[Z=\frac{416-\frac{24\left( 14+24+1 \right)}{2}}{\sqrt{\frac{14*24\left( 14+24+1 \right)}{12}}}=-1.57\]
Critères de rejet: Rejetez l'hypothèse nulle si la valeur absolue de la statistique de test est supérieure à la valeur critique au niveau de signification de 0,05.
Valeur critique inférieure = -1,96
Valeur critique supérieure = 1,96
Conclusion: Ne rejette pas l'hypothèse nulle, car la valeur absolue de la statistique de test est inférieure à la valeur critique. L'échantillon ne fournit pas suffisamment de preuves pour rejeter l'affirmation selon laquelle les deux échantillons proviennent de populations ayant la même médiane.
Si vous avez des suggestions, ou si vous souhaitez signaler un solveur / calculateur défectueux, n'hésitez pas à Nous contacter .