Statistiques non paramétriques, ou que faire lorsque les hypothèses d'un test paramétrique échouent


Question 1: Un chercheur médical estime que le nombre d'infections de l'oreille chez les nageurs peut être réduit si le les nageurs utilisent des bouchons d'oreille. Un échantillon de dix personnes a été sélectionné et le nombre d’otites sur une période de quatre mois a été enregistré. Au cours des deux premiers mois, les nageurs n'ont pas été utilisés de bouchons d'oreille; pendant les deux mois suivants, ils ont fait. Au début de la deuxième période de deux mois, chaque nageur a été examiné pour vérifier qu'une infection n'était présente. Les données sont présentées ci-dessous. À \(\alpha = 0.05\), le chercheur peut-il conclure que l'utilisation de bouchons d'oreille affecte le nombre d'infections de l'oreille?

Solution: Nous devons tester les hypothèses

\[\begin{aligned} & {{H}_{0}}:\text{ ear infections are the same with or without the ear plugs} \\ &{{H}_{A}}:\text{ swimmers get less ear infections with ear plugs} \\ \end{aligned}\]

Nous utilisons un test de signe. Nous utilisons Statdisk pour obtenir la sortie suivante:

La statistique \(x\) est égale à 2 (le nombre de signes le moins fréquent). La valeur critique est 1. Puisque \(x\) n'est pas inférieur ou égal à la valeur critique, nous ne parvenons pas à rejeter l'hypothèse nulle. Cela signifie que nous n'avons pas suffisamment de preuves pour soutenir l'affirmation selon laquelle le nombre d'infections de l'oreille chez les nageurs peut être réduit si les nageurs utilisent des bouchons d'oreille.



Question 2: Les recherches indiquent que les personnes qui se portent volontaires pour participer à des études de recherche ont tendance à avoir une intelligence plus élevée que les non-volontaires. Pour tester ce phénomène, un chercheur obtient un échantillon de 200 lycéens. Les étudiants reçoivent une description d'une étude de recherche psychologique et on leur demande s'ils seraient volontaires pour y participer. Le chercheur obtient également un score de QI pour chaque élève et classe les étudiants en groupes de QI élevé, moyen et faible. Les données suivantes indiquent-elles une relation significative entre le QI et le volontariat? Test au niveau de signification de 0,05.

Solution: Le tableau suivant présente le tableau de contingence correspondant:

Observé

Haute

Moyen

Faible

Total

Bénévole

43

73

34

150

Pas bénévole

7

27

16

50

Total

50

100

50

200


Nous souhaitons tester les hypothèses nulles et alternatives suivantes:

\[\begin{aligned}{{H}_{0}}:\,\,\, \text{Volunteer Status}\text{ and }\text {IQ}\text{ are independent} \\ {{H}_{A}}:\,\,\,\text{Volunteer Status}\text{ and }\text {IQ}\text{ are NOT independent} \\ \end{aligned}\]

À partir du tableau ci-dessus, nous calculons le tableau avec les valeurs attendues

Attendu

Haute

Moyen

Faible

Bénévole

37,5

75

37,5

Pas bénévole

12,5

25

12,5


La façon dont ces fréquences attendues sont calculées est indiquée ci-dessous:

\[{E}_{{1},{1}}= \frac{ {R}_{1} \times {C}_{1} }{T}= \frac{{150} \times {50}}{{200}}={37.5},\,\,\,\, {E}_{{1},{2}}= \frac{ {R}_{1} \times {C}_{2} }{T}= \frac{{150} \times {100}}{{200}}={75},\,\,\,\, {E}_{{1},{3}}= \frac{ {R}_{1} \times {C}_{3} }{T}= \frac{{150} \times {50}}{{200}}={37.5}\]

\[,\,\,\,\, {E}_{{2},{1}}= \frac{ {R}_{2} \times {C}_{1} }{T}= \frac{{50} \times {50}}{{200}}={12.5},\,\,\,\, {E}_{{2},{2}}= \frac{ {R}_{2} \times {C}_{2} }{T}= \frac{{50} \times {100}}{{200}}={25},\,\,\,\, {E}_{{2},{3}}= \frac{ {R}_{2} \times {C}_{3} }{T}= \frac{{50} \times {50}}{{200}}={12.5}\]

Enfin, nous utilisons la formule \(\frac{{{\left( O-E \right)}^{2}}}{E}\) pour obtenir

(fo - fe) ² / fe

Haute

Moyen

Faible

Bénévole

0.8067

0,0533

0,3267

Pas bénévole

2,42

0,16

0,98


Les calculs nécessaires sont indiqués ci-dessous:

\[\frac{ {\left( {43}-{37.5} \right)}^{2} }{{37.5}} ={0.8067},\,\,\,\, \frac{ {\left( {73}-{75} \right)}^{2} }{{75}} ={0.0533},\,\,\,\, \frac{ {\left( {34}-{37.5} \right)}^{2} }{{37.5}} ={0.3267},\,\,\,\, \frac{ {\left( {7}-{12.5} \right)}^{2} }{{12.5}} ={2.42}\]

\[,\,\,\,\, \frac{ {\left( {27}-{25} \right)}^{2} }{{25}} ={0.16},\,\,\,\, \frac{ {\left( {16}-{12.5} \right)}^{2} }{{12.5}} ={0.98}\]

Par conséquent, la valeur des statistiques du chi carré est

\[{{\chi }^{2}}=\sum{\frac{{{\left( {{O}_{ij}}-{{E}_{ij}} \right)}^{2}}}{{{E}_{ij}}}}={0.8067} + {0.0533} + {0.3267} + {2.42} + {0.16} + {0.98} = 4.747\]

La valeur critique du chi carré pour les degrés de liberté \(\alpha =0.05\) et \(\left( 3-1 \right)\times \left( 2-1 \right)=2\) est \(\chi _{C}^{2}= {5.991}\). Puisque \({{\chi }^{2}}=\sum{\frac{{{\left( {{O}_{ij}}-{{E}_{ij}} \right)}^{2}}}{{{E}_{ij}}}}= {4.747}\) <\(\chi _{C}^{2}= {5.991}\), nous ne parvenons pas à rejeter l'hypothèse nulle, ce qui signifie que nous n'avons pas suffisamment de preuves pour rejeter l'hypothèse nulle d'indépendance.



Question 3: Vous trouverez ci-dessous le nombre d'années pendant lesquelles les présidents américains, les papes depuis 1690 et les monarques britanniques ont vécu après leur inauguration, leur élection ou leur couronnement. Au moment de la rédaction de cet article, le dernier président est Gerald Ford et le dernier pape est Jean-Paul II. Les heures sont basées sur les données de l'analyse de données interactive par ordinateur, par Lunn et McNeil, John Wiley & Son. Utilisez un niveau de signification de 0,05 pour tester l'affirmation selon laquelle les 2 échantillons de données sur la longévité des papes et des monarques proviennent de populations ayant la même médiane.

Présidents

10 29 26 28 15 23 17 25 0 20 4 1 24 16 12 4 10 17 16 0 7 24 12 4

18 21 11 2 9 36 12 28 3 16 9 25 23 32

Les papes

2 9 21 3 6 10 18 11 6 25 23 6 2 15 32 25 11 8 17 19 5 15 0 26

Monarques 17 6 ​​13 12 13 33 59 10 7 63 9 25 36 15

Solution: Nous devons utiliser un test de Wilcoxon afin d'écrire l'affirmation selon laquelle les 2 échantillons provenant de populations de même médiane. Les résultats suivants sont obtenus:

Wilcoxon - Test de Mann / Whitney

n

somme des rangs

24

416

Les papes

14

325

Monarques

38

741

total

468,00

valeur attendue

33,00

écart-type

-1,56

z, corrigé pour les liens

.1186

valeur p (bilatérale)

Non.

Étiquette

Les données

Rang

1

Les papes

2

2,5

2

Les papes

9

12,5

3

Les papes

21

28

4

Les papes

3

4

5

Les papes

6

7,5

6

Les papes

dix

14,5

7

Les papes

18

26

8

Les papes

11

16,5

9

Les papes

6

7,5

dix

Les papes

25

31

11

Les papes

23

29

12

Les papes

6

7,5

13

Les papes

2

2,5

14

Les papes

15

22

15

Les papes

32

34

16

Les papes

25

31

17

Les papes

11

16,5

18

Les papes

8

11

19

Les papes

17

24,5

20

Les papes

19

27

21

Les papes

5

5

22

Les papes

15

22

23

Les papes

0

1

24

Les papes

26

33

25

Monarques

17

24,5

26

Monarques

6

7,5

27

Monarques

13

19,5

28

Monarques

12

18

29

Monarques

13

19,5

30

Monarques

33

35

31

Monarques

59

37

32

Monarques

dix

14,5

33

Monarques

7

dix

34

Monarques

63

38

35

Monarques

9

12,5

36

Monarques

25

31

37

Monarques

36

36

38

Monarques

15

22


Puisque nous comparons deux groupes indépendants (papes et monarques), nous pouvons utiliser Test de la somme des rangs de Wilcoxon.

le hypothèse nulle testé est

H0: Les deux échantillons proviennent de populations de même médiane.

le hypothèse alternative est

H1: Les deux échantillons proviennent de populations de médiane différente.

Niveau de signification = 0,05

Statistique de test: Les valeurs observées à partir des résultats de l'échantillon groupé sont classées du plus petit au plus grand. Une fois les classements obtenus, les échantillons sont séparés et la somme des classements est calculée pour chacun.

le statistique de test utilisé est

\[Z=\frac{{{T}_{A}}-\frac{{{n}_{2}}\left( {{n}_{1}}+{{n}_{2}}+1 \right)}{2}}{\sqrt{\frac{{{n}_{1}}{{n}_{2}}\left( {{n}_{1}}+{{n}_{2}}+1 \right)}{12}}}\]

,

où T UNE est la somme des rangs du plus petit échantillon. Ici n 1 = 24, n 2 = 14, T UNE = 416.

Therefore,

\[Z=\frac{416-\frac{24\left( 14+24+1 \right)}{2}}{\sqrt{\frac{14*24\left( 14+24+1 \right)}{12}}}=-1.57\]

Critères de rejet: Rejetez l'hypothèse nulle si la valeur absolue de la statistique de test est supérieure à la valeur critique au niveau de signification de 0,05.

Valeur critique inférieure = -1,96

Valeur critique supérieure = 1,96

Conclusion: Ne rejette pas l'hypothèse nulle, car la valeur absolue de la statistique de test est inférieure à la valeur critique. L'échantillon ne fournit pas suffisamment de preuves pour rejeter l'affirmation selon laquelle les deux échantillons proviennent de populations ayant la même médiane.

Ce tutoriel vous est offert gracieusement par MyGeekyTutor.com



Si vous avez des suggestions, ou si vous souhaitez signaler un solveur / calculateur défectueux, n'hésitez pas à Nous contacter .

s'identifier

Vous n'avez pas de compte de membre?
s'inscrire

réinitialiser le mot de passe

Retour à
s'identifier

s'inscrire

Retour à
s'identifier