В этом уроке мы собираемся затронуть тему Непараметрические тесты . См. Ниже список соответствующих примеров проблем с пошаговыми решениями.
Вопрос 1: Медицинский исследователь считает, что количество ушных инфекций у пловцов можно уменьшить, если пловцы используют беруши. Была выбрана выборка из десяти человек и зарегистрировано количество ушных инфекций за четырехмесячный период. Первые два месяца пловцы не использовали беруши; в течение следующих двух месяцев они это сделали. В начале второго двухмесячного периода каждого пловца обследовали на предмет отсутствия инфекций. Данные представлены ниже. На \(\alpha = 0.05\) может ли исследователь сделать вывод, что использование берушей влияет на количество ушных инфекций?
Решение: Нам нужно проверить гипотезы
\[\begin{aligned} & {{H}_{0}}:\text{ ear infections are the same with or without the ear plugs} \\ &{{H}_{A}}:\text{ swimmers get less ear infections with ear plugs} \\ \end{aligned}\]
Мы используем Sign-Test. Мы используем Statdisk, чтобы получить следующий результат:
Статистика \(x\) равна 2 (меньшее количество знаков). Критическое значение равно 1. Поскольку \(x\) не меньше или равно критическому значению, мы не можем отклонить нулевую гипотезу. Это означает, что у нас недостаточно доказательств, подтверждающих утверждение о том, что количество ушных инфекций у пловцов можно уменьшить, если они будут использовать беруши.
Вопрос 2: Исследования показывают, что люди, которые добровольно участвуют в исследованиях, обычно имеют более высокий интеллект, чем люди, не являющиеся добровольцами. Чтобы проверить это явление, исследователь берет выборку из 200 старшеклассников. Студентам дается описание психологического исследования и их спрашивают, согласны ли они добровольно принять в нем участие. Исследователь также получает оценку IQ для каждого студента и классифицирует студентов на группы с высоким, средним и низким IQ. Указывают ли следующие данные на значительную связь между IQ и волонтерством? Тест на уровне значимости 0,05.
Решение: В следующей таблице показана соответствующая таблица непредвиденных обстоятельств:
Наблюдаемый |
Высокий |
Середина |
Низкий |
Общий |
Волонтер |
43 год |
73 |
34 |
150 |
Не волонтер |
7 |
27 |
16 |
50 |
Общий |
50 |
100 |
50 |
200 |
Мы заинтересованы в проверке следующих нулевых и альтернативных гипотез:
\[\begin{aligned}{{H}_{0}}:\,\,\, \text{Volunteer Status}\text{ and }\text {IQ}\text{ are independent} \\ {{H}_{A}}:\,\,\,\text{Volunteer Status}\text{ and }\text {IQ}\text{ are NOT independent} \\ \end{aligned}\]
Из таблицы выше мы вычисляем таблицу с ожидаемыми значениями
Ожидал |
Высокий |
Середина |
Низкий |
Волонтер |
37,5 |
75 |
37,5 |
Не волонтер |
12,5 |
25 |
12,5 |
Ниже показано, как рассчитываются эти ожидаемые частоты:
\[{E}_{{1},{1}}= \frac{ {R}_{1} \times {C}_{1} }{T}= \frac{{150} \times {50}}{{200}}={37.5},\,\,\,\, {E}_{{1},{2}}= \frac{ {R}_{1} \times {C}_{2} }{T}= \frac{{150} \times {100}}{{200}}={75},\,\,\,\, {E}_{{1},{3}}= \frac{ {R}_{1} \times {C}_{3} }{T}= \frac{{150} \times {50}}{{200}}={37.5}\]
\[,\,\,\,\, {E}_{{2},{1}}= \frac{ {R}_{2} \times {C}_{1} }{T}= \frac{{50} \times {50}}{{200}}={12.5},\,\,\,\, {E}_{{2},{2}}= \frac{ {R}_{2} \times {C}_{2} }{T}= \frac{{50} \times {100}}{{200}}={25},\,\,\,\, {E}_{{2},{3}}= \frac{ {R}_{2} \times {C}_{3} }{T}= \frac{{50} \times {50}}{{200}}={12.5}\]
Наконец, мы используем формулу \(\frac{{{\left( O-E \right)}^{2}}}{E}\), чтобы получить
(fo - fe) ² / fe |
Высокий |
Середина |
Низкий |
Волонтер |
0,8067 |
0,0533 |
0,3267 |
Не волонтер |
2,42 |
0,16 |
0,98 |
Необходимые расчеты показаны ниже:
\[\frac{ {\left( {43}-{37.5} \right)}^{2} }{{37.5}} ={0.8067},\,\,\,\, \frac{ {\left( {73}-{75} \right)}^{2} }{{75}} ={0.0533},\,\,\,\, \frac{ {\left( {34}-{37.5} \right)}^{2} }{{37.5}} ={0.3267},\,\,\,\, \frac{ {\left( {7}-{12.5} \right)}^{2} }{{12.5}} ={2.42}\]
\[,\,\,\,\, \frac{ {\left( {27}-{25} \right)}^{2} }{{25}} ={0.16},\,\,\,\, \frac{ {\left( {16}-{12.5} \right)}^{2} }{{12.5}} ={0.98}\]
Следовательно, значение статистики хи-квадрат равно
\[{{\chi }^{2}}=\sum{\frac{{{\left( {{O}_{ij}}-{{E}_{ij}} \right)}^{2}}}{{{E}_{ij}}}}={0.8067} + {0.0533} + {0.3267} + {2.42} + {0.16} + {0.98} = 4.747\]
Критическое значение хи-квадрат для степеней свободы \(\alpha =0.05\) и \(\left( 3-1 \right)\times \left( 2-1 \right)=2\) равно \(\chi _{C}^{2}= {5.991}\). Поскольку \({{\chi }^{2}}=\sum{\frac{{{\left( {{O}_{ij}}-{{E}_{ij}} \right)}^{2}}}{{{E}_{ij}}}}= {4.747}\) <\(\chi _{C}^{2}= {5.991}\), мы не можем отклонить нулевую гипотезу, что означает, что у нас недостаточно доказательств, чтобы отклонить нулевую гипотезу независимости.
Вопрос 3: Ниже приводится количество лет, в течение которых президенты США, папы с 1690 года и британские монархи жили после инаугурации, избрания или коронации. На момент написания последним президентом был Джеральд Форд, а последним папой - Иоанн Павел II. Время основано на данных компьютерного интерактивного анализа данных, проведенного Ланном и МакНилом, Джоном Уайли и Сыном. Используйте уровень значимости 0,05, чтобы проверить утверждение о том, что 2 образца данных о долголетии от пап и монархов относятся к популяциям с одинаковой медианной величиной.
Президенты
10 29 26 28 15 23 17 25 0 20 4 1 24 16 12 4 10 17 16 0 7 24 12 4
18 21 11 2 9 36 12 28 3 16 9 25 23 32
Папы
2 9 21 3 6 10 18 11 6 25 23 6 2 15 32 25 11 8 17 19 5 15 0 26
Монархи 17 6 13 12 13 33 59 10 7 63 9 25 36 15
Решение: Нам необходимо использовать тест Вилкоксона, чтобы оценить утверждение, что 2 образца взяты из популяций с одинаковой медианной величиной. Получены следующие результаты:
Тест Вилкоксона - Манна / Уитни |
||||
п |
сумма рангов |
|||
24 |
416 |
Папы |
||
14 |
325 |
Монархи |
||
38 |
741 |
общий |
||
468,00 |
ожидаемое значение |
|||
33.00 |
среднеквадратичное отклонение |
|||
-1,56 |
z, с поправкой на связи |
|||
.1186 |
p-значение (двусторонний) |
|||
Нет. |
Этикетка |
Данные |
Классифицировать |
|
1 |
Папы |
2 |
2,5 |
|
2 |
Папы |
9 |
12,5 |
|
3 |
Папы |
21 год |
28 год |
|
4 |
Папы |
3 |
4 |
|
5 |
Папы |
6 |
7,5 |
|
6 |
Папы |
10 |
14,5 |
|
7 |
Папы |
18 |
26 |
|
8 |
Папы |
11 |
16,5 |
|
9 |
Папы |
6 |
7,5 |
|
10 |
Папы |
25 |
31 год |
|
11 |
Папы |
23 |
29 |
|
12 |
Папы |
6 |
7,5 |
|
13 |
Папы |
2 |
2,5 |
|
14 |
Папы |
15 |
22 |
|
15 |
Папы |
32 |
34 |
|
16 |
Папы |
25 |
31 год |
|
17 |
Папы |
11 |
16,5 |
|
18 |
Папы |
8 |
11 |
|
19 |
Папы |
17 |
24,5 |
|
20 |
Папы |
19 |
27 |
|
21 год |
Папы |
5 |
5 |
|
22 |
Папы |
15 |
22 |
|
23 |
Папы |
0 |
1 |
|
24 |
Папы |
26 |
33 |
|
25 |
Монархи |
17 |
24,5 |
|
26 |
Монархи |
6 |
7,5 |
|
27 |
Монархи |
13 |
19,5 |
|
28 год |
Монархи |
12 |
18 |
|
29 |
Монархи |
13 |
19,5 |
|
30 |
Монархи |
33 |
35 год |
|
31 год |
Монархи |
59 |
37 |
|
32 |
Монархи |
10 |
14,5 |
|
33 |
Монархи |
7 |
10 |
|
34 |
Монархи |
63 |
38 |
|
35 год |
Монархи |
9 |
12,5 |
|
36 |
Монархи |
25 |
31 год |
|
37 |
Монархи |
36 |
36 |
|
38 |
Монархи |
15 |
22 |
Поскольку мы сравниваем две независимые группы (Папы и Монархи), мы можем использовать Тест суммы рангов Вилкоксона.
В нулевая гипотеза проверено
H0: Две выборки взяты из популяций с одинаковой медианной величиной.
В Альтернативная гипотеза является
H1: Две выборки взяты из популяций с разной медианной величиной.
Уровень значимости = 0,05
Статистика теста: Наблюдаемые значения из результатов объединенной выборки ранжируются от наименьшего к наибольшему. После получения рейтингов образцы разделяются, и для каждой вычисляется сумма рейтингов.
В статистика теста используется
\[Z=\frac{{{T}_{A}}-\frac{{{n}_{2}}\left( {{n}_{1}}+{{n}_{2}}+1 \right)}{2}}{\sqrt{\frac{{{n}_{1}}{{n}_{2}}\left( {{n}_{1}}+{{n}_{2}}+1 \right)}{12}}}\]
,
где T А - сумма рангов меньшей выборки. Здесь n 1 = 24, п 2 = 14, Т А = 416.
Therefore,\[Z=\frac{416-\frac{24\left( 14+24+1 \right)}{2}}{\sqrt{\frac{14*24\left( 14+24+1 \right)}{12}}}=-1.57\]
Критерии отказа: Отклоните нулевую гипотезу, если абсолютное значение тестовой статистики больше критического значения на уровне значимости 0,05.
Нижнее критическое значение = -1,96
Верхнее критическое значение = 1,96
Заключение: Невозможно отвергнуть нулевую гипотезу, поскольку абсолютное значение тестовой статистики меньше критического значения. Выборка не предоставляет достаточно доказательств, чтобы опровергнуть утверждение о том, что две выборки взяты из популяций с одинаковой медианной величиной.
Если у вас есть какие-либо предложения или вы хотите сообщить о неисправности решателя / калькулятора, не стесняйтесь связаться с нами .