Непараметрическая статистика, или что делать, если допущения для параметрического теста не срабатывают

В этом уроке мы собираемся затронуть тему Непараметрические тесты . См. Ниже список соответствующих примеров проблем с пошаговыми решениями.

Вопрос 1: Медицинский исследователь считает, что количество ушных инфекций у пловцов можно уменьшить, если пловцы используют беруши. Была выбрана выборка из десяти человек и зарегистрировано количество ушных инфекций за четырехмесячный период. Первые два месяца пловцы не использовали беруши; в течение следующих двух месяцев они это сделали. В начале второго двухмесячного периода каждого пловца обследовали на предмет отсутствия инфекций. Данные представлены ниже. На \(\alpha = 0.05\) может ли исследователь сделать вывод, что использование берушей влияет на количество ушных инфекций?

Решение: Нам нужно проверить гипотезы

\[\begin{aligned} & {{H}_{0}}:\text{ ear infections are the same with or without the ear plugs} \\ &{{H}_{A}}:\text{ swimmers get less ear infections with ear plugs} \\ \end{aligned}\]

Мы используем Sign-Test. Мы используем Statdisk, чтобы получить следующий результат:

Статистика \(x\) равна 2 (меньшее количество знаков). Критическое значение равно 1. Поскольку \(x\) не меньше или равно критическому значению, мы не можем отклонить нулевую гипотезу. Это означает, что у нас недостаточно доказательств, подтверждающих утверждение о том, что количество ушных инфекций у пловцов можно уменьшить, если они будут использовать беруши.

Вопрос 2: Исследования показывают, что люди, которые добровольно участвуют в исследованиях, обычно имеют более высокий интеллект, чем люди, не являющиеся добровольцами. Чтобы проверить это явление, исследователь берет выборку из 200 старшеклассников. Студентам дается описание психологического исследования и их спрашивают, согласны ли они добровольно принять в нем участие. Исследователь также получает оценку IQ для каждого студента и классифицирует студентов на группы с высоким, средним и низким IQ. Указывают ли следующие данные на значительную связь между IQ и волонтерством? Тест на уровне значимости 0,05.

Решение: В следующей таблице показана соответствующая таблица непредвиденных обстоятельств:

Наблюдаемый	Высокий	Середина	Низкий	Общий
Волонтер	43 год	73	34	150
Не волонтер	7	27	16	50

Общий	50	100	50	200

Мы заинтересованы в проверке следующих нулевых и альтернативных гипотез:

\[\begin{aligned}{{H}_{0}}:\,\,\, \text{Volunteer Status}\text{ and }\text {IQ}\text{ are independent} \\ {{H}_{A}}:\,\,\,\text{Volunteer Status}\text{ and }\text {IQ}\text{ are NOT independent} \\ \end{aligned}\]

Из таблицы выше мы вычисляем таблицу с ожидаемыми значениями

Ожидал	Высокий	Середина	Низкий
Волонтер	37,5	75	37,5
Не волонтер	12,5	25	12,5

Ниже показано, как рассчитываются эти ожидаемые частоты:

\[{E}_{{1},{1}}= \frac{ {R}_{1} \times {C}_{1} }{T}= \frac{{150} \times {50}}{{200}}={37.5},\,\,\,\, {E}_{{1},{2}}= \frac{ {R}_{1} \times {C}_{2} }{T}= \frac{{150} \times {100}}{{200}}={75},\,\,\,\, {E}_{{1},{3}}= \frac{ {R}_{1} \times {C}_{3} }{T}= \frac{{150} \times {50}}{{200}}={37.5}\]

\[,\,\,\,\, {E}_{{2},{1}}= \frac{ {R}_{2} \times {C}_{1} }{T}= \frac{{50} \times {50}}{{200}}={12.5},\,\,\,\, {E}_{{2},{2}}= \frac{ {R}_{2} \times {C}_{2} }{T}= \frac{{50} \times {100}}{{200}}={25},\,\,\,\, {E}_{{2},{3}}= \frac{ {R}_{2} \times {C}_{3} }{T}= \frac{{50} \times {50}}{{200}}={12.5}\]

Наконец, мы используем формулу \(\frac{{{\left( O-E \right)}^{2}}}{E}\), чтобы получить

(fo - fe) ² / fe	Высокий	Середина	Низкий
Волонтер	0,8067	0,0533	0,3267
Не волонтер	2,42	0,16	0,98

Необходимые расчеты показаны ниже:

\[\frac{ {\left( {43}-{37.5} \right)}^{2} }{{37.5}} ={0.8067},\,\,\,\, \frac{ {\left( {73}-{75} \right)}^{2} }{{75}} ={0.0533},\,\,\,\, \frac{ {\left( {34}-{37.5} \right)}^{2} }{{37.5}} ={0.3267},\,\,\,\, \frac{ {\left( {7}-{12.5} \right)}^{2} }{{12.5}} ={2.42}\]

\[,\,\,\,\, \frac{ {\left( {27}-{25} \right)}^{2} }{{25}} ={0.16},\,\,\,\, \frac{ {\left( {16}-{12.5} \right)}^{2} }{{12.5}} ={0.98}\]

Следовательно, значение статистики хи-квадрат равно

\[{{\chi }^{2}}=\sum{\frac{{{\left( {{O}_{ij}}-{{E}_{ij}} \right)}^{2}}}{{{E}_{ij}}}}={0.8067} + {0.0533} + {0.3267} + {2.42} + {0.16} + {0.98} = 4.747\]

Критическое значение хи-квадрат для степеней свободы \(\alpha =0.05\) и \(\left( 3-1 \right)\times \left( 2-1 \right)=2\) равно \(\chi _{C}^{2}= {5.991}\). Поскольку \({{\chi }^{2}}=\sum{\frac{{{\left( {{O}_{ij}}-{{E}_{ij}} \right)}^{2}}}{{{E}_{ij}}}}= {4.747}\) <\(\chi _{C}^{2}= {5.991}\), мы не можем отклонить нулевую гипотезу, что означает, что у нас недостаточно доказательств, чтобы отклонить нулевую гипотезу независимости.

Вопрос 3: Ниже приводится количество лет, в течение которых президенты США, папы с 1690 года и британские монархи жили после инаугурации, избрания или коронации. На момент написания последним президентом был Джеральд Форд, а последним папой - Иоанн Павел II. Время основано на данных компьютерного интерактивного анализа данных, проведенного Ланном и МакНилом, Джоном Уайли и Сыном. Используйте уровень значимости 0,05, чтобы проверить утверждение о том, что 2 образца данных о долголетии от пап и монархов относятся к популяциям с одинаковой медианной величиной.

Президенты

10 29 26 28 15 23 17 25 0 20 4 1 24 16 12 4 10 17 16 0 7 24 12 4

18 21 11 2 9 36 12 28 3 16 9 25 23 32

Папы

2 9 21 3 6 10 18 11 6 25 23 6 2 15 32 25 11 8 17 19 5 15 0 26

Монархи 17 6 13 12 13 33 59 10 7 63 9 25 36 15

Решение: Нам необходимо использовать тест Вилкоксона, чтобы оценить утверждение, что 2 образца взяты из популяций с одинаковой медианной величиной. Получены следующие результаты:

Тест Вилкоксона - Манна / Уитни

	п	сумма рангов
	24	416	Папы
	14	325	Монархи
	38	741	общий

		468,00	ожидаемое значение
		33.00	среднеквадратичное отклонение
		-1,56	z, с поправкой на связи
		.1186	p-значение (двусторонний)


Нет.	Этикетка	Данные	Классифицировать
1	Папы	2	2,5
2	Папы	9	12,5
3	Папы	21 год	28 год
4	Папы	3	4
5	Папы	6	7,5
6	Папы	10	14,5
7	Папы	18	26
8	Папы	11	16,5
9	Папы	6	7,5
10	Папы	25	31 год
11	Папы	23	29
12	Папы	6	7,5
13	Папы	2	2,5
14	Папы	15	22
15	Папы	32	34
16	Папы	25	31 год
17	Папы	11	16,5
18	Папы	8	11
19	Папы	17	24,5
20	Папы	19	27
21 год	Папы	5	5
22	Папы	15	22
23	Папы	0	1
24	Папы	26	33
25	Монархи	17	24,5
26	Монархи	6	7,5
27	Монархи	13	19,5
28 год	Монархи	12	18
29	Монархи	13	19,5
30	Монархи	33	35 год
31 год	Монархи	59	37
32	Монархи	10	14,5
33	Монархи	7	10
34	Монархи	63	38
35 год	Монархи	9	12,5
36	Монархи	25	31 год
37	Монархи	36	36
38	Монархи	15	22

Поскольку мы сравниваем две независимые группы (Папы и Монархи), мы можем использовать Тест суммы рангов Вилкоксона.

В нулевая гипотеза проверено

H0: Две выборки взяты из популяций с одинаковой медианной величиной.

В Альтернативная гипотеза является

H1: Две выборки взяты из популяций с разной медианной величиной.

Уровень значимости = 0,05

Статистика теста: Наблюдаемые значения из результатов объединенной выборки ранжируются от наименьшего к наибольшему. После получения рейтингов образцы разделяются, и для каждой вычисляется сумма рейтингов.

В статистика теста используется

\[Z=\frac{{{T}_{A}}-\frac{{{n}_{2}}\left( {{n}_{1}}+{{n}_{2}}+1 \right)}{2}}{\sqrt{\frac{{{n}_{1}}{{n}_{2}}\left( {{n}_{1}}+{{n}_{2}}+1 \right)}{12}}}\]

где T _А - сумма рангов меньшей выборки. Здесь n ₁ = 24, п ₂ = 14, Т _А = 416.

Therefore,

\[Z=\frac{416-\frac{24\left( 14+24+1 \right)}{2}}{\sqrt{\frac{14*24\left( 14+24+1 \right)}{12}}}=-1.57\]

Критерии отказа: Отклоните нулевую гипотезу, если абсолютное значение тестовой статистики больше критического значения на уровне значимости 0,05.

Нижнее критическое значение = -1,96

Верхнее критическое значение = 1,96

Заключение: Невозможно отвергнуть нулевую гипотезу, поскольку абсолютное значение тестовой статистики меньше критического значения. Выборка не предоставляет достаточно доказательств, чтобы опровергнуть утверждение о том, что две выборки взяты из популяций с одинаковой медианной величиной.

Это руководство любезно предоставлено вам MyGeekyTutor.com

Если у вас есть какие-либо предложения или вы хотите сообщить о неисправности решателя / калькулятора, не стесняйтесь связаться с нами .