Учебное пособие по ANOVA
В уроке на этой неделе мы рассмотрим тему Дисперсионный анализ . См. Ниже список соответствующих примеров проблем с пошаговыми решениями.
Надеемся, они вам пригодятся. Мы делимся полными учебниками, советами и подсказками с членами нашего сообщества. Пожалуйста, не стесняйтесь связаться с нами если у вас есть вопросы.
Примеры задач ANOVA
Вопрос 1: Дисперсионный анализ использовался для оценки средних различий от повторных измерений. научное исследование. Результаты были представлены как F (3,24) = 6,40.
а. Сколько условий лечения сравнивалось в исследовании?
б. Сколько человек участвовало в исследовании?
Решение: (а) Было 3 + 1 = 4 условия лечения.
(б) Общее количество особей 3 + 24 + 1 = 28.
Вопрос 2: Следующие данные представляют собой результаты независимого исследования, в котором сравнивались три вида лечения.
а. Вычислить СС для набора из 3 лечебных средств. (Используйте три средства как набор из n = 3 баллов и вычислите SS.)
б. Используя результат части a, вычислите n (SSmeans). Обратите внимание, что это значение равно SS между (см. Уравнение 13.6).
c. Теперь вычислите SSbetween по вычислительной формуле, используя значения T (уравнение 13.7). Вы должны получить тот же результат, что и в части b.
Решение: (а) Получаем \(\bar{M}=\frac{2+3+7}{3}=4\)
что обозначает
\[S{{S}_{Means}}={{\left( 2-4 \right)}^{2}}+{{\left( 3-4 \right)}^{2}}+{{\left( 7-4 \right)}^{2}}=4+1+9=14\]
(b) Это означает, что \(n*S{{S}_{Means}}=10\times 14=140\).
(c) С другой стороны, мы получаем
\[S{{S}_{Between}}=\frac{{{20}^{2}}}{10}+\frac{{{30}^{2}}}{10}+\frac{{{70}^{2}}}{10}-\frac{{{120}^{2}}}{30}=140\]
Вопрос 3:
Повреждения домов, вызванные разрывом трубопроводов, могут быть дорогостоящими в ремонте. К тому времени, когда утечка будет обнаружена, дом уже может быть затоплен сотнями галлонов воды. Автоматические запорные клапаны могут предотвратить серьезное повреждение водой из-за неисправности водопровода. Клапаны содержат датчики, которые перекрывают поток воды в случае утечки, тем самым предотвращая затопление. Одной из важных характеристик является время (в миллисекундах), необходимое датчику для обнаружения утечки воды. Примеры данных, полученных для четырех различных запорных клапанов, содержатся в файле Waterflow.
а. Составьте соответствующую таблицу дисперсионного анализа и проведите проверку гипотез, чтобы определить, отличается ли среднее время обнаружения среди четырех моделей запорного клапана. Используйте уровень значимости 0,05.
б. Каков источник расхождений между образцами?
Клапан 1 |
Клапан 2 |
Клапан 3 |
Клапан 4 |
17 |
18 |
28 год |
17 |
10 |
17 |
25 |
17 |
18 |
11 |
30 |
17 |
18 |
16 |
26 |
19 |
17 |
16 |
25 |
18 |
14 |
18 |
27 |
21 год |
18 |
14 |
23 |
21 год |
13 |
17 |
23 |
12 |
10 |
20 |
26 |
15 |
11 |
14 |
22 |
18 |
Решение: Следующая таблица получена из предоставленных данных.
Примечание |
Клапан 1 |
Клапан 2 |
Клапан 3 |
Клапан 4 |
17 |
18 |
28 год |
17 |
|
10 |
17 |
25 |
17 |
|
18 |
11 |
30 |
17 |
|
18 |
16 |
26 |
19 |
|
17 |
16 |
25 |
18 |
|
14 |
18 |
27 |
21 год |
|
18 |
14 |
23 |
21 год |
|
13 |
17 |
23 |
12 |
|
10 |
20 |
26 |
15 |
|
11 |
14 |
22 |
18 |
|
Иметь в виду |
14,6 |
16.1 |
25,5 |
17,5 |
St. Dev. |
3,406 |
2,558 |
2,461 |
2,677 |
Мы хотим протестировать
\[H_0: \,\mu_{1}= \mu_{2}= \mu_{3}= \mu_{4}\]
\[H_A: \operatorname{Not all the means are equal}\]
С данными, найденными в таблице выше, мы можем вычислить следующие значения, которые необходимы для построения таблицы ANOVA. У нас есть:
\[SS_{Between}=\sum\limits_{i=1}^{k}{n}_{i} {\left( {\bar{x}}_{i}-\bar{\bar{x}} \right)}^{2}\]
and therefore\[SS_{Between}={10}\left({14.6}-{18.425}\right)^2+ {10}\left({16.1}-{18.425}\right)^2+ {10}\left({25.5}-{18.425}\right)^2+ {10}\left({17.5}-{18.425}\right)^2=709.475\]
Also,\[SS_{Within} = \sum\limits_{i=1}^{k}{\left( {n}_{i}-1 \right) s_{i}^{2}}\]
откуда мы получаем
\[SS_{Within}=\left({10}-1\right) \times {3.406}^2+ \left({10}-1\right) \times {2.558}^2+ \left({10}-1\right) \times {2.461}^2+ \left({10}-1\right) \times {2.677}^2=282.3\]
Therefore\[MS_{Between}=\frac{SS_{Between}}{k-1}= \frac{{709.475}}{3}= {236.492}\]
Таким же образом получается, что
\[MS_{Within} = \frac{SS_{Within}}{N-k}= \frac{{282.3}}{36}= {7.842}\]
Следовательно, F-статистика вычисляется как
\[F=\frac{MS_{Between}}{MS_{Within}} = \frac{{236.492}}{{7.842}}= {30.1583}\]
Критическое значение для \(\alpha ={0.05}\), \(df_{1} = 3\) и \(df_{2}= {36}\) определяется выражением
\[F_C = {2.8663}\]
и соответствующее значение p равно
\[p=\Pr \left( {{F}_{3,36}}> {30.1583} \right) = {0.000}\]
Замечено, что p-значение меньше уровня значимости \[\alpha =0.05\], и, следовательно, мы отклоняем \({{H}_{0}}\). Следовательно, у нас достаточно доказательств, чтобы отвергнуть нулевую гипотезу о равных средних при уровне значимости 0,05.
Подводя итог, мы имеем следующую таблицу ANOVA:
Источник |
SS |
df |
РС |
F |
p-значение |
Крит. F |
Между группами |
709,475 |
3 |
236 492 |
30,1583 |
0,000 |
2,8663 |
Внутри групп |
282,3 |
36 |
7,842 |
|||
Общий |
991,775 |
39 |
||||
(b) Сумма квадратов между выборками составляет 709,475.