Все, что вам нужно знать о проверке гипотез: уловки, которые вам нужно изучить
Проверка гипотез может сбивать с толку, особенно если вы плохо знаете основы. Изучив пару простых принципов, вы сможете понять все, что нужно знать о проверке гипотез.
Что такое проверка гипотез?
Это первый вопрос, который мы рассмотрим. Проверка гипотезы - это статистическая процедура который использует выборочные данные для принятия решения по определенному заявлению, которое включает определенный параметр совокупности. Итак, действующие лица, необходимые для проверки гипотезы:
(1) Образцы данных
(2) Определенное утверждение о параметре популяции
Без каких-либо двух вышеперечисленных гипотез можно проверить. Теперь давайте пойдем немного дальше и объясним, что это за два основных компонента.
Пример
Напомним, что выборка - это меньшее подмножество всей совокупности. А популяция - это полный набор предметов, которые вы хотите исследовать. Обычно популяции большие, поэтому, если мы хотим сделать заявление о большой популяции, мы пытаемся сделать это, отбирая небольшую выборку, в надежде, что она каким-то образом будет нести информацию обо всей генеральной совокупности. Это кажется маловероятным, но в некоторых случаях это оказывается правдой.
Мы надеемся, что, проанализировав небольшую выборку из совокупности, мы сможем много узнать о ней. Когда это происходит, мы говорим, что образец представитель всего населения . Но не любой образец подойдет. Нам нужно собрать нечто, называемое случайный пример . Существуют разные стратегии для сбора случайных выборок, в зависимости от типа и размера популяции, но я хочу, чтобы вы сейчас сохранили, что существуют несколько разумные процедуры для создания случайных выборок, которые, как ожидается, будут репрезентативными для их популяции. И когда у вас будет случайная выборка, вы будете использовать процедуру проверки гипотез, которая поможет вам получить информацию обо всей совокупности из выборки.
Утверждение о параметре численности
Теперь, когда у вас есть образец, вам понадобится претензия для проверки. Есть хорошие и плохие новости. Хорошая новость заключается в том, что параметры совокупности являются простыми числами, так что утверждение о параметрах совокупности просто о том, каким может быть потенциальное значение этого параметра совокупности. Я имею в виду, что утверждения очень просты со структурной точки зрения. Например, предположим, что вы случайная переменная с нормальным распределением, с неизвестным средним значением, равным \(\mu\). Мы хотели бы взять образец этого населения и сказать что-нибудь о \(\mu\). Заявления о \(\mu\) являются заявлениями о его потенциальных значениях. Я имею в виду, что что-то вроде \(\mu =10\) - это фактическая претензия, или \(\mu <10\) также является претензией. Все, что указывает возможный набор значений для параметра совокупности, является заявлением.
Плохая новость в том, что мы не можем проверить любое заявление. Чтобы провести проверку гипотез и проверить утверждение о параметре совокупности, нам нужна определенная структура. А именно, мы можем работать только с двумя типами утверждений, или в этом контексте нам нужно определить между двумя гипотезами: нулевой гипотезой и альтернативной гипотезой. Эти две гипотезы являются утверждениями о параметре популяции с той особенностью, что (а) они не должны перекрываться и (б) нулевая гипотеза должен содержать знак "=" в нем.
Позвольте мне перефразировать это : Если вы хотите запустить проверка гипотез у вас должны быть две гипотезы: нулевая гипотеза и альтернативная гипотеза. Эти две гипотезы являются утверждениями, которые что-то заявляют о численном значении параметра совокупности. Набор потенциальных значений параметра совокупности, которые указаны в нулевой гипотезе, НЕ МОЖЕТ иметь какое-либо значение, общее с набором потенциальных значений параметра совокупности, которые указаны в альтернативной гипотезе. Кроме того, нулевая гипотеза должна содержать знак "=" в своем алгебраическом утверждении. Например, \(\mu =13\) и \(\mu \le 13\) являются примерами нулевых гипотез, но \(\mu >10\) не может быть нулевой гипотезой.
Нулевая гипотеза записывается как \({{H}_{0}}\), а альтернативная гипотеза записывается как \({{H}_{A}}\). Пример правильно определенного набора гипотез:
\[\begin{align} & {{H}_{0}}:\mu =10 \\ & {{H}_{A}}:\mu \ne 10 \\ \end{align}\]Но, например, этот набор гипотез неверен:
\[\begin{align} & {{H}_{0}}:\mu =10 \\ & {{H}_{A}}:\mu \ge 10 \\ \end{align}\]Почему приведенный выше набор недействителен? Поскольку набор возможных значений, указанных в \({{H}_{0}}\) и \({{H}_{A}}\), перекрывается (см., Что и нулевая, и альтернативная гипотезы включают 10 как возможное значение для \(\mu\)).
Механика проверки гипотезы
Теперь, когда у вас есть образец и правильно определенная нулевая и альтернативная гипотезы, вы можете провести проверку гипотезы. Теперь вы можете вычислить статистика теста , это центральная часть всего процесса. Статистика теста - это просто числовое (случайное) значение, которое вычисляется из выборочных данных и значений, указанных в гипотезе. Фактическая формула, используемая для вычисления тестовой статистики, зависит от типа оцениваемого параметра (например, мы используем другой тип тестовой статистики, когда мы тестируем среднее значение генеральной совокупности \(\mu\), чем когда мы тестируем дисперсию генеральной совокупности \(\sigma\)).
Однако философия для ВСЕХ проверок гипотез ОДИНАКОВА. Пожалуйста, запомните это: статистика теста вычисляется, и ее результат проверяется в предположении, что нулевая гипотеза верна. Итак, принцип таков: если я предполагаю, что нулевая гипотеза \({{H}_{0}}\) верна, насколько маловероятны получение тех же результатов? Философия заключается в том, что если результаты выборки маловероятны при предположении, что \({{H}_{0}}\) истинно, то мы отбрасываем \({{H}_{0}}\) как правдоподобный вариант.
Вероятность того, что результаты выборки, по крайней мере, столь же экстремальны, как наблюдаемые, обычно может быть вычислена (потому что обычно предположение, что \({{H}_{0}}\) истинно, определяет значение неизвестного параметра, который определяет распределение совокупности), и эта вероятность называется p-значение .
Низкое значение p указывает на то, что результаты выборки необычны, если мы принимаем \({{H}_{0}}\) за истину. Но насколько низко достаточно низко? Что ж, нам нужно определить порог, который мы называем уровнем значимости, или \(\alpha\). Это значение \(\alpha\) представляет риск, который мы готовы принять, отвергнув истинную нулевую гипотезу.
Результаты проверки гипотез
Итак, наконец, как мы ответим на гипотезы? Просто, если вычисленное значение p таково, что $ p <\ alpha $, тогда мы отклонить нулевую гипотезу . В противном случае, если \(p\ge \alpha\), мы не отвергнуть нулевую гипотезу. Обратите внимание, что не существует такой вещи, как "принятие нулевой гипотезы". Выборочные данные НЕ МОГУТ подтвердить нулевую гипотезу из-за фундаментального способа ее построения.
Если нулевая гипотеза не отвергается, данные образца говорят нам: "Послушайте, не похоже, что данные образца противоречат нулевой гипотезе, поэтому давайте оставим его, по крайней мере, на данный момент".
С другой стороны, если нулевая гипотеза отклоняется, данные образца говорят нам: "Посмотрите, данные образца кажутся противоречащими нулевой гипотезе, поэтому было бы разумно проверить вашу нулевую гипотезу, потому что она может быть отключена. ".
Мы правильно поняли?
Одно заблуждение состоит в том, что проверка гипотез дает безошибочный ответ. Это не может быть дальше от истины. Решение о проверке гипотезы (либо отклонить Ho ИЛИ не отклонить Ho) может быть на самом деле неверным. Признайте факт, пройдите через это.
Как ты можешь ошибаться? Фактически, двумя способами. Во-первых, если вы отвергаете нулевую гипотезу, вы будете утверждать, что нулевая гипотеза не верна. Итак, если нулевая гипотеза ДЕЙСТВИТЕЛЬНО верна, вы сделали ошибку. Это называется ошибкой типа I, при которой ваше решение отклонить Хо неверно, потому что Хо на самом деле верно. Вероятность ошибки этого типа I равна \(\alpha\).
Второй тип ошибки возникает, когда вы не можете отклонить нулевую гипотезу, поэтому вы не найдете достаточно доказательств, чтобы утверждать, что нулевая гипотеза ложна. Но если окажется, что нулевая гипотеза ДЕЙСТВИТЕЛЬНО ложна, значит, вы сделали ошибку. Это называется ошибкой типа II, при которой ваше решение не отвергать Хо неверно, потому что Хо на самом деле ложно. Вероятность ошибки этого типа II обозначается как \(\beta\).
На данный момент это все.