关于假设检验你需要知道的一切：你需要学习的技巧

假设检验可能是一个令人困惑的话题,尤其是在您不太了解基础的情况下。通过学习一些简单的原则,您将能够了解有关假设检验的所有知识。

什么是假设检验？

这是我们要解决的第一个问题。假设检验是 统计程序 它使用样本数据对涉及某个总体参数的某个声明做出决定。因此,进行假设检验所需的参与者是：

(1) 样本数据

(2) 关于总体参数的某个断言

没有以上两者中的任何一个,都可以检验一个假设。现在,让我们更进一步解释这两个主要组件是什么

样品

让我们回想一下,样本是整个总体的较小子集。而且,总体是您要调查的完整主题集。通常情况下,总体很大,因此如果我们想对大总体做出陈述,我们会尝试通过选择小样本来实现,希望样本能够以某种方式携带有关整个总体的信息。这似乎是一个远景,但事实证明在某些情况下确实如此。

我们希望通过分析总体中的小样本,我们将能够对总体有很多了解。当这种情况发生时,我们说样本是 全体人民的代表 .但不是任何样本都可以。我们需要收集一些叫做 随机样品 .收集随机样本有不同的策略,具体取决于总体的类型和规模,但我现在希望您保留的是,有一些合理的程序可以生成随机样本,这些程序有望代表其总体。而且,一旦您有了随机样本,您将使用一种使用假设检验的程序,这将帮助您从样本中获取有关整个总体的信息。

关于人口参数的声明

现在您有了样本,您需要声明进行测试。有好消息也有坏消息。好消息是人口参数是简单的数字,因此关于人口参数的声明只是关于人口参数的潜在价值。我的意思是,从结构的角度来看,权利要求非常简单。例如,假设您是一个正态分布的随机变量,其未知均值等于 $\mu$。我们想从该人群中抽取一个样本,然后谈谈 $\mu$。关于 $\mu$ 的声明是关于其潜在价值的声明。我的意思是,像 $\mu =10$ 这样的东西是一个实际的声明,或者 $\mu <10$ 也是一个声明。任何说明总体参数的一组可能值的内容都是声明。

坏消息是我们无法测试任何声明。为了进行假设检验并检验关于总体参数的声明,我们需要有一定的结构。也就是说,我们只能处理两种类型的声明,或者在这种情况下,我们需要在两个假设之间进行定义：零假设和备择假设。这两个假设都是关于总体参数的声明,其特点是 (a) 它们不能重叠 (b) 零假设 必须包含 “=”符号。

让我改写一下 : 如果你想运行一个假设检验你必须有两个假设,零假设和备择假设。这两个假设都是关于总体参数数值的声明。原假设中陈述的总体参数的潜在值集不能与备择假设中陈述的总体参数的潜在值集具有任何相同的值。此外,原假设必须在其代数陈述中包含符号“=”。例如,$\mu =13$ 和 $\mu \le 13$ 是零假设的例子,但 $\mu >10$ 不能是零假设。

零假设写为 ${{H}_{0}}$,备择假设写为 ${{H}_{A}}$。正确定义的假设集的一个例子是

\[\begin{align} & {{H}_{0}}:\mu =10 \\ & {{H}_{A}}:\mu \ne 10 \\ \end{align}\]

但是,例如,这组假设是无效的：

\[\begin{align} & {{H}_{0}}:\mu =10 \\ & {{H}_{A}}:\mu \ge 10 \\ \end{align}\]

为什么上面的设置无效？因为 ${{H}_{0}}$ 和 ${{H}_{A}}$ 陈述的一组可能值重叠（请参阅原假设和替代假设都包括 10 作为 $\mu$ 的可能值）。

假设检验的机制

既然您有一个样本并且您有一个正确定义的原假设和替代假设,您就可以进行假设检验。现在你可以计算一个 检验统计量 , 这是整个过程的核心部分。检验统计量只是一个数字（随机）值,它是根据样本数据和假设中陈述的值计算得出的。用于计算检验统计量的实际公式取决于所估计参数的类型（例如,我们在检验总体均值 $\mu$ 时使用与检验总体方差 $\sigma$ 时使用不同类型的检验统计量）。

但是,所有假设检验的理念都是相同的。请记住这一点：假设原假设为真,计算检验统计量并检查其结果。所以原理是：如果我假设零假设 ${{H}_{0}}$ 为真,那么获得相同结果的可能性有多大？原理是,如果在 ${{H}_{0}}$ 为真的假设下样本结果不太可能,那么我们将 ${{H}_{0}}$ 作为一个合理的选项丢弃。

通常可以计算样本结果至少与观察到的结果一样极端的概率（因为通常假设 ${{H}_{0}}$ 为真决定了确定总体分布的未知参数的值）,并且该概率称为 p值 .

如果我们将 ${{H}_{0}}$ 视为真,则较低的 p 值表示样本结果不寻常。但是,多低才够低？好吧,我们需要定义一个阈值,我们称之为显着性水平,或 $\alpha$。 $\alpha$ 的这个值代表了我们愿意承担的拒绝真原假设的风险。