基本统计中的符号使用 - 第二部分
这是一个跟进 上一篇 ,介绍了描述性统计数据最常见的符号。要了解如何使用符号,因为数学和统计数据的符号使用是至关重要的 快捷方式 ,因此,如果你不了解他们的意思,那么你很快就会丢失,真的不理解正在谈论的内容。
在下列段落中,我们将继续本系列,试图澄清使用符号的推论统计数据,其中使用更加丰富和复杂的符号,因此您应该注意到来的内容。
引发统计中的符号
使用推动统计时通常使用以下符号和符号。这些符号仍然在大多数统计类中使用。
·\(\mu\):这是表示人口的通用符号。这是一个参数(因为它是未使用示例信息构造的常量)。有时\(\mu\)附带子索引,以表示我们正在谈论的哪种变量的含义。例如,如果我们看到\({{\mu }_{X}}\),那个符号是指随机变量\(X\)的群体均值。一般而言,如果__yz_d__是分布(密度)随机变量\(X\),则使用以下表达式计算群体均值:
\[{{\mu }_{X}}=\int\limits_{-\infty }^{\infty }{x\,f\left( x \right)dx}\]
在连续随机变量的情况下,或
\[{{\mu }_{X}}=\sum\limits_{k}{{{x}_{k}}f\left( {{x}_{k}} \right)}\]
对于离散分布的情况。
要记住的几件事:虽然\(\mu\)是指引用人口的通用符号,但是有一些分布通常使用不同的符号。例如,如果x是泊松随机变量,则传统是使用\(\lambda\)作为人口均值的符号。要记住的重要事项是,它只是一个值赞,这是一个符号。
·\({{\sigma }^{2}}\):这是人口方差,计算为
\[{{\sigma }^{2}}=\int\limits_{-\infty }^{\infty }{{{x}^{2}}\,f\left( x \right)dx}-{{\mu }^{2}}=\int\limits_{-\infty }^{\infty }{{{x}^{2}}\,f\left( x \right)dx}-{{\left( \int\limits_{-\infty }^{\infty }{xf\left( x \right)dx} \right)}^{2}}\]
这是人口参数,因为它是未从示例信息构造的固定号码(不是随机变量))。与人口相同,习惯性地添加子索引来表示底层变量。这是,\(\sigma _{X}^{2}\)表示随机变量x的群体方差,而\(\sigma _{Y}^{2}\)表示随机变量y的人口方差。
再次与前一个情况相同,这是一个最常见的符号(或捷径,如果您愿意)编写人口方差。但有些情况在于传统是使用其他东西。例如,如果x有泊松分布,那么我们之前提到的人口均值被称为\(\lambda\),事实证明,在计算人口方差时,我们发现它等于\(\lambda\)。在这种情况下,我们会写\(\sigma _{X}^{2}=\lambda\)。所以,拜托,请不要困惑 符号 \(\sigma _{X}^{2}=\lambda\)的一部分和\(\sigma _{X}^{2}=\lambda\)的计算部分。
·\(\sigma\):这是人口标准偏差,通过以人口方差的平方根或简单地使用下面的公式来计算
\[\sigma =\sqrt{\int\limits_{-\infty }^{\infty }{{{x}^{2}}\,f\left( x \right)dx}-{{\left( \int\limits_{-\infty }^{\infty }{xf\left( x \right)dx} \right)}^{2}}}\]
这是参数,因为它是未构造的固定号码,其不构造示例信息。
·\({{H}_{0}}\):这是符号 零假设 。在假设检测中,零假设是无效的假设
·\({{H}_{A}}\):这是符号 替代假设 。在假设测试中,替代假设是可以证明如果样品数据足够不太可能的情况,则可以证明如果空假设ho是真的
·\(\Theta\):这是一个较少常用的符号,它表示群体参数的所有可能值的集合。例如,如果x是常数分布式的随机变量,则具有\({{\sigma }^{2}}=1\)的群体方差,并且未知的群体平均值\(\mu\),这一套可以由\(\mu\)拍摄的所有可能拍摄的值。所以,换句话说,我们将在这种情况下,\(\Theta =\left( -\infty ,\infty \right)\)。
·\({{\Theta }_{0}}\):在上述符号的上下文中,该符号表示由假设试验的空假设中所述的群体参数所阐述的可能值。例如,假设x是常常分布的随机变量,具有\({{\sigma }^{2}}=1\)的群体方差以及未知的人口均值,并且我们有兴趣测试以下NULL和替代假设:
\[\begin{align} & {{H}_{0}}:\mu =0 \\ & {{H}_{A}}:\mu \ne 0 \\ \end{align}\]
在这种情况下,我们会有那个\({{\Theta }_{0}}=\left\{ 0 \right\}\) 。
·\({{\Theta }_{A}}\):沿着前一个符号的线,该符号表示由假设试验的替代假设中所述的人口参数所涉及的可能值。例如,假设x是常常分布的随机变量,具有\({{\sigma }^{2}}=1\)的群体方差以及未知的人口均值,并且我们有兴趣测试以下NULL和替代假设:
\[\begin{align} & {{H}_{0}}:\mu =0 \\ & {{H}_{A}}:\mu \ne 0 \\ \end{align}\]
在这种情况下,我们会有那个\({{\Theta }_{A}}=\left( -\infty ,0 \right)\cup \left( 0,\infty \right)\) 。 请注意,根据定义,我们需要拥有\(\Theta ={{\Theta }_{0}}\cup {{\Theta }_{A}}\)。
·\(\rho\):这对应于变量x和y之间的人口相关性。为了更明确地对所涉及的变量,符号可以写成\(\rho \left( X,Y \right)\)甚至\({{\rho }_{X,Y}}\)。
·\(\pi\):虽然不是通用,但这种符号用于表示人口比例。沿着这些线,\({{\pi }_{1}}\)将代表人口1等的人口比例(对于某个分类变量),有时,普通\(p\)用于代表人口比例,但我认为这是一个坏主意,虽然或多或少,\(p\)是最常用的表示人口比例的符号。
·\(\sim\):“tilde”符号用于表示某个随机变量具有指定的分发。例如,如果我们看到:\(X\tilde{\ }Poisson\left( \lambda \right)\),我们将其解释为:“x是一个随机变量,具有平均\(\lambda\)的泊松分布。