非参数统计,或当参数测试失败的假设

平均值,中值和模式是中央倾向的最常见测量,用于描述分布的中心。在三个中,平均值是最常用的,但中位数和模式也广泛使用。

我们需要区分样本平均值,中位数和模式,以及他们的人口同行。

通常,我们是 提供样品 我们需要计算样本意味着,样品中值和样本模式。这些统计数据是 估算器 相应的人口参数。

在上面的图表中,您有一个例子是中位数,模式和均值如何看待分发。

该模式对应于样本中最重复的值。在分布中,它对应于密度函数中的最高点,如上图所示。

中位数大致,定义了50％的分布左侧的点,以及它的右侧。

平均值对应于变量所带来的值的加权平均值及其相关概率（\(\sum x \cdot p(x)\)）。对于分发,这种加权总和是一个总和或积分。对于样本,我们只需计算样本中的值的平均值。

如何计算给定示例的平均值,中位数和模式

现在,假设我们给出了一个样本\(X_1, X_2, ..., X_n\),我们希望计算模式,中位数和均值。我们如何去做呢？

• 对于模式： 简单的。我们发现最重复的数字。例如：如果我们有一个样品1,2,2,2,3,1,4,模式为2,因为2是最重复的值（它重复3次）

• 为中位数： 此计算稍微涉及。拍摄样本\(X_1, X_2, ..., X_n\),第一步是按升序重新组织它。因此,假设\(\hat X_1, \hat X_2, ..., \hat X_n\)在重新排序到最高值之后是样本。

现在,我们将按升序计算样本中位数的位置。对于样本大小\(n\),我们计算\(P = 0.5 (n+1)\)。

如果此值是一个整数,那么我们发现中位数是p中的值 ^钍按升序在样本中的位置。

如果此值不是整数,那么我们发现\(P_L\)和\(P_U\),它是\(P\)的左侧和右侧的最接近的整数。（例如：如果\(P = 10.2\),那么\(P_L = 10\)和\(P_U = 11\)）。

然后,中间数是\(P_L\)的平移 ^钍和\(P_U\) ^钍按升序在本地。

• 对于平衡： 简单。制品平均通道练用公共来牌

\[\displaystyle \frac{1}{n}\sum_{i=1}^n X_i\]

28,36,43,30,15,182,29,36,36,33,38,30,30,39,33,38,30,41,42,46,40,33,30,40,43,40,337,40,30,30,35,3.40,30,30,35,39,37,42,42,37,38,3.2,51

下载显示计算平衡所需的所需计算