统计教程:百分比的最终指南 - 书上的所有技巧
这是教程的一个好主题,因为概念 百分位数 由于有时向学生提供相当令人困惑的信息,往往会令人困惑,有时会有很多惯例,有时会误导甚至是明白的错误。在以下段落中,我们将偏离概念 百分位数 以精确的方式,所以你确切地知道我们在谈论什么。
累积分布
首先,我们需要清楚地了解百分位数的定义,这与累积分布的概念相关。对于随机变量x,相关的累积分布函数定义为
\[{{F}_{X}}\left( x \right)=\Pr \left( X\le x \right)\]这是给定价值 X ,相关的累积分布函数是随机变量小于或等于的概率 X 。请注意使用的符号 X 由于参数是一个通用函数参数。如果我们写\({{F}_{X}}\left( y \right)\),我们的意思是价值的累积分布 y (对应于随机变量小于或等于的概率 y ),或者如果我们编写\({{F}_{X}}\left( 4 \right)\),我们表示4(对应于随机变量小于或等于4)的概率分布。
使用如定义,清除\({{F}_{X}}\)是一个函数,它从0到1的函数(因为它来自概率)并且它是非减小的(这是,它可以增加或保持恒定,但它永远不会减少)但是,什么不太明显,并且可以从概率的原理中证明,任何累积分布函数\({{F}_{X}}\)表现得很好,因为它是右连续的(非常粗略地意味着该功能是连续的,或者它可能有可能有“跳跃”......它比这更复杂,但现在你可以以这种方式思考)。通常,采用连续值范围的随机变量将具有连续累积函数\({{F}_{X}}\),而采取离散值范围的随机变量将在其关联的\({{F}_{X}}\)的图表中具有“跳转”。
什么是百分子?
现在我们可以定义一个百分位数。对于\(\alpha \in \left[ 0,1 \right]\),我们将\(\alpha\)百分位定义为\({{P}_{\alpha }}\),这样
\[\Pr \left( X\le {{P}_{\alpha }} \right)=\alpha\]在人类语言中,\(\alpha\)百分位数是一个点,使得随机变量小于或等于该点的概率正好是\(\alpha\)。例如,0.10百分位数是分布中的点,使得随机变量小于或等于该点的概率正好为0.10。通常,而不是要求例如为0.10百分位数,您将被要求10%百分位数或第10百分位数。那些是应该意识到的简单符号。
随机变量X的百分位数\({{P}_{\alpha }}\)在累积分布函数\({{F}_{X}}\left( x \right)\)是连续的时良好的定义。如果\({{F}_{X}}\left( x \right)\)在其图表中有“跳转”,那么定义一些百分位数可能有点困难。这就是为什么百分位数为连续随机变量很好地定义(例如正常分布,指数分布等),但离散变量可能难以(例如泊松,二项式等)。
如何计算是百分位数?
首先,您需要知道累积函数\({{F}_{X}}\)。所以,对于0到1之间的\(\alpha\),我们需要解决\(x\):
\[\alpha ={{F}_{X}}\left( x \right)\]观察到x求解上述等式与与行\(y=\alpha\)(并行于x轴)的曲线相同的等式相同。当\({{F}_{X}}\)是连续的时,行\(y=\alpha\)和\({{F}_{X}}\left( x \right)\)之间的交点存在,但对于非连续\({{F}_{X}}\left( x \right)\)的\(\alpha\)的所有值并不一定是true。
百分位数是参数还是统计?
对于我们提供的定义,百分位数是人口参数,因为它严格依赖于分发功能而不是在样本数据上。这就是混乱所产生的地方。有时,学生被赋予样本数据被要求计算百分位数。实际上,他们被要求计算的是一个样本百分位数,使用样本数据计算的统计数据,我们希望这将是对应的很好的估计。人口百分位数。