关于密度和概率分布你需要知道的一切
在本教程中,我们将介绍定义概率分布的关键元素。首先,我们需要先给出一个广泛而一般的定义:概率分布是一个描述随机变量 X 的概率行为的函数,它允许我们计算所有可能发生的概率(格式良好)事件。换句话说,概率函数为我们提供了一种清晰明确的机制来计算与某个随机变量 X 相关的概率。这就是我希望你现在记住并记住的。
符号
现在,让我们稍微谈谈符号。所以,假设 X 是一个随机变量,我们正在研究它的分布。假设 \(f\) 是 X 的分布。所以,通常,您会看到对 \({{f}_{X}}\) 的引用,其中 X 出现表示 具体来说 \(f\) 是 X 的分布。它并不总是这样发生,但是当分布函数有下标时,这意味着引用它对应的实际随机变量。
离散和连续随机变量之间的区别
从现在开始,我们需要精确地使用我们使用的符号。 “概率分布”这个术语是一个笼统的术语,在许多情况下被粗心地使用,但我们会尽量不要太松散,所以我们不会混淆。所以,让我们记在心上:当随机变量 X 是 连续随机变量 ,那么我们将使用一个 密度函数 \({{f}_{X}}\) 来计算与之相关的概率。另一方面,当随机变量 Y 是 离散随机变量 ,那么我们将使用一个 概率函数 \({{g}_{Y}}\) 来计算与之相关的概率。密度函数和概率函数以不同的方式工作,尽管它们以完全类似的方式工作。我承诺。
请记住,离散随机变量使用 概率函数 , 连续随机变量使用 密度函数 .例如,泊松随机变量使用概率函数,而二项式随机变量使用概率函数。或者正态分布的随机变量使用密度函数。
所有概率函数和密度函数都需要满足的属性
我们承诺概率函数和密度以不同但完全类似的方式工作。现在我们将看到原因。
· 对于密度
看看这个:连续随机变量 X 的密度函数 \(f\) 将满足以下两个条件:
(1) \(f\left( x \right)\ge 0\) 对于 \(\mathbb{R}\) 中的所有 x。
(2) \(\int\limits_{-\infty }^{\infty }{f\left( x \right)dx} = 1\)
让我们不要太挂在上面。条件 (1) 是说密度函数在任何时候都不能为负。它采用正值或零。条件 (2) 是说密度函数 \(f\) 在整条实线上的积分必须为 1。通俗地说,曲线下的总面积为 1。
· 现在是概率函数
离散随机变量 X 的概率函数 \(g\) 将满足以下两个条件:
(1) \(g\left( x \right)\ge 0\) 对于所有 \(x\in \left\{ {{a}_{1}},{{a}_{2}},....,{{a}_{n}},.... \right\}\)。
(2) \(\sum\limits_{i=1}^{\infty }{g\left( {{a}_{i}} \right)} = 1\)
请注意,\(\left\{ {{a}_{1}},{{a}_{2}},....,{{a}_{n}},.... \right\}\) 对应于随机变量 \(X\) 可以采用的所有可能值(请记住,我们假设 \(X\) 是一个离散变量)。据我所知,概率函数的 (1) 和 (2) 看起来与密度函数的 (1) 和 (2) 完全相同。事实上,在更高级的数学主题中,您可以看到 (1) 和 (2) 在更一般的上下文中(测量理论)对于这两种情况可以被视为完全相同,但我们不会在这里触及。我希望您记住的是,所有概率函数和密度函数都将满足这两个条件。
例 1
设 X 是一个随机变量,可以取值 1,2,3 和 4。是
\[ f\left( x \right) =\displaystyle \left\{ \begin{array}{cc} \frac{1}{2 } & \text{ for } x=1, \\ \\ \frac{1}{4} & \text{ for } x=2, \\ \\ \frac{1}{8} & \text{ for } x=3, \\ \\ \frac{1}{8} & \text{ for }x=4 \\ \end{array} \right.\]随机变量 X 的概率函数?
回答:
Let us see, we need to see if conditions (1) and (2) are met. First of all, notice that we have \(f\left( x \right)\ge 0\) for all values {1, 2, 3, 4}, which is the set of all possible values that X can take, since \(f\left( 1 \right)=\frac{1}{2}>\), \(f\left( 2 \right)=\frac{1}{4}>0\), \(f\left( 3 \right)=\frac{1}{8}>0\) and \(f\left( 4 \right)=\frac{1}{8}>0\). Therefore, condition (1) is met.现在,让我们看看是否满足条件(2):我们有
\[\sum\limits_{i=1}^{4}{f\left( {{x}_{i}} \right)}=f\left( 1 \right)+f\left( 2 \right)+f\left( 3 \right)+f\left( 4 \right)=\frac{1}{2}+\frac{1}{4}+\frac{1}{8}+\frac{1}{8}=1\]
因此,也满足条件(2)。所以最终的答案是,是的,\(f\left( x \right)\) 是随机变量 \(X\) 的概率函数。
例2
考虑函数 \(f\left( x \right)={{x}^{2}}\) 在 [0,2] 上,其他地方在 0 上。 \(f\left( x \right)\) 是密度函数吗?
回答:
让我们看看,我们需要看看是否满足条件(1)和(2)。首先,请注意我们有 \(f\left( x \right)\ge 0\) 用于所有 \(x\) ,因为 \(f\left( x \right)={{x}^{2}}\ge 0\) 在 [0, 2] 和 \(f=0\) 其他地方。因此,该函数不取负值,因此满足条件(1)。
对于条件 (2),我们计算:
\[\int\limits_{-\infty }^{\infty }{f\left( x \right)dx}=\int\limits_{0}^{2}{{{x}^{2}}dx}=\left. \frac{{{x}^{3}}}{3} \right|_{0}^{2}=\frac{{{2}^{3}}}{3}-\frac{{{0}^{3}}}{3}=\frac{8}{3}>1\]因此,不满足条件(2),因此 $f\left( x \right)$ 不是密度函数。
最后,如何用密度和概率函数计算概率?
这是我们正在寻找的最后一步。无论如何,我们为什么要处理概率和密度函数?嗯,有一个很好的理由,因为它们让我们有一个清晰,明确的程序来计算概率。换句话说,一旦你知道一个随机变量的相应密度(概率函数),那么你就知道了一个随机变量。它给你力量。
很好,但你怎么做???简单的。像往常一样,让我们看看连续随机变量(使用密度)和离散随机变量(使用概率函数)的两种情况。
计算连续随机变量的概率
设 X 为连续随机变量。一个典型的概率甚至写为 \(X\in D\),其中 \(D\subseteq \mathbb{R}\)。例如,感兴趣的事件可能是"X 小于或等于 5 但大于或等于 1"。这与说 \(X\in \left[ 1,5 \right]\) 是一样的,所以在这种情况下我们会有 \(D=\left[ 1,5 \right]\)。因此,换句话说,概率事件由集合表示(通常是间隔,但不一定总是)。
事件 \(X\in D\) 发生的概率是
\[\Pr \left( X\in D \right)=\int\limits_{D}^{{}}{f\left( x \right)dx}\]例如,如果 \(D=\left[ 1,5 \right]\),我们有
\[\Pr \left( X\in \left[ 1,5 \right] \right)=\Pr \left( 1\le X\le 5 \right)=\int\limits_{1}^{5}{f\left( x \right)dx}\]所以,它非常简单。我们在由我们想要计算概率的事件确定的范围内对密度函数进行积分。
计算离散随机变量的概率
设 X 为离散随机变量。在这种情况下,概率事件也表示为一组值,只是在这种情况下,事件是 \(\left\{ {{a}_{1}},{{a}_{2}},....,{{a}_{n}},.... \right\}\) 的子集,\(X\) 可以采用的所有可能值的集合。所以让 \(D\subseteq \left\{ {{a}_{1}},{{a}_{2}},....,{{a}_{n}},.... \right\}\),事件 \(X\in D\) 发生的概率是
\[\Pr \left( X\in D \right)=\Pr \left( X\in \left\{ {{b}_{1}},{{b}_{2}},...,{{b}_{k}} \right\} \right)=\sum\limits_{j=1}^{k}{f\left( {{b}_{j}} \right)}\]例如,假设 X 是参数为 \(N = 10\) 和 \(p = 0.5\) 的二项式。然后,如果我想计算 X 为 1 或 2 的概率,我需要计算
\[\Pr \left( X\in \left\{ 1,2 \right\} \right)=f\left( 1 \right)+f\left( 2 \right)\]
其中 \(f\) 是参数为 \(N = 10\) 和 \(p = 0.5\) 的二项式分布的相应概率函数。所以,它也超级简单。我们将在我们计算概率的事件中的点处评估的概率函数的值相加。