Tout ce que vous devez savoir sur les densités et les distributions de probabilités
Dans ce tutoriel, nous présenterons les éléments clés qui définissent une distribution de probabilité. Tout d'abord, nous devons commencer par donner une définition large et générale: une distribution de probabilité est une fonction qui décrit le comportement probabiliste d'une variable aléatoire X, de manière à nous permettre de calculer les probabilités d'occurrence de tous les possibles ( bien formés). En d'autres termes, une fonction de probabilité nous donne un mécanisme clair et sans équivoque pour calculer les probabilités associées à une certaine variable aléatoire X. C'est ce que je veux que vous reteniez et gardiez à l'esprit pour le moment.
Notation
Maintenant, parlons un peu de notation. Supposons donc que X soit une variable aléatoire et que nous travaillons avec sa distribution. Dites que \(f\) est la distribution de X. Donc, généralement, vous verrez une référence à \({{f}_{X}}\), où X apparaît indiquant Plus précisément que \(f\) est la distribution de X. Cela ne se produit pas toujours comme ça, mais lorsque la fonction de distribution a un indice, cela signifie faire référence à la variable aléatoire réelle à laquelle elle correspond.
Distinction entre les variables aléatoires discrètes et continues
Nous devons être précis à partir de maintenant en termes de notation que nous utilisons. Le terme «distribution de probabilité» est une sorte de terme générique qui est utilisé avec insouciance dans de nombreux contextes, mais nous essaierons de ne pas être trop lâche à ce sujet, afin de ne pas être confus. Alors, enregistrons ceci dans notre esprit: Quand une variable aléatoire X est un variable aléatoire continue , alors nous utiliserons un fonction de densité \({{f}_{X}}\) pour calculer les probabilités qui lui sont associées. En revanche, lorsqu'une variable aléatoire Y est un variable aléatoire discrète , alors nous utiliserons un fonction de probabilité \({{g}_{Y}}\) pour calculer les probabilités qui lui sont associées. Les fonctions de densité et les fonctions de probabilité fonctionnent d'une manière différente, bien qu'elles fonctionnent de manière COMPLÈTEMENT analogue. Je promets.
N'oubliez pas que les variables aléatoires discrètes utilisent fonctions de probabilité et l'utilisation de variables aléatoires continues fonctions de densité . Ainsi, par exemple, une variable aléatoire de Poisson utilise une fonction de probabilité et une variable aléatoire binomiale utilise une fonction de probabilité. Ou une variable aléatoire normalement distribuée utilise une fonction de densité.
Propriétés qui doivent être satisfaites par TOUTES les fonctions de probabilité et de densité
Nous avons promis que les fonctions de probabilité et les densités fonctionnent d'une manière différente mais tout à fait analogue. Maintenant, nous verrons pourquoi.
· Pour les densités
Regardez ceci: Une fonction de densité \(f\) pour une variable aléatoire continue X satisfera les deux conditions suivantes:
(1) \(f\left( x \right)\ge 0\) pour tout x dans \(\mathbb{R}\).
(2) \(\int\limits_{-\infty }^{\infty }{f\left( x \right)dx} = 1\)
Ne nous attardons pas trop sur ce qui précède. La condition (1) dit qu'une fonction de densité ne peut être négative à aucun moment. Il prend des valeurs positives ou zéro. La condition (2) dit que l'intégrale d'une fonction de densité \(f\) sur toute la ligne réelle doit être 1. En termes simples, l'aire totale sous la courbe est 1.
· Maintenant pour les fonctions de probabilité
Une fonction de probabilité \(g\) pour une variable aléatoire discrète X satisfera les deux conditions suivantes:
(1) \(g\left( x \right)\ge 0\) pour tous \(x\in \left\{ {{a}_{1}},{{a}_{2}},....,{{a}_{n}},.... \right\}\).
(2) \(\sum\limits_{i=1}^{\infty }{g\left( {{a}_{i}} \right)} = 1\)
Notez que \(\left\{ {{a}_{1}},{{a}_{2}},....,{{a}_{n}},.... \right\}\) correspond à toutes les valeurs possibles qui peuvent être prises par la variable aléatoire \(X\) (rappelez-vous, nous supposons que \(X\) est une variable discrète). Autant que je sache, (1) et (2) pour les fonctions de probabilité sont assez similaires (1) et (2) pour les fonctions de densité. En fait, dans des sujets mathématiques plus avancés, vous pouvez voir que (1) et (2) peuvent être considérés comme exactement les mêmes pour les deux cas, dans un contexte plus général (théorie des mesures), mais nous n'y toucherons pas ici. Ce que je veux que vous gardiez à l'esprit, c'est que TOUTES les fonctions de probabilité et la fonction de densité satisferont ces 2 conditions.
EXEMPLE 1
Soit X une variable aléatoire qui peut prendre les valeurs 1, 2, 3 et 4. Est
\[ f\left( x \right) =\displaystyle \left\{ \begin{array}{cc} \frac{1}{2 } & \text{ for } x=1, \\ \\ \frac{1}{4} & \text{ for } x=2, \\ \\ \frac{1}{8} & \text{ for } x=3, \\ \\ \frac{1}{8} & \text{ for }x=4 \\ \end{array} \right.\]une fonction de probabilité pour la variable aléatoire X?
RÉPONDRE:
Let us see, we need to see if conditions (1) and (2) are met. First of all, notice that we have \(f\left( x \right)\ge 0\) for all values {1, 2, 3, 4}, which is the set of all possible values that X can take, since \(f\left( 1 \right)=\frac{1}{2}>\), \(f\left( 2 \right)=\frac{1}{4}>0\), \(f\left( 3 \right)=\frac{1}{8}>0\) and \(f\left( 4 \right)=\frac{1}{8}>0\). Therefore, condition (1) is met.Maintenant, voyons si la condition (2) est remplie: nous avons cela
\[\sum\limits_{i=1}^{4}{f\left( {{x}_{i}} \right)}=f\left( 1 \right)+f\left( 2 \right)+f\left( 3 \right)+f\left( 4 \right)=\frac{1}{2}+\frac{1}{4}+\frac{1}{8}+\frac{1}{8}=1\]
et par conséquent, la condition (2) est également remplie. La réponse finale est donc oui, \(f\left( x \right)\) est une fonction de probabilité pour la variable aléatoire \(X\).
EXEMPLE 2
Considérons la fonction \(f\left( x \right)={{x}^{2}}\) sur [0,2], sur 0 ailleurs. \(f\left( x \right)\) est-il une fonction de densité?
RÉPONDRE:
Voyons, nous devons voir si les conditions (1) et (2) sont remplies. Tout d'abord, notez que nous avons \(f\left( x \right)\ge 0\) pour tous les \(x\) depuis \(f\left( x \right)={{x}^{2}}\ge 0\) sur [0, 2], et \(f=0\) ailleurs. Ainsi, la fonction ne prend pas de valeurs négatives, et désormais la condition (1) est remplie.
Pour la condition (2), nous calculons:
\[\int\limits_{-\infty }^{\infty }{f\left( x \right)dx}=\int\limits_{0}^{2}{{{x}^{2}}dx}=\left. \frac{{{x}^{3}}}{3} \right|_{0}^{2}=\frac{{{2}^{3}}}{3}-\frac{{{0}^{3}}}{3}=\frac{8}{3}>1\]Par conséquent, la condition (2) n'est pas remplie, et par conséquent, $ f \ left (x \ right) $ n'est PAS une fonction de densité.
Enfin, comment calculer des probabilités avec des densités et des fonctions de probabilité?
C'est la dernière étape que nous recherchions. Pourquoi avons-nous affaire aux fonctions de probabilité et de densité, de toute façon? Eh bien, il y a une bonne raison, c'est parce qu'ils nous permettent d'avoir une procédure claire et sans équivoque pour calculer les probabilités. En d'autres termes, une fois que vous connaissez la densité correspondante (fonction de probabilité) d'une variable aléatoire, alors vous savez TOUT sur une variable aléatoire. Cela vous donne le pouvoir.
Bien, mais comment fais-tu ??? Facile. Comme d'habitude, voyons les deux cas, pour les variables aléatoires continues (en utilisant les densités) et pour les variables aléatoires discrètes (en utilisant les fonctions de probabilité).
Calcul des probabilités pour les variables aléatoires continues
Soit X une variable aléatoire continue. Une probabilité typique même s'écrit \(X\in D\), où \(D\subseteq \mathbb{R}\). Par exemple, un événement intéressant pourrait être que «X est inférieur ou égal à 5 mais supérieur ou égal à 1». C'est la même chose que de dire que \(X\in \left[ 1,5 \right]\), donc dans ce cas nous aurions \(D=\left[ 1,5 \right]\). En d'autres termes, les événements de probabilité sont représentés par des ensembles (généralement des intervalles, mais pas nécessairement toujours).
La probabilité que l'événement \(X\in D\) se produise est
\[\Pr \left( X\in D \right)=\int\limits_{D}^{{}}{f\left( x \right)dx}\]Par exemple, si \(D=\left[ 1,5 \right]\), nous avons
\[\Pr \left( X\in \left[ 1,5 \right] \right)=\Pr \left( 1\le X\le 5 \right)=\int\limits_{1}^{5}{f\left( x \right)dx}\]Donc, c'est SUPER SIMPLE. Nous intégrons la fonction de densité sur une plage déterminée par l'événement pour lequel nous voulons calculer la probabilité.
Calcul des probabilités pour les variables aléatoires discrètes
Soit X une variable aléatoire discrète. Dans ce cas, un événement de probabilité est également exprimé comme un ensemble de valeurs, seulement que dans ce cas, un événement est un sous-ensemble de \(\left\{ {{a}_{1}},{{a}_{2}},....,{{a}_{n}},.... \right\}\), l'ensemble de toutes les valeurs possibles qui peuvent être prises par \(X\). Alors laissez \(D\subseteq \left\{ {{a}_{1}},{{a}_{2}},....,{{a}_{n}},.... \right\}\), la probabilité que l'événement \(X\in D\) se produise est
\[\Pr \left( X\in D \right)=\Pr \left( X\in \left\{ {{b}_{1}},{{b}_{2}},...,{{b}_{k}} \right\} \right)=\sum\limits_{j=1}^{k}{f\left( {{b}_{j}} \right)}\]Par exemple, supposons que X est binomial avec les paramètres \(N = 10\) et \(p = 0.5\). Ensuite, si je voulais calculer la probabilité que X soit 1 ou 2, je dois calculer
\[\Pr \left( X\in \left\{ 1,2 \right\} \right)=f\left( 1 \right)+f\left( 2 \right)\]
où \(f\) est la fonction de probabilité correspondante pour une distribution binomiale avec les paramètres \(N = 10\) et \(p = 0.5\). Donc, c'est SUPER SIMPLE TROP. Nous additionnons les valeurs de la fonction de probabilité évaluées aux points de l'événement pour lequel nous calculons la probabilité.