Tudo que você precisa saber sobre distribuições de densidade e probabilidade
Neste tutorial, apresentaremos os principais elementos que definem uma distribuição de probabilidade. Em primeiro lugar, precisamos começar dando uma definição ampla e geral: Uma distribuição de probabilidade é uma função que descreve o comportamento probabilístico de uma variável aleatória X, de uma forma que nos permite calcular as probabilidades da ocorrência de todos os possíveis ( bem formados) eventos. Em outras palavras, uma função de probabilidade nos dá um mecanismo claro e inequívoco para calcular probabilidades associadas a uma determinada variável aleatória X. Isso é o que quero que você mantenha e mantenha em mente por enquanto.
Notação
Agora, vamos falar um pouco sobre notação. Portanto, suponha que X seja uma variável aleatória e que estejamos trabalhando com sua distribuição. Digamos que \(f\) é a distribuição de X. Então, normalmente, você verá referência a \({{f}_{X}}\), onde X aparece indicando especificamente que \(f\) é a distribuição de X. Nem sempre acontece assim, mas quando a função de distribuição tem um subscrito, isso significa referir-se à variável aleatória real a que corresponde.
Distinção entre variáveis aleatórias discretas e contínuas
Precisamos ser precisos a partir de agora em termos da notação que usamos. O termo "distribuição de probabilidade" é uma espécie de termo guarda-chuva usado descuidadamente em muitos contextos, mas tentaremos não ser muito frouxos sobre isso, para não ficarmos confusos. Então, vamos registrar isso em nossa mente: quando uma variável aleatória X é um variável aleatória contínua , então usaremos um Função de densidade \({{f}_{X}}\) para calcular as probabilidades associadas a ele. Por outro lado, quando uma variável aleatória Y é um variável aleatória discreta , então usaremos um função de probabilidade \({{g}_{Y}}\) para calcular as probabilidades associadas a ele. Funções de densidade e funções de probabilidade funcionam de maneira diferente, embora funcionem de maneira COMPLETAMENTE análoga. Eu prometo.
Lembre-se, variáveis aleatórias discretas usam funções de probabilidade , e variáveis aleatórias contínuas usam funções de densidade . Assim, por exemplo, uma variável aleatória de Poisson usa uma função de probabilidade e uma variável aleatória Binomial usa uma função de probabilidade. Ou uma variável aleatória normalmente distribuída usa uma função de densidade.
Propriedades que precisam ser atendidas por TODAS as funções de probabilidade e densidade
Prometemos que funções de probabilidade e densidades funcionam de uma maneira diferente, mas completamente análoga. Agora veremos por quê.
· Para densidades
Observe isto: uma função de densidade \(f\) para uma variável aleatória contínua X irá satisfazer as duas seguintes condições:
(1) \(f\left( x \right)\ge 0\) para todos os x em \(\mathbb{R}\).
(2) \(\int\limits_{-\infty }^{\infty }{f\left( x \right)dx} = 1\)
Não vamos ficar muito preocupados com o acima. A condição (1) diz que uma função de densidade não pode ser negativa em nenhum ponto. Aceita valores positivos ou zero. A condição (2) está dizendo que a integral de uma função de densidade \(f\) sobre toda a linha real deve ser 1. Em termos gerais, a área total sob a curva é 1.
· Agora, para funções de probabilidade
Uma função de probabilidade \(g\) para uma variável aleatória discreta X irá satisfazer as duas seguintes condições:
(1) \(g\left( x \right)\ge 0\) para todos \(x\in \left\{ {{a}_{1}},{{a}_{2}},....,{{a}_{n}},.... \right\}\).
(2) \(\sum\limits_{i=1}^{\infty }{g\left( {{a}_{i}} \right)} = 1\)
Observe que \(\left\{ {{a}_{1}},{{a}_{2}},....,{{a}_{n}},.... \right\}\) corresponde a todos os valores possíveis que podem ser obtidos pela variável aleatória \(X\) (lembre-se, estamos assumindo que \(X\) é uma variável discreta). Até onde posso ver, (1) e (2) para funções de probabilidade parecem exatamente o mesmo (1) e (2) para funções de densidade. Na verdade, em tópicos de matemática mais avançados, você pode ver que (1) e (2) podem ser vistos exatamente como os mesmos para ambos os casos, em um contexto mais geral (Teoria da Medida), mas não vamos tocar nisso aqui. O que eu quero que você tenha em mente é que TODAS as funções de probabilidade e função de densidade irão satisfazer essas 2 condições.
EXEMPLO 1
Seja X uma variável aleatória que pode assumir os valores 1, 2, 3 e 4. É
\[ f\left( x \right) =\displaystyle \left\{ \begin{array}{cc} \frac{1}{2 } & \text{ for } x=1, \\ \\ \frac{1}{4} & \text{ for } x=2, \\ \\ \frac{1}{8} & \text{ for } x=3, \\ \\ \frac{1}{8} & \text{ for }x=4 \\ \end{array} \right.\]uma função de probabilidade para a variável aleatória X?
RESPONDA:
Let us see, we need to see if conditions (1) and (2) are met. First of all, notice that we have \(f\left( x \right)\ge 0\) for all values {1, 2, 3, 4}, which is the set of all possible values that X can take, since \(f\left( 1 \right)=\frac{1}{2}>\), \(f\left( 2 \right)=\frac{1}{4}>0\), \(f\left( 3 \right)=\frac{1}{8}>0\) and \(f\left( 4 \right)=\frac{1}{8}>0\). Therefore, condition (1) is met.Agora, vamos ver se a condição (2) é atendida: Temos que
\[\sum\limits_{i=1}^{4}{f\left( {{x}_{i}} \right)}=f\left( 1 \right)+f\left( 2 \right)+f\left( 3 \right)+f\left( 4 \right)=\frac{1}{2}+\frac{1}{4}+\frac{1}{8}+\frac{1}{8}=1\]
e, portanto, a condição (2) também é atendida. Portanto, a resposta final é, sim, \(f\left( x \right)\) é uma função de probabilidade para a variável aleatória \(X\).
EXEMPLO 2
Considere a função \(f\left( x \right)={{x}^{2}}\) em [0,2], em 0 em outro lugar. \(f\left( x \right)\) é uma função de densidade?
RESPONDA:
Vamos ver, precisamos ver se as condições (1) e (2) são atendidas. Em primeiro lugar, observe que temos \(f\left( x \right)\ge 0\) para todos os \(x\) desde \(f\left( x \right)={{x}^{2}}\ge 0\) em [0, 2] e \(f=0\) em outros lugares. Assim, a função não assume valores negativos e, doravante, a condição (1) é atendida.
Para a condição (2), calculamos:
\[\int\limits_{-\infty }^{\infty }{f\left( x \right)dx}=\int\limits_{0}^{2}{{{x}^{2}}dx}=\left. \frac{{{x}^{3}}}{3} \right|_{0}^{2}=\frac{{{2}^{3}}}{3}-\frac{{{0}^{3}}}{3}=\frac{8}{3}>1\]Portanto, a condição (2) não é atendida e, portanto, $ f \ left (x \ right) $ NÃO é uma função de densidade.
Finalmente, como calcular probabilidades com funções de densidade e probabilidade?
Esta é a etapa final que estávamos procurando. Por que lidamos com funções de probabilidade e densidade, afinal? Bem, há uma boa razão, é porque eles nos permitem ter um procedimento claro e inequívoco para calcular probabilidades. Em outras palavras, uma vez que você conhece a densidade correspondente (função de probabilidade) de uma variável aleatória, então você sabe TUDO sobre uma variável aleatória. Dá a você o PODER.
Legal, mas como você faz isso ??? Simples. Como de costume, vejamos os dois casos, para variáveis aleatórias contínuas (usando densidades) e para variáveis aleatórias discretas (usando funções de probabilidade).
Computando probabilidades para variáveis aleatórias contínuas
Seja X uma variável aleatória contínua. Uma probabilidade par típica é escrita como \(X\in D\), onde \(D\subseteq \mathbb{R}\). Por exemplo, um evento de interesse pode ser "X é menor ou igual a 5, mas maior ou igual a 1". Isso é o mesmo que dizer que \(X\in \left[ 1,5 \right]\), então nesse caso teríamos \(D=\left[ 1,5 \right]\). Em outras palavras, eventos de probabilidade são representados por conjuntos (normalmente intervalos, mas não necessariamente sempre).
A probabilidade de que o evento \(X\in D\) ocorra é
\[\Pr \left( X\in D \right)=\int\limits_{D}^{{}}{f\left( x \right)dx}\]Por exemplo, se \(D=\left[ 1,5 \right]\), temos
\[\Pr \left( X\in \left[ 1,5 \right] \right)=\Pr \left( 1\le X\le 5 \right)=\int\limits_{1}^{5}{f\left( x \right)dx}\]Então, é SUPER SIMPLES. Integramos a função de densidade em um intervalo determinado pelo evento para o qual queremos calcular a probabilidade.
Computando Probabilidades para Variáveis Aleatórias Discretas
Seja X uma variável aleatória discreta. Nesse caso, um evento de probabilidade também é expresso como um conjunto de valores, apenas que, nesse caso, um evento é um subconjunto de \(\left\{ {{a}_{1}},{{a}_{2}},....,{{a}_{n}},.... \right\}\), o conjunto de todos os valores possíveis que podem ser assumidos por \(X\). Então vamos \(D\subseteq \left\{ {{a}_{1}},{{a}_{2}},....,{{a}_{n}},.... \right\}\), a probabilidade de que o evento \(X\in D\) ocorra é
\[\Pr \left( X\in D \right)=\Pr \left( X\in \left\{ {{b}_{1}},{{b}_{2}},...,{{b}_{k}} \right\} \right)=\sum\limits_{j=1}^{k}{f\left( {{b}_{j}} \right)}\]Por exemplo, suponha que X seja binomial com os parâmetros \(N = 10\) e \(p = 0.5\). Então, se eu quiser calcular a probabilidade de que X seja 1 ou 2, preciso calcular
\[\Pr \left( X\in \left\{ 1,2 \right\} \right)=f\left( 1 \right)+f\left( 2 \right)\]
onde \(f\) é a função de probabilidade correspondente para uma distribuição Binomial com parâmetros \(N = 10\) e \(p = 0.5\). Então, é SUPER SIMPLES DEMASIADO. Somamos os valores da função de probabilidade avaliada nos pontos do evento para o qual estamos computando a probabilidade.