Estadísticas Tutoriales

Todo lo que necesita saber sobre densidades y distribuciones de probabilidad

En este tutorial presentaremos los elementos clave que definen una distribución de probabilidad. En primer lugar, debemos comenzar dando una definición amplia y general: una distribución de probabilidad es una función que describe el comportamiento probabilístico de una variable aleatoria X, de manera que nos permite calcular las probabilidades de ocurrencia de todas las posibles ( bien formado) eventos. En otras palabras, una función de probabilidad nos da un mecanismo claro e inequívoco para calcular las probabilidades asociadas a una determinada variable aleatoria X. Eso es lo que quiero que retengas y tengas en cuenta por ahora.

Notación

Ahora, hablemos un poco de notación. Entonces, suponga que X es una variable aleatoria y estamos trabajando con su distribución. Digamos que $f$ es la distribución de X. Entonces, por lo general, verá una referencia a ${{f}_{X}}$, donde X aparece indicando específicamente que $f$ es la distribución de X. No siempre sucede así, pero cuando la función de distribución tiene un subíndice, eso significa referirse a la variable aleatoria real a la que corresponde.

Distinción entre variables aleatorias discretas y continuas

Necesitamos ser precisos de ahora en adelante en términos de la notación que usamos. El término "distribución de probabilidad" es una especie de término general que se usa descuidadamente en muchos contextos, pero trataremos de no ser demasiado vagos al respecto para no confundirnos. Entonces, registremos esto en nuestra mente: cuando una variable aleatoria X es una variable aleatoria continua , entonces usaremos un función de densidad ${{f}_{X}}$ para calcular las probabilidades asociadas a él. Por otro lado, cuando una variable aleatoria Y es un variable aleatoria discreta , entonces usaremos un función de probabilidad ${{g}_{Y}}$ para calcular las probabilidades asociadas a él. Las funciones de densidad y las funciones de probabilidad funcionan de forma diferente, aunque funcionan de forma COMPLETAMENTE análoga. Lo prometo.

Recuerde, las variables aleatorias discretas utilizan funciones de probabilidad y variables aleatorias continuas utilizan funciones de densidad . Entonces, por ejemplo, una variable aleatoria de Poisson usa una función de probabilidad y una variable aleatoria Binomial usa una función de probabilidad. O una variable aleatoria distribuida normalmente usa una función de densidad.

Propiedades que deben cumplir TODAS las funciones de probabilidad y densidad

Prometimos que las funciones de probabilidad y las densidades funcionan de una manera diferente, pero completamente análoga. Ahora veremos por qué.

· Para densidades

Mire esto: una función de densidad $f$ para una variable aleatoria continua X satisfará las dos condiciones siguientes:

(1) $f\left( x \right)\ge 0$ para todas las x en $\mathbb{R}$.

(2) $\int\limits_{-\infty }^{\infty }{f\left( x \right)dx} = 1$

No nos obsesionemos demasiado con lo anterior. La condición (1) dice que una función de densidad no puede ser negativa en ningún punto. Toma valores positivos o cero. La condición (2) dice que la integral de una función de densidad $f$ sobre toda la línea real debe ser 1. En términos sencillos, el área total bajo la curva es 1.

· Ahora para las funciones de probabilidad

Una función de probabilidad $g$ para una variable aleatoria discreta X satisfará las dos condiciones siguientes:

(1) $g\left( x \right)\ge 0$ para todos los $x\in \left\{ {{a}_{1}},{{a}_{2}},....,{{a}_{n}},.... \right\}$.

(2) $\sum\limits_{i=1}^{\infty }{g\left( {{a}_{i}} \right)} = 1$

Observe que $\left\{ {{a}_{1}},{{a}_{2}},....,{{a}_{n}},.... \right\}$ corresponde a todos los valores posibles que puede tomar la variable aleatoria $X$ (recuerde, estamos asumiendo que $X$ es una variable discreta). Por lo que puedo ver, (1) y (2) para las funciones de probabilidad se ven bastante iguales (1) y (2) para las funciones de densidad. De hecho, en temas de matemáticas más avanzados, podría ver que (1) y (2) pueden verse exactamente igual para ambos casos, en un contexto más general (teoría de la medida), pero no lo tocaremos aquí. Lo que quiero que tenga en cuenta es que TODAS las funciones de probabilidad y la función de densidad satisfarán esas 2 condiciones.

EJEMPLO 1

Sea X una variable aleatoria que puede tomar los valores 1, 2, 3 y 4. Es

\[ f\left( x \right) =\displaystyle \left\{ \begin{array}{cc} \frac{1}{2 } & \text{ for } x=1, \\ \\ \frac{1}{4} & \text{ for } x=2, \\ \\ \frac{1}{8} & \text{ for } x=3, \\ \\ \frac{1}{8} & \text{ for }x=4 \\ \end{array} \right.\]

una función de probabilidad para la variable aleatoria X?

RESPONDER:

Let us see, we need to see if conditions (1) and (2) are met. First of all, notice that we have $f\left( x \right)\ge 0$ for all values {1, 2, 3, 4}, which is the set of all possible values that X can take, since $f\left( 1 \right)=\frac{1}{2}>$, $f\left( 2 \right)=\frac{1}{4}>0$, $f\left( 3 \right)=\frac{1}{8}>0$ and $f\left( 4 \right)=\frac{1}{8}>0$. Therefore, condition (1) is met.

Ahora, veamos si se cumple la condición (2): Tenemos que

\[\sum\limits_{i=1}^{4}{f\left( {{x}_{i}} \right)}=f\left( 1 \right)+f\left( 2 \right)+f\left( 3 \right)+f\left( 4 \right)=\frac{1}{2}+\frac{1}{4}+\frac{1}{8}+\frac{1}{8}=1\]

y por lo tanto, también se cumple la condición (2). Entonces, la respuesta final es sí, $f\left( x \right)$ es una función de probabilidad para la variable aleatoria $X$.

EJEMPLO 2

Considere la función $f\left( x \right)={{x}^{2}}$ en [0,2], en 0 en otro lugar. ¿Es $f\left( x \right)$ una función de densidad?

RESPONDER:

Veamos, necesitamos ver si se cumplen las condiciones (1) y (2). En primer lugar, observe que tenemos $f\left( x \right)\ge 0$ para todos los $x$ desde $f\left( x \right)={{x}^{2}}\ge 0$ en [0, 2] y $f=0$ en otros lugares. Entonces, la función no toma valores negativos y, en adelante, se cumple la condición (1).

Para la condición (2), calculamos:

\[\int\limits_{-\infty }^{\infty }{f\left( x \right)dx}=\int\limits_{0}^{2}{{{x}^{2}}dx}=\left. \frac{{{x}^{3}}}{3} \right|_{0}^{2}=\frac{{{2}^{3}}}{3}-\frac{{{0}^{3}}}{3}=\frac{8}{3}>1\]

Por lo tanto, la condición (2) no se cumple y, por lo tanto, $ f \ left (x \ right) $ NO es una función de densidad.

Finalmente, ¿cómo calcular probabilidades con densidades y funciones de probabilidad?

Este es el último paso que estábamos buscando. De todos modos, ¿por qué nos ocupamos de las funciones de probabilidad y densidad? Bueno, hay una buena razón, es porque nos permiten tener un procedimiento claro e inequívoco para calcular probabilidades. En otras palabras, una vez que conoce la densidad correspondiente (función de probabilidad) de una variable aleatoria, entonces sabe TODO acerca de una variable aleatoria. Te da el PODER.

Bien, pero ¿cómo lo haces ??? Sencillo. Como de costumbre, veamos los dos casos, para variables aleatorias continuas (usando densidades) y para variables aleatorias discretas (usando funciones de probabilidad).

Cálculo de probabilidades para variables aleatorias continuas

Sea X una variable aleatoria continua. Una probabilidad par típica se escribe como $X\in D$, donde $D\subseteq \mathbb{R}$. Por ejemplo, un evento de interés podría ser que "X es menor o igual a 5 pero mayor o igual a 1". Eso es lo mismo que decir que $X\in \left[ 1,5 \right]$, entonces en ese caso tendríamos $D=\left[ 1,5 \right]$. En otras palabras, los eventos de probabilidad están representados por conjuntos (típicamente intervalos, pero no necesariamente siempre).

La probabilidad de que ocurra el evento $X\in D$ es

\[\Pr \left( X\in D \right)=\int\limits_{D}^{{}}{f\left( x \right)dx}\]

Por ejemplo, si $D=\left[ 1,5 \right]$, tenemos

\[\Pr \left( X\in \left[ 1,5 \right] \right)=\Pr \left( 1\le X\le 5 \right)=\int\limits_{1}^{5}{f\left( x \right)dx}\]

Entonces, es SUPER SIMPLE. Integramos la función de densidad en un rango determinado por el evento para el que queremos calcular la probabilidad.

Calcular probabilidades para variables aleatorias discretas

Sea X una variable aleatoria discreta. En este caso, un evento de probabilidad también se expresa como un conjunto de valores, solo que en este caso, un evento es un subconjunto de $\left\{ {{a}_{1}},{{a}_{2}},....,{{a}_{n}},.... \right\}$, el conjunto de todos los valores posibles que puede tomar $X$. Entonces, sea $D\subseteq \left\{ {{a}_{1}},{{a}_{2}},....,{{a}_{n}},.... \right\}$, la probabilidad de que ocurra el evento $X\in D$ es

\[\Pr \left( X\in D \right)=\Pr \left( X\in \left\{ {{b}_{1}},{{b}_{2}},...,{{b}_{k}} \right\} \right)=\sum\limits_{j=1}^{k}{f\left( {{b}_{j}} \right)}\]

Por ejemplo, suponga que X es binomial con los parámetros $N = 10$ y $p = 0.5$. Entonces, si quisiera calcular la probabilidad de que X sea 1 o 2, necesito calcular

\[\Pr \left( X\in \left\{ 1,2 \right\} \right)=f\left( 1 \right)+f\left( 2 \right)\]

donde $f$ es la función de probabilidad correspondiente para una distribución binomial con los parámetros $N = 10$ y $p = 0.5$. Entonces, es SUPER SIMPLE DEMASIADO. Sumamos los valores de la función de probabilidad evaluados en los puntos en el evento para el que estamos calculando la probabilidad.

This tutorial is brought to you courtesy of MyGeekyTutor.com