Tutoriales de estadística: la guía definitiva de percentiles: todos los trucos del libro
Este es un buen tema para un tutorial porque el concepto de percentil tiende a ser confuso, debido al hecho de que a veces se proporciona información bastante confusa a los estudiantes, y existen muchas convenciones que a veces pueden ser engañosas e incluso erróneas. En los siguientes párrafos vamos a destacar el concepto de percentil de forma precisa, para que sepas exactamente de qué estamos hablando.
Distribución acumulativa
En primer lugar, debemos tener claro la definición de percentil, que se asocia al concepto de distribución acumulativa. Para una variable aleatoria X, la función de distribución acumulativa asociada se define como
\[{{F}_{X}}\left( x \right)=\Pr \left( X\le x \right)\]Esto es, por un valor dado X , la función de distribución acumulada asociada es la probabilidad de que la variable aleatoria sea menor o igual a X . Note que el símbolo usado X ya que el argumento es un argumento de función genérico. Si escribimos \({{F}_{X}}\left( y \right)\) nos referimos a la distribución acumulativa al valor de y (que corresponde a la probabilidad de que la variable aleatoria sea menor o igual a y ), o si escribimos \({{F}_{X}}\left( 4 \right)\) nos referimos a la distribución acumulada en 4 (que corresponde a la probabilidad de que la variable aleatoria sea menor o igual a 4).
Con tal definición, está claro que \({{F}_{X}}\) es una función que toma valores de 0 a 1 (ya que proviene de una probabilidad) y no es decreciente (es decir, aumenta o permanece constante, pero nunca disminuye) , pero lo que es menos obvio, y que se puede probar a partir de los axiomas de probabilidad, cualquier función de distribución acumulativa \({{F}_{X}}\) se comporta bastante bien, ya que es continua a la derecha (lo que significa, aproximadamente, que la función es continua o puede tener "saltos" .... es más complicado que eso, pero por ahora puedes pensar así). En general, las variables aleatorias que toman un rango continuo de valores tendrán una función acumulativa continua \({{F}_{X}}\) mientras que las variables aleatorias que toman un rango discreto de valores tendrán "saltos" en el gráfico de su \({{F}_{X}}\) asociado.
¿Qué es un percentil?
Ahora podemos definir un percentil. Para \(\alpha \in \left[ 0,1 \right]\), definimos un percentil \(\alpha\) como \({{P}_{\alpha }}\), de modo que
\[\Pr \left( X\le {{P}_{\alpha }} \right)=\alpha\]En lenguaje humano, un percentil \(\alpha\) es un punto de modo que la probabilidad de que la variable aleatoria sea menor o igual a ese punto es exactamente \(\alpha\). Por ejemplo, un percentil de 0,10 es un punto en la distribución de modo que la probabilidad de que la variable aleatoria sea menor o igual a ese punto es exactamente 0,10. Por lo general, en lugar de preguntar, por ejemplo, por el percentil 0,10, se le pedirá el percentil 10%, o el percentil 10. Esas son notaciones simples de las que debe estar consciente.
Un percentil \({{P}_{\alpha }}\) para una variable aleatoria X está bien definido cuando la función de distribución acumulativa \({{F}_{X}}\left( x \right)\) es continua. Si \({{F}_{X}}\left( x \right)\) tiene "saltos" en su gráfico, entonces podría ser un poco más difícil definir algunos valores de percentiles. Esta es la razón por la que los percentiles están bien definidos para las variables aleatorias continuas (como la distribución normal, la distribución exponencial, etc.), pero puede ser difícil para las variables discretas (como Poisson, Binomial, etc.).
¿Cómo calcular es un percentil?
Primero, necesita conocer la función acumulativa \({{F}_{X}}\). Entonces, para \(\alpha\) entre 0 y 1 necesitamos resolver para \(x\):
\[\alpha ={{F}_{X}}\left( x \right)\]Observe que resolver para x la ecuación anterior es lo mismo que intersecar la curva \( F_{X}(x)\) con la línea \(y=\alpha\) (que es paralela al eje x). Cuando \({{F}_{X}}\) es continuo, la intersección entre la línea \(y=\alpha\) y \({{F}_{X}}\left( x \right)\) existe, pero eso no es necesariamente cierto para todos los valores de \(\alpha\) para un \({{F}_{X}}\left( x \right)\) no continuo.
¿Un percentil es un parámetro o una estadística?
Para la definición que hemos proporcionado, un percentil es un parámetro de población, ya que depende estrictamente de la función de distribución y no de los datos muestrales. Ahí es donde surge la confusión. A veces se les da a los estudiantes datos de muestra y se les pide que calculen un percentil. En realidad, lo que se les pide que calculen es un percentil muestral, un estadístico que se calcula usando datos muestrales y que esperamos sea una buena estimación del correspondiente. percentil de población.