Tutoriales de estadística: la guía definitiva de percentiles: todos los trucos del libro
Este es un buen tema para un tutorial porque el concepto de percentil tiende a ser confuso, debido al hecho de que a veces se proporciona información bastante confusa a los estudiantes, y existen muchas convenciones que a veces pueden ser engañosas e incluso erróneas. En los siguientes párrafos vamos a destacar el concepto de percentil de forma precisa, para que sepas exactamente de qué estamos hablando.
Distribución acumulativa
En primer lugar, debemos tener claro la definición de percentil, que se asocia al concepto de distribución acumulativa. Para una variable aleatoria X, la función de distribución acumulativa asociada se define como
Esto es, por un valor dado X , la función de distribución acumulada asociada es la probabilidad de que la variable aleatoria sea menor o igual a X . Note que el símbolo usado X ya que el argumento es un argumento de función genérico. Si escribimos nos referimos a la distribución acumulativa al valor de y (que corresponde a la probabilidad de que la variable aleatoria sea menor o igual a y ), o si escribimos nos referimos a la distribución acumulada en 4 (que corresponde a la probabilidad de que la variable aleatoria sea menor o igual a 4).
Con tal definición, está claro que es una función que toma valores de 0 a 1 (ya que proviene de una probabilidad) y no es decreciente (es decir, aumenta o permanece constante, pero nunca disminuye) , pero lo que es menos obvio, y que se puede probar a partir de los axiomas de probabilidad, cualquier función de distribución acumulativa se comporta bastante bien, ya que es continua a la derecha (lo que significa, aproximadamente, que la función es continua o puede tener "saltos" .... es más complicado que eso, pero por ahora puedes pensar así). En general, las variables aleatorias que toman un rango continuo de valores tendrán una función acumulativa continua mientras que las variables aleatorias que toman un rango discreto de valores tendrán "saltos" en el gráfico de su asociado.
¿Qué es un percentil?
Ahora podemos definir un percentil. Para , definimos un percentil como , de modo que
En lenguaje humano, un percentil es un punto de modo que la probabilidad de que la variable aleatoria sea menor o igual a ese punto es exactamente . Por ejemplo, un percentil de 0,10 es un punto en la distribución de modo que la probabilidad de que la variable aleatoria sea menor o igual a ese punto es exactamente 0,10. Por lo general, en lugar de preguntar, por ejemplo, por el percentil 0,10, se le pedirá el percentil 10%, o el percentil 10. Esas son notaciones simples de las que debe estar consciente.
Un percentil para una variable aleatoria X está bien definido cuando la función de distribución acumulativa es continua. Si tiene "saltos" en su gráfico, entonces podría ser un poco más difícil definir algunos valores de percentiles. Esta es la razón por la que los percentiles están bien definidos para las variables aleatorias continuas (como la distribución normal, la distribución exponencial, etc.), pero puede ser difícil para las variables discretas (como Poisson, Binomial, etc.).
¿Cómo calcular es un percentil?
Primero, necesita conocer la función acumulativa . Entonces, para entre 0 y 1 necesitamos resolver para :
Observe que resolver para x la ecuación anterior es lo mismo que intersecar la curva con la línea (que es paralela al eje x). Cuando es continuo, la intersección entre la línea y existe, pero eso no es necesariamente cierto para todos los valores de para un no continuo.
¿Un percentil es un parámetro o una estadística?
Para la definición que hemos proporcionado, un percentil es un parámetro de población, ya que depende estrictamente de la función de distribución y no de los datos muestrales. Ahí es donde surge la confusión. A veces se les da a los estudiantes datos de muestra y se les pide que calculen un percentil. En realidad, lo que se les pide que calculen es un percentil muestral, un estadístico que se calcula usando datos muestrales y que esperamos sea una buena estimación del correspondiente. percentil de población.