La regla empírica y otras reglas en estadística
En cualquier clase de Estadística, encontrará con mucha frecuencia que se hace referencia a ciertas "reglas". Por lo general, esas reglas están destinadas a simplificar su vida y ayudarlo a hacer algunos cálculos más fáciles. Pero no todas esas reglas son iguales. De hecho, no todas esas reglas son "reglas" reales, ya que algunas son solo aproximaciones y, como tales, pueden tener un uso específico o incluso un uso limitado en ocasiones.
En los siguientes párrafos discutiremos algunas de esas reglas y aproximaciones de estadísticas que se usan comúnmente. En general, son bastante simples, pero debe saber exactamente cómo usarlos de la manera prevista.
Regla empírica para la distribución normal
Esta es, con mucho, una de las "reglas" más conocidas en estadística. Sigo escribiendo "regla" con comillas, porque esto no es realmente una regla sino una aproximación. La regla empírica establece que si una variable tiene una distribución normal, aproximadamente el 68% de la distribución está dentro de una desviación estándar de la media, el 95% de la distribución está dentro de dos desviaciones estándar de la media y el 99,7% de la distribución está dentro de tres desviaciones estándar de la media.
Primero que nada, veamos por qué esto tiene sentido. El evento que corresponde a los valores que están dentro de una desviación estándar de la media es , y si normalizamos (restamos por y dividimos por ), obtenemos los siguientes eventos equivalentes:
Pero, si se distribuye normalmente con media y desviación estándar , sabemos que la variable tiene una distribución normal estándar (esta es una distribución normal con media 0 y desviación estándar 1). Normalmente, la variable se escribe como , entonces lo que tenemos es
donde tiene una distribución normal estándar. Si usamos una calculadora o un programa de hoja de cálculo como Excel, encontramos que la probabilidad del evento que corresponde a los valores que están dentro de una desviación estándar de la media es
Entonces, el verdadero porcentaje de valores dentro de una desviación estándar de la media es algo así como 68.2689492%, que todavía es solo una aproximación, pero esta aproximación es mucho mejor que el 68% establecido por la regla empírica.
De manera similar, podemos calcular que
Entonces, el verdadero porcentaje de valores dentro de dos desviaciones estándar de la media es algo así como 95.4499736% (aproximadamente), pero esta aproximación es mucho mejor que el 95% establecido por la regla empírica.
Finalmente, podemos calcular que
Entonces, el verdadero porcentaje de valores dentro de dos desviaciones estándar de la media es aproximadamente algo así como 99.7300204%, pero esta aproximación es aún más precisa que el 99.7% establecido por la regla empírica.
Precaución: Algunos libros de texto ni siquiera dirán que esto es una aproximación, y pueden decir que "el 68% de la distribución está dentro de una desviación estándar de la media, el 95% de la distribución está dentro de dos desviaciones estándar de la media y el 99,7% de la distribución está dentro de tres desviaciones estándar de la media ", como si fuera un número exacto. Eso puede causarle confusión porque cuando realiza el cálculo en Excel (o usando tablas de probabilidad normales de la parte posterior de su libro), encontrará que 68%, 95% y 99,7% no son realmente precisos. Asegúrese de usarlo en sus exámenes o tareas exactamente como su instructor le dijo que lo hiciera, pero no olvide que es SÓLO UNA APROXIMACIÓN.
La regla de oro para la desviación estándar
Esta regla es otra aproximación aproximada que se usa para estimar la desviación estándar usando el rango. La regla dice que la desviación estándar se puede aproximar con la siguiente fórmula:
Sencillo. En algunos casos o aplicaciones, no tendrá acceso a los datos en sí, pero conocerá el rango. Si ese es el caso, todo lo que tiene que hacer es tomar el rango y dividir por 4.
Regla de Chebyshev
Ésta es una regla muy fina. Bueno, en realidad es una desigualdad. Es una especie de regla empírica, pero se aplica a TODAS las distribuciones (sí, escuchaste bien), no solo a la distribución normal. La regla de Chebyshev proporciona un límite inferior para el porcentaje de la distribución que estará dentro k desviaciones estándar de la media. De hecho, tenemos eso
¿Qué dice la regla de Chebyshev para ? Dice
Esto es: Al menos el 75% de la distribución está dentro de 2 desviaciones estándar de la media . Bien dices. ¿Para qué sirve eso? Puede estar pensando que sabía algo mucho mejor de la Regla empírica. Sí, sabía que el 95% (o aproximadamente el 95%) de la distribución está dentro de 2 desviaciones estándar de la media. ¿Qué tiene que decir este apestoso 75% aquí? Sí, el 95% es correcto, pero SÓLO funciona para distribuciones normales. La afirmación de que al menos el 75% de la distribución está dentro de 2 desviaciones estándar de la media obtenida con la regla de Chebyshev funciona para TODAS las distribuciones ... Suficiente dicho.