Todo lo que necesita saber sobre las pruebas de hipótesis: los trucos que necesita aprender
La prueba de hipótesis puede ser un tema confuso, especialmente si no conoce bien los fundamentos. Al aprender un par de principios sencillos, podrá comprender todo lo que hay que saber sobre la prueba de hipótesis.
¿Qué es una prueba de hipótesis?
Esa es la primera pregunta que abordaremos. Una prueba de hipótesis es una procedimiento estadístico que utiliza datos de muestra para tomar una decisión sobre una determinada afirmación, que involucra un determinado parámetro de población. Entonces, los actores requeridos para realizar una prueba de hipótesis son:
(1) Los datos de muestra
(2) Cierta afirmación sobre un parámetro de población
Sin ninguno de los dos anteriores, se puede probar una hipótesis. Ahora, vayamos un poco más allá y expliquemos cuáles son esos dos componentes principales
La muestra
Recordemos que una muestra es un subconjunto más pequeño de una población total. Y una población es el conjunto completo de temas sobre los que desea investigar. Por lo general, las poblaciones son grandes, por lo que si queremos hacer una afirmación sobre una población grande, intentamos hacerlo seleccionando una muestra pequeña, con la esperanza de que la muestra contenga de alguna manera información sobre toda la población. Parece una posibilidad remota, pero resulta ser cierto en algunos casos.
Nuestra esperanza es que al analizar una pequeña muestra de una población, podamos saber mucho sobre la población. Cuando eso sucede, decimos que la muestra es representante de toda la población . Pero no cualquier muestra servirá. Necesitamos recolectar algo llamado muestra aleatoria . Existen diferentes estrategias para recolectar muestras aleatorias, dependiendo del tipo y tamaño de la población, pero lo que quiero que retengas ahora es que existen procedimientos algo razonables para producir muestras aleatorias, que se espera que sean representativas de sus poblaciones. Y, una vez que tenga una muestra aleatoria, utilizará un procedimiento que utiliza pruebas de hipótesis que le ayudarán a obtener información sobre toda la población de la muestra.
La afirmación sobre un parámetro de población
Ahora que tiene una muestra, necesita un reclamo para probar. Hay buenas y malas noticias. La buena noticia es que los parámetros de población son números simples, por lo que una afirmación sobre los parámetros de una población es simplemente sobre cuál podría ser el valor potencial de ese parámetro de población. Lo que quiero decir con esto es que las afirmaciones son muy simples desde un punto de vista estructural. Por ejemplo, suponga que tiene una variable aleatoria que se distribuye normalmente, con una media desconocida igual a \(\mu\). Nos gustaría tomar una muestra de esa población y decir algo sobre \(\mu\). Las afirmaciones sobre \(\mu\) son afirmaciones sobre sus valores potenciales. Quiero decir, algo como \(\mu =10\) es un reclamo real, o \(\mu <10\) también es un reclamo. Todo lo que indique un posible conjunto de valores para un parámetro de población es una afirmación.
La mala noticia es que no podemos probar cualquier afirmación. Para realizar una prueba de hipótesis y probar una afirmación sobre un parámetro de población, necesitamos tener cierta estructura. Es decir, solo podemos trabajar con dos tipos de afirmaciones, o en este contexto, necesitamos definir entre dos hipótesis: la hipótesis nula y la hipótesis alternativa. Estas dos hipótesis son ambas afirmaciones sobre un parámetro de población, con la peculiaridad de que (a) no deben superponerse y (b) la hipótesis nula debe contener el signo "=".
Déjame reformular eso : Si desea ejecutar un prueba de hipotesis debe tener dos hipótesis, la hipótesis nula y la hipótesis alternativa. Estas dos hipótesis son afirmaciones que afirman algo sobre el valor numérico del parámetro de población. El conjunto de valores potenciales del parámetro de población que se establecen en la hipótesis nula NO PUEDE tener ningún valor en común con el conjunto de valores potenciales del parámetro de población que se establecen en la hipótesis alternativa. Además, la hipótesis nula debe contener el signo "=" en su enunciado algebraico. Por ejemplo, \(\mu =13\) y \(\mu \le 13\) son ejemplos de hipótesis nulas, pero \(\mu >10\) no puede ser una hipótesis nula.
Una hipótesis nula se escribe como \({{H}_{0}}\) y una hipótesis alternativa se escribe como \({{H}_{A}}\). Un ejemplo de un conjunto de hipótesis correctamente definido es
\[\begin{align} & {{H}_{0}}:\mu =10 \\ & {{H}_{A}}:\mu \ne 10 \\ \end{align}\]Pero, por ejemplo, este conjunto de hipótesis no es válido:
\[\begin{align} & {{H}_{0}}:\mu =10 \\ & {{H}_{A}}:\mu \ge 10 \\ \end{align}\]¿Por qué el conjunto anterior no es válido? Porque el conjunto de valores posibles establecidos por \({{H}_{0}}\) y \({{H}_{A}}\) se superponen (ver que tanto la hipótesis nula como la alternativa incluyen 10 como valor posible para \(\mu\)).
La mecánica de una prueba de hipótesis
Ahora que tiene una muestra y una hipótesis nula y alternativa correctamente definida, puede realizar una prueba de hipótesis. Ahora puedes calcular un Estadística de prueba , esa es la pieza central de todo el proceso. Una estadística de prueba es simplemente un valor numérico (aleatorio) que se calcula a partir de los datos de la muestra y de los valores establecidos en la hipótesis. La fórmula real que se usa para calcular una estadística de prueba depende del tipo de parámetro que se estima (por ejemplo, usamos un tipo diferente de estadística de prueba cuando estamos probando una media poblacional \(\mu\) que cuando estamos probando una varianza poblacional \(\sigma\)).
La filosofía, sin embargo, para TODAS las pruebas de hipótesis es la MISMA. Conserve esto en su cabeza: la estadística de prueba se calcula y su resultado se verifica asumiendo que la hipótesis nula es cierta. Entonces, el principio es: si asumo que la hipótesis nula \({{H}_{0}}\) es verdadera, ¿qué tan improbables son los mismos resultados obtenidos? La filosofía es que si los resultados de la muestra son poco probables bajo el supuesto de que \({{H}_{0}}\) es verdadero, descartamos \({{H}_{0}}\) como una opción plausible.
La probabilidad de que los resultados de la muestra sean al menos tan extremos como los observados se puede calcular normalmente (porque generalmente asumir que \({{H}_{0}}\) es verdadero determina el valor del parámetro desconocido que determina la distribución de la población), y esta probabilidad se llama valor p .
Un valor p bajo indica que los resultados de la muestra son inusuales si tomamos \({{H}_{0}}\) como verdadero. Pero, ¿qué tan bajo es lo suficientemente bajo? Bueno, necesitamos definir un umbral, al que llamamos nivel de significancia, o \(\alpha\). Este valor de \(\alpha\) representa el riesgo que estamos dispuestos a correr de rechazar una verdadera hipótesis nula.
Resultados de una prueba de hipótesis
Entonces, finalmente, ¿cómo damos nuestra respuesta a las hipótesis? Simple, si el valor p calculado es tal que $ p <\ alpha $, entonces rechazar la hipótesis nula . De lo contrario, si \(p\ge \alpha\), no rechazan la hipótesis nula. Observe que no existe tal cosa como "aceptar la hipótesis nula". Los datos de muestra NO PUEDEN probar la hipótesis nula debido a la forma fundamental en que se construyen.
Si no se rechaza la hipótesis nula, los datos de la muestra nos dicen "mira, no parece que los datos de la muestra contradigan la hipótesis nula, así que conservémosla, al menos por ahora".
Por otro lado, si se rechaza la hipótesis nula, los datos de la muestra nos dicen "mire, los datos de la muestra parecen estar en conflicto con la hipótesis nula, por lo que sería prudente verificar su hipótesis nula, porque puede estar fuera de lugar ".
¿Lo hicimos bien?
Una idea errónea es que una prueba de hipótesis dará una respuesta infalible. No puede estar más lejos de la verdad. La decisión sobre la prueba de hipótesis (rechazar Ho O no rechazar Ho) puede ser realmente incorrecta. Enfréntate al hecho, revísalo.
¿Cómo puedes estar equivocado? En realidad, de dos maneras: primero, si rechaza la hipótesis nula, estará afirmando que la hipótesis nula no es cierta. Entonces, si la hipótesis nula REALMENTE es cierta, entonces ha cometido un error. Eso se llama error de Tipo I, en el que su decisión de rechazar a Ho es incorrecta, porque Ho es realmente cierto. La probabilidad de este tipo I de error es \(\alpha\).
El segundo tipo de error ocurre cuando no rechaza la hipótesis nula, por lo que no encuentra suficiente evidencia para afirmar que la hipótesis nula es falsa. Pero, si resulta que la hipótesis nula es REALMENTE falsa, entonces ha cometido un error. Esto se denomina error de Tipo II, en el que su decisión de no rechazar a Ho es incorrecta, porque Ho es en realidad falsa. La probabilidad de este tipo II de error se denomina \(\beta\).
Eso es por ahora.