Calculadora de varianza agrupada
Instrucciones : Esta calculadora calcula la varianza combinada y la desviación estándar para dos desviaciones estándar de muestra dadas \(s_1\) y \(s_2\), con los tamaños de muestra correspondientes \(n_1\) y \(n_2\).
Cómo calcular las variaciones agrupadas
A Varianza agrupada es una estimación de la varianza poblacional obtenida a partir de dos varianzas muestrales cuando se supone que las dos muestras provienen de una población con la misma desviación estándar poblacional.
En esa situación, ninguna de las varianzas muestrales es una estimación mejor que la otra, y las dos varianzas muestrales proporcionadas se "agrupan", en una especie de promedio ponderado, para calcular la varianza combinada.
¿cómo se calcula la varianza agrupada?
La fórmula para calcular la varianza combinada dadas dos varianzas muestrales es:
\[ s_p^2 = \frac{(n_1-1)s_1^2 + (n_2-1)s_2^2}{n_1+n_2-2} \]Por otro lado, de la fórmula de la varianza combinada podemos deducir que la desviación estándar combinada es:
\[s_p = \sqrt{ \frac{(n_1-1)s_1^2 + (n_2-1)s_2^2}{n_1+n_2-2}}\]Relación entre varianza agrupada y suma de cuadrados
Una forma genial de expresar las fórmulas anteriores se basa en la idea de Suma de cuadrados (\(SS\)). En Ciencias Sociales la suma de cuadrados de una muestra se define como
\[SS = \sum_{i=1}^n \left( X - \bar X\right)^2 \]Pero utilizando la definición de varianza muestral, es directo ver que
\[SS = \sum_{i=1}^n \left( X - \bar X \right)^2 = (n-1) s^2\]Entonces, multiplicamos la varianza muestral por \(n-1\) y obtenemos la suma de cuadrados \(SS\). Además, sabemos que para el caso de una muestra, tenemos ese \(df = n-1\). Por lo tanto, la varianza agrupada se puede escribir de manera muy simple como:
\[ s_p^2 = \frac{(n_1-1)s_1^2 + (n_2-1)s_2^2}{n_1+n_2-2} = \frac{ SS_1 + SS_2}{df_1+df_2}\]Cuándo utilizar variaciones agrupadas
La idea de varianzas agrupadas requiere el supuesto de que las varianzas poblacionales son iguales. Para el caso de varianzas poblacionales desiguales, debe utilizar este calculadora de variaciones no agrupadas .
Un contexto en el que se utiliza la idea de varianzas agrupadas es para la prueba t para dos varianzas independientes. Para una calculadora de prueba t (donde se utiliza la idea de varianzas agrupadas), compruébalo aquí.
¿cuál es la varianza agrupada en la prueba z?
La varianza agrupada no se aplica en el caso de una prueba z, porque en ese caso se supone que las varianzas poblacionales son conocidas y no es necesario agruparlas para hacer la mejor estimación posible.
La idea de una varianza agrupada es más relevante cuando no se conocen las varianzas de la población y es necesario obtener una buena estimación, en cuyo caso la combinación de las varianzas funciona bien en ese sentido.
¿cuál es el propósito de la variación agrupada?
Como se explicó anteriormente, el propósito de calcular la varianza del conjunto es estimar la varianza común de la población cuando no se conoce la varianza real de la población.
Por eso es relevante conocer la varianza agrupada para el fórmula de prueba t , porque ese es un caso en el que se desconocen precisamente las varianzas poblacionales.
Entonces, en cierto modo, la varianza agrupada es una especie de promedio ponderado de varianzas , así que trate de obtener la mejor estimación posible, basada en información de muestra.
¿la varianza agrupada es lo mismo que mse?
En el contexto de una ANOVA , es. La fórmula MSE toma la varianza combinada de las muestras. En ese caso, la combinación puede incluir más de dos muestras.
La fórmula de varianza combinada para más de dos muestras es una extensión simple de la fórmula para dos muestras.