Calculateur de variance groupée
Instructions : Cette calculatrice calcule la variance et l'écart-type regroupés pour deux écarts-types d'échantillons donnés \(s_1\) et \(s_2\), avec les tailles d'échantillons correspondantes \(n_1\) et \(n_2\).
Comment calculer les écarts regroupés
A Variance groupée est une estimation de la variance de la population obtenue à partir de deux variances d'échantillons lorsqu'on suppose que les deux échantillons proviennent d'une population ayant le même écart-type.
Dans ce cas, aucune des variances de l'échantillon n'est une meilleure estimation que l'autre, et les deux variances de l'échantillon fournies sont "regroupées", en quelque sorte sous forme de moyenne pondérée, pour calculer la variance regroupée
Comment calculer la variance cumulée ?
La formule permettant de calculer la variance groupée à partir de deux variances d'échantillon est la suivante :
\[ s_p^2 = \frac{(n_1-1)s_1^2 + (n_2-1)s_2^2}{n_1+n_2-2} \]D'autre part, la formule de la variance groupée nous permet de déduire que l'écart-type groupé est :
\[s_p = \sqrt{ \frac{(n_1-1)s_1^2 + (n_2-1)s_2^2}{n_1+n_2-2}}\]Relation entre la variance groupée et la somme des carrés
Une façon simple d'exprimer les formules ci-dessus est basée sur l'idée du Somme des carrés (\(SS\)). En sciences sociales, la somme des carrés d'un échantillon est définie comme suit
\[SS = \sum_{i=1}^n \left( X - \bar X\right)^2 \]Mais en utilisant la définition de la variance de l'échantillon, il est facile de voir que
\[SS = \sum_{i=1}^n \left( X - \bar X \right)^2 = (n-1) s^2\]Nous multiplions donc la variance de l'échantillon par \(n-1\) et nous obtenons la somme des carrés \(SS\). Nous savons également que dans le cas d'un seul échantillon, nous avons \(df = n-1\). Par conséquent, la variance groupée peut s'écrire très simplement comme suit :
\[ s_p^2 = \frac{(n_1-1)s_1^2 + (n_2-1)s_2^2}{n_1+n_2-2} = \frac{ SS_1 + SS_2}{df_1+df_2}\]Quand utiliser le pool de variances
L'idée des variances regroupées nécessite l'hypothèse que les variances de la population sont égales. Dans le cas de variances de population inégales, vous devez utiliser la méthode suivante calculatrice de variances non regroupées .
Le test t pour deux variances indépendantes est l'un des contextes dans lesquels l'idée de variances regroupées est utilisée. Pour une calculatrice de test t (où l'idée de variances regroupées est utilisée), vérifier ici.
Quelle est la variance groupée dans le test z ?
La variance regroupée ne s'applique pas dans le cas d'un test z, car dans ce cas, les variances de la population sont supposées connues et il n'est pas nécessaire de les regrouper pour obtenir la meilleure estimation possible.
L'idée d'une variance regroupée est plus pertinente lorsque les variances de la population ne sont pas connues et qu'il est nécessaire d'obtenir une bonne estimation, auquel cas le regroupement des variances permet d'obtenir de bons résultats.
Quel est l'objectif de la variance groupée ?
Comme nous l'avons expliqué plus haut, le calcul de la variance de pool a pour but d'estimer la variance de la population commune lorsque la variance réelle de la population n'est pas connue.
C'est pourquoi il est important de connaître la variance groupée pour la formule de test t car il s'agit d'un cas où les variances de la population sont précisément inconnues.
D'une certaine manière, la variance regroupée est donc une sorte de moyenne pondérée des écarts il faut donc essayer d'obtenir la meilleure estimation possible, sur la base d'un échantillon d'informations.
La variance groupée est-elle identique à l'eqm ?
Dans le cadre d'une ANOVA , c'est le cas. La formule de l'EQM prend la variance regroupée des échantillons. Dans ce cas, le regroupement peut inclure plus de deux échantillons.
La formule de la variance groupée pour plus de deux échantillons est une simple extension de la formule pour deux échantillons.