next up previous contents index
suivant: Comparaison de deux écarts-types monter: Les tests d'homogénéité précédent: Comparaison de deux fréquences   Table des matières   Index


Comparaison de deux moyennes observées

Soient m1 et m2 les moyennes observées d'un caractère dont la moyenne théorique est $ \mu$. Cette observation est faite à partir de deux échantillons de taille respéctive n1 et n2.
On veut savoir si les moyennes m1 et m2 sont significativement différentes ce qui voudrait dire que les deux échantillons proviennent de deux populations différentes de moyenne $ \mu_{1}^{}$ et $ \mu_{2}^{}$ ou si au contraire les deux échantillons proviennent d'une même population ou de populations de même moyenne $ \mu$ = $ \mu_{1}^{}$ = $ \mu_{2}^{}$.
Soient deux caractères normaux indépendants X et Y distribués respectivement selon les lois $ \mathcal {N}$($ \mu_{1}^{}$,$ \sigma$(X)) et $ \mathcal {N}$($ \mu_{2}^{}$,$ \sigma$(Y)),
On veut donc tester l'hypothèse H0 : $ \mu_{1}^{}$ = $ \mu_{2}^{}$ = $ \mu$ contre H1 : $ \mu_{1}^{}$ $ \neq$ $ \mu_{2}^{}$ au seuil $ \alpha$.
Soient deux échantillons considérés l'un comme échantillon du caractère X et l'autre comme échantillon du caractère Y, de taille respective n1 et n2 de moyenne respective m1 et m2 et d'écart-type respectif s1 et s2.
Soit $ \bar{X}$ (resp $ \bar{Y}$) la variable aléatoire égale à la moyenne du caractère X (resp Y) pour des échantillons de taille n1 (resp n2).
On a :
$ \bar{X}$ a pour moyenne $ \mu_{1}^{}$ et comme écart-type $ {\frac{{\sigma(X)}}{{\sqrt{n_1}}}}$
$ \bar{Y}$ a pour moyenne $ \mu_{2}^{}$ et comme écart-type $ {\frac{{\sigma(Y)}}{{\sqrt{n_2}}}}$

Cas où $ \sigma$(X) et $ \sigma$(Y) sont connus
On a si $ \mu_{1}^{}$ = $ \mu_{2}^{}$ :
$ {\frac{{\bar X-\bar Y}}{{\sqrt{\sigma(X)^2/n_1+\sigma(Y)^2/n_2}}}}$ suit approximativement une loi $ \mathcal {N}$(0, 1).

Cas où $ \sigma$(X) et $ \sigma$(Y) ne sont pas connus
On les estime :

- si n1 et n2 sont grands,
$ \sigma$(X) $ \simeq$ s1$ \sqrt{\frac}$n1n1-1 donc $ {\frac{{\sigma(X)^2}}{{n_1}}}$ $ \simeq$ $ {\frac{{s_1^2}}{{n_1-1}}}$
$ \sigma$(Y) $ \simeq$ s2$ \sqrt{\frac}$n2n2-1 donc $ {\frac{{\sigma(Y)^2}}{{n_2}}}$ $ \simeq$ $ {\frac{{s_2^2}}{{n_2-1}}}$
On pose :
s12 = $ \sqrt{{\sigma(X)^2/n_1+\sigma(Y)^2/n_2}}$ $ \simeq$ $ \sqrt{{\frac{s_1^2}{n_1-1}+\frac{s_2^2}{n_2-1}}}$
Donc sous l'hypothèse H0 : $ \mu_{1}^{}$ = $ \mu_{2}^{}$ = $ \mu$, on a ($ \bar{X}$ - $ \bar{Y}$) $ \in$ $ \mathcal {N}$(0, s12)
Recette si n1 et n2 sont grands
Avec Xcas on tape si $ \alpha$ = 0.05:
a:=normal_icdf(0,s12,0.975)
On regarde si :
| m1 - m2| < a
Si c'est le cas, on admet que $ \mu_{1}^{}$ = $ \mu_{2}^{}$ et que les deux échantillons ne sont pas significativement différents au seuil $ \alpha$, sinon on dira que $ \mu_{1}^{}$ $ \neq$ $ \mu_{2}^{}$ et que les deux échantillons ne proviennent pas de la même population.

- si n1 et n2 sont petits,
on peut estimer $ \sigma$(X) et $ \sigma$(Y) grâce à la reunion des deux échantillons et en faisant l'hypothèse $ \sigma$(X) = $ \sigma$(Y) (pour vérifier cette hypothèse on pourra faire une étude de l'hypothèse $ \sigma$(X) = $ \sigma$(Y) grâce au test expliqué au paragraphe suivant).
On montre qu'une bonne approximation est :
$\displaystyle \sigma^{2}_{}$ = $\displaystyle \sigma$(X)2 = $\displaystyle \sigma$(Y)2 $\displaystyle \simeq$ s2 = $\displaystyle {\frac{{n_1s_1^2+n_2s_2^2}}{{n_1+n_2-2}}}$.
En effet, la statistique $\displaystyle {\frac{{n_1S_1^2+n_2S_2^2}}{{n_1+n_2-2}}}$ est un estimateur sans biais de $ \sigma^{2}_{}$ si $ \sigma$ est l'écart-type de X. La valeur de cette statistique est obtenue à partir de deux échantillons de taille respective n1 et n2 et d'écart-type respectif s1 et s2 qui sont les valeurs de S1 et S2 pour ces deux échantillons (avec comme notation S2 = $\displaystyle {\frac{{1}}{{n}}}$$\displaystyle \sum_{j}^{}$(Xj - $\displaystyle \bar{X}$)2 pour un échantillon de taille n de la variable X d'écart-type $ \sigma$, on sait que $\displaystyle {\frac{{n}}{{n-1}}}$S2 est un estimateur sans biais de $ \sigma^{2}_{}$) :
On a :
$\displaystyle \sigma^{2}_{}$ = $\displaystyle {\frac{{n_1}}{{n_1-1}}}$E(S12) = $\displaystyle {\frac{{n_2}}{{n_2-1}}}$E(S22) donc
E($\displaystyle {\frac{{n_1S_1^2+n_2S_2^2}}{{n_1+n_2-2}}}$) = $\displaystyle {\frac{{n_1E(S_1^2)+n_2E(S_2^2)}}{{n_1+n_2-2}}}$ = $\displaystyle {\frac{{(n_1-1)\sigma^2+(n_2-1)\sigma^2}}{{n_1+n_2-2}}}$ = $\displaystyle \sigma^{2}_{}$
donc $\displaystyle \sigma^{2}_{}$ $\displaystyle \simeq$ s2 = $\displaystyle {\frac{{n_1s_1^2+n_2s_2^2}}{{n_1+n_2-2}}}$.
Alors sous l'hypothèse H0 : $ \mu_{1}^{}$ = $ \mu_{2}^{}$ = $ \mu$, et $ \sigma$(X) = $ \sigma$(Y) = $ \sigma$, la statistique :

T = $\displaystyle {\frac{{\bar X-\bar Y}}{{\sqrt{\sigma(X)^2/n_1+\sigma(Y)^2/n_2}}}}$ $\displaystyle \simeq$ $\displaystyle {\frac{{(\bar X-\bar Y)\sqrt{n_1+n_2-2}}}{{\sqrt{(n_1s_1^2+n_2s_2^2)(1/n_1+1/n_2)}}}}$

suit une loi de Student à n1 + n2 - 2 degrés de liberté.
Recette si n1 et n2 sont petits
Avec Xcas on tape si $ \alpha$ = 0.05 :
a:=student_icdf(n1+n2-2,0.975)
On regarde si :
| m1 - m2| < a
Si c'est le cas, on admet que $ \mu_{1}^{}$ = $ \mu_{2}^{}$ et que les deux échantillons ne sont pas significativement différents au seuil $ \alpha$, sinon on dira que $ \mu_{1}^{}$ $ \neq$ $ \mu_{2}^{}$ et que les deux échantillons ne proviennent pas de la même population.
next up previous contents index
suivant: Comparaison de deux écarts-types monter: Les tests d'homogénéité précédent: Comparaison de deux fréquences   Table des matières   Index
Documentation de giac écrite par Renée De Graeve