next up previous contents index
suivant: Application : le test monter: Comparaison de la distribution précédent: Cas général : on   Table des matières   Index


Application à deux échantillons prenant deux valeurs

Soient f1(1) et f1(2) les fréquences observées sur deux échantillons d'un caractère dont la fréquence théorique est p. Cette observation est faite à partir de deux échantillons de taille respéctive n(1) et n(2) (même notations qu'en 2.11.1).
On veut savoir si les fréquences f1(1) et f1(2) sont significativement différentes ce qui voudrait dire que les deux échantillons proviennent de deux populations différentes de paramètre p1 et p2 ou si au contraire les deux échantillons proviennent d'une même population de paramètre p = p1 = p2 c'est à dire que ces deux échantillons sont ceux d'une même loi (voir aussi 2.9.1).
On a :
n(1) + n(2) = n
f1(1)n(1) = n1(1) et (1 - f1(1))n(1) = n2(1)(= f2(1)n(1))
f1(2)n(2) = n1(2) et (1 - f1(2))n(2) = n2(2)(= f2(2)n(2))
n1 = f1(1)n(1) + f1(2)n(2)
n2 = (1 - f1(1))n(1) + (1 - f1(2))n(2)
$ \nu_{j}^{{(i)}}$ = n(i)nj/n donc
$ \nu_{1}^{{(1)}}$ - n1(1) = n(1)(f1(1)n(1) + f1(2)n(2))/(n(1) + n(2)) - f1(1)n(1) =
n(2)n(1)(f1(2) - f1(1))/(n(1) + n(2))
$ \nu_{1}^{{(2)}}$ - n1(2) = n(2)(f1(1)n(1) + f1(2)n(2))/(n(1) + n(2)) - f1(2)n(2) =
n(1)n(2)(f1(1) - f1(2))/(n(1) + n(2))
$ \nu_{2}^{{(1)}}$ - n2(1) = n(1)((1 - f1(1))n(1) + (1 - f1(2))n(2))/(n(1) + n(2)) - (1 - f1(1))n(1) =
n(1)n(2)(f1(1) - f1(2))/(n(1) + n(2))
$ \nu_{2}^{{(2)}}$ - n2(2) = n(2)((1 - f1(1))n(1) + (1 - f1(2))n(2))/(n(1) + n(2)) - (1 - f1(2))n(2) =
n(1)n(2)(f1(2) - f1(1))/(n(1) + n(2))
1/$ \nu_{1}^{{(1)}}$ +1/$ \nu_{1}^{{(2)}}$ +1/$ \nu_{2}^{{(1)}}$ +1/$ \nu_{2}^{{(2)}}$ =
(n(1) + n(2))($\displaystyle {\frac{{1}}{{n^{(1)}}}}$ + $\displaystyle {\frac{{1}}{{n^{(2)}}}}$)($\displaystyle {\frac{{1}}{{f_1^{(1)}n^{(1)}+f_1^{(2)}n^{(2)}}}}$ + $\displaystyle {\frac{{1}}{{(1-f_1^{(1)})n^{(1)}+(1-f_1^{(2)})n^{(2)}}}}$) =
$\displaystyle {\frac{{(n^{(1)}+n^{(2)})^2}}{{n^{(1)}n^{(2)}}}}$($\displaystyle {\frac{{1}}{{f_1^{(1)}n^{(1)}+f_1^{(2)}n^{(2)}}}}$ + $\displaystyle {\frac{{1}}{{(1-f_1^{(1)})n^{(1)}+(1-f_1^{(2)})n^{(2)}}}}$) =
$\displaystyle {\frac{{(n^{(1)}+n^{(2)})^3}}{{n^{(1)}n^{(2)}(n_1f_1^{(1)}+n_2f_1^{(2)})(n_1(1-f_1^{(1)})+n_2(1-f_1^{(2)}))}}}$
La variable D2 suit une loi du $ \chi^{2}_{}$ a 1 degré de liberté : on a 2 échantillons (m = 2) et chaque échantillon ne prend que 2 valeurs, (k = 2) donc s = (m - 1)(k - 1) = 1.
La variable D2 s'écrit alors :
D2 = $\displaystyle {\frac{{n^{(1)}n^{(2)}(f_1^{(1)}-f_1^{(2)})^2(n^{(1)}+n^{(2)})}}{{(n^{(1)}f_1^{(1)}+n^{(2)}f_1^{(2)})(n^{(1)}(1-f_1^{(1)})+n^{(2)}(1-f_1^{(2)}))}}}$
ou encore
D2 = $\displaystyle {\frac{{n(n_1^{(1)}n_2^{(2)}-n_1^{(2)}n_2^{(1)})^2}}{{n^{(1)}n^{(2)}n_1n_2}}}$
D2 suit une loi du $ \chi^{2}_{}$ ayant 1 degré de liberté.
Exercice (le même qu'en section 2.9.1)
Pour tester l'efficacité d'un vaccin antigrippal on soumet 300 personnes à une expérience :
- sur 100 personnes non vaccinées, 32 sont atteintes par la grippe,
- sur 200 personnes vaccinées, 50 sont atteintes par la grippe,
Ce résultat permet-il d'apprécier l'efficacité du vaccin ?
On a le tableau suivant :

  grippé non grippé taille
vacciné 32 68 100
non vacciné 50 150 200
total 82 218 300

On calcule la valeur d2 de D2 on tape :
d2:=300*(150*32-68*50)^2/(100*200*82*218)
On obtient :
7350/4469
donc d2 $ \simeq$ 1.645
On cherche la valeur h qui vérifie :
Proba($ \chi_{1}^{2}$ > h) = 0.05  ou encore  Proba($ \chi_{1}^{2}$ $ \leq$ h) = 0.95
pour cela on tape :
chisquare_icdf(1,0.95)
On obtient :
3.84145882069
donc h $ \simeq$ 3.84
Puisque $ \tt d2\simeq 1.645<3.84$ on en déduit que les deux échantillons ne sont pas significativement différents au seuil de 5% : on peut donc mettre en doute l'efficacité du vaccin.


next up previous contents index
suivant: Application : le test monter: Comparaison de la distribution précédent: Cas général : on   Table des matières   Index
Documentation de giac écrite par Renée De Graeve