next up previous contents index
suivant: Adéquation d'une distribution expérimentale monter: Le test du précédent: Le test du   Table des matières   Index

Adéquation d'une distribution expérimentale à une distribution théorique

Considérons un échantillon de taille n ayant une distribution x1,.., xk d'effectifs n1,..,nk (avec n1 + ... + nk = n) correspondant à l'observation d'une variable aléatoire X : X est discrète ou X est continue et dans ce cas on effectue un regroupement en k classes des valeurs de X, et x1,.., xk représentent alors le centre de ces classes.
On veut comparer cette distribution empirique à une distribution théorique d'effectifs e1,..,ek (si chaque valeur xj est obtenue avec la probabilité théorique pj on a ej = npj).
La statistique D2 = $\displaystyle \sum_{{j=1}}^{k}$$\displaystyle {\frac{{(n_j-e_j)^2}}{{e_j}}}$ est une bonne mesure de l'écart entre les effectifs observés et les effectifs théoriques : plus D2 est proche de zéro, plus la distribution de l'échantillon est conforme à la distribution théorique.
L'objectif sera donc d'estimer si D2 est suffisamment faible pour que l'on puisse ajuster la loi théorique à la distribution observée.
On montre que si n est grand, si ej > 5 pour tout j, et si les ej ont été obtenus sans avoir eu recours à l'échantillon, la statistique D2 suit approximativement une loi du $ \chi^{2}_{}$ à $ \nu$ = (k - 1) degrés de liberté où k est le nombre de classes.
Lorsque l'on a eu recours à l'échantillon pour déterminer r paramètres, le nombre de degrés de liberté est alors de $ \nu$ = (k - r - 1).
On note dans la suite $ \nu$ le nombre de degrés de liberté.
La statistique D2 est alors utilisée comme variable de décision dans le test d'hypothèses :
H0 : pour tout j = 1...k, Proba(X = xj) = pj
H1 : il existe j = 1...k, Proba(X = xj) $ \neq$ pj
On rejettera l'hypothèse d'adéquation au modèle dès que l'écart D2 est supérieur à ce que l'on peut attendre de simples fluctuations dues à l'échantillonnage. La région critique au seuil $ \alpha$ (c'est la région où il faudra rejeter l'hypothèse) est la région pour laquelle : d2 > h} quand Proba($ \chi^{2}_{\nu}$ < h) = 1 - $ \alpha$ et lorsque d2 est la valeur de D2 pour l'échantillon.
On remarquera que D2 fait intervenir le nombre de classes et les effectis de chaque classe et que D2 ne fera intervenir les xj que pour estimer les paramètres pj de la loi. Pour les effectifs ej trop petits on effectuera un regroupement de classes.
Recette
Dans une table du $ \chi^{2}_{}$ on cherche h tel que :
Proba($ \chi_{{k-1}}^{2}$ < h) = 1 - $ \alpha$
Avec Xcas on tape pour trouver h, si on a k classes et si $ \alpha$ = 0.05 :
chisquare_icdf(k-1,0.975)
On prélève un échantillon de taille n et on note sa distribution n1,.., nk correspondant aux k classes de centre x1,.., xk.
On calcule la valeur d2 de D2 : d2 = $\displaystyle \sum_{{j=1}}^{k}$$\displaystyle {\frac{{(n_j-np_j)^2}}{{np_j}}}$ = $\displaystyle \sum_{{j=1}}^{k}$$\displaystyle {\frac{{(n_j-e_j)^2}}{{e_j}}}$
Règle
On rejette l'hypothèse H0 au seuil $ \alpha$, quand d2 est supérieure à h.
Exemple
Dans un croisement de fleurs rouges et blanches, on a obtenu le résultat suivant sur un échantillon de 600 plants de la 2-ième génération :
141 fleurs rouges, 315 fleurs roses, 144 fleurs blanches.
Ces résultats sont-ils conformes à la distribution théorique :
25% fleurs rouges, 50% fleurs roses, 25% fleurs blanches.
On a 3 classes donc 3-1=2 degrés de liberté :
n1 = 141 et e1 = 600*25/100 = 150
n2 = 315 et e2 = 600*50/100 = 300
n3 = 144 et e3 = 600*25/100 = 150
On calcule d2 = $\displaystyle \sum_{{j=1}}^{3}$$\displaystyle {\frac{{(n_j-e_j)^2}}{{e_j}}}$ = $\displaystyle {\frac{{81}}{{150}}}$ + $\displaystyle {\frac{{15^2}}{{300}}}$ + $\displaystyle {\frac{{36}}{{150}}}$ On tape dans Xcas :
81/150+15^2/300+36/150
On obtient :
=153/100
On tape :
chisquare_icdf(2,0.95)
On obtient :
5.99146454711
Comme 1.53 < 5.992 on ne peut pas rejeter l'hypothèse H0 au seuil de 5%, donc on l'accepte.
next up previous contents index
suivant: Adéquation d'une distribution expérimentale monter: Le test du précédent: Le test du   Table des matières   Index
Documentation de giac écrite par Renée De Graeve