suivant: Adéquation d'une distribution expérimentale
monter: Le test du
précédent: Le test du
Table des matières
Index
Considérons un échantillon de taille n ayant une distribution
x1,.., xk d'effectifs
n1,..,nk (avec
n1 + ... + nk = n) correspondant à l'observation d'une
variable aléatoire X : X est discrète ou X est continue et dans ce
cas on effectue un regroupement en k classes des valeurs de X,
et
x1,.., xk représentent alors le centre de ces classes.
On veut comparer cette distribution empirique à une distribution théorique
d'effectifs e1,..,ek (si chaque valeur xj est obtenue avec la
probabilité théorique pj on a ej = npj).
La statistique
D2 = 
est une
bonne mesure de l'écart entre les effectifs observés et les effectifs
théoriques : plus D2 est proche de zéro, plus la distribution de
l'échantillon est conforme à la distribution théorique.
L'objectif sera donc d'estimer si D2 est suffisamment faible pour que l'on puisse ajuster la loi théorique à la distribution observée.
On montre que si n est grand, si ej > 5 pour tout j, et si les ej
ont été obtenus sans avoir eu recours à l'échantillon, la statistique
D2 suit approximativement une loi du
à
= (k - 1) degrés de
liberté où k est le nombre de classes.
Lorsque l'on a eu recours à l'échantillon pour déterminer r
paramètres, le nombre de degrés de liberté est alors de
= (k - r - 1).
On note dans la suite
le nombre de degrés de liberté.
La statistique D2 est alors utilisée comme variable de décision dans le
test d'hypothèses :
H0 : pour tout j = 1...k,
Proba(X = xj) = pj
H1 : il existe j = 1...k,
Proba(X = xj)
pj
On rejettera l'hypothèse d'adéquation au modèle dès que l'écart D2
est supérieur à ce que l'on peut attendre de simples fluctuations dues
à l'échantillonnage. La région critique au seuil
(c'est la
région où il faudra rejeter l'hypothèse) est la région pour laquelle :
d2 > h} quand
Proba(
< h) = 1 -
et
lorsque d2 est la valeur de D2 pour l'échantillon.
On remarquera que D2 fait intervenir le nombre de classes et les effectis
de chaque classe et que D2 ne
fera intervenir les xj que pour estimer les paramètres pj de la loi.
Pour les effectifs ej trop petits on effectuera un regroupement de classes.
Recette
Dans une table du
on cherche h tel que :
Proba(
< h) = 1 -
Avec Xcas on tape pour trouver h, si on a k classes et si
= 0.05 :
chisquare_icdf(k-1,0.975)
On prélève un échantillon de taille n et on note sa distribution
n1,.., nk correspondant aux k classes de centre
x1,.., xk.
On calcule la valeur d2 de D2 :
d2 = 
= 
Règle
On rejette l'hypothèse H0 au seuil
, quand d2 est supérieure à h.
Exemple
Dans un croisement de fleurs rouges et blanches, on a obtenu le résultat
suivant sur un échantillon de 600 plants de la 2-ième génération :
141 fleurs rouges, 315 fleurs roses, 144 fleurs blanches.
Ces résultats sont-ils conformes à la distribution théorique :
25% fleurs rouges, 50% fleurs roses, 25% fleurs blanches.
On a 3 classes donc 3-1=2 degrés de liberté :
n1 = 141 et
e1 = 600*25/100 = 150
n2 = 315 et
e2 = 600*50/100 = 300
n3 = 144 et
e3 = 600*25/100 = 150
On calcule
d2 = 
=
+
+
On tape dans Xcas :
81/150+15^
2/300+36/150
On obtient :
=153/100
On tape :
chisquare_icdf(2,0.95)
On obtient :
5.99146454711
Comme
1.53 < 5.992 on ne peut pas rejeter l'hypothèse H0 au seuil de 5%,
donc on l'accepte.
suivant: Adéquation d'une distribution expérimentale
monter: Le test du
précédent: Le test du
Table des matières
Index
Documentation de giac écrite par Renée De Graeve