next up previous contents index
suivant: Comparaison de la distribution monter: Le test du précédent: Adéquation d'une distribution expérimentale   Table des matières   Index


Adéquation d'une distribution expérimentale à une distribution normale

Pour pouvoir calculer les effectifs théoriques, on est souvent obligé d'estimer les paramètres $ \mu$ et $ \sigma$ à partir de l'échantillon ($ \mu$ par la moyenne m de l'échantillon et $ \sigma$ par s$ \sqrt{\frac}$nn-1 où s est l'écart-type de l'échantillon).
Règle
Soit k le nombre de classes.
Si on s'est servi de l'échantillon pour estimer $ \mu$ et $ \sigma$ la statistique D2 suit une loi du $ \chi^{2}_{}$ à k - 3 degrés de liberté (cas 1),
si on s'est servi de l'échantillon pour estimer $ \mu$ ou $ \sigma$ la statistique D2 suit une loi du $ \chi^{2}_{}$ à k - 2 degrés de liberté (cas 2)
sinon D2 suit une loi du $ \chi^{2}_{}$ à k - 1 degrés de liberté (cas 3) (k est le nombres de classes).
On rejette l'hypothèse H0 au seuil $ \alpha$, quand la valeur d2 de D2 est supérieure à h avec h vérifiant :
- cas 1 : Proba($ \chi^{2}_{{k-3}}$ $ \leq$ h) = 1 - $ \alpha$,
- cas 2 : Proba($ \chi^{2}_{{k-2}}$ $ \leq$ h) = 1 - $ \alpha$,
- cas 3 : Proba($ \chi^{2}_{{k-1}}$ $ \leq$ h) = 1 - $ \alpha$.
Exemple
On a effectué un échantillon de taille 250 et on a obtenu, pour les valeurs d'une variable aléatoire X, réparties en 10 classes, les effectifs suivants :
X nj
45..46 11
46..47 15
47..48 27
48..49 35
49..50 47
50..51 58
51..52 28
52..53 16
53..54 10
54..55 3
On va tout d'abord calculer la moyenne m et l'écart-type s de l'échantillon :
On tape :
L1:=[45..46,46..47,47..48,48..49,49..50,50..51,51..52
,52..53,53..54,54..55]
L2:=[11,15,27,35,47,58,28,16,10,3]
On tape :
m:=mean(L1,L2)
On obtient :
6207/125
Donc m $ \simeq$ 49.656
s:=stddev(L1,L2)
On obtient :
sqrt(249229/62500)
On obtient une estimation de $ \sigma$ en tapant :
s*sqrt(250/249)
On obtient :
2.00091946736
Donc s $ \simeq$ 2
On cherche les effectifs théoriques on tape :
normal_cdf(49.656,2,45,46)
On obtient :
0.0238187239894,
normal_cdf(49.656,2,46,47),
etc ...
normal_cdf(49.656,2,54,55).
On rappelle que :
normal_cdf ($\displaystyle \mu$,$\displaystyle \sigma$, x1, x2) = $\displaystyle \int_{{x_1}}^{{x_2}}$$\displaystyle {\frac{{1}}{{\sigma\sqrt{2\pi}}}}$exp(- $\displaystyle {\frac{{(x-\mu)^2}}{{2*\sigma^2}}}$)dx
ou bien on tape
L:=[];
for(j:=0;j<10;j++) {
L:=concat(L,normal_cdf(49.656,2,45+j,46+j));}
ou encore on tape :
L:=seq(normal_cdf(49.656,2,45+j,46+j),j,0,9)
On obtient la liste L des pj (pj est la probabilité théorique pour que la valeur de X soit dans la j-ième classe) :
[0.0238187239894,0.0583142776342,0.11174619649,
0.167620581364,0.196825404189,0.180926916339,
0.130193320084,0.0733363670394, 0.0323343295781,
0.0111577990363]
Il faut modifier le premier terme et le dernier terme de L car la première classe est en fait ] - $ \infty$;46[ et la dernière [54; + $ \infty$[.
On tape :
normal_cdf(49.656,2,-infinity,46)
On obtient :
0.0337747758231
On tape :
normal_cdf(49.656,2,54,+infinity)
On obtient :
0.0149278314584
L:=[0.0337747758231,0.0583142776342,0.11174619649,
0.167620581364,0.196825404189,0.180926916339,
0.130193320084,0.0733363670394,0.0323343295781,
0.0149278314584]
On obtient la liste L des effectifs théoriques ej de chaque classe en tapant :
L:=250*L
On obtient :
[8.44369395578,14.5785694086,27.9365491225,41.
905145341,49.2063510472,45.2317290848,
32.548330021,18.3340917599,8.08358239453,
3.7319578646]
On regroupe les 2 dernières classes (L[8]+L[9]=11.8155402591),
Ou encore , on tape :
L:=accumulate_head_tail(L,1,2) on obtient la liste L des effectifs théoriques des 9 classes :
L:= [8.44369395578,14.5785694086,27.9365491225,
41.905145341,49.2063510472,45.2317290848,
32.548330021,18.3340917599,11.8155402591]
La liste L2:=[11,15,27,35,47,58,28,16,10,3] des effectifs de l'échantillon après un regroupement en 9 classes, on tape :
L2:=accumulate_head_tail(L2,1,2)
On obtient :
L2:=[11,15,27,35,47,58,28,16,13]
On calcule la valeur de D2 :
d2:=sum(((L-L2)[j])^2/L[j],j,0,8)
On obtient :
6.71003239422
On calcule Proba($ \chi^{2}_{6}$ < h) = 0.95, pour cela on tape (car on a 9 - 3 = 6 degrés de liberté) :
chisquare_icdf(6,0.95)
On obtient :
12.5915872437
donc h $ \simeq$ 12.6
L'hypothèse n'est pas à rejeter au seuil de 5% puisque d2 = 6.71 < 12.6.
next up previous contents index
suivant: Comparaison de la distribution monter: Le test du précédent: Adéquation d'une distribution expérimentale   Table des matières   Index
Documentation de giac écrite par Renée De Graeve