suivant: Comparaison de la distribution
monter: Le test du
précédent: Adéquation d'une distribution expérimentale
Table des matières
Index
Adéquation d'une distribution expérimentale à une distribution normale
Pour pouvoir calculer les effectifs théoriques, on est souvent obligé d'estimer
les paramètres
et
à partir de l'échantillon (
par la moyenne m de l'échantillon et
par
s
nn-1 où s est l'écart-type de l'échantillon).
Règle
Soit k le nombre de classes.
Si on s'est servi de l'échantillon pour estimer
et
la
statistique D2
suit une loi du
à k - 3 degrés de liberté (cas 1),
si on s'est servi de l'échantillon pour estimer
ou
la statistique D2
suit une loi du
à k - 2 degrés de liberté (cas 2)
sinon D2
suit une loi du
à k - 1 degrés de liberté (cas 3) (k est le
nombres de classes).
On rejette l'hypothèse H0 au seuil
, quand la valeur d2 de
D2 est supérieure à h
avec h vérifiant :
- cas 1 :
Proba(
h) = 1 -
,
- cas 2 :
Proba(
h) = 1 -
,
- cas 3 :
Proba(
h) = 1 -
.
Exemple
On a effectué un échantillon de taille 250 et on a obtenu, pour les
valeurs d'une variable aléatoire X, réparties en 10 classes,
les effectifs suivants :
X |
nj |
45..46 |
11 |
46..47 |
15 |
47..48 |
27 |
48..49 |
35 |
49..50 |
47 |
50..51 |
58 |
51..52 |
28 |
52..53 |
16 |
53..54 |
10 |
54..55 |
3 |
On va tout d'abord calculer la moyenne m et l'écart-type s de
l'échantillon :
On tape :
L1:=[45..46,46..47,47..48,48..49,49..50,50..51,51..52
,52..53,53..54,54..55]
L2:=[11,15,27,35,47,58,28,16,10,3]
On tape :
m:=mean(L1,L2)
On obtient :
6207/125
Donc
m
49.656
s:=stddev(L1,L2)
On obtient :
sqrt(249229/62500)
On obtient une estimation de
en tapant :
s*sqrt(250/249)
On obtient :
2.00091946736
Donc
s
2
On cherche les effectifs théoriques on tape :
normal_cdf(49.656,2,45,46)
On obtient :
0.0238187239894,
normal_cdf(49.656,2,46,47),
etc ...
normal_cdf(49.656,2,54,55).
On rappelle que :
normal_cdf
(
,
, x1, x2) = 
exp(-
)dx
ou bien on tape
L:=[];
for(j:=0;j<10;j++) {
L:=concat(L,normal_cdf(49.656,2,45+j,46+j));}
ou encore on tape :
L:=seq(normal_cdf(49.656,2,45+j,46+j),j,0,9)
On obtient la liste L des pj (pj est la probabilité théorique
pour que la valeur de X soit dans la j-ième classe) :
[0.0238187239894,0.0583142776342,0.11174619649,
0.167620581364,0.196825404189,0.180926916339,
0.130193320084,0.0733363670394, 0.0323343295781,
0.0111577990363]
Il faut modifier le premier terme et le dernier terme de L car la
première classe est en fait
] -
;46[ et la dernière
[54; +
[.
On tape :
normal_cdf(49.656,2,-infinity,46)
On obtient :
0.0337747758231
On tape :
normal_cdf(49.656,2,54,+infinity)
On obtient :
0.0149278314584
L:=[0.0337747758231,0.0583142776342,0.11174619649,
0.167620581364,0.196825404189,0.180926916339,
0.130193320084,0.0733363670394,0.0323343295781,
0.0149278314584]
On obtient la liste L des effectifs théoriques ej de chaque classe
en tapant :
L:=250*L
On obtient :
[8.44369395578,14.5785694086,27.9365491225,41.
905145341,49.2063510472,45.2317290848,
32.548330021,18.3340917599,8.08358239453,
3.7319578646]
On regroupe les 2 dernières classes (L[8]+L[9]=11.8155402591),
Ou encore , on tape :
L:=accumulate_head_tail(L,1,2)
on obtient la liste L des effectifs théoriques des 9 classes :
L:= [8.44369395578,14.5785694086,27.9365491225,
41.905145341,49.2063510472,45.2317290848,
32.548330021,18.3340917599,11.8155402591]
La liste L2:=[11,15,27,35,47,58,28,16,10,3] des effectifs de
l'échantillon après un
regroupement en 9 classes,
on tape :
L2:=accumulate_head_tail(L2,1,2)
On obtient :
L2:=[11,15,27,35,47,58,28,16,13]
On calcule la valeur de D2 :
d2:=sum(((L-L2)[j])^
2/L[j],j,0,8)
On obtient :
6.71003239422
On calcule
Proba(
< h) = 0.95, pour cela on tape (car on a 9 - 3 = 6
degrés de liberté) :
chisquare_icdf(6,0.95)
On obtient :
12.5915872437
donc
h
12.6
L'hypothèse n'est pas à rejeter au seuil de 5% puisque
d2 = 6.71 < 12.6.
suivant: Comparaison de la distribution
monter: Le test du
précédent: Adéquation d'une distribution expérimentale
Table des matières
Index
Documentation de giac écrite par Renée De Graeve