Pour n=500, on trouve par exemple :
m=mean(A0:E99)=0.484342422505 et
s=stddev(A0:E99)=0.285946471987
Ici, on est parti d'une loi connue : la loi uniforme sur [0;1] de moyenne
= 0.5 et d'écart-type
=
0.288675134595.
Dans la pratique on ne connait ni ni
.
D'après la théorie, si on considère tous les échantillons de taille
n, la variable aléatoire :
=
suit approximativement une loi normale
(
,
)
lorsque n est grand et la variable aléatoire :
S2 = a pour moyenne
Pour la loi uniforme on a :
la moyenne de la série des moyennes des échantillons de taille n
est égale à 0.5 ,
l'écart-type de la série des moyennes des échantillons de taille n est
,
la moyenne de la série des écarts-types des échantillons de taille n est
,
l'écart-type
(S2) de la série des écarts-types des échantillons de taille n est plus petit que K/
où K est une constante qui ne dépend que de la loi.
Au vu d'un échantillon d'effectif 500 (n=500), de moyenne m, et
d'écart-type s, on convient de dire
que la moyenne empirique :
m=mean((A0):(E99))=0.484342422505 (m est la valeur observée de
)
est l'approximation de la moyenne
et que l'écart-type empirique :
s=stddev(A0:E99)=0.285946471987 (s2 est la valeur observée de
S2) est l'approximation de la moyenne de la série des écarts-types des échantillons de taille n = 500 et on a :
=
*
s.
Lorsque l'on ne connait pas on en calcule une valeur approchée
à partir de l'écart type d'un échantillon de grande taille ici 500 :
on a : s=0.285946471987
On calcule la valeur théorique estimée :
- est = s*
On tape et on obtient :
=0.285946471987*sqrt500/499=0.286232848095
au lieu de
= 0.288386314978
De plus la théorie nous dit que la distribution des moyennes des
échantillons d'effectif 500 suit sensiblement une loi normale de moyenne
et
d'écart-type :
=0.0128007221147.
Ceci nous permet de dire qu'au seuil de 5%, on a :
| m - | < 1.96*0.0127879149858 = 0.0250894153448 soit :
0.45925300716 = m - <
< m +
= 0.50943183785.
D'où un intervalle de confiance au seuil de 5% pour de :
[0.4592;0.5095].
Voici les résultats des lignes 100 et 101 :
- ligne 100 est la valeur de la moyenne de 5 échantillons d'effectif 100, on
trouve :
0.466489640726, 0.487896819143, 0.499799806252,
0.453281438346, 0.514244408058.
Ces 5 moyennes ont pour moyenne la moyenne totale:
mean(A100:E100) =m =0.484342422505
et ces 5 moyennes ont pour écart-type :
stddev(A100:E100)=0.022041777341
/
- ligne 101 est la valeur de l'écart-type de 5 échantillons d'effectif 100,
on trouve :
0.264640095911, 0.302416108249, 0.299622396086,
0.276154743049, 0.280843050885
ces 5 écarts-types ont pour moyenne :
mean(A101:E101) =0.284735278836
valeur approchée de
*
0.287228132327
et pour écart-type :
stddev(A101:E101)=0.0143305924398.
Dans la colonne F on fait la moyenne des lignes ce qui correspond à
100 échantillons de 5 tirages (n=5).
Ces 100 moyennes ont pour moyenne la moyenne totale :
mean(F0:F99)=0.484342422505
et es 100 moyennes ont pour écart-type :
stddev(F0:F99)=0.112665383246
valeur approchée de
/
0.129099444874.
Dans la colonne G on fait l'écart-type des lignes ce qui correspond
à 100 échantillons de 5 tirages (n=5).
Ces 100 écarts-types ont pour moyenne :
mean(G0:G99)=0.252572046948
valeur approchée de
*
0.258198889747
et pour écart-type :
stddev(G0:G99)=0.0726584981978
Observations :
- Comment évoluent les moyennes :
les valeurs de la ligne 100 des moyennes de chaque colonne A..F
c'est à dire la moyenne de 100 observations est assez proche de la valeur attendue 0.5, alors que la colonne F
moyenne des lignes c'est à dire de 5 observations est loin de la valeur attendue 0.5. On voit bien que l'écart-type des moyennes d'un échantillon de taille n dépend de n et que plus n est grand plus cet écart-type diminue.
Les écarts-types de ces 2 séries ne sont donc pas les mêmes :
d'après la théorie, l'écart-type des moyennes d'un échantillon de
taille n est :
/
si
est l'écart-type de la population toute
entière qui est pour la loi uniforme de :
= 0.288675134595.
De façon expérimentale on a :
- écart type des 5 moyennes correspondant à 5 échantillons de taille 100 :
0.022041777341
On calcule la valeur théorique :
sqrt(1/12)/10=0.0288675134595
- écart type des 100 moyennes correspondant à 100 échantillons de taille 5 :
0.112665383246
On calcule la valeur théorique :
sqrt(1/12)/sqrt(5)=0.129099444874
- Comment évoluent les écarts-types :
d'après la théorie, la moyenne des écarts-types d'un échantillon de
taille n est :
*
si
est l'écart-type de la population toute entière qui est pour la loi uniforme de :
= 0.288675134595.
De façon expérimentale on a :
- moyenne des 5 écarts-types correspondant à 5 échantillons de taille 100 :
0.284735278836
On calcule la valeur théorique :
sqrt(1/12)*sqrt(99/100)=0.298337151271
- moyenne des 100 écarts-types correspondant à 100 échantillons de taille 5 :
0.252572046948
On calcule la valeur théorique :
sqrt(1/12)*sqrt(4/5)=0.258198889747
Lorsque l'on ne connait pas on en calcule une valeur approchée
à partir de l'écart type d'un échantillon de grande taille ici 500 :
on a : s=0.285946471987
La valeur théorique estimée
est de
:
est = s*
On tape :
0.285946471987*sqrt(500/499)
On obtient :
0.286232848095 (au lieu de =0.288386314978
Quant aux écarts-types des écarts-types des échantillons de taille n,
on voit qu'il sont d'autant plus
petit que n est grand : c'est pourquoi on peut approcher l'écart type par l'écart-type d'un seul échantillon de grande taille.