next up previous contents index
suivant: Exemples d'exercies utilisant le monter: Résolution d'exercices de statistiques précédent: Intervalle de confiance   Table des matières   Index

Simulation de la loi uniforme sur [0;1]

Si X suit une loi uniforme sur [0;1], X a pour espérance 1/2 et pour écart-type $ \sqrt{{1/12}}$ $ \simeq$ 0.288675134595.
En effet :
E(X) = $ \int_{0}^{1}$xdx = 1/2 et
E(X2) = $ \int_{0}^{1}$x2dx = 1/3 et donc
$ \sigma$(X) = $ \sqrt{{1/3-(1/2)^2}}$ = $ \sqrt{{1/12}}$
Dans Xcas la fonction rand() renvoie, de façon équirpartie, un nombre aléatoire entre 0 et 232 et rand(0,1) ou rand(0..1)() renvoie, de façon équirpartie, un nombre aléatoire entre 0 et 1 : on remarquera que r:=rand(0..1) définit une fonction r et que r() renvoie alors de façon équirpartie, un nombre aléatoire entre 0 et 1.
Exercice :
Simuler dans la colonne A du tableur, le tirage de 100 nombres aléatoires.
Calculer la moyenne dans A100 et l'écart type dans A101 de la série obtenue.
Refaire la même chose dans les colonnes B, C, D, E.
Refaire la même chose avec les 100 lignes ainsi crées.
Comparer avec les valeurs théoriques.
Réponse :
De 0 à 99 et sur 5 colonnes les cellules sont remplies aléatoirement : les cellules A0:E99 contiennent rand(0,1).
La ligne 100 (A100:E100) contient les moyennes des lignes de 0 à 99 pour chacune des colonnes A..E.
La ligne 101 (A101:E101) contient les écarts-types des lignes de 0 à 99 pour chacune des colonnes A..E.
La colonne F (F0:F99) va servir à faire la moyenne des colonnes de A à E pour chacune des lignes de 0 à 99.
La colonne G (G0:G99) va servir à mettre les écarts-types des colonnes de A à E pour chacune des lignes de 0 à 99.
On remplit ensuite F100, F101, G100, G101 :
F100=[mean(A100:E100),mean(F0:F99),mean(A0:E99)], F100 est la moyenne de la ligne 100 (moyenne des moyennes de 5 échantillons d'effectif 100), suivi de la moyenne de la colonne F (moyenne des moyennes de 100 échantillons d'effectif 5), suivi de la moyenne totale (moyenne d'un échantillon d'effectif 500). Évidemment ces 3 moyennes sont les mêmes !
F101=[mean(A101:E101),stddev(F0:F99)]
F101est la moyenne de la ligne 101 (moyenne des écarts-types de 5 échantillons d'effectif 100) suivi de l'écart-type de la colonne F (écart-type des moyennes de 100 échantillons d'effectif 5).
G100=[stddev(A100:E100),mean(G0:G99)]
G100 l'écart-type de la ligne 100 (écart-type des moyennes de 5 échantillons d'effectif 100) suivi de la moyenne de la colonne G (moyenne des l'écarts-types de 100 échantillons d'effectif 5).
G101=[stddev(A101:E101),stddev(G0:G99),stddev(A0:E99)]
G101 est l'écart-type de la ligne 101 (l'écart-type des l'écarts-types de 5 échantillons d'effectif 100), suivi de l'écart-type de la colonne G (l'écart-type des l'écarts-types de 100 échantillons d'effectif 5), suivi de l'écart-type total (l'écart-type d'un échantillon d'effectif 500).

Pour n=500, on trouve par exemple :
m=mean(A0:E99)=0.484342422505 et
s=stddev(A0:E99)=0.285946471987
Ici, on est parti d'une loi connue : la loi uniforme sur [0;1] de moyenne $ \mu$ = 0.5 et d'écart-type $ \sigma$ = $ \sqrt{{1/12}}$ $ \simeq$ 0.288675134595.
Dans la pratique on ne connait ni $ \mu$ ni $ \sigma$.
D'après la théorie, si on considère tous les échantillons de taille n, la variable aléatoire :
$ \bar{X}$ = $ {\frac{{(X_1+...+X_n)}}{{n}}}$ suit approximativement une loi normale $ \mathcal {N}$($ \mu$,$ {\frac{{\sigma}}{{\sqrt n}}}$) lorsque n est grand et la variable aléatoire :
S2 = $ {\frac{{(X_1-\bar X)^2+...+(X_n-\bar X)^2}}{{n}}}$ a pour moyenne $ {\frac{{n-1}}{{n}}}$$ \sigma^{2}_{}$
Pour la loi uniforme on a :
la moyenne de la série des moyennes des échantillons de taille n est égale à 0.5 ,
l'écart-type de la série des moyennes des échantillons de taille n est $ \sqrt{{\frac{1}{12 n}}}$,
la moyenne de la série des écarts-types des échantillons de taille n est $ \sqrt{{\frac{n-1}{12 n}}}$,
l'écart-type $ \sigma$(S2) de la série des écarts-types des échantillons de taille n est plus petit que K/$ \sqrt{n}$K est une constante qui ne dépend que de la loi.
Au vu d'un échantillon d'effectif 500 (n=500), de moyenne m, et d'écart-type s, on convient de dire que la moyenne empirique :
m=mean((A0):(E99))=0.484342422505 (m est la valeur observée de $ \bar{X}$) est l'approximation de la moyenne $ \mu$ et que l'écart-type empirique :
s=stddev(A0:E99)=0.285946471987 (s2 est la valeur observée de S2) est l'approximation de la moyenne de la série des écarts-types des échantillons de taille n = 500 et on a :
$ \sqrt{{E(S^2)}}$ = $ \sigma$*$ \sqrt{{499/500}}$ $ \simeq$ s.
Lorsque l'on ne connait pas $ \sigma$ on en calcule une valeur approchée à partir de l'écart type d'un échantillon de grande taille ici 500 :
on a : s=0.285946471987
On calcule la valeur théorique estimée :
$ \sigma$ - est = s*$ \sqrt{{n/(n-1)}}$
On tape et on obtient :
=0.285946471987*sqrt500/499=0.286232848095
au lieu de $ \sigma$ = 0.288386314978
De plus la théorie nous dit que la distribution des moyennes des échantillons d'effectif 500 suit sensiblement une loi normale de moyenne $ \mu$ et d'écart-type :
$\displaystyle {\frac{{\sigma}}{{\sqrt{500}}}}$ $\displaystyle \simeq$ $\displaystyle {\frac{{s}}{{\sqrt{499}}}}$ =0.0128007221147.
Ceci nous permet de dire qu'au seuil de 5%, on a :
| m - $ \mu$| < 1.96*0.0127879149858 = 0.0250894153448 soit :
0.45925300716 = m - $\displaystyle {\frac{{s}}{{\sqrt{499}}}}$ < $\displaystyle \mu$ < m + $\displaystyle {\frac{{s}}{{\sqrt{499}}}}$ = 0.50943183785.
D'où un intervalle de confiance au seuil de 5% pour $ \tt\mu$ de :
[0.4592;0.5095].
Voici les résultats des lignes 100 et 101 :
- ligne 100 est la valeur de la moyenne de 5 échantillons d'effectif 100, on trouve :
0.466489640726, 0.487896819143, 0.499799806252,
0.453281438346, 0.514244408058.
Ces 5 moyennes ont pour moyenne la moyenne totale:
mean(A100:E100) =m =0.484342422505
et ces 5 moyennes ont pour écart-type :
stddev(A100:E100)=0.022041777341 $ \simeq$ $ \sigma$/$ \sqrt{{100}}$
- ligne 101 est la valeur de l'écart-type de 5 échantillons d'effectif 100, on trouve :
0.264640095911, 0.302416108249, 0.299622396086,
0.276154743049, 0.280843050885
ces 5 écarts-types ont pour moyenne :
mean(A101:E101) =0.284735278836
valeur approchée de $ \sigma$*$ \sqrt{{99/100}}$ $ \simeq$0.287228132327
et pour écart-type :
stddev(A101:E101)=0.0143305924398.
Dans la colonne F on fait la moyenne des lignes ce qui correspond à 100 échantillons de 5 tirages (n=5).
Ces 100 moyennes ont pour moyenne la moyenne totale :
mean(F0:F99)=0.484342422505
et es 100 moyennes ont pour écart-type :
stddev(F0:F99)=0.112665383246
valeur approchée de $ \sigma$/$ \sqrt{5}$ $ \simeq$ 0.129099444874.
Dans la colonne G on fait l'écart-type des lignes ce qui correspond à 100 échantillons de 5 tirages (n=5).
Ces 100 écarts-types ont pour moyenne :
mean(G0:G99)=0.252572046948
valeur approchée de $ \sigma$*$ \sqrt{{4/ 5}}$ $ \simeq$ 0.258198889747
et pour écart-type :
stddev(G0:G99)=0.0726584981978

Observations :
- Comment évoluent les moyennes :
les valeurs de la ligne 100 des moyennes de chaque colonne A..F c'est à dire la moyenne de 100 observations est assez proche de la valeur attendue 0.5, alors que la colonne F moyenne des lignes c'est à dire de 5 observations est loin de la valeur attendue 0.5. On voit bien que l'écart-type des moyennes d'un échantillon de taille n dépend de n et que plus n est grand plus cet écart-type diminue. Les écarts-types de ces 2 séries ne sont donc pas les mêmes : d'après la théorie, l'écart-type des moyennes d'un échantillon de taille n est :
$ \sigma$/$ \sqrt{n}$ si $ \sigma$ est l'écart-type de la population toute entière qui est pour la loi uniforme de : $ \sqrt{{1/12}}$ = 0.288675134595.
De façon expérimentale on a :
- écart type des 5 moyennes correspondant à 5 échantillons de taille 100 :
0.022041777341
On calcule la valeur théorique :
sqrt(1/12)/10=0.0288675134595
- écart type des 100 moyennes correspondant à 100 échantillons de taille 5 :
0.112665383246
On calcule la valeur théorique :
sqrt(1/12)/sqrt(5)=0.129099444874
- Comment évoluent les écarts-types :
d'après la théorie, la moyenne des écarts-types d'un échantillon de taille n est :
$ \sigma$*$ \sqrt{{n-1/n}}$ si $ \sigma$ est l'écart-type de la population toute entière qui est pour la loi uniforme de : $ \sqrt{{1/12}}$ = 0.288675134595.
De façon expérimentale on a :
- moyenne des 5 écarts-types correspondant à 5 échantillons de taille 100 :
0.284735278836
On calcule la valeur théorique :
sqrt(1/12)*sqrt(99/100)=0.298337151271
- moyenne des 100 écarts-types correspondant à 100 échantillons de taille 5 :
0.252572046948
On calcule la valeur théorique :
sqrt(1/12)*sqrt(4/5)=0.258198889747
Lorsque l'on ne connait pas $ \sigma$ on en calcule une valeur approchée à partir de l'écart type d'un échantillon de grande taille ici 500 :
on a : s=0.285946471987
La valeur théorique estimée $ \sigma$est de $ \sigma$ :
$ \sigma$est = s*$ \sqrt{{n/(n-1)}}$
On tape :
0.285946471987*sqrt(500/499)
On obtient :
0.286232848095 (au lieu de $ \sigma$=0.288386314978
Quant aux écarts-types des écarts-types des échantillons de taille n, on voit qu'il sont d'autant plus petit que n est grand : c'est pourquoi on peut approcher l'écart type par l'écart-type d'un seul échantillon de grande taille.


next up previous contents index
suivant: Exemples d'exercies utilisant le monter: Résolution d'exercices de statistiques précédent: Intervalle de confiance   Table des matières   Index
Documentation de giac écrite par Renée De Graeve