suivant: Intervalle de confiance d'une
monter: Résolution d'exercices de statistiques
précédent: Statistiques à 1 variable
Table des matières
Index
Un exercice pour bien comprendre qu'un intervalle de confiance dépend de
l'échantillon.
Une usine fabrique des pièces de diamètre
. On suppose que la variable
aléatoire X qui, à chaque pièce associe son diamètre suit une loi
normale de moyenne
et d'écart-type
= 1.1.
On cherche à estimer
à partir d'un échantillon d'effectif n = 40.
On regroupe les résultats en classes, on a obtenu :
2 pièces ont un diamètre entre 32.5 et 33.5,
7 pièces ont un diamètre entre 33.5 et 34.5,
19 pièces ont un diamètre entre 34.5 et 35.5,
8 pièces ont un diamètre entre 35.5 et 36.5,
3 pièces ont un diamètre entre 36.5 et 37.5,
1 pièce a un diamètre entre 37.5 et 38.5,
1/ Déterminer la moyenne, l'écart-type et l'histogramme de cet echantillon.
Réponse :
On tape dans la colonne A :
33,34,35,36,37,38 (ou 32.5..33.5 etc...mais c'est plus long!!!) et
dans la colonne B :
2,7,18,8,3,2.
puis en A9 on tape =mean(A0:A5,B0:B5),
on trouve 1409/40 =35.225 et
en B9 on tape =stddev(A0:A5,B0:B5),
on trouve
sqrt(2039/1600
1.12888219049.
Pour réaliser l'histogramme on sélectionne les colonnes A et B,
on peut faire la sélection à la souris ou on
tape dans la case de sélection A0,5,B.
Avec le menu Statistiques du tableur, on choisit 1d puis
histogram et on obtient l'histogramme.
2/ Déterminer à partir de l'échantillon :
- un intervalle de confiance à 95% pour la moyenne
, et
- un intervalle de confiance à 99% pour la moyenne
.
Réponse :
On connait
et on sait que la variable
égale à
la moyenne des échantillons de taille n suit une loi normale de moyenne
et d'écart-type
/
.
On a
/
= 1.1/
= 0.173925271309.
On sait que l'on a :
Prob(|
-
| < k*
/
) = 0.95 pour k = 1.96 et,
Prob(|
-
| < k*
/
) = 0.99 pour k = 2.576
donc on a:
-1.96*
/
<
<
+1.96*
/
dans 95% des cas et,
-2.576*
/
<
<
+2.576*
/
dans 99% des cas.
Au vu de l'échantillon on a
= 35.225:
a1 = 35.225 - 1.96*1.1/
= 34.8841064682
b1 = 35.225 + 1.96*1.1/
= 35.5658935318
a2 = 35.225 - 2.576*1.1/
= 34.7769685011
b2 = 35.225 - 2.576*1.1/
= 35.6730314989
Avec Xcas on tape et on obtient :
a1:=normal_icdf(1409/40,1.1/sqrt(40),0.025)
=34.8841127322
b1:=normal_icdf(1409/40,1.1/sqrt(40),0.975)
=35.5658872678
a2:=normal_icdf(1409/40,1.1/sqrt(40),0.005)
=34.7769981895
b2:=normal_icdf(1409/40,1.1/sqrt(40),0.995)
=35.6730018105
on en déduit que :
[34.88;35.57] est un intervalle de confiance à 95% pour
et que
[34.77;35.68] est un intervalle de confiance à 99% pour
.
3/ On suppose encore que
= 1.1 et qu'un échantillon de taille
n = 100 a une moyenne de 35.225.
Déterminer à partir de cet échantillon,
un intervalle de confiance à 95% pour la moyenne
.
Réponse :
On a:
Proba(
-1.96*
/
<
<
+1.96*
/
) = 0.95.
Au vu de cet échantillon la valeur de
est de 35.225 on a :
35.225 - 1.96*1.1/
= 35.0094
35.225 + 1.96*1.1/
= 35.4406
Ou avec Xcas on tape :
normal_icdf(35.225,1.1/sqrt(100),0.025)
On obtient : 35.0094039617
normal_icdf(35.225,1.1/sqrt(100),0.975)
On obtient : 35.4405960383
On en déduit que :
[35 ; 35.45] est un intervalle de confiance pour
au seuil de 5%.
Donc quand on augmente la taille de l'échantillon on a un intervalle de
confiance de plus faible amplitude, en effet, on a une information plus
précise avec un échantillon de taille plus grande.
4/ On suppose que X suit la loi normale
(35.25, 1.1).
Simuler la prise de 5 échantillons de taille 100 et déterminer pour
chacun des échantillons un intervalle de
confiance pour la moyenne
au seuil de 5%, dans les deux cas suivant :
a/ lorsqu'on suppose que l'on connait
= 1.1
b/ lorsqu'on estime
à l'aide de l'échantillon.
Réponse :
On demande d'avoir 102 lignes dans le tableur en tapant A102 dans la case
de sélection.
On tape en A0 : =randnorm(35.25,1.1)
puis on sélectionne A0 et on appuie sur remplir et
vers le bas.
On tape en A100 : =mean(A0:A99)
On tape en A101 : =stddev(A0:A99)
On tape en A102 : =A101*10/sqrt(99)
puis on recopie toutes ces formules sur les colonnes B,C,D,E si on veut
voir les 5 échantillons et on se met en mode manual,on sélectionne
pour cela Ne pas recalculer automatiquement dans le sous-menu
Configuration du menu Edit du tableur. En effet en mode auto
chaque fois que l'on valide une cellule contenant =randnorm(35.25,1.1),
on a un nouvel échantillon grâce au recalcul automatique.
On obtient par exemple :
La ligne 100 est la liste m des valeurs des moyennes des 5
échantillons :
[35.2341469676,35.3942572081,35.0898127739,
35.1447916945,35.2456441276],
La ligne 101 est la liste s des valeurs des écarts-types des 5 échantillons :
[1.00342913254,1.14149481601,1.19977064554,
1.00252282025,1.09862748198],
ligne 102 est la liste

des valeurs estimées de l'écart-type
:
[1.00848422314,1.14724545601,1.20581486841,
1.00757334501,1.10416216427]
On rajoute 2 lignes au tableur (dans la case de sélection on tape A104)
Dans la cellule A103 on tape puisque
1.1/
= 0.11 :
normal_icdf(A100,0.11,0.025)..normal_icdf(A100,0.11,0.975)
On recopie cette formule sur la ligne 103.
On obtient sur la ligne 103 :
[35.0185509293..35.4497430059,35.1786611698..35.6098532464,
34.8742167356..35.3054088122,34.9291956562..35.3603877328,
35.0300480893..35.4612401659]
d'où lorsqu'on connait
= 1.1, les intervalles de confiance pour
,
au seuil de 5%, sont pour les 5 échantillons :
[35.0185509293 ; 35.4497430059]
[35.1786611698 ; 35.6098532464]
[34.8742167356 ; 35.3054088122]
[34.9291956562 ; 35.3603877328]
[35.0300480893 ; 35.4612401659]
Dans la cellule A104, on tape, puisque l'on estime
/
par
s/
:
normal_icdf(A100,A101/sqrt(99),0.025)..
normal_icdf(A100,A101/sqrt(99),0.975)
On recopie cette formule sur la ligne 104.
On obtient sur la ligne 104 :
[35.0364840599..35.4318098753,35.1693970987..35.6191173175,
34.8534730597..35.3261524881,34.9473073189..35.3422760701,
35.0292283434..35.4620599118]
d'où lorsqu'on estime
, les intervalles de confiance pour
,
au seuil de 5%, sont pour les 5 échantillons :
[35.0364840599 ; 35.4318098753]
[35.1693970987 ; 35.6191173175]
[34.8534730597 ; 35.3261524881]
[34.9473073189 ; 35.3422760701]
[35.0292283434 ; 35.4620599118]
Si on reunit ses 5 échantillons on a :
n = 500
m = (m[0] + m[1] + m[2] + m[3] + m[4])/5 = 176.108652772/5 = 35.2217305544
s2 = (s[0]2 + s[1]2 + s[2]2 + s[3]2 + s[4]2)/5 = 1.19227287804 donc

= s
=
= 1.09300603953
d'où pour cet
échantillon, un intervalle de confiance pour
, au seuil de 5%, est :
[35.1259243509 ; 35.3175367579]
car
35.2217305544-1.96*1.09300603953/sqrt(500)=35.1259243509 et
35.2217305544+1.96*1.09300603953/sqrt(500)=35.3175367579
5/ On suppose que X suit la loi normale
(35.25, 1.1).
Simuler la prise de 5 échantillons de taille 40 et déterminer pour chacun
des échantillons un intervalle de
confiance pour la moyenne
, au seuil de 5%, dans les deux cas suivant :
a/ lorsqu'on suppose que l'on connait
= 1.1
b/ lorsqu'on estime
à l'aide de l'écart type de l'échantillon.
Réponse :
On considére un échantillon de taille n = 40.
Il a pour moyenne
m = 35.531073986
et pour écart type
s = 1.00296897139
Pour les quatres autres échantillons de taille 40 on trouve par exemple :
m = 35.6360091101 et
s = 1.29301963917
m = 35.0684414822 et
s = 0.951157103863
m = 35.4535840905 et
s = 0.917989271482
m = 35.0910551678 et
s = 1.05109677585
a/
suit une loi normale de moyenne
et d'écart-type :
/
= 1.1/
= 0.173925271309.
On a:
-1.96*
/
<
<
+1.96*
/
dans 95% des cas.
On a, pour le premier échantillon :
m - 1.96*1.1/
= 35.1901804542 et,
m + 1.96*1.1/
= 35.8719675178,
d'où un intervalle de confiance de [35.19;35.88] pour
, au seuil
de 5%.
b/ On suppose que l'on ne connait pas
. Ici, n est trop petit pour
évaluer
à l'aide de l'écart type s de l'échantillon.
On considère alors,
avec :
est la variable aléatoire qui au
tirage
associe son résultat et
= 
Xj.
Alors T suit une loi de Student à (n - 1)
degrés de liberté.
Ici n = 40 et on lit sur la table de Student que
lorsque il y a
= 39 degrés de liberté,
Proba(- t < T < t) = 0.95 pour
t = 2.023.
Ou bien avec Xcas on tape :
student_icdf(39,0.025)
On obtient :
-2.02269092002
student_icdf(39,0.975)
On obtient :
2.02269092002
Donc
- t*S/
<
<
+ t*S/
.
Pour le premier échantillon on trouve :
m = 35.531073986
s = 1.00296897139
m - 2.023*s/
= 35.2061729645
m + 2.023*s/
= 35.8559750075
d'où un intervalle de confiance de [35.2;35.86] pour
au seuil
de 5%.
Pour les 4 autres échantillons, on trouve :
[35.2171492913;36.0548689289]
[34.7603243584;35.376558606]
[35.1562113297;35.7509568513]
[34.7505636611;35.4315466745]
En estimant
par
s
on aurait obtenu pour le premier
échantillon :
[35.2162967736;35.8458511984]
En effet avec Xcas on tape :
normal_icdf(35.531073986,1.00296897139/sqrt(39),0.025)
On obtient :
35.2162967736
On tape :
normal_icdf(35.531073986,1.00296897139/sqrt(39),0.975)
On obtient :
35.8458511984
suivant: Intervalle de confiance d'une
monter: Résolution d'exercices de statistiques
précédent: Statistiques à 1 variable
Table des matières
Index
Documentation de giac écrite par Renée De Graeve