next up previous contents index
suivant: Valeur moyenne d'un caractère monter: Valeur de la fréquence précédent: Estimation ponctuelle   Table des matières   Index

Estimation par un intervalle

Cas des échantillons de taille n > 30
Soit X une variable aléatoire de Bernouilli de paramètre p (X vaut 0 ou 1 et Proba(X = 1) = p).
Soit $ \bar{X}$ la variable aléatoire égale à la moyenne des valeurs prises par X pour des échantillons de taille n. On a $ \bar{X}$ = F est égal à la fréquence du nombre d'apparitions de la valeur 1 pour chaque échantillon de taille n, .
On sait que n*F suit une loi binomiale $ \mathcal {B}$(n, p), cette loi est proche de la loi normale
$ \mathcal {N}$(np,$ \sqrt{{np(1-p)}}$) car n est grand (n > 30).
On peut donc considérer que F suit approximativement la loi $ \mathcal {N}$(p,$ \sqrt{{\frac{p(1-p)}{n}}}$).
Recette
- On choisit $ \alpha$ (par exemple $ \alpha$ = 0.05),
- On cherche à l'aide d'une table de loi normale centrée réduite, h vérifiant :
Proba(Y < h) = 1 - $ \alpha$/2 pour Y $ \in$ $ \mathcal {N}$(0, 1).
On a donc en posant Y = $ {\frac{{F-p}}{{\sqrt{\frac{p(1-p)}{n}}}}}$ :
Proba(p - h$ \sqrt{{\frac{p(1-p)}{n}}}$ < F < p + h$ \sqrt{{\frac{p(1-p)}{n}}}$) = 1 - $ \alpha$
- On calcule la valeur f de F pour l'échantillon
On a donc n(f - p)2 < h2p(1 - p) c'est à dire (h2 + n)p2 - p(h2 +2nf )+ nf2 < 0 donc p se trouve à l'intérieur des racines de l'équation du second degré :
(h2 + n)x2 - x(h2 +2nf )+ nf2 = 0 que l'on peut résoudre (calcul du discriminant $ \Delta$ = h4 + (- (4*h2))*n*f2 +4*h2*n*f etc...)
mais il est plus simple de dire, que l'on peut estimer l'écart-type de n*F. On a $ \sigma$(n*F) = $ \sqrt{{np(1-p)}}$ que l'on peut estimer par $ \sqrt{{nf(1-f)}}$$ \sqrt{{\frac{n}{n-1}}}$.
Donc l'écart-type de $ \bar{X}$ = F, $ \sigma$(F) = $ \sigma$($ \bar{X}$) = $ \sqrt{{\frac{p(1-p)}{n}}}$ peut être estimé par
$ {\frac{{1}}{{n}}}$$ \sqrt{{nf(1-f)}}$$ \sqrt{{\frac{n}{n-1}}}$ = $ \sqrt{{\frac{f(1-f)}{n-1}}}$, donc on a :
Proba(p - h$ \sqrt{{\frac{f(1-f)}{n-1}}}$ $ \leq$ f $ \leq$ p + h$ \sqrt{{\frac{f(1-f)}{n-1}}}$) = 1 - $ \alpha$
ou encore
Proba(f - h$ \sqrt{{\frac{f(1-f)}{n-1}}}$ $ \leq$ p $ \leq$ f + h$ \sqrt{{\frac{f(1-f)}{n-1}}}$) = 1 - $ \alpha$
Si a1 = f - h$ \sqrt{{\frac{f(1-f)}{n-1}}}$ et a2 = f + h$ \sqrt{{\frac{f(1-f)}{n-1}}}$ on a a1 $ \leq$ p $ \leq$ a2
Avec Xcas, on tape si $ \alpha$ = 0.05 :
a1:=normal_icdf(f,sqrt(f*(1-f)/(n-1),0.025)
a2:=normal_icdf(f,sqrt(f*(1-f)/)n-1,0.975)
Résultat I$\scriptstyle \alpha$ = [a1 ; a2] est un intervalle de confiance de p au seuil $ \alpha$.
Cas des échantillons de taille n $ \leq$ 30
Soit X une variable aléatoire de Bernouilli de paramètre p (X vaut 0 ou 1 et Proba(X = 1) = p).
Soit la variable aléatoire F = $ \bar{X}$.
On sait que nF suit une loi binomiale $ \mathcal {B}$(n, p). On utilisera donc une table de la loi binomiale.
Recette
- On choisit $ \alpha$ (par exemple $ \alpha$ = 0.05)
- On calcule la valeur f de F pour l'échantillon
- On approche p par f, ainsi n*F = n*$ \bar{X}$ $ \in$ $ \mathcal {B}$(n, f ), on cherche n*p1 et n*p2 à l'aide d'une table de loi binomiale pour avoir :
Proba(n*F < n*p1) = 1 - $ \alpha$/2 et Proba(n*F < n*p2) = $ \alpha$/2
Avec Xcas, on tape si $ \alpha$ = 0.05 :
p1:=1/n*binomial_icdf(,n,f,0.025)
p2:=1/n*binomial_icdf(n,f,0.975)
On a donc :
Proba(p2 < f < p1) = 1 - $ \alpha$.
Résultat
I$\scriptstyle \alpha$ = [p2 ; p1] est un intervalle de confiance de p au seuil $ \alpha$.
next up previous contents index
suivant: Valeur moyenne d'un caractère monter: Valeur de la fréquence précédent: Estimation ponctuelle   Table des matières   Index
Documentation de giac écrite par Renée De Graeve