suivant: Le test de corrélation
monter: Résumé de statistique descriptive
précédent: Application à deux échantillons
Table des matières
Index
C'est une application du test d'adéquation.
Considérons une variable aléatoire X valant
x1,.., xk avec une
probabilité théorique p1,..,pk (avec
p1 + ... + pk = 1) et une variable
aléatoire Y valant
y1,.., yl avec une
probabilité théorique q1,..,ql (avec
q1 + ... + ql = 1).
On a un échantillon de taille n (n grand) pour lequel le nombre
d'éléments présentant le caractère xi et le caractère yj est
ni, j (
ni, j = n).
On veut savoir, au vue de l'échantillon si les variables X et Y sont indépendantes.
On peut estimer les pi et les qj par :
pi
j=1lni, j/n
qj
i=1kni, j/n
En estimant ces valeurs, on a estimé
k - 1 + l - 1 = k + l - 2 paramètres (car quand
on a estimé
p1,.., pk-1 on a l'estimation de pk et quand on
a estimé
q1,.., ql-1 on a l'estimation de ql).
Si X et Y sont indépendantes (hypothèse H0), alors :
Proba((X = xi)
(Y = yj)) = piqj
donc l'effectif théorique des
éléments présentant le caractère xi et yj est :
ei, j = npiqj.
La statistique
D2 = 

suit approximativement une loi du
ayant
(k - 1)(l - 1) degrés
de liberté (car
(k - 1)(l - 1) = kl - 1 - (k + l - 2)).
Règle
On calcule d2 la valeur de D2 pour l'échantillon et
= (k - 1)(l - 1)
le nombre de degrés de liberté.
On cherche dans une table la valeur de h vérifiant :
Proba(
< h) = 1 -
Avec Xcas on tape si
= 0.05 :
h:=chisquare_icdf((k-1)(l-1),0975)
Si d2 < h, on accepte l'hypothèse d'indépendance au seuil
,
sinon on la rejette.
suivant: Le test de corrélation
monter: Résumé de statistique descriptive
précédent: Application à deux échantillons
Table des matières
Index
Documentation de giac écrite par Renée De Graeve