suivant: La régression linéaire :
monter: Les fonctions statistiques à
précédent: La corrélation avec effectif
Table des matières
Index
La covariance et la corrélation avec effectifs : covariance et correlation
- si les couples a[j], b[j] ont pour
effectif n[j] (j = 0..p - 1), covariance (resp correlation) a pour
argument trois listes a, b, n de même longueur p, ou
une matrice composée trois colonnes a, b, n et de p lignes
[a[j], b[j], n[j]].
covariance (resp correlation) calcule la covariance (resp
corrélation) numérique des deux premières
listes pondérées par la liste donnée comme dernier argument ou
des deux colonnes de cette matrice pondérées par la troisiéme colonne.
Dans une ligne d'entrée
On tape :
covariance([1,2,3,4],[1,4,9,16],[3,1,5,2])
Ou on tape :
covariance([[1,1,3],[2,4,1],[3,9,5],[4,16,2]])
On obtient :
662/121
On tape dans une ligne d'entrée :
correlation([1,2,3,4],[1,4,9,16],[3,1,5,2])
Ou on tape :
correlation([[1,1,3],[2,4,1],[3,9,5],[4,16,2]])
On obtient :
662/(180*sqrt(14))
Dans le tableur
On remplit les colonnes A,B,C.
On tape dans A0 :
[[1,1,3],[2,4,1],[3,9,5],[4,16,2]]
On tape dans D0 :
=covariance(list2mat(A0:C3,3))
On obtient dans D0 :
662/121
On tape dans D1 :
=correlation(list2mat(A0:C3,3))
On obtient dans E1 :
662/(180*sqrt(14))
- si les couples a[j], b[k] ont pour effectif N[j, k] lorsque j = 0..p - 1 et
k = 0..q - 1,
covariance (resp correlation) a pour argument deux listes a, b de longueurs
respectives p et q et une matrice N de p lignes et q colonnes.
covariance (resp correlation) calcule la covariance (resp
corrélation) numérique des éléments de deux listes pondérés par
un tableau donné comme troisième argument.
Exercice
Soient X=[1,2], Y=[11,13,14] et N=[[3,4,5],[12,1,2]].
Calculer la covariance et la corrélation de X,Y sachant qu'il y a
N= Nj, k couples Xj, Yk.
Dans une ligne d'entrée
On tape :
covariance([1,2],[11,13,14],[[3,4,5],[12,1,2]])
On obtient :
-83/243
On tape :
correlation([1,2],[11,13,14],[[3,4,5],[12,1,2]])
On obtient :
-83/160
On a :
simplify(stddev([1,2],[12,15]))=2*sqrt(5)/9
simplify(stddev([11,13,14],[15,5,7]))=16*sqrt(5)/27
et on a bien :
-83/243=-83/160*(sqrt(20)/9)*(16*sqrt(5)/2)
Dans le tableur
On peut disposer les données selon un tableau à double entrée à
condition de rajouter -1 comme dernier argument aux fonctions
covariance et correlation.
On tape :
dans A0 :
"X\ Y" (c'est pour l'esthétique)
dans A1 :
1
dans A2 :
2
dans B0,C0,D0 :
11,13,14
dans B1,C1,D1 :
3,4,5
dans B2,C2,D2 :
12,1,2
- Calcul de la covariance ou de la corrélation dans le tableur :
On tape dans E0 :
=covariance(list2mat(A0:D2,4),-1)
On obtient dans E0 :
-83/243
On tape dans E1 :
=correlation(list2mat(A0:D2,4),-1)
On obtient dans E1 :
-83/160
Remarque
On peut bien sûr faire le même calcul dans une ligne d'entrée :
On sélectionne avec la souris A0..2,B,C,D, puis on
tape :
covariance(,-1)
puis, on met le curseur à l'endroit
de l'argument manquant, puis on appuie sur coller,
ou on tape :
covariance([["x\y",11,13,14], [1,3,4,5],[2,12,1,2]],-1)
On obtient :
-83/243
On tape :
correlation([["x\y",11,13,14], [1,3,4,5],[2,12,1,2]],-1)
On obtient :
-83/160
Attention
Dans une cellule du tableur on ne peut pas désigner
un sous-tableau ou une matrice par :
"référence de la première case de la matrice" :
"référence de sa dernière case de la matrice".
en effet si dans la cellule C0 on tape :
=A0:B4 et on obtient dans la cellule C0 la liste :
[A0,B0,A1,B1,A2,B2] c'est à dire la matrice "aplatie".
Pourtant, si les couples A= a[j] et B= b[j] ont pour
effectif N= n[j] (j = 0..p - 1),
la covariance (resp la corrélation) de A,B avec effectifs N
peuvent se calculer dans une ligne d'entrée, mais aussi dans le tableur
même si
les données ne figurent pas dans des colonnes consécutives.
Lorsque les colonnes sont consécutives, on peut
reconstituer la matrice en utilisant list2mat, par exemple si on met
les valeurs de A dans la colonne A, les valeurs de B
dans la colonne B et les
effectifs N dans la colonne C on tape dans la cellule
E1 =list2mat(A0:C5,6,3) et on obtient dans la cellule E1 la
matrice cherchée ayant 6 lignes et 3 colonnes A,B,C.
Lorsque les colonnes ne sont pas consécutives par exemple si on met les
effectifs N= n[j] dans la colonne D on
tape alors pour avoir une matrice dans la cellule E1 :
=tran([A0:A5,B0:B5,D0:D5]) et on obtient dans la cellule E1 la
matrice cherchée ayant 6 lignes et 3 colonnes A,B,D.
suivant: La régression linéaire :
monter: Les fonctions statistiques à
précédent: La corrélation avec effectif
Table des matières
Index
Documentation de giac écrite par Renée De Graeve