next up previous contents index
suivant: La régression linéaire : monter: Les fonctions statistiques à précédent: La corrélation linéaire avec   Table des matières   Index


La covariance et la corrélation linéaire avec effectifs : covariance et correlation

Exercice
Soient X=[1,2], Y=[11,13,14] et N=[[3,4,5],[12,1,2]].
Calculer la covariance et la corrélation de X,Y sachant qu'il y a N= Nj, k couples Xj, Yk.
Dans une ligne d'entrée
On tape :
covariance([1,2],[11,13,14],[[3,4,5],[12,1,2]])
On obtient :
-83/243
On tape :
correlation([1,2],[11,13,14],[[3,4,5],[12,1,2]])
On obtient :
-83/160
On a :
simplify(stddev([1,2],[12,15]))=2*sqrt(5)/9
simplify(stddev([11,13,14],[15,5,7]))=16*sqrt(5)/27
et on a bien :
-83/243=-83/160*(sqrt(20)/9)*(16*sqrt(5)/2)
Dans le tableur
On peut disposer les données selon un tableau à double entrée à condition de rajouter -1 comme dernier argument aux fonctions covariance et correlation.
On tape :
dans A0 :
"X\ Y" (c'est pour l'esthétique)
dans A1 :
1
dans A2 :
2
dans B0,C0,D0 :
11,13,14
dans B1,C1,D1 :
3,4,5
dans B2,C2,D2 :
12,1,2
Calcul de la covariance ou de la corrélation dans le tableur :
On tape dans E0 :
=covariance(list2mat(A0:D2,4),-1)
On obtient dans E0 :
-83/243
On tape dans E1 :
=correlation(list2mat(A0:D2,4),-1)
On obtient dans E1 :
-83/160
Remarque
On peut bien sûr faire le même calcul dans une ligne d'entrée :
On sélectionne avec la souris A0..2,B,C,D, puis on tape :
covariance(,-1)
puis, on met le curseur à l'endroit de l'argument manquant, puis on appuie sur coller, ou on tape :
covariance([["x\y",11,13,14], [1,3,4,5],[2,12,1,2]],-1)
On obtient :
-83/243
On tape :
correlation([["x\y",11,13,14], [1,3,4,5],[2,12,1,2]],-1)
On obtient :
-83/160
Attention
Dans une cellule du tableur on ne peut pas désigner un sous-tableau ou une matrice par :
"référence de la première case de la matrice" : "référence de sa dernière case de la matrice".
en effet si dans la cellule C0 on tape :
=A0:B4 et on obtient dans la cellule C0 la liste :
[A0,B0,A1,B1,A2,B2] c'est à dire la matrice "aplatie".
Pourtant, si les couples A= a[j] et B= b[j] ont pour effectif N= n[j] (j = 0..p - 1), la covariance (resp la corrélation) de A,B avec effectifs N peuvent se calculer dans une ligne d'entrée, mais aussi dans le tableur même si les données ne figurent pas dans des colonnes consécutives.
Lorsque les colonnes sont consécutives, on peut reconstituer la matrice en utilisant list2mat, par exemple si on met les valeurs de A dans la colonne A, les valeurs de B dans la colonne B et les effectifs N dans la colonne C on tape dans la cellule E1 =list2mat(A0:C5,6,3) et on obtient dans la cellule E1 la matrice cherchée ayant 6 lignes et 3 colonnes A,B,C.
Lorsque les colonnes ne sont pas consécutives par exemple si on met les effectifs N= n[j] dans la colonne D on tape alors pour avoir une matrice dans la cellule E1 :
=tran([A0:A5,B0:B5,D0:D5]) et on obtient dans la cellule E1 la matrice cherchée ayant 6 lignes et 3 colonnes A,B,D.


next up previous contents index
suivant: La régression linéaire : monter: Les fonctions statistiques à précédent: La corrélation linéaire avec   Table des matières   Index
Documentation de giac écrite par Renée De Graeve