Pour approcher les données par la droite des moindres carrés ayant pour
équation y=mx+b, on utilise linear_regression qui renvoie le couple
(m,b).
Si les données sont xi,yi avec i=1..n, on a :
m=cov(X,Y)/σ(X)2
et b=Ȳ−mX
car la somme des carrés des distances di=|yi−mxi−bi| est
minimale pour ces valeurs et ce minimum (qui est donc l’erreur quadratique
moyenne verticale) vaut (1−ρ2)σ(Y)2 où r est
le coefficient de corrélation (ρ=cov(X,Y/σ(X)σ(Y)).
linear_regression a les mêmes arguments que covariance.
On tape :
Ou on tape :
On obtient :
c’est donc la fonction linéaire d’équation y=4x−2
qui approche au mieux les données.
On tape :
On obtient :
c’est donc la fonction linéaire d’équation z=ln(y)=0.267x+1.99 qui approche au mieux les données.