RLM

Rgression linaire multiple
Examinons maintenant la corrlation entre plus de deux variables ; supposons que nous ayons une variable X(0) et que nous voulons l'"expliquer" partir de k variables X(1), X(2), ...., X(k) par une loi linaire :
X(0) = 0 +
X(k)
k k
Les paramtres
k sont, a priori inconnus.
X(0) est la variable expliquer et X(k) pour k = 1,..N sont les variables explicatives. Pour simplifier, on admettra que l'on a effectu n observations ce qui a conduit n valeurs X i(k) pour chaque variable X(k).
X (k))/n variances : v(X(k)) = ( (X (k) - m )2 covariances : cov(X(k), X(l)) = [ (X (k) - m

moyennes : mX(k) =(
i i i i X(k) i i
X(k))(Xi(l)
- mX(l))
On dfinira l'cart entre l'exprience et le modle par
Pour minimiser E et donc trouver les coefficients par rapport aux coefficients
k sont nulles :
k, on crira que les drives partielles de E
ce qui conduit aux quations suivantes :
La premire de ces quations donne n0 =
X (0) - X (k)
i i i k k i
ou
n0 = nmX(0) - n soit
m
k k
X(k)
0 = mX(0) - kkmX(k)
La seconde quation s'crit alors
0iXi(l) + iXi(l)kkXi(k) - iXi(l)Xi(0) = 0

n0mX(l) + nmX(0)mX(l) - n
X (l)X (k) - X (l)X (0) = 0

k k i i i i i i X(l)mX(k)
m
k k
X (l)X (k) - X (l)X (0) = 0

k k i i i i i i
Pour faciliter l'criture posons Vkl = cov(X(k), X(l)) =(
X (k)X (l))/n - m
i i i
X(k)mX(l)
d'o
V
k
k kl
= V0l
ou matriciellement
M est appele matrice des covariances.
Pour rsoudre ce systme, il faut calculer la matrice inverse M-1 :
B = M-1V
relation qui fournit les coefficients
k pour k = 1 N.
On est amen poser, pour mesurer la corrlation globale
Ce coefficient est quelquefois appel coefficient de corrlation multiple
exemple1 : On donne les deux sries suivantes, relatives un pays alpha :
annes
Rcepteurs de radio en service (en centaines de milliers) : x 13 20 23 25 27 31 36 46 55 63 70 76 81 85
Nombre de maladies mentales dclares (pour 1000 habitants) : y 8 8 9 10 11 11 12 16 18 19 20 21 22 23
1924 1925 1926 1927 1928 1929 1930 1931 1932 1933 1934 1935 1937 1937
Recherchons s'il y a une corrlation entre x et y. Calculons tout d'abord le coefficient de corrlation.
Le coefficient de corrlation est r = 0,99 . Il est donc trs lev ce qui indique une forte corrlation entre x et y. Les droites de rgression, qui figurent ci-dessous et ont pour quations Dy/x : y = 0,22x + 4,55 Dx/y : x = 4,44y - 19,48
La corrlation observe ne permet pas de dire si la radio rend fou ou bien si seulement les fous utilisent la radio.
exemple 2 : Le bassin versant du Danube hongrois se situe en Bavire et en Autriche. Si par l,

la quantit de condensations atmosphriques devient leve, une vague de crue se produit tout au long du Danube dont le plafond Budapest on veut prdire. Le problme ncessite une approche mathmatique assez complexe mais pour le moment nous nous contentons de prsenter une illustration bien simplifie sur la rgression plusieurs variables. On introduit les trois variables suivantes :
X(0) le plafond du Danube Budapest. On ne considre que les cas les plus importants. X(1) la quantit de condensations atmosphriques dans le bassin versant du Danube
hongrois. La moyenne mathmatique des donnes mesur par 15 station dobservation en Bavire et en Autriche. X(2) le niveau du Danube Budapest juste avant les grandes eaux causant des vagues de crue. Le tableau suivant donne les trois donnes de 26 vagues de crue du Danube Budapest.
Numro dordre 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 temps 1896.08.14 1896.08.20 1897.08.08 1899.09.22 1903.07.15 1906.07.20 1907.05.02 1907.06.29 1907.07.21 1912.05.31 1912.07.27 1912.08.04 1912.09.16 1912.09.21 1914.07.14 1914.07.24 1918.07.01 1918.08.15 1926.06.26 1926.07.01 1926.07.17 1926.08.06 1926.08.14 1954.07.18 1955.06.26 X(0) (cm) 590 660 780 770 710 640 670 520 660 690 500 460 610 710 620 660 620 590 740 730 720 720 640 805 510 X(1) (mm) 58 52 133 179 98 72 72 43 62 67 64 33 57 62 54 48 86 74 95 44 53 77 46 123 26 X(2) (cm) 405 450 350 285 330 400 550 480 450 610 380 460 425 560 420 620 390 350 570 710 700 580 700 560 370
26
1955.07.16
673
62
430
On tente d'expliquer X(0) en fonction de X(1) et X(2) suivant le modle linaire : X(0) = 0 + 1X(1) + 2X(2) Calculons la matrice M et le vecteur V :
Le modle linaire donne X(0) = 274,89 + 2,35X(1) + 0,44X(2). Les valeurs thoriques sont donnes ci-dessus.

RLM

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

RLM

Transféré par

Droits d'auteur :

Formats disponibles

Rgression linaire multiple

k sont, a priori inconnus.

X (k))/n variances : v(X(k)) = ( (X (k) - m )2 covariances : cov(X(k), X(l)) = [ (X (k) - m

On dfinira l'cart entre l'exprience et le modle par

k, on crira que les drives partielles de E

ce qui conduit aux quations suivantes :

La premire de ces quations donne n0 =

0iXi(l) + iXi(l)kkXi(k) - iXi(l)Xi(0) = 0

X (l)X (k) - X (l)X (0) = 0

X (l)X (k) - X (l)X (0) = 0

Pour faciliter l'criture posons Vkl = cov(X(k), X(l)) =(

M est appele matrice des covariances.

Pour rsoudre ce systme, il faut calculer la matrice inverse M-1 :

relation qui fournit les coefficients

On est amen poser, pour mesurer la corrlation globale

Ce coefficient est quelquefois appel coefficient de corrlation multiple

exemple1 : On donne les deux sries suivantes, relatives un pays alpha :

Rcepteurs de radio en service (en centaines de milliers) : x 13 20 23 25 27 31 36 46 55 63 70 76 81 85

Nombre de maladies mentales dclares (pour 1000 habitants) : y 8 8 9 10 11 11 12 16 18 19 20 21 22 23

exemple 2 : Le bassin versant du Danube hongrois se situe en Bavire et en Autriche. Si par l,

Vous aimerez peut-être aussi