Vous êtes sur la page 1sur 31

L’analyse de la régression linéaire simple

Validation de la droite de régression empirique…


Test d’hypothèse sur 1
Pour vérifier si l’influence de la variable indépendante X est
significative, on procède à un test d’hypothèses sur 1

Y   0  1 X  
Si β1 = 0 alors peu importe les
valeurs de X, elles n’auront
pas d’impact sur Y

Pr.Mahacine Amrani Master AGRO 2021/2022


L’analyse de la régression linéaire simple

Étapes contribuant à la validation de la droite de régression


empirique
i i

 Estimer la variance des erreurs théoriques


q  2 (Parfois dénotée  2 )
 Estimer  0 et 1 par intervalle de confiance

 Test d’hypothèses sur 1

Pr.Mahacine Amrani Master AGRO 2021/2022


L’analyse de la régression linéaire simple

Validation de la droite de régression empirique…


Estimation de la variance des erreurs théoriques  2
La précision des estimateurs b0 et b1 dépend de la valeur de la
variance des erreurs théoriques : plus  2 sera petite, plus ces
estimateurs
ti t sontt précis.
é i

a a ce   est inconnue,
2
Puisque,
u sque, e
en p
pratique,
at que, la
a variance co ue, oon l’estime
est e pa
par le
e
terme suivant :
n n

i
e 2
 i i
( y  ˆ
y ) 2

s s 
2 2 i 1
 i 1
n2 n2
e

Pr.Mahacine Amrani Master AGRO 2021/2022


L’analyse de la régression linéaire simple

Validation de la droite de régression empirique…

Estimation de  b2 0
et  b
2
1

En pratique, les variances  b et  b sont inconnues, alors on les


2 2
0 1
estime par les deux termes suivants :

   
 1 x 2   s 2 
sb20  s 2   n  b1   n
s 2

n 2  ( x  x )2 
 
i 1
( x i  x )

  
 i 1
i

Pr.Mahacine Amrani Master AGRO 2021/2022
L’analyse de la régression linéaire simple

Exemple d’application … Yˆ  33, 31  3, 95 X


Compléter le tableau suivant : 33,31 + 3,95 x 2 = 41,21

0.49 49.11 0.39 0.1521 7.6176


1.69 41.21 - 0.21 0.0441 26.4196

2 2 2 pour l’ensemble des données ci-dessus.


s ,s ,s
Calculer
b0 b1 2
s  1, 1 8 4 7
s b20  0 , 7 9 3 9
Pr.Mahacine Amrani Master AGRO 2021/2022
s 2
b1  0, 062
L’analyse de la régression linéaire simple

Validation de la droite de régression empirique…


Estimation de 1 par intervalle de confiance

L’intervalle de confiance pour estimer 1, la pente du modèle de


régression théorique, au niveau de confiance (1 - ) est donné par:

b1  t / 2 sb1  n 2 < 30 t / 2  t (n  2)d .l


Si n-2

b1  z / 2 sb1  Si n-2


2 ≥ 30 z / 2  N (0,1)

Si la valeur 1=0 appartient à l’intervalle de confiance,


on ne rejette pas l’hypothèse nulle: 1=0 au niveau de signification  et
on conclut qu’il n’existe pas de relation linéaire
Pr.Mahacine significative
Amrani entre Y2021/2022
Master AGRO et X
L’analyse de la régression linéaire simple

D’après les données de l’exemple numérique de la publicité et le


volume
l d ventes
de t d'autos,
d' t construisez
t i un intervalle
i t ll de
d confiance
fi pour 1
au niveau 95% :
Puisque n-2 = 10 -2 = 8 < 30, alors
Table de Student
b1  t / 2 sb1 
3, 95  t 0 ,025 0, 062 
 
3, 95  2, 306 0, 062 
 

3, 3758 à 4, 5242


Pr.Mahacine Amrani Master AGRO 2021/2022
Tester la signification d’une régression

 Tester la signification d’une régression correspond à


détérminer si l’équation de régression est pertinente
pour décrire la population et non seulement l’échantillon

Le modèle linéaire Y =1 X + 0 est-il adapté pour décrire


Y en fonction de X dans la population

Pr.Mahacine Amrani Master AGRO 2021/2022


Tester la signification d’une régression

 Pour tester la signification d’une régression, on peut


effectuer un test d’hypothèses afin de déterminer si la
valeur de 1 est zéro.
 Deux tests sont couramment utilisés
– Test t ou z (selon la taille de l'échantillon)
– Test F

– Les deux tests nécessitent une estimation de  2, la


variance des erreurs  du modèle de régression

Pr.Mahacine Amrani Master AGRO 2021/2022


Tester la signification d’une régression

 Une estimation de  2
 l moyenne des
la d carrésé des
d résidus
é id s2 fournit
f it une
estimation de  2
s2 = SCres/(n-2)
où:

SCres   ( yi  yˆ i )   ( yi  b0  b1 xi )
2 2

SCres
s  s est l’erreur type de l’estimation
n2 Pr.Mahacine Amrani Master AGRO 2021/2022
L’analyse de la régression linéaire simple

Les étapes d’un test z ou t d’hypothèses sur 1


1. Énoncer les hypothèses H0 et Ha. H 0 : 1  0
H a : 1  0
2. Préciser les conditions du test
 LLa population
l ti desd erreurs estt normale l
La variance résiduelle  est inconnue
2


 Le niveau de signification 
 Si la taille de l’échantillon n – 2 ≥ 30, on utilise z (Normale)
 Si la taille de ll’échantillon
échantillon n – 2 < 30,
30 on utilise t (Student)

3. Calculer la statistique de test. b1  1 b1


z  si n  2  30
sb1 sb1
b1  1 b1
t  si n  2  30
sb1 sb1
4. Trouver la région critique au niveau de signification 
j tt H 0 , sii t  t / 2 ,( n  2 ) d . l ou sii t  t / 2 ,( n 2 ) d . l
O rejette
On
Pr.Mahacine Amrani Master AGRO 2021/2022
On rejette H 0 , si z  z / 2 ou si z   z / 2
Exemple

Pr.Mahacine Amrani Master AGRO 2021/2022


Pr.Mahacine Amrani Master AGRO 2021/2022
Pr.Mahacine Amrani Master AGRO 2021/2022
Pr.Mahacine Amrani Master AGRO 2021/2022
Pr.Mahacine Amrani Master AGRO 2021/2022
Pr.Mahacine Amrani Master AGRO 2021/2022
Pr.Mahacine Amrani Master AGRO 2021/2022
Pr.Mahacine Amrani Master AGRO 2021/2022
L’analyse de la régression linéaire simple
D’après les données de l’exemple d’application sur la publicité et le
volume de ventes d'autos, vérifiez au niveau de signification  = 0,05
si X explique Y, à partir de la droite de régression linéaire obtenue

Étape
p 1 Étape
p 2
H 0 : 1  0
n – 2 = 8 < 30, population normale,  2 inconnue
H a : 1  0
É
Étape 3 É
Étape 4
b1  1 3, 95  0 t0 ,025,8d . l  2, 306
t   15, 86
sb1 0, 062

puisque t  15, 86  t0 ,025,8d . l  2, 306, on rejette H 0


Cela implique que X explique les valeurs
Pr.Mahacine Amrani prises niveau  = 0,05
par Y au 2021/2022
Master AGRO
Hypothèses du modèle

 Hypothèses concernant le terme d’erreurs 


– L’erreur
L’  est une variable
i bl aléatoire
lé i d’espérance
d’ é 0
– La variance de  , dénotée  2 ou  2 , est la même pour
to tes les valeurs
toutes ale rs de X
– Les valeurs de  sont indépendantes.
– L’erreur
L’  estt distribuée
di t ib é selon
l une loi
l i normale
l

Pr.Mahacine Amrani Master AGRO 2021/2022


Pr.Mahacine Amrani Master AGRO 2021/2022
Linéarisation de modèles non linéaires

 Toutes les situations expérimentales ne se simplifient pas


par une régression linéaire
linéaire. Dans certains cas
cas, il faut
utiliser d'autres modèles pour décrire la relation existant
entre X et Y.

 Pour déterminer les paramètres de telles régressions, on


transforme les valeurs de X et/ou Y pour retrouver le
modèle linéaire.

Pr.Mahacine Amrani Master AGRO 2021/2022


M dèl exponentiel:
Modèle ti l YY=a.ebx

La fonction exponentielle est très courante en sciences


y  ae bx

Par exemple la décroissance d’un élément radioactif...


 t
210
Pb(t )  Pb0  e
210

Si les constantes a et b sont inconnues, on espère pouvoir les


estimer à partir de x et y. Malheureusement l’approche directe
fournit des équations insolubles.

Pr.Mahacine Amrani Master AGRO 2021/2022


Modèle exponentiel: Y=a.ebx

On transforme l’équation non linéaire en une équation


linéaire Linéarisation en prenant le logarithme:
linéaire.

ln y  ln a  bx

ln y devient linéaire en x

On utilise un papier « semi-log » puisque


l’
l’espacement
t logarithmique
l ith i des
d graduations
d ti évite
é it le
l calcul
l l de
d
lny.

Pr.Mahacine Amrani Master AGRO 2021/2022


Modèle exponentiel: Y=a.ebx

 Le modèle exponentiel se linéarise en calculant le


logarithme népérien de y.
y

Pr.Mahacine Amrani Master AGRO 2021/2022


Modèle polynomial : Y= a+ bx
bx++ c x2 …

Y s’exprime comme polynôme d’une seconde variable X


y  a  bx  cx 2  ...  Hx n
E
Exemple l : la
l hauteur
h t h de
d chute
h t d' un corps estt une fonction
f ti quadratiqu
d ti e du
d ttemps t :
1
h  h0  v0t  gt 2
2
On tire comme précédement :
n n n

 i
y
i 1
 na  b  i  i
x  c x 2

i 1 i 1
n n n n

x y
i 1
i i  a  xi  b x  c  xi3
i 1 i 1
2
i
i 1
a, b, c
n n n n

 i 
x y
i 1
 2
a
i x  b  x  c
i 1
 i
x 4 2
i
i 1
3
i
i 1

Ajustement polynômial par moindres carrés


Pr.Mahacine Amrani Master AGRO 2021/2022
Modèle polynomial : Y= a+ bx+
bx+ c x2 …

Ou sous forme matricielle...


 n    a  
    y 
2
 x x
  x  x 2  x 3  b     xy 
 4    
  x  x  x  c    x 2 y 
2 3

 
et pour un polynôme de degré n...
 n 1
  x0 x
1
... x  a    x 0 y 
    
  x1 x  x  b     x y 
2 n 1
...
  
 ... ... ... ...  ...   ... 
2  n 1  
 x n 1 h    x y 
 x ...  x
n ( n 1)


Pr.Mahacine Amrani Master AGRO 2021/2022


Modèle puissance: Y=
Y=a.x
a.xb

 Le modèle puissance se linéarise en calculant les


logarithmes népériens de x et y.
y

Pr.Mahacine Amrani Master AGRO 2021/2022


Modèle double inverse: Y=ax
Y=ax/(b+x)
/(b+x)

 Le modèle double inverse se linéarise en calculant les


inverses de x et y : 1/x et 1/y.
1/y

Pr.Mahacine Amrani Master AGRO 2021/2022


Attention!

• Les points isolés ont un effet indésirables sur la régression


Leur influence doit être testée en les éliminant et en
répétant la régression.

• La différence en y entre un point et la droite de


régression est connue sous le nom de résidu.
La validité
lidi ded la
l régression
i statistique
i i dépend
d d de
d la
l
distribution des résidus:

1. Les résidus doivent être normalement distribués


2. Il ne doit ppas y avoir de tendance dans la distribution de
variance le long de x.
Pr.Mahacine Amrani Master AGRO 2021/2022

Vous aimerez peut-être aussi