Académique Documents
Professionnel Documents
Culture Documents
1
Jusqu’à présent, nous avons supposé que la fonction de
régression était linéaire, c’est-à-dire que nous avons traité
le paramètre de pente de la fonction de régression comme
une constante.
Cela implique que l'effet sur un changement d'une unité
dans X ne dépend pas du niveau de X .
4
la droite de régression linéaire semble surestimer la véritable relation
entre les deux variables.
lorsque le revenu est très élevé ou très faible
lesous-estimer pour le groupe à revenu intermédiaire.
On peut penser alors à un autre modèle qui pourrait capter mieux la
relation:
6
La régression quadratique est un cas particulier de la régression
polynomiale
L'équation générale d'un modèle de régression polynomiale est :
7
Ce test nous permettra de tester si l relation est linéaire ou non: Si H0
est vraie c’est une simple relation linéaire sinon c’est une relation
quadratique.
8
Représentation graphique
9
10
On voit que la fonction quadratique s’adapte mieux que la
fonction linéaire
11
Régression polynomiale
Il s’agit de généraliser la régression quadratique pour un
degré r
12
La question qui se pose quel degré choisir pour une régression ?
nous pouvons tester l'hypothèse nulle selon laquelle la vraie
relation est linéaire contre l'hypothèse alternative selon
laquelle la relation est un polynôme de degré r
13
Par exemple, nous pouvons tester la valeur nulle d'un modèle linéaire
par rapport à l'alternative d'un polynôme de degré maximal r = 3
comme suit.
# test d'hypotheses linear model vs quadratic or polynomial
R <- rbind(c(0, 0, 1, 0), c(0, 0, 0, 1)) # pour écrire b2=b3 = 0
R
15
1-Estimer un modèle polynomial pour une valeur
maximale r
2-Utiliser un test de student H0:βr = 0, rejeter H0 cela
veut dire que Xr fait partie du modèle.
3- L’acceptation de H0 dans 2 signie qu’on peut éliminer
Xr, continuer la procédure en 1 avec l’ordre r-1 et faire
le test de student.
4-Si le test de l’étape 3 est rejeté, poursuivez la
procédure jusqu’à ce que le coefficient de la puissance
la plus élevée soit statistiquement significatif.
16
La littérature économique suggère de ne pas dépasser 2 ou 2
ou 4 comme degré du polynome.
17
Modèle Logarithmique
Un autre type de régression non linéaire est l’usage des algorithmes.
Il existe 3 situations de passage en Log:
Transformer y sans transformer x
Transformer x sans stranformer y
Transformer les deux en Log
1er cas: y en Log uniquement:
Parfois il est intéressant de passer au Log de y pour bien capter la
relation:
20
Cas 2: Appliquer le Log à x sans y:
21
# Graphique de la relation:
plot(score ~ income, col = "steelblue",pch = 20, data =
CASchools,ylab="Score",xlab="Income", main = "Linear-Log
Regression Line")
order_id <- order(CASchools$income)
lines(CASchools$income[order_id], fitted(LinearLog_model)
[order_id], col = "red",
lwd = 2)
legend("bottomright",legend = "Linear-log line",lwd = 2,col
="red")
22
23
Variation de 1 % de x entraine une variation de 0,01 β1 de
y
24
Cas 3: x et y transformées par la fonction Log:
LogLog_model <- lm(log(score) ~ log(income), data
= CASchools)
coeftest(LogLog_model,
vcov = vcovHC, type = "HC1")
25
1% variation de x est associée à 1% * b1 de y, b1
est appelée élasticité de y par rapport à x
# graphique du modèle log-log:
plot(log(score) ~ income,
col = "steelblue",
pch = 20,
data = CASchools,
ylab="log(Score)",
xlab="Income",
main = "Log-Linear Regression Function")
26
27
Les logarithmes peuvent être utilisés pour transformer la
variable dépendante ou la variable indépendante X,
ou les deux (la variable transformée doit être positive).
28
Comparons graphiquement cubic model linear-log model:
plot(score ~ income,
data = CASchools,
col = "steelblue",
pch = 20,
ylab="Score",
xlab="Income",
main = "Linear-Log and Cubic Regression Functions")
29
# Ajoutons the linear-log regression line
order_id <- order(CASchools$income)
lines(CASchools$income[order_id],
fitted(LinearLog_model)[order_id],
col = "darkgreen",
lwd = 2)
30
# Ajoutons cubic model:
#
lines(x = CASchools$income[order_id],
y = fitted(cubic_model)[order_id],
col = "red",
lwd = 2)
# add a legend
legend("bottomright",
legend = c("Linear-Log model", "Cubic model"),
lwd = 2,
col = c("darkgreen", "red"))
31
32
Les deux droites de régression semblent presque identiques.
Dans l’ensemble, le modèle logarithmique linéaire peut être
préférable pour évaluer des accroissements par exemple,
le modèle logarithmique est adapté aux situations où les
changements relatifs sont importants, tandis que le modèle
cubique est plus flexible pour capturer des formes de courbes
complexes. Le choix entre les deux dépend du contexte
spécifique de votre problème et des caractéristiques des
données.
33
Exercice
x=1:15
y=c(59, 50, 44, 38, 33, 28, 23, 20, 17, 15, 13, 12, 11, 10,
9.5)
Faire le plot de x et y
Proposer un modèle de régression
Résultats du modèle
34