Vous êtes sur la page 1sur 2

Devoir libre sur l’analyse de la régression

BOUDCHICHI Oussama

1 Introduction et identification des déterminets de la dépense annuelle du ménage en


agrumes :
Dans le but d’expliquer la dépense annuelle du ménage en agrumes, on doit tout d’abord
chercher les facteurs qui peuvent influer sur cette dernière, ainsi que les variables qui peuvent
l’expliquer. Dans un premier temps, on a pensé d’expliquer la variable d’intérêt par les dépenses
annuelles du ménage en autres biens, car il se peut qu’il existe une relation de complémentarité
entre le bien d’intérêt et les autres biens. Ainsi, une combinaison de ces dépenses peut expliquer la
dépense annuelle du ménage en agrumes. on a commencé par chercher parmis les variables
quantitatives présentes dans la base de données, à savoir la dépense annuelle du ménage en autres
biens, celles qui sont les plus statistiquement significativement corrélées linéairement avec la
variable d’intérêt. Pour ce faire, on a ordonné les coefficients de corrélation linéaire par ordre
décroissant (Voir le code). On a obtenu ainsi, le tableau contenant les 10 coefficients de corrélation
linéaire les plus élevés, ainsi que les p-value des tests de significativité associés. Cependant, on
remarque que le plus grand de ces coefficients vaut 0,39 au risque de 5%, qui est le coefficient de
corrélation linéaire de la variable d’intérêt avec la variable dépense annuelle du ménage en fruits,
est relativement faible. Ainsi, il parait que les dépense annuelles du ménage en autres biens ne
suffisent pas à eux seulement pour expliquer la variable d’intérêt. C’est pour cela qu’on s’est tourné
vers les variables catégorielles présentes dans la base de données, qui nous paraissent les plus
intéressantes. A savoir le milieu de résidence du ménage, sa taille, le niveau scolaire agrégé du chef
du ménage et sa situation professionnelle agrégée. Vu que les ménages de tailles supérieures ou
égales à 9 ont des proportions relativement très faible par rapport aux ménages de tailles inférieurs à
9 ( Voir le tableau), on a décidé de réduire le nombre de modalités de la variable Taille du ménage
en 5 modalités : ménages ayant la taille entre 1 et 2, ménages ayant la taille entre 3 et 4, ménages
ayant la taille entre 5 et 6, ménages ayant la taille entre 7 et 8 et ménages ayant la taille supérieure
ou égale à 9. Afin d’identifier parmis ces facteurs, ceux qui ont une influence sur la variable
expliquée, on doit savoir comment cette variable se répartit sur les modalités de chacun de ces
facteurs.
Pour la variable milieu du résidence, on remarque tout d’abord que les ménages issus du
milieu urbain représentent 65% de l’échantillon tandis que ceux issus du milieu rural en constituent
35%. D’après le diagramme en barres qui représente les moyennes conditionnelles de la variable
d’intérêt par rapport aux modalités du facteur, on remarque qu’il y a qu’une légère différence entre
ces deux moyennes.
Quant à la variable taille du ménage, on constate d’après le diagramme en barres que les
moyennes conditionnelles de la variable d’intérêt par rapport aux modalités de ce facteur sont
globalement proches les unes des autres, à l’exeption de la moyenne conditionnelle par rapport à la
première modalité qui a un écart important par rapport aux autres moyennes.
Pour la variable niveau de scolarité du chef du ménage, on voit d’après le diagramme en
barres que les moyennes conditionnelles de la variable d’intérêt par rapport aux modalités de ce
facteur sont globalement proches les unes des autres, à l’exeption de la moyenne conditionnelle par
rapport à la sixième modalité qui a un écart important par rapport aux autres moyennes.
Pour la variable situation professionnelle du chef du ménage, on constate d’après le
diagramme en barres que les moyennes conditionnelles de la variable d’intérêt par rapport aux
modalités de ce facteur sont globalement proches les unes des autres, à l’exeption des deux
moyennes conditionnelles par rapport à la cinquième et la sixième modalités qui ont un écart
important par rapport aux autres moyennes.
Il nous semble ainsi, que le facteurs Taille du ménage est celui qui peut avoir une influence
significative sur la variable expliquée. En plus, on a introduit dans notre modèle, la variable
quantitative qui a le coefficient de corrélation linéaire avec la variable d’intérêt le plus élevé, qui est
la Dépense annuelle du ménage en fruits.
Afin d’éliminer le problème de multicolinéarité qui peut être issu du codage disjonctif
complet de la variable qualitative, on lui adopte un codage “Cornered Effect”. Ainsi, la première
modalité est omise dans la régression

Le Modèle de la Régression linéaire multiple


On note :
Y :Dépense annuelle du ménage en agrumes X 1 : Taille du ménage X 2 :Dépense annuelle du ménage en fru
Pour le codage de la variable qualitative, on associe à chaque modalité de cette variable, une
variable indicatrice définie par :
Z k =1{X 1=k }

Vous aimerez peut-être aussi