1 Introduction et identification des déterminets de la dépense annuelle du ménage en
agrumes : Dans le but d’expliquer la dépense annuelle du ménage en agrumes, on doit tout d’abord chercher les facteurs qui peuvent influer sur cette dernière, ainsi que les variables qui peuvent l’expliquer. Dans un premier temps, on a pensé d’expliquer la variable d’intérêt par les dépenses annuelles du ménage en autres biens, car il se peut qu’il existe une relation de complémentarité entre le bien d’intérêt et les autres biens. Ainsi, une combinaison de ces dépenses peut expliquer la dépense annuelle du ménage en agrumes. on a commencé par chercher parmis les variables quantitatives présentes dans la base de données, à savoir la dépense annuelle du ménage en autres biens, celles qui sont les plus statistiquement significativement corrélées linéairement avec la variable d’intérêt. Pour ce faire, on a ordonné les coefficients de corrélation linéaire par ordre décroissant (Voir le code). On a obtenu ainsi, le tableau contenant les 10 coefficients de corrélation linéaire les plus élevés, ainsi que les p-value des tests de significativité associés. Cependant, on remarque que le plus grand de ces coefficients vaut 0,39 au risque de 5%, qui est le coefficient de corrélation linéaire de la variable d’intérêt avec la variable dépense annuelle du ménage en fruits, est relativement faible. Ainsi, il parait que les dépense annuelles du ménage en autres biens ne suffisent pas à eux seulement pour expliquer la variable d’intérêt. C’est pour cela qu’on s’est tourné vers les variables catégorielles présentes dans la base de données, qui nous paraissent les plus intéressantes. A savoir le milieu de résidence du ménage, sa taille, le niveau scolaire agrégé du chef du ménage et sa situation professionnelle agrégée. Vu que les ménages de tailles supérieures ou égales à 9 ont des proportions relativement très faible par rapport aux ménages de tailles inférieurs à 9 ( Voir le tableau), on a décidé de réduire le nombre de modalités de la variable Taille du ménage en 5 modalités : ménages ayant la taille entre 1 et 2, ménages ayant la taille entre 3 et 4, ménages ayant la taille entre 5 et 6, ménages ayant la taille entre 7 et 8 et ménages ayant la taille supérieure ou égale à 9. Afin d’identifier parmis ces facteurs, ceux qui ont une influence sur la variable expliquée, on doit savoir comment cette variable se répartit sur les modalités de chacun de ces facteurs. Pour la variable milieu du résidence, on remarque tout d’abord que les ménages issus du milieu urbain représentent 65% de l’échantillon tandis que ceux issus du milieu rural en constituent 35%. D’après le diagramme en barres qui représente les moyennes conditionnelles de la variable d’intérêt par rapport aux modalités du facteur, on remarque qu’il y a qu’une légère différence entre ces deux moyennes. Quant à la variable taille du ménage, on constate d’après le diagramme en barres que les moyennes conditionnelles de la variable d’intérêt par rapport aux modalités de ce facteur sont globalement proches les unes des autres, à l’exeption de la moyenne conditionnelle par rapport à la première modalité qui a un écart important par rapport aux autres moyennes. Pour la variable niveau de scolarité du chef du ménage, on voit d’après le diagramme en barres que les moyennes conditionnelles de la variable d’intérêt par rapport aux modalités de ce facteur sont globalement proches les unes des autres, à l’exeption de la moyenne conditionnelle par rapport à la sixième modalité qui a un écart important par rapport aux autres moyennes. Pour la variable situation professionnelle du chef du ménage, on constate d’après le diagramme en barres que les moyennes conditionnelles de la variable d’intérêt par rapport aux modalités de ce facteur sont globalement proches les unes des autres, à l’exeption des deux moyennes conditionnelles par rapport à la cinquième et la sixième modalités qui ont un écart important par rapport aux autres moyennes. Il nous semble ainsi, que le facteurs Taille du ménage est celui qui peut avoir une influence significative sur la variable expliquée. En plus, on a introduit dans notre modèle, la variable quantitative qui a le coefficient de corrélation linéaire avec la variable d’intérêt le plus élevé, qui est la Dépense annuelle du ménage en fruits. Afin d’éliminer le problème de multicolinéarité qui peut être issu du codage disjonctif complet de la variable qualitative, on lui adopte un codage “Cornered Effect”. Ainsi, la première modalité est omise dans la régression
Le Modèle de la Régression linéaire multiple
On note : Y :Dépense annuelle du ménage en agrumes X 1 : Taille du ménage X 2 :Dépense annuelle du ménage en fru Pour le codage de la variable qualitative, on associe à chaque modalité de cette variable, une variable indicatrice définie par : Z k =1{X 1=k }