Académique Documents
Professionnel Documents
Culture Documents
ème
Enseignant : Walid Ayadi 2 année GI
Pour 47 immeubles d’appartements locatifs d’une grande ville américaine, les données
fournissent le revenu net de chaque immeuble en fonction du nombre d’appartements.
Liste des variables :
– Revenu : Revenu net de chaque immeuble
– Nbappart : Nombre d’appartements de chaque immeuble
Etude statistique
summary(don)
Pour le revenu, on constate que la valeur moyenne est 92257. La médiane (qui est un
indicateur plus pertinent que la valeur moyenne) est 48008. De plus, 1rd Qu est inférieur à la
3re Qu ce qui indique que les valeurs sont plus importantes dans le 75% des observations. Le
revenu minimal est 9882. Quant au revenu maximal, il est de 562 942.
Pour le nbapp, on constate que la valeur moyenne est 41.32. La médiane est 24. D’un autre
côté, 1st Qu est inférieure à 3rd Qu. Le nbapp minimal est 12. Quant au nbapp maximal, il est
de 205.
Ajuster le modèle
reg=lm(revenu~nbappt,data=suit)
β0 = -4872 et β1 = 2351
la variation d’une unite du nombre d’appartement engendre un gain de 2351
summary(reg)
La ligne en trait plein est la droite de régression linéaire (définie par la méthode des
moindres carrés) entre les deux variables.
Pour déterminer la droite de régression, on ajuste un modèle linéaire simple aux
données, à l’aide de la fonction “lm”.
La régression linéaire simple permet d’évaluer la significativité du lien linéaire entre deux
variables. La forme linéaire entre les deux variables est donc présupposée.
Autrement dit, on fait l’hypothèse que la forme de la relation entre les variables est
linéaire. Néanmoins, il est préférable de vérifier si cette hypothèse est acceptable, ou
non, car si ce n’est pas le cas, les résultats de l’analyse n’auront pas de sens.