Vous êtes sur la page 1sur 2

Fiche TP 2

Statistiques Régression linéaire simple

2020/2021

Partie 1 :

L’entreprise INFORMATEX se spécialise dans l’analyse de systèmes et la programmation sur


ordinateur de problèmes techniques et de gestion. Elle veut utiliser la régression dans une
étude sur le temps requis, par ses analystes-programmeurs, pour programmer des projets
complexes. Cette étude pourrait permettre à la firme d’établir des normes quant au temps
requis pour programmer certains projets et d’assurer éventuellement une meilleure
planification des ressources humaines. Les données du tableau suivant représentent le temps
total en heures requis pour programmer différents projets en fonction du nombre
d’instructions dans chaque programme.

Nombre d’instructions 18 7 14 31 21 5 11 16 26 29
(Xi)
Temps total en heures 55 17 36 85 62 18 33 41 63 87
(Yi)

1) Si nous voulons expliquer les fluctuations dans le temps requis pour programmer les
projets quelle variable devons-nous identifier comme variable dépendante ? Comme
variable explicative ?
2) Rentrer les valeurs du tableau dans une structure R la plus appropriée.
3) Tracer le diagramme de dispersion des couples (Xi, Yi). A la vue de ce diagramme,
pouvons-nous soupçonner une liaison linéaire entre ces deux variables ?
4) Déterminer pour ces observations la droite des moindres carrés, c’est-à-dire donner les
coefficients de la droite des MC.
5) Donner les ordonnées des Yi calculés par la droite des moindres carrés correspondant
aux différentes valeurs des Xi.
6) Tracer ensuite la droite sur le même graphique.
7) Quelle est une estimation plausible de Y à Xi = 21 ?
8) Quel est l’écart entre la valeur observée de Y à Xi = 21 et la valeur estimée avec la
droite des moindres carrés ? Comment appelons-nous cet écart ?
9) Est-ce que la droite des moindres carrés obtenue en 2. passe par le point¿) ? Pouvons-
nous généraliser cette conclusion à n’importe laquelle droite de régression ?

1
Partie 2 :

Dans un village, on a relevé le rendement de maïs (Y) de parcelles de terrain à partir de (X)
quantité d’engrais comme le montre le tableau suivant :

Y (en quintal) 68 6 6 65 69 66 68 65 71 67 68 70
6 8
X (en kg) 65 6 6 64 68 62 70 66 68 67 69 71
3 7

On cherche à expliquer Y en fonction de X soit :

y i=a+b x i+ μ i

Voici les résultats numériques que nous avons obtenus :


12 12 12 12
2
∑ X i=800, ∑ X =53418, ∑ X i Y i =54107, ∑ Y i=811,
i
i=1 i=1 i=1 i=1

12

∑ Y 2i =54849
i=1

1) Tracer le nuage de points et commenter.


2) Calculer les paramètres du modèle, a et b.
3) Estimer les paramètres du modèle à l'aide de la fonction lm ().
4) Tester si les paramètres a et b sont nuls. Indication : on regardera la sortie de
summary (mod) ou mod est le modèle défini dans la question précédente.
5) Quel est le pourcentage de la variabilité totale qui est expliqué par le modèle ?
Au vu de ce résultat, que pouvez-vous conclure sur la qualité du modèle ?
6) Représenter graphiquement les données et la droite des moindres carrés.

Vous aimerez peut-être aussi