Vous êtes sur la page 1sur 5

DEVOIR ET EXAMEN

Un agronome s’intéresse à la liaison pouvant exister entre le rendement de


maïs x (en quintal) d’une parcelle de terre et la quantité d’engrais y (en kilo). Il
relève 10 couples de données consignés dans le tableau suivant :
Rendements 1 18 23 24 28 29 26 31 32 34
x 6
Engrais y 2 24 28 22 32 28 32 36 41 41
0

Afin d’aider cet agronome, on vous demande de réaliser une étude de la


corrélation en effectuant les tâches suivantes :
1. Vérifions que la liaison est linéaire
2. Modélisez cette relation (en utilisant comme paramètres β0 et β1)
3. Donnez la formule des estimateurs β0 et β1
4. Calculez ces estimateurs
5. Écrire la relation estimée
6. Étudiez l’adéquation du modèle

Pour ce faire nous traçons un nuage de points

40

35

30
Rendement du maïs (X)

25

20

15

10

0
15 20 25 30 35 40 45
Quantité d'engrais (Y)

1. Testez de normalité des séries (Shapiro-Wilk)


Comme tout test le test de Shapiro-Wilk consiste à
Hypothèses à tester
H0 : la variable est gaussienne vs H1 : la variable est non gaussienne
Statistique du test (W):

Pour calculer W, il faut trier les série de données en ordre croissant, déterminer
la partir entière j de n/2 et identifier les a i. Ces valeurs sont lues dans la table des
coefficients de Shapiro et Wilk sachant n et j sont donné.
Ici j=10/2=5. Les coefficients ai associés dans la table des coefficients de
Shapiro et Wilk sachant n et j sont colonne 4.

i X X(n-i+1)-X(i) ai ai[X(n-i+1)-X(i)] (X(i)-Xb)²


1 1 18 0,5739
6 10,3302 102,01
2 1 14 0,3291
8 4,6074 65,61
3 2 8 0,2141
3 1,7128 9,61
4 2 5 0,1224
4 0,612 4,41
5 2 2 0,0399
6 0,0798 3,61
6 2 17,3422
8 8,41
7 2
9 0,01
8 3
1 24,01
9 3
2 34,81
10 3
4 62,41
314,9

i X X(n-i+1)-X(i) ai ai[X(n-i+1)-X(i)] (X(i)-Xb)²


1 2 21 0,5739
0 12,0519 108,16
2 2 19 0,3291 6,2529 40,96
2
3 2 12 0,2141
4 2,5692 5,76
4 2 4 0,1224
8 0,4896 70,56
5 2 4 0,0399
8 0,1596 2,56
6 3 21,5232
2 5,76
7 3
2 2,56
8 3
6 31,36
9 4
1 112,36
10 4
1 112,36
492,4

Règle de décision
Si W < WTable(n) au seuil α, on rejette H0 la variable est non gaussienne. La
statistique lu dans la table pour n=10 au seuil de 5% est 0,842. W est supérieur à
Wlu on accepte dans les deux cas l’hypothèse nulle. Les variables sont
gaussiennes.

2. Choisissez et estimez le coefficient de corrélation approprié

Les deux séries étant gaussienne le calcul du coefficient de corrélation en


utilisant la méthode de Pearson et celle de Spearman devrait conduire
normalement au même résulte. Nous choisissons alors la méthode de Pearson
qui s’obtient par :

AN :

3. Testez la significativité du coefficient de corrélation


1) Hypothèses du test :
 H0 : ρ = 0 (absence de liaison linéaire entre x et y)
 H1 bilatérale : ρ  0 (existence d’une liaison entre X et Y)
2) Seuil de confiance ou seuil significativité (α) = 5%
3) Statistique du test (tC)

AN :

4) Règle de décision
En principe Si tC>tα/2, n-2 ou tC<-tα/2, n-2 alors on rejette H0 au seuil de α. Ici t0,025,
8=2,67.
On remarque que tC=27,6 >2,67. Ainsi on rejette H0 et le coefficient de
corrélation est significativement différent de zéro.

4. Interprétez le coefficient estimé

D’après les calculs ci-dessus, le coefficient de corrélation est positif, significatif


et tend vers 1. Il existe donc une corrélation positive forte entre la quantité
d’engrais et les rendements du maïs.

5. Modélisez cette relation (en utilisant comme paramètres β0 et β1)


40

35

30
Rendement du maïs (X)

25

20

15

10

0
15 20 25 30 35 40 45
Quantité d'engrais (Y)

6. Formule des estimateurs β0 et β1

7. Calculons les estimateurs

8. La relation estimée est :

Vous aimerez peut-être aussi