Vous êtes sur la page 1sur 2

TD de statistique

préformation CEA
Olivier Bonin

Exercice I
On mesure le nombre de personnes aux guichets d’entrée d’un stade, et on
obtient les résultats suivant :

10 13 8 10 13 19 12 10 10 11 9 12 8 12 4 11 6 6 6 10

Donnez un intervalle de confiance à 95% du nombre moyen de personnes


aux guichets. On utilisera pour cela le fait que le nombre de personnes à chaque
guichet suit une loi de Poisson de paramètre λ, et le fait que cette loi de Poisson
peut être approchée par une loi normale de paramètres m = λ et σ 2 = λ.

Exercice II
On mesure des températures dans une pièce à l’aide de neuf thermomètres
du même fabricant. Les mesures obtenues sont :

18,8 19,8 19,0 16,8 18,7 17,9 19,8 18,3 20,1

Le fabricant prétend que ses thermomètres ont un écart-type de mesure (une


précision) inférieure à 0,5 degrés Celsius. Testez cette hypothèse au niveau 5%.

Exercice III
Soit un modèle de régression multiple écrit sous forme matricielle :

Y = XA + ε

avec Y = (Y1 , Y2 , . . . , Yn )T , A = (a1 , a2 , . . . , ap )T le vecteur des paramètres, X


la matrice des variables explicatives, et ε un vecteur gaussien d’espérance nulle
et de variance σ 2 I.
L’estimateur des moindres carrés ordinaires de A est :

 = (X T X)−1 X T Y

soit, en remplaçant Y par XA + ε :

 = (X T X)−1 X T (XA + ε) = A + (X T X)−1 X T ε

1
ce qui prouve que Â−A est un vecteur gaussien, (X T X)−1 X T étant déterministe
et ε étant un vecteur gaussien.

Sous l’hypothèse de normalité des résidus, c’est-à-dire Y ∼ N (XA, σ 2 I), on


a donc :
âj − aj
tj = q
σ̂ 2 (âj )
qui suit une loi de Student de paramètres n−p. On est donc capable de construire
des intervalles de confiance pour les paramètres de la régression, et de tester la
nullité de coefficients.

On simule le tirage de 10 variables normales centrées réduites :

-0,8990092 -0,5932445 2,1312565 -0,6673051 0,8117633


-0,4521267 -1,3059399 -0,4346369 1,2199085 0,8573387

qu’on regroupe dans le vecteur x, et on construit y comme le vecteur x


auquel on ajoute un nouveau tirage de 10 variables normale centrées réduites :

-0,42206194 -2,30075935 2,60289418 -1,03364400 0,83440116


0,61806285 -0,66013959 -1,90003070 1,99750476 0,05831892

Vue la construction de y, on peut s’attendre à avoir une forte corrélation


entre y et x. On propose le modèle de régression :

yi = a + bxi + εi

pour i = 1, . . . 10, et l’estimation par moindres carrés donne le modèle suivant :

yi = −0.09629 + 1.13387xi + εi

Le R2 du modèle est de 0,6354. Le modèle possédant 10 observations et deux


paramètres estimés, il a 8 degrés de liberté.

Les estimateurs des écarts-types de â et de b̂ valent respectivement 0,32037


et 0,30369. Testez, au niveau 5%, la nullité de â et de b̂. Pourquoi pouvait-on
s’attendre à avoir un coefficient â statistiquement nul ?

Vous aimerez peut-être aussi