Vous êtes sur la page 1sur 5

M2 Pro Ingnierie Mathmatique

Universit d'Angers, Universit de Nantes

Anne 2011-2012

TD de Rappels
Estimateurs, intervalles de confiance, tests

Exercice 1 : EMV

On dispose d'un chantillon de n variables alatoires X1 , . . . Xn de loi P . Dterminer l'estimateur


du maximum de vraisemblance dans les cas suivants :
1. P est une loi normale N (, 2 ) avec = , puis = 2 puis = (, 2 ).
2. P est une loi de Poisson de paramtre .
3. P est une loi exponentielle de paramtre .
4. P est une loi de densit f (x) = exp((x )) 1I[,[ (x).
5. P est une loi gomtrique de paramtre dnie par P (k) = (1 )k .

Exercice 2 : IC

On dispose d'un chantillon gaussien X1 , . . . Xn de moyenne et de variance 2 . On veut dterminer les intervalles de conance pour ces paramtres.
1. On suppose que l'on connat 2 . Dterminer l'intervalle de conance bilatral au niveau
de .
Application : on tudie la rsistance l'clatement d'un certain type de rservoir. Aprs
des essais antrieurs, on peut supposer que cette rsistance suit un loi normale d'cart type
4kg/cm2 . Aucours de ces essais sur un chantillon de 9 rservoirs, on a relev une rsistance
moyenne de 215kg/cm2 . Donner l'intervalle de conance bilatral 95% pour la rsistance.
2. Dterminer l'intervalle de conance bilatral au niveau de la moyenne dans le cas o la
variance est inconnue.
Application : an d'estimer le salaire journalier d'un ouvrier, on a observ le salaire d'un
chantillon de 16 ouvriers :
41
45

40
52

45
40

50
48

41
50

41
40

40
47

43
46

On suppose que la variable "salaire journalier" suit une loi normale. Calculer les estimateurs
de et 2 et donner un intervalle de conance au niveau = 10%.
3. On suppose prsent que l'on connait et on veut estimer 2 . Dterminer, partir des
observations, l'intervalle de conance bilatral au niveau .
Application : on veut tester la prcision d'une balance, en eectuant une srie de 15 mesures
du poids d'un kilo de riz. On obtient les mesures suivantes :
996.17
997.01

994.45
999.36

998.78
997.64

997.2
993.81

1007.01
1004.33

998.45
991.38

1003.93
1000.97

995.23

Dterminer l'intervalle de conance 95% pour 2 .


4. On suppose prsent que la moyenne est inconnue et on veut estimer 2 . Dterminer,
partir des observations, l'intervalle de conance bilatral au niveau pour 2 .
Application : on considre nouveau les donnes de 2. Donner l'intervalle de conance bilatral au niveau = 5% pour 2 . Dterminer a tel que P(0 < 2 < a) = 95%. On parle
d'intervalle de conance unilatral 95%.

Exercice 3 : Application

Soit N le nombre d'oiseaux sur une le. On suppose N trs grand. On capture 800 oiseaux que
l'on marque et que l'on relche. On en recapture 1000, et on constate que 250 d'entre eux sont
marqus. Btir un intervalle de conance pour N .

Exercice 4 : Test de Student

Une entreprise de chimie achte un catalyseur et convient par contrat avec son fournisseur que
la surface spcique du catalyseur doit tre suprieure ou gale 360m2 /g . Une socit de contrle
fait "au hasard" 20 prlvements au moment de la fabrication. Puis elle tire un sous-chantillon de
10 prlvements (groupe 1) parmi ces 20. Sur chaque prlvement, elle mesure la surface spcique
an de pouvoir porter un jugement sur la qualit du lot. On obtient le tableau suivant :
Groupe 1
Groupe 2

322.1
314.5

361.5
343.8

345.6
345.8

346.4
323.3

382.3
361.6

361.8
353.7

334.1
348

321.1
355.4

374.6
333.7

330.4
351.1

On suppose que la surface du catalyseur suit une loi normale.


1. Le fournisseur accepte un risque de 5% de rejeter un lot alors qu'il est dans les spcications.
Il veut tester la validit de son lot avant de le vendre. Prciser H0 et H1 et faites le test
l'aide du sous-chantillon ci-dessus.
2. Le client accepte un risque de 10% d'avoir utiliser un lot alors qu'il n'est dans les spcications. Le client dsire raliser un test an de vrier la validit du lot avant de l'acheter.
Prciser H0 et H1 et faites le test l'aide du sous-chantillon ci-dessus.
3. Discuter. Comment mettre d'accord le client et le fournisseur ?

Exercice 5 : Test de Fisher-Student

Lors d'un TP de chimie, deux groupes ont dos la teneur en Arsenic (As) d'une solution I et
d'une solution II. Les rsultats sont rsums dans le tableau ci-dessous
Solution I
Solution II

3.16
3.14

3.13
3.19

3.17
2.98

2.68
3.26

3.06
3.01

2.91
3.30

3.37
3.04

3.08
3.19

2.73
3.22

3.32

3.40

3.18

On admettra que ces teneurs en Arsenic se rpartissent selon une loi Normale.
1. On se demande tout d'abord si un groupe d'tudiant est plus prcis dans son dosage. Pour
cela, on va tester l'galit des variances entre ces deux chantillons. Calculer les estimateurs
2
2
de la variance et eectuer le test de Fisher suivant : H0 : I2 = II
contre H1 : I2 6= II
,
en xant l'erreur de premire espce = 5%. Conclure.
2. Tester H0 : I = II contre H0 : I 6= II .

Exercice 6 : Test du Khi2

Le couvert vgtal du domaine vital d'un orignal (lan d'amrique) se compose de peuplement
feuillus (25% de la supercie du domaine vital), de peuplements mixtes (38% de la supercie), de
peuplements rsineux (25.8%) et d'un marcage (10.4%). Dans ce domaine, l'orignal a t localis
511 reprises au cours de l'anne. Sur les 511 localisations, 118 se trouvaient dans les feuillus, 201
dans les peuplements mixtes, 110 dans les rsineux et 82 dans les marcages.
1. On veut montrer que l'orignal frquente prfrentiellement certains milieux. Proposer un test
statistique pour vrier cette hypothse.
2. Raliser le test et proposer une interprtation biologique du rsultats.

3.16

M2 Pro Ingnierie Mathmatique


Universit d'Angers, Universit de Nantes

Anne 2009-2010

TP de Rappels
Estimateurs, intervalles de confiance, tests

Exercice 1 : Echantillon gaussien

On va tudier un chantillon gaussien l'aide de la fonction rnorm() de R.


1. Gnrer une suite de 100 observations de loi normales N (10, 2). Calculer la moyenne et l'cart
type de l'chantillon et reprsenter les donnes sous la forme d'un histogramme.
2. Crer une fonction qui gnre un chantillon gaussien de taille 100 de moyenne , variable
alatoire uniforme entre 5 et 10, et de variance 2. Donner un estimateur de sa moyenne, et
calculer l'intervalle de conance 95% de cet estimateur (on utilisera la fonction qnorm( ),
qui donne le fractile au niveau de la loi normale).
3. Crer une fonction qui gnre un chantillon gaussien de taille 100 de moyenne un nombre
alatoire entre 5 et 10 et de variance un nombre alatoire entre 1 et 2. Donner un estimateur
de sa moyenne, et l'intervalle de conance 95% de cet estimateur (on utilisera la fonction
qt( , df = ddl), qui donne le fractile au niveau de la loi de Student ddl degr de libert).
4. On s'intresse maintenant
l'estimation dePla variance. On veut comparer les deux estimaPn
n
1
n )2 et
n )2 .A l'aide de plusieurs ralisations
(X

X
2 = n1 i=1 (Xi X
teurs s2 = n1
i
i=1
2
d'chantillons gaussiens ci-dessus, montrer que s est un meilleur estimateur de la variance
que 2 .
5. Crer une fonction qui gnre un chantillon gaussien de taille 100 de moyenne un nombre
alatoire entre 5 et 10 et de variance un nombre alatoire entre 1 et 2 et qui donne un
estimateur de la variance et un intervalle de conance 95% de cet estimateur.

Exercice 2 : Intervalles de Conances

On se propose d'tudier le poids des poulpes femelles. On va construire des intervalles de


conances pour la moyenne et la variance de cette variable, l'aide du chier de donnes "poulpeF.csv".
1. Rcuprer le chier "poulpeF.csv" l'aide de la commande
>poulpeF<-read.table("poulpeF.csv",header=T)

Calculer les estimateurs de la moyenne et de la variance. Reprsenter les donnes sur un


histogramme.
2. Dterminer un intervalle de conance 95% pour la moyenne, en calculant les bornes de
l'intervalle avec la fonction qt(, ddl).
3. Retrouver cet intervalle l'aide de la fonction t.test :
>t.test(poulpeF$Poids,conf.lev=0.95)$conf.int

4. Dterminer un intervalle de conance 95% pour la variance.


5. Crer une fonction ICvar ayant comme argument un vecteur d'observations, et un risque ,
et qui sort l'intervalle de conance pour la variance de l'chantillon.

Exercice 3 : Test de Fisher-Student

On veut comparer prsent le poids des poulpes mles celui des femelles. On veut valider de
manire statistique une dirence de poids entre les poulpes de sexe dirent.
1. Rcuprer le chier "poulpe.csv" l'aide de la commande

>poulpe<-read.table("poulpe.csv",header=T,sep=";")

2. Rsumer le jeu de donne l'aide de la commande


>summary(poulpe)

3. Visualiser une bote moustaches des donnes l'aide de la commande :


>boxplot(Poids~Sexe,ylab="Poids",xlab="Sexe",data=poulpe)

4. On suppose prsent que les donnes suivent une loi normale. Tester l'galit des variances
l'aide de la commande
>var.test(Poids~Sexe,data=poulpe)

Que conclure si on souhaite tester H0 : F = H contre H1 : F 6= H ?


5. On peut prsent tester l'galit des moyennes l'aide de la commande
>t.test(Poids~Sexe,var.equal=TRUE,data=poulpe)

Conclure. Discuter les arguments de la fonction t.test. Comment procder si on considre les
variances direntes ?
6. Proposer une fonction qui dtermine la puissance observe du test de Student. Est-ce utile
ici avec ce jeu de donne ?

Exercice 4 : Test du Khi2 d'indpendance

On tudie l'inuence du sexe sur la couleur des cheveux d'lves d'un district cossais. Nous
souhaitons savoir si la couleur des cheveux est indpendante du sexe. Pour cela, on dispose du
tableau de donnes suivant :
Garon
Fille

Blond
592
544

Roux
119
97

Chtain
849
677

Brun
504
451

Noir de jais
36
14

1. Saisissez le jeu de donnes manuellement dans une matrice :


>tab<-matrix(c(592,544,119,97,849,677,504,451,36,14),ncol=5)
>rownames(tab)<-c("Garon","Fille")
>colnames(tab)<-c("Blond","Roux","Chatain","Brun","Noir de jais")

2. Reprsenter les donnes l'aide de diagrammes en barres, o on reprsente les donnes par
sexe sur un mme graphique :
>par(mfrow=c(2,1))
>barplot(tab[1,],main="Garons")
>barplot(tab2,],main="Filles")

3. Raliser le test l'aide de la commande :


>resultat<-chisq.test(tab)

4. Prcisez les couleurs qui contribuent le plus au Khi2. Ces contributions sont dans l'objet
residuals. En divisant chaque valeur par la statistique de test (contenu dans l'objet stat),
on obtient les pourcentages suivants :
>round(100*resultat$residuals^2/resultat$stat,1)

Exercice 5 : Comparaison de plusieurs tests

On se propose confronter le gnrateur alatoire gaussien de R l'aide de plusieurs tests d'adquation.


1. Gnrer un chantillon de taille 100 de loi normale N (10, 2). Raliser un test de Shapiro-Wilk
d'hypothses H0 : Les donnes suivent une loi normale". Rpter le procd plusieurs fois.
Que constatez-vous ?

2. Comparer les rsultats obtenus avec le test de Kolmogorov Smirnov. Proposer, sans utiliser
de boucle for, une sortie graphique permettant de comparer les deux test (Shapiro-Wilk et
Kolmogorov-Smirnov) sur un grand nombres d'chantillons. Discuter et conclure.
3. A prsent on va tester l'adquation en loi entre deux chantillons issue du mme gnrateur
alatoire. Gnrer deux chantillons gaussiens de loi N (10, 2) et tester H0 : Les deux vecteurs
ont la mme loi" contre l'alternative H1 : Les deux vecteurs ne sont pas issus de la mme
loi" grce au test de Kolmogorov-Smirnov.
4. Enn, on va comparer l'ecacit du test de Kolmogorov-Smirnov par rapport au test du
Khi2 pour tester l'adquation de deux chantillons. Pour cela, gnrer un grand nombre
de fois deux chantillons gaussiens de loi N (10, 2) et tester l'adquation avec les fonctions
shapiro.test et chisq.test. Proposer une manire graphique de comparer les rsultats. Discuter
et conclure.