Académique Documents
Professionnel Documents
Culture Documents
MA1300
3 novembre 2011
ECP S5 - 2011/2012
2
ECP S5 - 2011/2012
Exercice 1.2. Soient {Xi }i∈N∗ des variables aléatoires indépendantes de loi uniforme sur
[0, θ]. On pose X(n) = maxi=1,...,n Xi .
1. Calculer P X(n) ≤ x pour tout x réel.
2. Donner limn→+∞ P n(θ − X(n) ) ≤ x et en déduire un résultat de convergence en
loi.
θn −θx n−1
fnX̄ (x) = e x I{x>0} .
Γ(n)
1. Donner la loi de X̄. Calculer E(1/X̄) et Var(1/X̄). Montrer que E(1/X̄) tend vers θ
quand n tend vers l’infini. Établir la relation
2 2
1 1 1
E −θ = Var + E −θ ,
X̄ X̄ X̄
Exercice 1.4. (Théorique) On dit que X suit une loi Gamma de paramètres p et θ
(p > 0, θ > 0), notée γ(p, θ) si sa densité (par rapport à la mesure de Lebesgue) est :
θp
f (x) = exp(−θx)xp−1 I(x > 0) ,
Γ(p)
Z 1
Γ(α1 )Γ(α2 )
B(α1 , α2 ) = uα1 −1 (1 − u)α2 −1 du = , ∀α1 , α2 > 0.
0 Γ(α1 + α2 )
Exercice 1.5. (Appliqué) On mesure le cours d’une action Yt au cours du temps (toutes
les minutes par exemple) et on s’intéresse à la modélisation des log-retours, c’est-à-dire des
quantités Xt = log(Yt+1 /Yt ). Sur le graphique, on a représenté la simulation d’une série
financière x1 , . . . , xn , ainsi que l’histogramme des valeurs observées et le profil de la queue
de distribution F : t 7→ #{Xi > t}/n, en coordonnées logarithmiques.
On rappelle qu’une variable de Cauchy de paramètre m et c admet une densité fm,c (x) =
1 1
πc 1+(x−m)2 /c2
1. Justifier l’utilisation d’une loi de Cauchy plutôt qu’une loi normale pour modéliser
les valeurs Xt observées.
2. Pour X une loi de Cauchy de paramètre m et c, que vaut E|X| ? Comment se com-
porte la moyenne empirique des Xi lorsque n → ∞ ?
3. Que vaut la médiane de X ? On dit que m est le paramètre de position de la loi.
4
ECP S5 - 2011/2012
0.2
0.1
x
−0.1 0.0
Index
250
Frequency
150
0 50
x
0.05 0.20
F
0.01
6
ECP S5 - 2011/2012
Exercice 2.3. Soit X une variable aléatoire uniforme sur l’intervalle [0, 2a].
1. Donner l’espérance E(X) et la variance Var(X) de la variable X.
On considère une suite (Xk )k≥1 de n variables aléatoires indépendantes et de même
loi que X. Posons X̄n = n−1 (X1 + . . . + Xn ) et T = max{X1 , . . . , Xn }.
2. Justifier l’utilisation de ces statistiques dans le problème d’estimation de a.
3. Montrer que X̄ est un estimateur convergent de E(X). En déduire un estimateur
convergent de la variance.
4. Donner la densité de la variable T , son espérance et sa variance. En déduire un
estimateur sans biais de E(X).
5. Comparer les deux estimateurs.
Exercice 2.5. (Appliqué) Une étude préalable a montré que, dans une production en
grande série, 3% des pièces usinées par une certaine machine sont mauvaises. Un client
reçoit une caisse de 500 pièces en provenance de cette machine.
On s’intéresse à la probabilité p1 que le client trouve moins de 1% de pièces mauvaises
à l’intérieur de sa caisse ainsi qu’à la probabilité p2 qu’il trouve plus de 4, 5% de pièces
mauvaises, auquel cas il renverra la caisse à son fournisseur comme leur contrat le permet.
1. Modéliser X le nombre de pièce défectueuses dont on déterminera la loi, et s’en servir
pour calculer les valeurs exactes (ou approchées) de p1 et p2 .
2. Utiliser l’inégalité d’Hoeffding pour majorer p1 et p2 .
3. Utiliser le TLC pour donner une approximation de p1 et p2
4. Comparer ces trois résultats.
8
ECP S5 - 2011/2012
lundi 5 décembre
Exercice 3.2. On suppose k fixé. On considère la famille de fonctions indexée par a > 0 :
ck xk si x ∈]0, a]
f (x, a) =
0 sinon
Exercice 3.3. Soient ξ1 , . . . , ξn des variables aléatoires i.i.d. de densité f (·) par rapport
à la mesure de Lebesgue sur R, et soit Xi ∈ R, i = 1, . . . , n. On observe les couples
(Xi , Yi ), i = 1, . . . , n, issus du modèle de régression linéaire
Yi = θXi + ξi ,
où θ ∈ R est un paramètre inconnu. On suppose d’abord que les Xi sont déterministes
(modèle de régression à effets fixes).
1. Expliciter la densité jointe de Y1 , . . . , Yn .
2. Montrer que si la loi de ξi est N (0, 1), la densité des (Y1 , . . . , Yn ) est
n
1 1X 2
exp − (Yi − θXi ) .
(2π)n/2 2
i=1
Exercice 3.4. (Théorique) On considère une suite {Xi }i∈N de variable aléatoires de
Pareto de paramètres c > 0 et α > 0, dont la densité est donnée par
Exercice 3.5. (Appliqué) Le tableau suivant donne le coût horaire de la main d’œuvre
en France (X) et en Allemagne (Y ).
1997 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007
France 22.52 22.94 23.57 24.84 26 27.04 27.68 28.46 29.29 30.25 31.24
Allemagne 23.3 23.6 24 25 25.6 26.2 26.8 26.9 27.1 27.6 27.8
3. Donner une prédiction du coût du travail en Allemagne en 2008, sachant qu’il était
de 31¤97 en France. En supposant que a et b ont été parfaitement estimés, donner
une estimation grossière de l’erreur de prédiction.
10
ECP S5 - 2011/2012
NB : On notera indifférement qαN ou Φ−1 (α) le quantile d’ordre α de la loi normale standard.
Exercice 4.1. On dispose d’un échantillon de taille n = 400 d’une loi de Poisson P(θ)
de paramètre θ inconnu. Proposer un intervalle de confiance au niveau asymptotique 0.99
pour θ fondé sur l’estimateur du maximum de vraisemblance.
Exercice 4.2. On désire estimer, avec une précision fixée, la valeur de la variance d’une
loi normale. On va calculer la taille de l’échantillon nécessaire pour obtenir cette précision.
1. Préciser la loi limite d’une variable aléatoire suivant une loi du χ2 (n) à n degrés de
liberté, lorsque n tend vers l’infini.
2. On considère n réalisations indépendantes XP
1 , . . . , Xn d’une variable X suivant une
2 2 −1 n 2 2
loi normale N (m, σ ). Soit σ̂ = (n − 1) i=1 (Xi − X̄) . Montrer que σ̂ est un
estimateur sans biais de la variance.
3. Trouver la valeur de n telle que :
σ̂ 2
P 1−< 2 <1+ =1−α
σ
Exercice 4.3. On effectue un sondage sur un échantillon de 400 électeurs. On relève 212
intentions de vote en faveur d’un candidat A, 188 pour B.
Exercice 4.4. (Théorique) Soit {Xi }i=1,...,n un échantillon i.i.d. de loi uniforme sur
[0, θ].
1. Montrer que θ/X(n) est une fonction pivotale.
2. Trouver le plus petit intervalle de confiance de la forme [aX(n) , bX(n) ] où a et b sont
à déterminer, et de niveau 1 − α.
3. A partir du résultat de convergence établi dans l’exercice 1.2, déduire un intervalle
de confiance asymptotique de niveau 1 − α de la même forme que le précédent.
Commenter.
Exercice 4.5. (Appliqué) Une usine produit en série des tôles métalliques dont la
surface est modélisée par une variable aléatoire X normale de variance égale à 16. Après
mise en place d’un nouveau processus de fabrication, on prélève un échantillon de 28 tôles
afin de déterminer une estimation de la moyenne m de X.
1. On trouve une moyenne empirique X = 45, 25 dm2 . Construire un intervalle de
confiance pour m au niveau 95% en supposant que la variance n’a pas changée au
moment de la mise en place du nouveau processus.
2. Pour un même niveau de confiance, on souhaite réduire la largeur de l’intervalle
trouvé dans la question précédente en choisissant un échantillon de taille supérieure.
En souhaitant obtenir une largeur d’intervalle de 1 dm2 , quelle doit être la taille du
nouvel échantillon ?
3. On considère maintenant que la variance de la variable X ne peut pas être supposée
invariante suite à la mise en place du nouveau processus. On relève la variance
empirique de l’échantillon et on trouve s2 = 16 dm4 . Construire le nouvel intervalle
de confiance de m avec le même niveau de confiance et le comparer à celui trouvé
dans la première question.
12
ECP S5 - 2011/2012
Séquence no 5: Tests
Exercice 5.2. Soit X une v.a. de densité f (x; θ) = θxθ−1 I{0<x<1} avec θ ∈ {θ : θ = 1, 2}.
Afin de tester H0 : θ = 1 contre H1 : θ = 2, on utilise un échantillon X1 , X2 de taille n = 2
et on définit la région critique W = {(x1 , x2 ) : 34 ≤ x1 x2 }.
1. Donner la taille du test.
2. Donner sa puissance.
Exercice 5.3. Un grand groupe pétrolier étudie l’éventualité d’une fermeture de ses
stations service dans un pays européen car celles-ci ne lui semblent pas rentables. Pour
cela, il considère le litrage de ces stations, en un type donné de carburant, durant une année
de fonctionnement. Il a été démontré que l’ensemble des stations service se distribue, en
matière de litrage, selon la fonction de répartition suivante, où a est un paramètre positif
inconnu :
F (x) = 1 − e−x/a I(x > 0) .
Pour justifier les fermetures, le directeur du groupe commande un test statistique sur un
échantillon de 20 stations. Les hypothèses du test sont les suivantes :
H0 : a = a0 = 800m3 /an
H1 : a = a1 = 1000m3 /an
5. Quelle devrait être la taille de l’échantillon pour que les risques de première et de
deuxième espèce soient égaux à 5% ?
Exercice 5.4. (Théorique) On suppose que l’on observe X1 , . . . , Xn , i.i.d. de loi N (µ, 1).
On veut tester H0 : µ = 0 contre H1 : µ = m < 0.
H1 : µ = −Cn−γ
Exercice 5.5. (Appliqué) On veut vérifier que la précision d’une balance n’a pas di-
minué au bout d’un an de fonctionnement. Si on pèse un poids d’un gramme, on peut
considérer que l’observation faite est la réalisation d’une variable aléatoire X qui suit une
loi normale de moyenne m = 1 g et d’écart-type s0 = 1, 5 mg. Si, au bout d’un an on
constate que l’écart-type s a augmenté, on conclut que la précision a diminué.
1. On veut tester :
H0 : s = s0 = 1, 5 mg
H1 : s = s1 = 2 mg
En appliquant la méthode de Neyman et Pearson, définir la variable de décision, sa
loi et donner la région critique. On prendra un échantillon de taille n = 10 et un
risque de première espèce α = 0, 10.
2. Quelle est la puissance du test ?
3. Que doit-on conclure si les résultats de 10 pesées donnent, en mg :
997 999 1002 1001 1003 998 999 1002 997 1001
14
ECP S5 - 2011/2012
16 janvier 2012
Exercice 6.1. La législation sur les problèmes d’environnement impose des normes de
plus en plus strictes. Une usine de traitement industriel des résidus urbains d’une grande
ville rejette dans l’atmosphère un certain nombre d’éléments polluants, en particulier de
la dioxine. Il a été prouvé par de nombreuses mesures que la teneur en dioxine des rejets
de cette usine dans l’atmosphère suit une loi normale de paramètres m = 0, 11 ng/m3 et
s = 0, 01 ng/m3 . Or une nouvelle norme a été adoptée et l’usine a six mois pour avoir des
rejets de moyenne 0, 10 ng/m3 maximum. Une entreprise propose un traitement des rejets
afin de respecter la nouvelle réglementation et souhaite vendre son procédé à l’usine qui
n’effectuera cet investissement que si elle est certaine du résultat. Pour tester l’efficacité
du procédé proposé, l’usine traite 11 lots de ses rejets et les teneurs en dioxine à la sortie
sont les suivantes :
0,114 0,096 0,115 0,105 0,120 0,100 0,110 0,080 0,085 0,112 0,113
1. Peut-on affirmer, au risque 5%, que le procédé ne permet pas de respecter la nouvelle
norme concernant la teneur en dioxine des rejets ? On précisera clairement tous les
éléments du test effectué.
2. Quelle est la puissance minimale du test ?
3. Le directeur de l’usine souhaitant un risque de deuxième espèce maximum égal à 2%
combien d’observations seront-elles nécessaires ?
4. Une étude des mesures effectuées depuis de longues années montre que la dispersion
des mesures est très fortement influencée par les conditions climatiques et qu’il est
impossible en fait de supposer connue la valeur de l’écart-type s. Reprendre alors les
questions 1 et 2.
Exercice 6.2. 1. Parmi les matrices suivantes, lesquelles peuvent être la matrice de
covariance d’un vecteur aléatoire X ∈ R2 ?
1 2 −1 −1/2 1 1/2 1 1/2
, , , .
2 1 −1/2 −1 1/2 1 1/3 1
On note Σ les matrices répondant à la question, et on suppose désormais que X est
de loi N2 (0, Σ).
2. Calculer, pour chaque matrice Σ, les valeurs propres (λ1 , λ2 ) et les vecteurs propres
associés (V1 , V2 ).
3. Donner la loi jointe de V1T X et V2T X.
Exercice 6.3. On désire tester les hypothèses suivantes concernant un certain pourcen-
tage :
H0 : p = p0 = 0, 20
H1 : p = p1 6= 0, 20
0, 12 ≤ p̂ ≤ 0, 28
Exercice 6.4. (Théorique) Soient X1 , . . . , Xn des variables aléatoires i.i.d. dont la loi
admet la densité f (x − θ), où f (x) = 2(1 − x)I{0 ≤ x ≤ 1}. On veut tester l’hypothèse
H0 : θ ≥ 1 contre l’alternative H1 : θ < 1. Introduisons les régions critiques
Rc = {X(1) < c}
et
R̃c = {X(n) < c}.
Le but de cet exercice est de comparer le test basé sur Rc avec celui basé sur R̃c .
1. Calculer la fonction puissance π associée à Rc et vérifier que cette fonction est mo-
notone.
2. Quelle valeur critique c faut-il choisir pour que le test associé à Rc soit de niveau
5% ?
3. Calculer la fonction puissance π̃ associée à R̃c , où c est choisi de telle façon que le
test soit de niveau 5%.
4. Comparer les fonctions puissance π et π̃ pour les tests de niveau 5%. Peut–on affirmer
qu’un de ces tests est plus puissant que l’autre ?
5. Analyser l’asymptotique de π et π̃ quand n → ∞ et c reste fixé.
Exercice 6.5. (Appliqué) Pour déterminer le poids moyen d’épis de blé appartenant à
une variété particulière, on a procédé à 10 pesées réalisées sur des épis tirés au hasard. On
suppose que le poids des épis appartenant à cette variété est une variable aléatoire suivant
une loi normale de moyenne m et de variance σ 2 , ces deux paramètres étant inconnus.
1. Les observations sont les suivantes :
194,46 183,16 171,57 177,38 155,37 205,61 171,24 207,73 175,54 188,30
– Donner un intervalle de confiance au niveau 95% pour la moyenne m.
– Donner un intervalle de confiance au niveau 95% pour la variance σ 2 .
2. La proportion d’utilisateurs de cette variété dans la région était égale à 15%. Soit p̂
la proportion d’utilisateurs de cette variété parmi n agriculteurs.
(a) Déterminer, à partir du théorème de la limite centrale, le nombre minimal d’agri-
culteurs que l’on doit interroger pour que :
P {|p̂ − p| ≤ 0, 01} ≥ 0, 95
16
ECP S5 - 2011/2012
Les corrélations empiriques r̃ij entre les variables et les composantes principales sont
reportées dans la matrice suivante :
0, 969 −0, 103 0, 191 0, 119
0, 906 −0, 394 −0, 105 −0, 111
R̃ = (r̃ij )1≤i,j≤4 =
0, 970 0, 160 −0, 156 0, 090
0, 943 0, 249 0, 096 −0, 197
18
ECP S5 - 2011/2012
Lois usuelles
est une variable dite du chi-deux de Pearson à p degrés de liberté. Sa densité est
donnée par :
f (y) = C(p)y p/2−1 e−y/2 I{y > 0}
où C(p) = (2p/2 Γ(p/2))−1 . On note que la loi du χ2 (p) correspond à une loi γ(p/2, 1/2).
Espérance : p , Variance : 2p
– Loi de Student tp
Soit U ∼ N (0, 1) et V ∼ χ2p deux v.a. indépendantes. La variable aléatoire
U
Y =p ∼ t(p)
V /p
est une variable de Student à p degrés de liberté. Sa densité est donnée par :
−(p+1)/2
x2
f (x) = C(p) 1 +
p
√
où C(p) = ( pB(1/2, p/2))−1 et B(p, q) = Γ(p)Γ(q)/Γ(p + q).
20
ECP S5 - 2011/2012
22