Académique Documents
Professionnel Documents
Culture Documents
1 Exercices
Ci-après, Leb désigne la mesure de Lebesgue sur R ; et Leb⊗n celle sur Rn .
On écrit i.i.d. pour ”indépendantes et identiquement distribuées”.
Par convention, les vecteurs sont des vecteurs colonne. Pour a ∈ Rn , a′ désigne la transposée
de a.
Exercice 2 (Modèle de translation et d’échelle). Soit g une densité par rapport à Leb.
On considère le modèle statistique
où
n
−n
Y xk − µ
pn,θ (x1 , · · · , xn ) := σ g , θ := (µ, σ).
σ
k=1
Xi − µ
, i ∈ {1, . . . , n}
σ
sont i.i.d. de loi de densité g par rapport à Leb.
Supposons que g est une densité gaussienne centrée réduite. On définit les statistiques
n
X n
X
Sn := Xi , Kn := (Xk − n−1 Sn )2 .
i=1 k=1
1. de façon équivalente, ϕθ est un C 1 -difféomorphisme de O sur ϕθ (O) i.e. c’est une bijection de O sur
ϕθ (O) telle que ϕθ et ϕ−1θ sont de classe C 1 .
Page 1
Ecole Polytechnique, promotion 2022 PC-1 Cours MAP433
2.6 2.6
2.4 2.4
2.2 2.2
2 2
1.8 1.8
1.6 1.6
1.4 1.4
(x1 , y1 ), . . . , (xn , yn ) ,
où
n
yi − f (x′i β)
Y
−n
pn,θ (y1 , · · · , yn ) := σ g ;
σ
i=1
g est une densité par rapport Leb, f : R → R une fonction. Pour i ∈ {1, . . . , n} nous notons
Yi la i-ème variable canonique, Yi (y1 , . . . , yn ) = yi .
Page 2
Ecole Polytechnique, promotion 2022 PC-1 Cours MAP433
1. Montrer que sous pn,θ ·Leb⊗n , les statistiques (Y1 , . . . , Yn ) sont indépendantes et préciser
leurs lois.
2. Montrer que sous pn,θ · Leb⊗n les variables
Proposer un estimateur de β0 et β1 .
Nous disposons de 150 mesures de concentration d’Ozone (moyennes observées entre 13 :00
et 15 :00 à Roosevelt Island en p.p.m) en fonction de différents facteurs : radiation solaire,
vitesse du vent, température. On décide d’explorer la relation entre la concentration d’ozone
(considérée comme la variable de réponse) et la radiation solaire (considérée comme la variable
explicative).
Residuals vs Fitted
117
150
100
62
99
100
50
Residuals
Ozone
0
50
−50
0
Figure 2 – (gauche) Le nuage de 150 points (xi , yi ) où, pour la mesure i, xi est la radiation
solaire et yi la concentration d’ozone. On trace aussi, en rouge, la droite P de régression x 7→ b0 +
b1 x où b0 , b1 ont été obtenus comme minimisant la quantité (β0 , β1 ) 7→ 150 2
i=1 (yi − β0 − β1 xi ) .
−1
P n
La droite horizontale est la droite d’équation x 7→ n k=1 yk . (droite) Nuage de 150 points
(ybi , ei ) où ybi = b0 + b1 xi et ei = yi − ybi .
λk
pλ (k) = e−λ , k∈N
k!
1. Calculer la fonction génératrice des moments de la loi de Poisson de paramètre λ.
2. En déduire la moyenne et la variance d’une loi de Poisson de paramètre λ.
Page 3
Ecole Polytechnique, promotion 2022 PC-1 Cours MAP433
Page 4
Ecole Polytechnique, promotion 2022 PC-1 Cours MAP433
8. Comment obtenir des réalisations d’une telle loi à partir d’un générateur de v.a. uniforme
sur [0, 1] et d’un générateur de loi de Poisson de paramètre λ ?
9. Calculer la moyenne et le moment d’ordre 2 de cette distribution.
10. Proposer une méthode d’estimation de π et de λ.
Exercice 5 (Prix d’un actif financier). Soit X une variable aléatoire réelle d’espérance
µ et d’écart type σ. Si E[|X|3 ] < ∞, on définit le coefficient d’asymétrie comme le moment
d’ordre trois de la variable centrée réduite :
" #
X −µ 3 µ3
γ1 = E = 3/2 ,
σ µ2
avec µi les moments centrés d’ordre i. Si E[X 4 ] < ∞, on définit son kurtosis non normalisé
(coefficient d’aplatissement) comme le moment d’ordre quatre de la variable centrée réduite :
" #
X −µ 4 µ4
β2 = E = 2 .
σ µ2
Xk := log(Pk /Pk−1 ) .
Page 5
Ecole Polytechnique, promotion 2022 PC-1 Cours MAP433
7. Pour modéliser les log-rendements, R. Engle (Prix Nobel d’Economie 2003) a proposé
le modèle ARCH(1) :
q
2 Z ,
Xk = α0 + α1 Xk−1 X0 = 0 ,
k
où α0 > 0 et α1 ≥ 0 et {Zk }nk=1 est une suite i.i.d. de variables aléatoires gaussiennes
centrées réduites. Définir le modèle statistique associé.
Apple Computer − 2015
0.06
apple.prices
0.04
130
130
125
0.02
120
120
0.00
115
110
−0.02
110
100
105
−0.04
135
1.5e+08
−0.06
130
Date
1.0e+08
Volume
High
120
115
5.0e+07
30
110
130
Index 20
density
120
Low
110
10
100
Page 6
Ecole Polytechnique, promotion 2022 PC-1 Cours MAP433
2. Démontrer que le modèle statistique de mélange gaussien (R, B(R), {fα,µ · Leb : (α, µ) ∈ S × M})
est identifiable. On rappelle pour cela la fonction caractéristique d’une variable aléatoire
X gaussienne centrée réduite :
2
E[eitX ] = e−t /2 .
n
La loi de Poisson de paramètre µ est la loi de densité {pµ (n) := e−µ µn! , n ∈ N} par rapport à
la mesure de comptage ν sur N. Sa fonction caractéristique est donnée par
3. Démontrer que le modèle statistique de mélange poissonnien : (N, P(N), {qα,µ ·ν, (α, µ) ∈
S × M}) est identifiable.
Page 7