Académique Documents
Professionnel Documents
Culture Documents
TD 2 - Vraisemblance et EMV
Exercice 1
On a observé sur 50 lancers d’une pièce, les résultats suivants (où 0 représente face et 1 pile) :
0; 1; 0; 0; 1; 0; 1; 1; 1; 0; 1; 1; 0; 0; 1; 1; 0; 1; 0; 1; 0; 0; 1; 0; 1; 1; 1; 1; 0; 0; 0; 1; 1; 1; 0; 1;
0; 0; 0; 1; 1; 1; 1; 1; 1; 0; 0; 1; 1; 1
On suppose que les résultats des lancers sont la réalisation d’un échantillon tiré d’une loi de Bernoulli de
paramètre p :
– Calculer la fonction de log-vraisemblance du paramètre p et la représenter graphiquement.
– Trouver numériquement l’EMV pb de p. Correspond-il à ce que l’on attendait ?
La log-vraisemblance pour p :
L(x1 , . . . , xn ; p) = log(L (x1 , . . . , xn ; p) = log(Πi pxi (1 − p)1−xi ) = i xi log(p) + (n − i xi ) log(1 − p)
P P
1
Exercice 2
Les nombres de clients entrant dans un supermarché pendant 40 périodes consécutives de 1 minute sont les
suivants :
3 7 7 7 9 7 1 4 7 6 7 6 4 10 5 8 5 4 4 4
5 5 4 2 0 8 6 9 8 2 6 4 5 6 4 8 4 4 13 8
On suppose que les nombres de clients sont la réalisation d’un échantillon issu d’une loi de Poisson de
paramètre λ :
– Calculer la fonction de log-vraisemblance du paramètre λ et la représenter graphiquement.
– Trouver numériquement l’EMV λ
b de λ. Correspond-il à ce que l’on attendait ?
La log-vraisemblance pour λ :
λxi
L(x1 , . . . , xn ; λ) = log(L (x1 , . . . , xn ; λ) = log Πi exp {−λ} = −nλ + log(λ)( i xi ) −
P P
i log(xi !)
xi !
sa dérivée en λ s’annule pour l’EMV λ
b=x
2
Exercice 3
On a observé les durées de vie (en heures) suivantes de 30 composants électroniques :
0.1 ; 7.4 ; 1.0 ; 7.9 ; 2.1 ; 1.8 ; 17.9 ; 9.3 ; 6.5 ; 3.3 ; 5.6 ; 7.7 ; 0.1 ; 24.3 ; 8.1 ;
19.3 ; 11.9 ; 1.6 ; 2.7 ; 0.5 ; 5.8 ; 42.5 ; 5.1 ; 2.0 ; 0.2 ; 15.0 ; 3.5 ; 6.4 ; 0.6 ; 3.3
(a) On suppose que les durées de vie sont la réalisation d’un échantillon tiré d’une loi exponentielle
d’intensité λ :
– Calculer la fonction de log-vraisemblance du paramètre λ pour des valeurs de λ inférieures à 1 et
la représenter graphiquement.
– Trouver numériquement l’EMV λ b de λ. Correspond-il à ce que l’on attendrait ?
(b) On suppose que les durées de vie sont la réalisation d’un échantillon tiré d’une loi du khi-deux à k
ddl :
– Calculer la fonction de log-vraisemblance du paramètre k pour des valeurs de k inférieures à 50
et la représenter graphiquement.
– Trouver numériquement l’EMV kb de k. Correspond-il à ce que l’on attendrait ?
(c) On suppose que les durées de vie sont la réalisation d’un échantillon tiré d’une loi Normale d’espérance
µ et de variance σ 2 :
– Calculer la fonction de log-vraisemblance des paramètres µ, σ 2 et la représenter graphiquement.
– Trouver numériquement les EMV µ b de µ et σb 2 de σ 2 . Correspondent-ils à ce que l’on attendrait ?
(d) On suppose que les durées de vie sont la réalisation d’un échantillon tiré d’une loi Gamma de paramètres
de forme a et d’intensité b :
– Calculer la fonction de log-vraisemblance des paramètres a, b pour des valeurs de a, b inférieures
à 1 et la représenter graphiquement.
– Trouver numériquement les EMV a b de a et bb de b. Correspondent-ils à ce que l’on attendrait ?
3
La log-vraisemblance pour λ :
L(x1 , . . . , xn ; λ) = log(L (x1 , . . . , xn ; λ) = log (Πi λ exp {−λ xi }) = n log(λ) − λ( i xi )
P
La log-vraisemblance pour k : !
k
−1
1
exp − xi
2
L(x1 , . . . , xn ; k) = log(L (x1 , . . . , xn ; k) = log Πi k k
xi 2
2 Γ( 2)
2
P
nk k
i xi
= − log(2) − n log Γ( k2 ) +
−1 i log(xi ) −
P
2 2 ! 2
P
k
b log(x i )
sa dérivée en k s’annule pour l’EMV kb tel que : ψ = i − log(2)
2 n
où ψ est la fonction Digamma, dérivée du logarithme de la fonction Gamma
4
La valeur initiale de k (ici k = 1) peut avoir un impact sur la solution trouvée : on peut vérifier si elle
est modifiée en changeant la valeur initiale, par exemple
emv <- mle(lvn, start = list(k = 50))
La log-vraisemblance pour µ, σ 2 :
1 1
L(x1 , . . . , xn ; µ, σ 2 ) = log(L (x1 , . . . , xn ; µ, σ 2 ) = log Πi √ exp − (xi − µ)2
2πσ 2 2σ 2
n 1 P
= log(2πσ 2 ) − 2 i (xi − µ)
2
2 2σ
1 P
ses dérivées en µ et σ 2 s’annulent pour les EMV µ b2 =
b = x et σ b )2
i (xi − µ
n
5
6. Calculer la log-vraisemblance de a, b (loi Gamma)
a <- 1; b <- 0.1
sum(log(dgamma(X,a,b))) # log-vrais en a, b
lvrais <- function(a,b) {
-length(X)*(log(gamma(a))-a*log(b))+(a-1)*sum(log(X))-sum(X)*b }
a <- seq(0.01,1,0.01)
b <- seq(0.01,1,0.01)
z <- outer(a,b,lvrais)
max(z)
which(z==max(z),arr.ind=TRUE) # indices du maximum
a[which(z==max(z),arr.ind=TRUE)[1]] -> achap
b[which(z==max(z),arr.ind=TRUE)[2]] -> bchap
achap; bchap
# représentation graphique
par(mfrow=c(1,1), oma=c(0,0,0,0), mar=c(2,2,2,0))
persp(a,b,z, xlab=expression(a), ylab=expression(b), zlab="log-vraisemblance", theta=45,
phi=20, ticktype="detailed", col="steelblue", expand=1, border="gray") -> graph
lines(trans3d(x=achap, y=b, z=lvrais(achap, b), pmat = graph), col = "purple", lwd=2)
lines(trans3d(x=max(a), y=b, z=lvrais(max(a), b), pmat = graph), col = "purple", lwd=1)
lines(trans3d(x=min(a), y=b, z=lvrais(min(a),b), pmat = graph),col ="purple", lty=3)
lines(trans3d(x=a, y=bchap, z=lvrais(a, bchap), pmat = graph), col = "cyan", lwd=2)
lines(trans3d(x=a, y=min(b), z=lvrais(a, min(b)), pmat = graph), col = "cyan")
lines(trans3d(x=a, y=max(b), z=lvrais(a, max(b)), pmat = graph), col = "cyan", lty=3)
lines(trans3d(x=c(achap,max(b)), y=bchap, z=min(z), pmat = graph), col="red", lty=2)
lines(trans3d(x=achap, y=c(min(a),bchap), z=min(z), pmat = graph), col="red", lty=2)
lines(trans3d(x=achap, y=bchap, z=c(min(z),max(z)), pmat = graph), col="red", lty=2)
title(bquote(paste("Loi Gamma : log-vraisemblance et EMV de ", a, " et ",b)) )
text(trans3d(x=achap, y=min(b), z=min(z), pmat = graph), expression(hat(a)),xpd=TRUE,
col="red", pos=2)
text(trans3d(x=max(a), y=bchap, z=min(z), pmat = graph), expression(hat(b)), xpd=TRUE,
col="red", pos=1)
text(trans3d(x=achap, y=bchap, z=max(z), pmat = graph), expression(L(x,hat(a),hat(b))),
xpd=TRUE, col="red", pos=3)
achap/bchap
mean(X)
La log-vraisemblance pour a, b :
ba
L(x1 , . . . , xn ; a, b) = log(L (x1 , . . . , xn ; a, b) = log Πi xa−1
i exp {−b xi }
Γ(a)
= n a log(b) − n log (Γ(a)) + (a − 1) i log(xi ) − b i xi
P P
ses dérivées
en a et b s’annulent pour les EMV a b tels que :
b et b
a
b
=x
b
b P
log(xi )
log(a b) = log(x) − i
b) − ψ (a
n
où ψ est la fonction Digamma, dérivée du logarithme de la fonction Gamma
6
# library(stats4)
emv <- mle(lvn)
summary(emv)
emv
attributes(emv)
coef(emv)
vcov(emv)
confint(emv,level=0.95)
lvn(coef(emv)[1],coef(emv)[2]); logLik(emv)
On peut vérifier si la solution trouvée est modifiée selon les valeurs initiales des paramètres a et b ;
emv <- mle(lvn, start = list(a=10, b=5))
Exercice 4
Générer une réalisation d’un échantillon (y1 , . . . , yn ) de taille n d’une loi de la liste suivante, décrire et
représenter graphiquement les observations :
(a) loi de Bernoulli de paramètre p
(b) loi binomiale de paramètres m et p
(c) loi de Poisson de paramètre λ
(d) loi Gaussienne de paramètres µ et σ
(e) loi Exponentielle de paramètre λ
(f) loi Gamma de paramètres a (forme) et b (intensité)
(g) loi Uniforme sur [0, b] de paramètre b
7
y <- rbinom(n,m,prob=p0)
addmargins(table(y))
prop.table(table(y))
mean(y); var(y); sd(y)
# représentation graphique
plot(prop.table(table(y)),ylab="fréquence observée", col="grey80")
mtext(bquote(paste(n==.(n)," observations : ", list(bar(y)==.(round(mean(y),3))))),
col="grey40",adj=1)
title(bquote(paste("Loi binomiale : ",bolditalic(B)(m,p) )))
plot(0:m,dbinom(0:m,m,p0),col="red",pch=20, type="h", lwd=3, ylab="fréquence observée",
xlab="y") # densité théorique loi B(m,p)
points(as.numeric(names(prop.table(table(y))))+0.1, prop.table(table(y)),type="h",
col="grey70", lwd=3)
mtext(bquote(list(m==.(m),p[0]==.(p0),mp[0]==.(m*p0))), col="red",adj=0)
mtext(bquote(paste(n==.(n)," observations : ", list(bar(y)==.(round(mean(y),3))))),
col="grey40",adj=1)
title(bquote(paste("Loi binomiale : ", bolditalic(B)(m,p) )))
mean(y)/m
y
Le paramètre p est estimé par pb = à comparer à sa "vraie valeur" p0
m
3. Loi de Poisson P(λ)
set.seed(12345)
n <- 1000
l0 <- 15
y <- rpois(n,l0)
addmargins(table(y))
prop.table(table(y))
mean(y); var(y); sd(y)
# représentation graphique
plot(prop.table(table(y)),ylab="fréquence observée", col="grey80")
mtext(bquote(paste(n==.(n)," observations : ", list(bar(y)==.(round(mean(y),3))))),
col="grey40",adj=1)
title(bquote(paste("Loi de Poisson : ", bolditalic(P)(lambda) )))
maxy <- 50
maxf <- max(prop.table(table(y)))
plot(0:maxy,dpois(0:maxy,l0),col="red",pch=20, type="h", lwd=3, ylim=c(0,maxf),
ylab="fréquence observée", xlab="y") # densité théorique loi P(l)
points(as.numeric(names(prop.table(table(y))))+0.3, prop.table(table(y)),type="h",
col="grey70", lwd=3)
mtext(bquote(lambda[0]==.(l0)), col="red",adj=0)
mtext(bquote(paste(n==.(n)," observations : ", list(bar(y)==.(round(mean(y),3))))),
col="grey40",adj=1)
title(bquote(paste("Loi de Poisson : ", bolditalic(P)(lambda) )))
Le paramètre λ est estimé par λ
b = y à comparer à sa "vraie valeur" λ0
8
# représentation graphique
hist(y, main=bquote(paste("Loi Normale : ", bolditalic(N)(mu,sigma^2) )), freq=FALSE,
ylab="fréquence observée")
curve(dnorm(x,mu0,sig0),add=T,col="red", lwd=2) # densité théorique loi N(mu0,sig0^2)
mtext(bquote(list(mu[0]==.(mu0),sigma[0]==.(sig0))), col="red",adj=0)
mtext(bquote(paste(n==.(n)," observations : ", list(bar(y)==.(round(mean(y),3))),
~~hat(s)[y]^2==.(round(var(y),2)), ~~s[y]^2==.(round(vy,2)))), col="grey40",adj=1)
9
a
b a0
Les EMV des paramètres a et b vérifient = y à comparer à sa "vraie valeur"
b
b b0
y2 y
les estimateurs des moments (EMM) des paramètres a et b : a
e= et eb = 2 à comparer aux "vraies
s2y sy
valeurs" a0 et b0 : ces estimateurs sont biaisés mais convergents.
10
Exercice 5
(a) Générer N réalisations d’un échantillon (y1 , . . . , yn ) de taille n d’une loi de Bernoulli de paramètre p.
Calculer la moyenne de chaque réalisation et décrire les fluctuations d’échantillonnage de ces moyennes
observées.
(b) Mêmes questions pour une loi Gaussienne de paramètres µ et σ : calculer la moyenne de chaque
réalisation et décrire les fluctuations d’échantillonnage de ces moyennes observées, puis calculer la
variance observée sans biais de chaque réalisation et décrire les fluctuations d’échantillonnage de ces
variances observées.
on représente la distribution des N valeurs de pb qui tend vers une loi normale lorsque n tend vers
l’infini.
11
# représentations graphiques
boxplot(mest)
points(mean(mest), pch=15, cex=1.25)
points(mu0, col="red",pch=16)
hist(mest, main="", freq=F, xlab=bquote(hat(mu)))
mtext(bquote(list(mu[0]==.(mu0), sigma[0]==.(sig0),
over(sigma[0],sqrt(n))==.(round(sig0/sqrt(n),4)))), col="red",adj=0)
mtext(bquote(paste(N==.(N), " échantillons de taille ",n==.(n)," : ",
list(bar(hat(mu))==.(round(mean(mest),3)),hat(s[hat(mu)])==.(round(sd(mest),4))))),
col="grey40",adj=1,line=-1)
title(bquote(paste("Loi Normale : ", bolditalic(N)(mu,sigma^2) )),line=3)
curve(dnorm(x,mu0,sig0/sqrt(n)),add=T,col="red", lwd=2)
# calcul des variances observées sans biais
vest <- apply(Y,2,var)
mean(vest); sig0^2
var(vest); 2*sig0^4/n
# représentations graphiques
boxplot(vest)
points(mean(vest), pch=15, cex=1.25)
points(sig0^2, col="red",pch=16)
hist(vest, main="", freq=F, xlab=bquote(hat(S)^2))
mtext(bquote(list(mu[0]==.(mu0), sigma[0]==.(sig0),
over(2*sigma[0]^4,n)==.(round(2*sig0^4/n,4)))), col="red",adj=0)
mtext(bquote(paste(N==.(N), " échantillons de taille ",n==.(n)," : ",
list(bar(hat(S)^2)==.(round(mean(vest),3)),
hat(s)[hat(S)^2]^2==.(round(var(vest),4))))), col="grey40",adj=1,line=-1)
title(bquote(paste("Loi Normale : ", bolditalic(N)(mu,sigma^2) )),line=3)
curve(dnorm(x,sig0^2,sqrt(2/n)*sig0^2),add=T,col="red", lwd=2)
# calcul des variances observées biaisées
var_obs <- function(x) var(x)*(n-1)/n
vbest <- apply(Y,2,var_obs)
mean(vbest); (n-1)*sig0^2/n
var(vbest)
# représentations graphiques
boxplot(cbind(vest,vbest),names=c(expression(hat(S)^2),expression(S^2)))
points(c(mean(vest),mean(vbest)), pch=15, cex=1.25)
points(c(sig0^2,sig0^2), col="red",pch=16)
hist(vbest, freq=F)
curve(dnorm(x,sig0^2,sqrt(2/n)*sig0^2),add=T,col="red", lwd=2)
On simule N échantillons de taille n d’une loi N (µ0 , σ02 ) donc
σ2
– N valeurs de µ b −→ µ0 et la variance sb2 ' 0 −→ 0
b dont la moyenne µ
n→∞ µ
b n n→∞
on représente la distribution des N valeurs de µ
b qui tend vers une loi normale lorsque n tend vers
l’infini,
2 σ04
– N valeurs de Sby2 dont la moyenne Sby2 −→ σ02 et la variance Sbbs22 ' −→ 0
n→∞ y n n→∞
on représente la distribution des N valeurs de Sby2 qui tend vers une loi normale lorsque n tend
vers l’infini,
2 σ04
– N valeurs de Sy2 dont la moyenne Sy2 −→ σ02 et la variance Sbs22 ' −→ 0
n→∞ y n n→∞
12
Exercice 6
Générer N réalisations d’un échantillon (y1 , . . . , yn ) de taille n d’une loi Uniforme sur [0, b].
Calculer pour chaque réalisation la valeur observée de l’estimateur des moments eb = 2 y, celle de l’EMV
(n + 1)
b = maxi (yi ) et celle de sa version sans biais bb
b et décrire les fluctuations d’échantillonnage de
n
ces estimations.
13
On simule N échantillons de taille n d’une loi U(0, b0 ) donc
b20
– N valeurs de eb = 2 y dont la moyenne eb −→ b0 et la variance Sbe2 ' −→ 0
n→∞ b 3 n n→∞
on représente la distribution des N valeurs de eb qui tend vers une loi normale lorsque n tend vers
l’infini (par le TCL),
n
– N valeurs de bb = maxi (yi ) dont la moyenne bb −→ b0 on représente la distribution des N
n→∞ n + 1
valeurs de bb qui ne tend pas vers une loi normale lorsque n tend vers l’infini,
n+1 b b20
– N valeurs de bbc = b dont la moyenne bbc −→ b0 et la variance Sb2b ' −→ 0
n n→∞ bc n(n + 2) n→∞
on représente la distribution des N valeurs de bbc qui ne tend pas vers une loi normale lorsque n
tend vers l’infini,
!
b0 − bb
la loi de T = n tend vers une loi exponentielle Exp(1) quand n tend vers l’infini
b0
T <- n*(1-Vest/b0)
mean(T); var(T); sd(T)
hist(T, freq=F, main="")
hist(T, main="", freq=F, xlab=bquote(T), ylim=c(0,1))
mtext(bquote(b[0]==.(b0)), col="red",adj=0)
mtext(bquote(paste(N==.(N), " échantillons de taille ",n==.(n)," : ",
list(bar(T)==.(round(mean(T),3)), hat(s[T])^2==.(round(var(T),4))))),
col="grey40",adj=1,line=-1)
title(bquote(paste("Loi Uniforme : ", bolditalic(U)(0,b) )),line=3)
lines(sort(T),dexp(sort(T),1), col="red", lwd=2)
14
Lois de probabilités usuelles
A. Fonctions de densité de lois continues
15