Statistique-Non Paramétrique-et-Robustesse-Série Exercices N°2

ENSAE Sngal
3ime anne
Anne 2015 / 2016
M. SADIO
Statistique non paramtrique et robustesse
Cours de M. SADIO
Srie dexercices n2
Exercice n1
On mesure la pression sanguine systolique de 11 patients avant et aprs administration dun mdicament
dont on sait quil peut la faire baisser, mais pas laugmenter.
Pour chaque patient, la baisse de la pression sanguine (pression avant moins pression aprs) est :
7, 5, 12, -3, -5, 2, 14, 18, 19, 21, -1
Utiliser un test de signe pour voir si ces observations contredisent lhypothse H0 : [pas de modification
systmatique de la pression sanguine systolique].
Exercice n2 : Choix dun investissement
Un investisseur veut rentabiliser son pargne en optant pour un investissement dans un seul actif
financier. Il cherche des conseils qui laideront choisir entre deux actifs financiers A et B pour placer
son pargne. Il dispose de deux chantillons (1 , , ) et (1 , , ) de rendements sur chaque
actif. On suppose que A et B sont indpendants. Les rendements (en %) sont donns ci-dessous :
1) Linvestisseur souhaite placer son pargne dans linvestissement rapportant le rendement mdian le
plus lev. En sappuyant sur un test non paramtrique, avec des hypothses clairement prcises,
quel actif lui conseillerez-vous ?
2) Dans le cas o ces deux possibilits dinvestissement apporteraient le mme rendement mdian, il
souhaite investir dans celui qui a la plus petite volatilit (ou variance). En utilisant des outils de
statistique non paramtrique, quel conseil donneriez-vous linvestisseur ?
Exercice n3 : Estimation non paramtrique
Considrons le problme destimation non paramtrique suivant :
= ( ) + , = 1, , ,
o f() est une fonction inconnue et , , sont des variables alatoires indpendantes avec
[ ] = 0 et [ ] = 2 < . Pour simplifier, nous supposons que = , + , =
1, , .
1
Pour chaque , nous estimons ( ) par une moyenne mobile dordre k dfinie comme suit :
+
1
( ) =

2 + 1
=
1) Calculez [ ( )] et [ ( )]
2) Montrez que le biais de ( ) est dordre k, cest--dire
( + 1)
( )2
6
Indication: Vous pouvez utiliser un dveloppement limit et remarquez que
[ ( )] ( )
2 =
=1
( + 1)(2 + 1)
.
6
3) Calculez lerreur quadratique moyenne (Mean Square Error) note ( ( ), ( ) ) et

dterminez qui minimise cette erreur.
Exercice n4
Soit un N-chantillon (1 , , )dune variable alatoire D symtrique autour de (mdiane). On
considre le problme de test suivant :
H : = 0
{ 0
H1 : 0
La statistique de test de Wilcoxon sign est dfinie par
N
WN+ = R+i 1+ (Di ) , avec R+i = 1+ (|Di | |Dj |)

i=1
j=1
1) Soit Z une variable alatoire dfinie par
1 >
={
0 si D
a. Montrez que les deux variables alatoires Z et D sont indpendantes.
b. En dduire que les 2N variables alatoires , R+i , , , R+N sont mutuellement
indpendantes sous 0 , avec = 1{ >}
c. Montrez que sous 0 ,
( + 1)
1
(WN+ ) =
( + 1)(2 + 1)
4
24
2) On suppose que lchantillon (1 , , ) possde m valeurs positives et n valeurs ngatives, et
pas de valeurs gales zro (n+m = N). On dfinit la valeur absolue de comme suit :
(WN+ ) =
| | = {
avec X et Y valeurs indpendantes.
> 0
Yi si D < 0
a. Montrez que la statistique de test de Wilcoxon pour lgalit des distributions des deux
chantillons (1 , , ) et (1 , , ), est gale la statistique de test de Wilcoxon sign
+ pour lchantillon (1 , , ) .
b. Peut on utiliser le test de Wilcoxon pour deux chantillons indpendants pour rsoudre un
problme de test de paramtre de position 0 un chantillon ? Justifiez votre rponse.
Exercice n5: Estimation non paramtrique

Soit (, ) un couple de variables alatoires relles tel que Y soit intgrable :(||) < .
La fonction
() = (| = )
est appele fonction de rgression de Y sur X. Supposons que lon dispose dun n-chantillon iid
(1 , 1 ) , , ( , ) de variables alatoire de mme loi que (, ).
Lobjectif de cet exercice est de proposer une estimation de ().
1) Montrez que les variables = ( )sont des variables alatoires centres iid.
2) Montrez que si Z est une variable alatoire relle de loi de carr intgrable, alors son
esprance mathmatique () est le nombre qui minimise, parmi tous rels t, la quantit :
( )2 = ( )2 ()
3) En dduire que () minimise la quantit :
{ =}
( )2
{ =}
o
4)
()
est la loi conditionnelle de sachant que = .

{ =}
Soit la loi empirique de
dfinie comme suit
= , () { } , avec , () =
=1
[(
=1 [(
)/()]
)/()]
o K est un noyau de Parzen Rosenblatt positif, et () une fentre.

Montrez que lon peut dfinir un estimateur
() de ()en cherchant le nombre rel t qui
minimise la quantit:
, () { }2
=1
Calculez
(). Comment appelle- t- on cet estimateur ?
5) Montrez que
() converge en probabilit vers ().
Exercice n6: Robustesse dune rgression linaire

Soit le modle de rgression linaire suivant
= + .
Soit lestimateur de par la mthode des moindres carrs ordinaires.
Calculez la fonction dinfluence de . Cet estimateur est-il robustesse ? Justifiez votre rponse.
Indications: Posons = =1 . Nous avons (1 )1 = 1
1
1
1
1 1
1+ 1
1
Exercice n7
Soit (1 ) un chantillon alatoire de fonction de rpartition F continue. Soient ]0,1[ et le
quantile dordre de F cest--dire ( ) = . Posons [] + 1.
Un L-estimateur est donn par
= , ()
=1
avec
1
=
(1 )(1)1
(, + 1) 1
1) Donnez la fonction dinfluence de

2) Etudiez la robustesse de
Exercice n8
Soient 1 , , des variables alatoires indpendantes et identiquement distribues, o a une
fonction de rpartition et une densit . Considrons la fonctionnelle T(F), estimateur de par
maximum de vraisemblance.
1) Calculer la fonction dinfluence de lestimateur de ( ).
2) Discuter des proprits de robustesse de lestimateur de maximum de vraisemblance dans le cas
gnral, et dans les cas suivants :
a. Loi normale : () = ( ), avec fonction de densit de N(0,1)
1
b. Loi de Laplace : () = 2(||)
c. Loi Gamma : () =
()()1
()
, o = (, )
Exercice n9
Considrons le modle linaire suivant :
= + ,
o suit une loi de Cauchy de fonction de densit () =
(1+ 2 )
1) Montrer que lestimateur du maximum de vraisemblance de est un M-estimateur.

2) Montrer que (, ; ) = (), o = et la drive de la fonction objective par

rapport .

3) Rcrire lquation dfinissant comme ( , ) = 0, o = . Quelle
interprtation donneriez-vous ?
4) Quel serait le poids des observations avec des rsidus > 3 ?
5) Discuter des proprits de robustesse de cet estimateur.
Exercice n10
Soit () une fonctionnelle statistique de fonction dinfluence , et soit : une fonction
diffrentiable.
1) Montrez que la fonction dinfluence de la fonctionnelle () = [()] est donne par
, () = [()] , (),
avec () la drive de ()par rapport .
2) En dduire que si (1 , , ): est une fonction diffrentiable, si () une
fonctionnelle statistique de fonction dinfluence , alors la fonctionnelle () =
(1 (), , ()) a pour fonction dinfluence
, () =
=1
, ()
3) En utilisant ce dernier rsultat, calculez la fonction dinfluence de la corrlation linaire entre deux
variables alatoires X et Y de fonction de rpartition respective et . La corrlation linaire
est-elle robuste ?
Exercice n11 : Etude de la robustesse de lindice de Theil
Notons F la fonction de rpartition de la distribution de revenu dune population donne. Lindice de Theil
est souvent utilis pour tudier les ingalits de revenu dans une population ou dans une rgion
gographique. Il est dfini comme suit:
() = [(
) ( )],
o = () et une variable alatoire de fonction de rpartition F.
1) On suppose que suit une loi Lognormal de paramtre = (, 2 ), cest--dire ()

(, 2 ).
(a) Montrez que ( ) =
2
2
(b) En dduire un estimateur ( ) de ( ), avec lestimateur de maximum de vraisemblance

de .
(c) Calculez les sensibilits locale et globale de ( ). Discutez de la robustesse de cet estimateur.

2) On suppose que () = 1 ( )
(a) Montrez que ( ) =
, > 0 > 1 (distribution de Parto).
+ (1)
(b) Dterminez la fonction dinfluence (, , ( )) de lestimateur paramtrique de lindice de
Theil ( ), avec lestimateur de maximum de vraisemblance de .
(c) Etudiez la robustesse de cet estimateur.

(d) Etant donn que ( ) est asymptotiquement normal, calculez sa variance asymptotique.
3) On se place dans le cas gnral o est de distribution quelconque.

(a) Montrez que la fonction dinfluence de () est donne par
(, , ()) =
1
+
[() ] (
) ( ),
o = () et = ()().
Indication: Remarquez que () = ( , ) et utilisez le rsultat tabli dans lexercice 9.
(b) Calculez les sensibilits locale et globale de ().
(c) Discutez de la robustesse de lindice de Theil ().
Exercice n12: Robustesse de quelques mesures de risques
Pour un tablissement financier (une banque ou une socit dassurance par exemple), mesurer les
risques lis ses activits est trs important. Pour ce faire, plusieurs mesures de risques sont utilises.
La plus utilise est la fonction quantile ou la VaR (Value-at-Risk), qui est une mesure de la perte
potentielle: combien ltablissement financier peut-il perdre avec une probabilit 1- pour une priode
temps fixe.
Dautres mesures de risque sont galement utilises par les tablissements financiers comme par
exemple lExpected Shortfall (la moyenne des pertes sachant quelles ont dpass la VaR).
En pratique, on dispose souvent dun chantillon Y1 , , Yn pour estimer ces mesures de risques.
Lobjectif de cet exercice est dtudier la robustesse de quelques mesures de risques utilises par les
tablissements financiers et de choisir la meilleure mesure de risque compte tenu dun critre donn.
Soit un n-chantillon (Y1 , , Yn ) indpendant et identiquement distribu, de fonction de rpartition F
strictement croissante et de densit f. On note Fn la fonction de rpartition empirique :
1. Montrer que
n(Fn (y) F(y)) N[0, F(y)(1 F(y))]
2. Soit la fonctionnelle statistique q (F) dfinie par
q (F) = F 1 () = inf{y F(y) }
La fonctionnelle statistique q (F) est le quantile (ou la VaR) dordre de F.
Notons par F (y) = (1 )F(y) + x (y) la contamine de F au taux par la loi de Dirac dfinie
par
x (y) = {
0 si y < x
1 si y x
2.1. Dterminez F (q (F ))
2.2. Donnez une expression explicite q (F ) en fonction de F, et .
2.3. Montrez que la fonction dinfluence de q (F) est donne par
I[,F1 ()] ()
IFq () =
f[F 1 ()]
2.4. Lestimateur q ( ) de q (F) est il robuste ? justifiez votre rponse.
2.5. Dterminez la loi et la variance asymptotique de q ( ).
2.6. Dans le cas de la densit f inconnue, proposez deux mthodes non paramtriques
destimation de la variance asymptotique de q ( ). Prcisez ces estimateurs.
2.7. On souhaite tester asymptotiquement lhypothse H0 : q ( ) = 0 . Prcisez les rgions
critiques de ce test en fonction des hypothses alternatives retenues.
3. Lautre mesure de risque, lExpected Shortfall note ES est dfinie par
ES () = (| > q (F) )
3.1. Montrez que

ES () =
1
1
1
1
()
1 ()
1
1
3.2. Dterminez la fonction dinfluence IFES de ES ().

Indication : Vous pouvez utiliser la dfinition de la fonction dinfluence. Vous pouvez supposer
galement que les conditions pour permuter lintgrale et la limite sont vrifies.
3.3. Cette fonction dinfluence est elle borne ? Conclure quant la robustesse ES ( )
lestimateur de ES ().
3.4. Dterminez la loi et variance asymptotique de ES ( ).
4. On sintresse enfin la mesure de risque spectrale dfinie par
() = () ()
0
o [0,1] [0, +) une densit, dcroissante.

4.1. Montrez lestimateur ( ) de () est un L-estimateur, cest--dire
() = , ()
=1
4.2. Rappelez les conditions ncessaires de robustesse dun L-estimateur

4.3. Lestimateur ( ) est il robuste ?
5. Quelle mesure de risque conseillerez-vous un dirigeant dun tablissement financier si le seul
critre de slection est la robustesse ? Justifiez votre rponse.
Exercice n13: Robustesse dune allocation dactifs
Lallocation dactifs est trs importante pour une banque, une compagnie dassurance ou une socit de
gestion dactifs. Laversion au risque, le rendement cible, les contraintes rglementaires, etc., peuvent
conditionner cette allocation.
Une socit de gestion souhaite investir dans N actifs financiers (risqus) A1 , , An , de vecteur de
rendements not = (R1 , , R n ), avec R i variable alatoire, E[R i ] = i et Var[R i ] = 2i . Dans
chaque actif Ai , il souhaite investir une proportion wi de son pargne, avec ni=1 wi = 1.
Le rendement de ce portefeuille diversifi est donn par
n
R = wi R i =
i=1
Nous avons E[R ] = = ni=1 wi E[R i ] = ni=1 wi i = w et Var[R ] = w w, avec la

matrice de variance-covariance des rendements, et w = (w1 , , wn ) .
Diffrentes mthodes destimation de w existent. Lobjectif de cette partie est dtudier la robustesse de
quelques-unes de ces mthodes.
1) Portefeuille moyenne-variance
Le portefeuille moyenne-variance est dtermin par solution du problme doptimisation suivant,
bas sur la moyenne et la variance de R :
1
Min {w w w }
. w e = ni=1 wi = 1 (contrainte)
o e = (1, , 1) et est le paramtre daversion au risque. Remarquez que si = , alors le

portefeuille optimal est celui de variance minimale ! Pour simplifier, nous supposons que ( , ) =
0 pour .
1
+
1
212
1.1) Montrez que = (
,,
1
+

22
) , avec =
2
=1
Lagrange du problme doptimisation.
(2 =1 2 ) le multiplicateur de
1.2) En pratique le calcul de se fait en utilisant lhistorique observ des rendements sur une priode
donne. Soit = (,1 , , , ) , = 1, , lhistorique des rendements, avec , le rendement

1
de lactif i la date t. Soient = =1 = , 2 = =1(, ) et = =1 ,

les estimateurs de , 2i et i respectivement. On pose n = 2.
a)
En utilisant les donnes de lexercice n2, calculez les poids optimaux en prenant
successivement = 1 , = 10. Lallocation obtenue est elle cohrente ?
b) Calculez la fonction dinfluence de .
Indication: Vous pouvez utiliser le rsultat de lexercice n3 en remarquant que est une
fonctionnelle statistique dpendant , 2 , = 1,2.
c) Lestimateur
de , obtenu en remplaant i et 2i par et 2 , est il robuste ?
justifiez votre rponse ?
1.3) Proposez un estimateur robuste de , partir des estimateurs robustes de i et 2i .
2) Lobjectif de cette question est dtudier la robustesse de estimateur de w obtenu partir dun
M-estimateur.
1
min (w )
,
=1
n
. w e = wi = 1
{
i=1
o est une fonction symtrique et convexe avec un unique minimum en zro, et m est un M-estimateur
de la rentabilit moyenne du portefeuille.
2.1) Donnez les conditions de premier ordre doptimalit du problme doptimisation
2.2) En utilisant le rsultat tabli en cours de la fonction dinfluence dun M-estimateur, montrez que la
fonction dinfluence vrifie lquation suivante
[ ( )]
[ ( ) ]
([ ( )] [ ( ) ]
0
( )
( ( ) ),
0
0
) ( ) =
0
, et sont respectivement les fonctions dinfluence de m, w et (le multiplicateur de

Lagrange), et () = ().
2.3) En supposant que toutes les conditions de rgularit sont vrifies, montrez que la fonction
dinfluence du vecteur w des poids est donne par
[ ( )]
avec
= ( ) 1 ( [ ( )] ),
= [ ( ) ]
[ ( )][ ( ) ]
[ ( )]
2.4) Discutez de la robustesse de avec les deux choix suivants de la fonction () :

9
a) () = {
b) () =
||
(fonction dHuber)
(|| /2) || >
Exercice n14
Le but de cet exercice est destimer la matrice de covariance des coefficients dune rgression linaire
par la mthode de Jackknife. Considrons le modle de rgression linaire
= + , = 1, ,
o = (1 , , ) , = (1 , , ) et des variables alatoires indpendantes et

identiquement distribues, de fonction de rpartition note F telle que ( ) = 0. En notation matricielle,
le modle peut tre rcrit comme suit :
= + ,
avec
1
= (1 , , , = (1 , , et = ( ) ( )
1) Donnez linterprtation de la diffrence () , avec () lestimateur obtenu sans la ime

observation.
2) Calculez lestimateur Jackknife de la matrice de covariance
)
Indication:
- Montrez que
() =
en utilisant que
(()
() )
( )1
( )1
1
1 ( )1
= ( )1 +
( )1 ( )1
1
Lestimateur Jackknife de la matrice de variance-covariance du vecteur alatoire est donn

par
( ) =
( ) ( )
( 1)
=1
Exercice n15
Lestimateur Jackknife de la variance dun estimateur est donn par
1
2
=
( ) ,
( 1)
=1
10
o = ( 1) , =
=1 et lestimateur obtenu en enlevant de
lchantillon la ime observation.

Soit 1 , , un chantillon de variables alatoires indpendantes et identiquement
distribues de distribution inconnue F (fonction de rpartition) telle que ( ) = et
( ) = 2 . Nous estimons et 2 par leur estimateur usuel, cest--dire
=1
=1
1
1
= = 2 =
( )2
1
1) Calculer ( ) et lestimateur Jackknife de la variance de . Comparez et commentez
les rsultats.
1
2) Soient = [( ( )) ] et = =1( ) les moments centrs dordre
k thorique et empirique, respectivement. Nous savons que

3 2
4
1 2.
( 2 ) =
Calculez lestimateur Jackknife de la variance de 2 dpendant de 2 et 4 . Comparez avec

( 2 ) et commentez les rsultats.
11

Statistique-Non Paramétrique-et-Robustesse-Série Exercices N°2

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Statistique-Non Paramétrique-et-Robustesse-Série Exercices N°2

Transféré par

Droits d'auteur :

Formats disponibles

ENSAE Sngal

3) Calculez lerreur quadratique moyenne (Mean Square Error) note ( ( ), ( ) ) et

WN+ = R+i 1+ (Di ) , avec R+i = 1+ (|Di | |Dj |)

1) Soit Z une variable alatoire dfinie par

Exercice n5: Estimation non paramtrique

est la loi conditionnelle de sachant que = .

Soit la loi empirique de

dfinie comme suit

o K est un noyau de Parzen Rosenblatt positif, et () une fentre.

Exercice n6: Robustesse dune rgression linaire

1) Donnez la fonction dinfluence de

1) Montrer que lestimateur du maximum de vraisemblance de est un M-estimateur.

2) Montrer que (, ; ) = (), o = et la drive de la fonction objective par

o = () et une variable alatoire de fonction de rpartition F.

1) On suppose que suit une loi Lognormal de paramtre = (, 2 ), cest--dire ()

(b) En dduire un estimateur ( ) de ( ), avec lestimateur de maximum de vraisemblance

, > 0 > 1 (distribution de Parto).

(b) Dterminez la fonction dinfluence (, , ( )) de lestimateur paramtrique de lindice de

Theil ( ), avec lestimateur de maximum de vraisemblance de .

(c) Etudiez la robustesse de cet estimateur.

3) On se place dans le cas gnral o est de distribution quelconque.

3.1. Montrez que

3.2. Dterminez la fonction dinfluence IFES de ES ().

o [0,1] [0, +) une densit, dcroissante.

4.2. Rappelez les conditions ncessaires de robustesse dun L-estimateur

Nous avons E[R ] = = ni=1 wi E[R i ] = ni=1 wi i = w et Var[R ] = w w, avec la

o e = (1, , 1) et est le paramtre daversion au risque. Remarquez que si = , alors le

1.1) Montrez que = (

Lagrange du problme doptimisation.

donne. Soit = (,1 , , , ) , = 1, , lhistorique des rendements, avec , le rendement

de lactif i la date t. Soient = =1 = , 2 = =1(, ) et = =1 ,

, et sont respectivement les fonctions dinfluence de m, w et (le multiplicateur de

2.4) Discutez de la robustesse de avec les deux choix suivants de la fonction () :

(|| /2) || >

o = (1 , , ) , = (1 , , ) et des variables alatoires indpendantes et

1) Donnez linterprtation de la diffrence () , avec () lestimateur obtenu sans la ime

Lestimateur Jackknife de la matrice de variance-covariance du vecteur alatoire est donn

lchantillon la ime observation.

k thorique et empirique, respectivement. Nous savons que

Calculez lestimateur Jackknife de la variance de 2 dpendant de 2 et 4 . Comparez avec

Vous aimerez peut-être aussi