Académique Documents
Professionnel Documents
Culture Documents
3ime anne
Anne 2015 / 2016
M. SADIO
Statistique non paramtrique et robustesse
Cours de M. SADIO
Srie dexercices n2
Exercice n1
On mesure la pression sanguine systolique de 11 patients avant et aprs administration dun mdicament
dont on sait quil peut la faire baisser, mais pas laugmenter.
Pour chaque patient, la baisse de la pression sanguine (pression avant moins pression aprs) est :
7, 5, 12, -3, -5, 2, 14, 18, 19, 21, -1
Utiliser un test de signe pour voir si ces observations contredisent lhypothse H0 : [pas de modification
systmatique de la pression sanguine systolique].
Exercice n2 : Choix dun investissement
Un investisseur veut rentabiliser son pargne en optant pour un investissement dans un seul actif
financier. Il cherche des conseils qui laideront choisir entre deux actifs financiers A et B pour placer
son pargne. Il dispose de deux chantillons (1 , , ) et (1 , , ) de rendements sur chaque
actif. On suppose que A et B sont indpendants. Les rendements (en %) sont donns ci-dessous :
1) Linvestisseur souhaite placer son pargne dans linvestissement rapportant le rendement mdian le
plus lev. En sappuyant sur un test non paramtrique, avec des hypothses clairement prcises,
quel actif lui conseillerez-vous ?
2) Dans le cas o ces deux possibilits dinvestissement apporteraient le mme rendement mdian, il
souhaite investir dans celui qui a la plus petite volatilit (ou variance). En utilisant des outils de
statistique non paramtrique, quel conseil donneriez-vous linvestisseur ?
Exercice n3 : Estimation non paramtrique
Considrons le problme destimation non paramtrique suivant :
= ( ) + , = 1, , ,
o f() est une fonction inconnue et , , sont des variables alatoires indpendantes avec
[ ] = 0 et [ ] = 2 < . Pour simplifier, nous supposons que = , + , =
1, , .
1
Pour chaque , nous estimons ( ) par une moyenne mobile dordre k dfinie comme suit :
+
1
( ) =
2 + 1
=
1) Calculez [ ( )] et [ ( )]
2) Montrez que le biais de ( ) est dordre k, cest--dire
( + 1)
( )2
6
Indication: Vous pouvez utiliser un dveloppement limit et remarquez que
[ ( )] ( )
2 =
=1
( + 1)(2 + 1)
.
6
j=1
1 >
={
0 si D
a. Montrez que les deux variables alatoires Z et D sont indpendantes.
b. En dduire que les 2N variables alatoires , R+i , , , R+N sont mutuellement
indpendantes sous 0 , avec = 1{ >}
c. Montrez que sous 0 ,
( + 1)
1
(WN+ ) =
( + 1)(2 + 1)
4
24
2) On suppose que lchantillon (1 , , ) possde m valeurs positives et n valeurs ngatives, et
pas de valeurs gales zro (n+m = N). On dfinit la valeur absolue de comme suit :
(WN+ ) =
| | = {
avec X et Y valeurs indpendantes.
> 0
Yi si D < 0
a. Montrez que la statistique de test de Wilcoxon pour lgalit des distributions des deux
chantillons (1 , , ) et (1 , , ), est gale la statistique de test de Wilcoxon sign
+ pour lchantillon (1 , , ) .
b. Peut on utiliser le test de Wilcoxon pour deux chantillons indpendants pour rsoudre un
problme de test de paramtre de position 0 un chantillon ? Justifiez votre rponse.
( )2
{ =}
o
4)
()
= , () { } , avec , () =
=1
[(
=1 [(
)/()]
)/()]
, () { }2
=1
Calculez
(). Comment appelle- t- on cet estimateur ?
5) Montrez que
() converge en probabilit vers ().
1
1
1 1
1+ 1
1
Exercice n7
Soit (1 ) un chantillon alatoire de fonction de rpartition F continue. Soient ]0,1[ et le
quantile dordre de F cest--dire ( ) = . Posons [] + 1.
Un L-estimateur est donn par
= , ()
=1
avec
1
=
(1 )(1)1
(, + 1) 1
()()1
()
, o = (, )
Exercice n9
Considrons le modle linaire suivant :
= + ,
o suit une loi de Cauchy de fonction de densit () =
(1+ 2 )
, () =
=1
, ()
3) En utilisant ce dernier rsultat, calculez la fonction dinfluence de la corrlation linaire entre deux
variables alatoires X et Y de fonction de rpartition respective et . La corrlation linaire
est-elle robuste ?
Exercice n11 : Etude de la robustesse de lindice de Theil
Notons F la fonction de rpartition de la distribution de revenu dune population donne. Lindice de Theil
est souvent utilis pour tudier les ingalits de revenu dans une population ou dans une rgion
gographique. Il est dfini comme suit:
() = [(
) ( )],
2
2
2) On suppose que () = 1 ( )
(a) Montrez que ( ) =
+ (1)
1
+
[() ] (
) ( ),
o = () et = ()().
Indication: Remarquez que () = ( , ) et utilisez le rsultat tabli dans lexercice 9.
(b) Calculez les sensibilits locale et globale de ().
(c) Discutez de la robustesse de lindice de Theil ().
Exercice n12: Robustesse de quelques mesures de risques
Pour un tablissement financier (une banque ou une socit dassurance par exemple), mesurer les
risques lis ses activits est trs important. Pour ce faire, plusieurs mesures de risques sont utilises.
La plus utilise est la fonction quantile ou la VaR (Value-at-Risk), qui est une mesure de la perte
potentielle: combien ltablissement financier peut-il perdre avec une probabilit 1- pour une priode
temps fixe.
Dautres mesures de risque sont galement utilises par les tablissements financiers comme par
exemple lExpected Shortfall (la moyenne des pertes sachant quelles ont dpass la VaR).
En pratique, on dispose souvent dun chantillon Y1 , , Yn pour estimer ces mesures de risques.
Lobjectif de cet exercice est dtudier la robustesse de quelques mesures de risques utilises par les
tablissements financiers et de choisir la meilleure mesure de risque compte tenu dun critre donn.
Soit un n-chantillon (Y1 , , Yn ) indpendant et identiquement distribu, de fonction de rpartition F
strictement croissante et de densit f. On note Fn la fonction de rpartition empirique :
1. Montrer que
n(Fn (y) F(y)) N[0, F(y)(1 F(y))]
2. Soit la fonctionnelle statistique q (F) dfinie par
q (F) = F 1 () = inf{y F(y) }
La fonctionnelle statistique q (F) est le quantile (ou la VaR) dordre de F.
Notons par F (y) = (1 )F(y) + x (y) la contamine de F au taux par la loi de Dirac dfinie
par
x (y) = {
0 si y < x
1 si y x
2.1. Dterminez F (q (F ))
2.2. Donnez une expression explicite q (F ) en fonction de F, et .
2.3. Montrez que la fonction dinfluence de q (F) est donne par
I[,F1 ()] ()
IFq () =
f[F 1 ()]
2.4. Lestimateur q ( ) de q (F) est il robuste ? justifiez votre rponse.
2.5. Dterminez la loi et la variance asymptotique de q ( ).
2.6. Dans le cas de la densit f inconnue, proposez deux mthodes non paramtriques
destimation de la variance asymptotique de q ( ). Prcisez ces estimateurs.
2.7. On souhaite tester asymptotiquement lhypothse H0 : q ( ) = 0 . Prcisez les rgions
critiques de ce test en fonction des hypothses alternatives retenues.
3. Lautre mesure de risque, lExpected Shortfall note ES est dfinie par
ES () = (| > q (F) )
1
1
1
1
()
1 ()
1
1
() = () ()
0
() = , ()
=1
R = wi R i =
i=1
Min {w w w }
. w e = ni=1 wi = 1 (contrainte)
,,
1
+
22
) , avec =
2
=1
(2 =1 2 ) le multiplicateur de
1.2) En pratique le calcul de se fait en utilisant lhistorique observ des rendements sur une priode
1
min (w )
,
=1
n
. w e = wi = 1
{
i=1
o est une fonction symtrique et convexe avec un unique minimum en zro, et m est un M-estimateur
de la rentabilit moyenne du portefeuille.
2.1) Donnez les conditions de premier ordre doptimalit du problme doptimisation
2.2) En utilisant le rsultat tabli en cours de la fonction dinfluence dun M-estimateur, montrez que la
fonction dinfluence vrifie lquation suivante
[ ( )]
[ ( ) ]
([ ( )] [ ( ) ]
0
( )
( ( ) ),
0
0
) ( ) =
0
avec
= ( ) 1 ( [ ( )] ),
= [ ( ) ]
[ ( )][ ( ) ]
[ ( )]
a) () = {
b) () =
||
(fonction dHuber)
Exercice n14
Le but de cet exercice est destimer la matrice de covariance des coefficients dune rgression linaire
par la mthode de Jackknife. Considrons le modle de rgression linaire
= + , = 1, ,
avec
1
= (1 , , , = (1 , , et = ( ) ( )
Indication:
- Montrez que
() =
en utilisant que
(()
() )
( )1
( )1
1
1 ( )1
= ( )1 +
( )1 ( )1
1
( ) =
( ) ( )
( 1)
=1
Exercice n15
Lestimateur Jackknife de la variance dun estimateur est donn par
1
2
=
( ) ,
( 1)
=1
10
o = ( 1) , =
=1 et lestimateur obtenu en enlevant de
=1
=1
1
1
= = 2 =
( )2
1
1) Calculer ( ) et lestimateur Jackknife de la variance de . Comparez et commentez
les rsultats.
1
2) Soient = [( ( )) ] et = =1( ) les moments centrs dordre
1 2.
( 2 ) =
11