Rappel

Vous aimerez peut-être aussi

Vous êtes sur la page 1sur 26

Méthodes Quantitatives Avancées

pour la Finance

Résumé des fondamentaux


2022/2023

François Desmoulins-Lebeault

Alain Guéniche

Grenoble Ecole de Management 1A ET- Finance 1


Méthodes Quantitatives Avancées pour la Finance – Rappel – 2022/2023

Résumé des fondamentaux

I. Rappel sur les Variables Aléatoires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3

II. Rappel sur l’Estimation Statistique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

A. Estimation Ponctuelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

B. Estimation par Intervalle de Confiance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9

III. Rappel sur les Propriétés Souhaitables des Estimateurs . . . . . . . . . . . . . . . . . . . . . . 12

IV. Rappel sur le Théorème Central Limite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

V. Rappel sur la Loi Normale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

VI. Rappel sur la Loi de Student . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

VII. Rappel sur la Loi du Khi-deux . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

VIII.Rappel sur la Loi de Fisher-Snedecor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21

IX. Rappel sur les Matrices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

A. Définition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

B. Quelques Matrices Particulières . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22

C. Calcul Matriciel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

2
Méthodes Quantitatives Avancées pour la Finance – Rappel – 2022/2023

“Faire toujours la même chose et s’attendre à un résultat différent n’est pas de la folie.
C’est déterminer la loi de probabilité d’une variable aléatoire.”
Alain Guéniche

I. Rappel sur les Variables Aléatoires


À un ensemble Ω d’événements élémentaires, on fait correspondre X prenant l’une des valeurs lorsque
l’événement élémentaire correspondant se réalise. X est appelé variable aléatoire (abrégé v.a. ci-après).
C’est la fonction qui, à chaque issue possible, associe un nombre réel. L’évènement "X prend la valeur x i "
est noté (X = x i ). Une v.a. est définie si l’on connait les probabilités, P(x 1 ), . . . , P(x i ), . . . , P(x n ), correspondant
aux différentes valeurs possibles de X. Ces probabilités sont évidemment telles que leur somme est égale
à 1. La correspondance x i , P(x i ) est appelée loi de probabilité (ou distribution de probabilité) de la v.a.
X. C’est la fonction de R dans [0, 1] définie par : x → P (X = x).

Ex : Prenons un jeux de hasard. Soit l’expérience aléatoire "lancer un dé". Il y a 6 évènements :


c ar d (Ω) = {1, 2, 3, 4, 5, 6}, où le cardinal d’un ensemble est le nombre de ses éléments. À chaque évènement
on associe un gain/perte : le joueur gagne 2€ s’il obtient un nombre pair, sinon il perd 1€. Soit la v.a. X =
"gain associé à chaque lancer". Probabilité de l’évènement "obtenir un nombre impair" :

c ar d (X = −1) 3 1
P (X = −1) = = =
c ar d (Ω) 6 2

Loi de probabilité :

Valeur x i prises par X −1 2


Probabilité correspondante P(X = x i ) 1/2 1/2

Ainsi, mathématiquement, une variable aléatoire est une fonction mesurable X : Ω → E où Ω est
l’espace des résultats possibles du triplet probabiliste (Ω, A, P) et E un espace mesurable.

Ex : On lance quatre fois de suite une pièce non équilibrée (probabilité d’obtenir pile de 2/3). Soit X
la v.a. représentant le "nombre de lancers nécessaires pour obtenir deux piles consécutifs". On note Pk
(resp. Fk ) l’événement on obtient pile (resp. face) au k-ème lancer. X est donc la fonction qui transforme
un espace de départ en un espace d’arrivée :

(Ω, A, P) (E, B , PX )

L’espace de départ contient :

• l’univers Ω, qui est l’ensemble des résultats possibles, soit Ω = {"Pile", "Face"} ;

• une tribu A, qui va regrouper l’ensemble de tous les sous-ensembles (parties) d’Ω, soit : l’ensemble
vide appelé "événement impossible", les différents résultats possibles ω, et leurs unions, ici { "Pile",
"Face" } qui va constituer l’univers, aussi appelé "événement certain"). Ces sous-ensembles de
résultats possibles sont appelés évènements. Ainsi A = {Ø, {"Pile"}, {"Face"}, Ω} ;

3
Méthodes Quantitatives Avancées pour la Finance – Rappel – 2022/2023

• une loi de probabilité P qui va indiquer la chance de réalisation d’un évènement d’une tribu A.
Ainsi la probabilité d’obtenir ni pile ni face est nulle (pièce tombant sur la tranche), P (Ø) = 0,
d’obtenir pile est de P ({"Pile"}) = 2/3, d’obtenir face est de P ({"Face"}) = 1/3, et d’obtenir ou pile
ou face est de P (Ω) = 1.

L’espace d’arrivée contient lui :

• E, c’est-à-dire l’ensemble des valeurs que peut prendre X, dans ce cas les entiers naturels supérieurs
à 1 (2 lancers minimum nécessaires pour obtenir 2 piles) et inférieurs ou égal à 4 (on se limite à 4
lancers), soit E = {2, 3, 4} ;

• B , l’ensemble des parties de E (ensemble vide, parties à un élément, parties à deux éléments et
partie à trois élements qui va constituer ici l’univers), soit B = {Ø, {2}, {3}, {4}, {2, 3}, {2, 4}, {3, 4}, E} ;

• PX , la loi de X qui va indiquer les chances de réalisation de notre évènement "obtenir deux piles
consécutifs" au 2e lancer, PX (X = 2), au 3e, PX (X = 3), au 4e, PX (X = 4), se calculant comme suit :

PX (X = 2) = P ({"P1 P2 "}) PX (X = 3) = P ({"F1 P2 P3 "})


= P ({"P1 "}) × P ({"P2 "}) = 1/3 × 2/3 × 2/3
= 2/3 × 2/3 = 4/27
= 4/9
PX (X = 4) = P ({"F1 F2 P3 P4 "} ∪ {"P1 F2 P3 P4 "})
= 1/3 × 1/3 × 2/3 × 2/3 + 2/3 × 1/3 × 2/3 × 2/3
= 12/81

II. Rappel sur l’Estimation Statistique


Pour recueillir des informations sur une population, on peut utiliser soit :

− Méthode exhaustive ou recensement, en examinant chacun des individus de la population


selon le caractère étudié
Ex : recensement général de la population française

− Méthode des sondages, en examinant une partie de la population seulement, appelée échantillon
Ex : prélever un échantillon dans le cadre d’un contrôle qualité produit afin de juger de
l’acceptabilité des lots

Un échantillon se définit comme un sous-ensemble de la population, et est constitué de v.a. indépendantes


suivant une même loi. L’acte de sélection s’appelle l’échantillonnage. Il y a deux manières de prélever
un échantillon aléatoirement : avec remise et sans remise.

Notation :

• (X 1 , X 2 , . . . , X n ) est un échantillon de taille n issu de la population N

• Les v.a. X i sont indépendantes et suivent la même loi que X

• (x 1 , x 2 , . . . , x n ) est la réalisation de cet échantillon après n expériences aléatoires

4
Méthodes Quantitatives Avancées pour la Finance – Rappel – 2022/2023

En d’autres termes, on observe la v.a. X sur n individus (avec X 1 le 1er élément d’un échantillon, etc.).
Une autre série d’expérience donnera une autre réalisation x 1′ , x 2′ , . . . , x n′ .
¡ ¢

Le tirage aléatoire, où chaque individu a la même probabilité d’être choisi, permet à l’échantillon
d’être représentatif, c’est-à-dire non biaisé. Ce choix au hasard des différentes observations est très
important :

Chaque observation individuelle dans un échantillon aléatoire a la même distribution de probabilité


que la population.

Chaque observation a alors même moyenne µ et même écart-type σ que la population.

Pour trouver les paramètres d’une population Ω à l’aide de ceux d’un échantillon (démarche des
sondages), deux méthodes :

− Estimation ponctuelle

− Estimation par intervalle de confiance

A. Estimation Ponctuelle
L’estimation ponctuelle consiste à donner une valeur approchée à un paramètre inobservable de la
population à partir des réalisations d’un échantillon.

En prélevant aléatoirement un échantillon de taille n dans une population donnée, la moyenne x de


l’échantillon donnera ainsi une idée approximative de la moyenne de la population :
Pn
xi
x = i =1 ≈ µ
n
Ex : Un fabriquant d’ampoules électriques veut étudier la durée de vie de ses 10 000 ampoules
produites mensuellement. Il est évidemment impossible de les laisser toutes allumées jusqu’à leur usure
complète. On prélève donc un échantillon de taille 10 (pour simplifier), noté (X 1 , X 2 , ..., X 10 ), où X 1 est la
durée de vie en heures de l’ampoule 1, etc. L’expérience donne les résultats suivants :

x1 x2 x3 x4 x5 x6 x7 x8 x9 x 10
950 980 940 970 990 910 890 965 946 927

La durée de vie moyenne calculée sur cet échantillon, appelée moyenne échantillonnale ou empirique
:
950 + 980 + · · · + 927
x= = 946, 8
10
La valeur 946,8 est UNE estimation ponctuelle de la durée de vie moyenne µ des ampoules de la production
mensuelle. Ce qui est risqué puisqu’un autre échantillon donnerait une autre moyenne.

Si on prélève un autre échantillon de même taille, on obtiendra d’autres réalisations. C’est ce qu’on
appelle l’erreur d’échantillonnage. On l’évalue en considérant la distribution de la moyenne de chaque
échantillon parmi la totalité des échantillons.

5
Méthodes Quantitatives Avancées pour la Finance – Rappel – 2022/2023

Ex : Une population est constituée de 5 étudiants en statistiques (pour simplifier). Leur professeur
s’intéresse au temps hebdomadaire consacré à l’étude de cette matière pour chaque étudiant :

Étudiant A B C D E Total
Temps d’étude (en heures) 7 3 6 10 4 30

Soit une moyenne pour la population de :

30
µ= =6
5
Si le professeur choisit un échantillon de taille 3, quelles sont les différentes valeurs possibles pour la
moyenne de son échantillon ?

Valeurs du tps d’étude


N° de l’échantillon Échantillon Moyennes échantillonnales
dans cet échantillon
1 A, B, C 7, 3, 6 5,33
2 A, B, D 7, 3, 10 6,67
3 A, B, E 7, 3, 4 4,67
4 A, C, D 7, 6, 10 7,67
5 A, C, E 7, 6 ,4 5,67
6 A, D, E 7, 10, 4 7,00
7 B, C, D 3, 6, 10 6,33
8 B, C, E 3, 6, 4 4,33
9 B, D, E 3, 10, 4 5,67
10 C, D, E 6, 10, 4 6,67
Total 60

Si par exemple l’échantillon se retrouve constitué par les étudiants les moins travailleurs, on va ainsi
sous-estimer la durée moyenne de la population à étudier les maths par semaine.

On remarque que l’espérance des moyennes empiriques est égale à la moyenne de la population:
³ ´ 60
E X = =6=µ
10

Sauf que dans la réalité on ne choisit qu’un seul échantillon... Comment peut-on alors déduire
quelque chose sur les paramètres de la population ?

Pour cela on définit des v.a. pour chaque statistique de l’échantillon (ici la moyenne X). Comme
toute v.a., X possède une distribution de probabilité, appelée distribution d’échantillonnage. Ainsi X
associe à chaque n-échantillon sa moyenne échantillonnale et a :

− une distribution de probabilité (loi normale ou Student)

− une valeur moyenne E(X) (la moyenne des moyennes d’échantillons)

6
Méthodes Quantitatives Avancées pour la Finance – Rappel – 2022/2023

− un écart-type σ(X) (appelé aussi erreur-type de la moyenne pour ne pas confondre)

Sur les k échantillons aléatoires possibles, on travaillera en pratique sur un seul, en considérant que
les valeurs observées constituent les réalisations de v.a. :

EN PRATIQUE
k échantillons aléatoires Un seul échantillon

Population Population
X µ, σ2 , p X µ, σ2 , p
¡ ¢ ¡ ¢

k échantillons aléatoires k échantillons aléatoires


simples de n individus simples de n individus

x 1 , s 1′2 , f 1 x 2 , s 2′2 , f 2 x k , s k′2 , f k x 1 , s 1′2 , f 1 x 2 , s 2′2 , f 2 x k , s k′2 , f k

© ª © ª © ª
Distribution d’échantillonnage de la : x 1, x 2, . . . , x n x 1, x 2, . . . , x n x 1, x 2, . . . , x n
© ª
- Moyenne x 1 , x 2 , . . . , x k
- Variance s 1 , s 2 , . . . , s k′2
© ′2 ′2 ª
© ª
- Proportion f 1 , f 2 , . . . , f k X1 X2 Xn

⇒ Pour chaque paramètre estimé, on ⇒ Les n observations faites sur un


obtient une série statistique composée de échantillon peuvent être considérées
k éléments comme n v.a. X 1 , X 2 , . . . , X n

Ainsi les n observations x 1 , x 2 , . . . , x i , . . . , x n faites sur un échantillon peuvent être considérées comme
n variables aléatoires X 1 , X 2 , . . . , X i , . . . , X n . La valeur prise par le premier élément extrait de la population
X 1 , dépend en effet de l’échantillon obtenu lors du tirage aléatoire. Cette valeur sera différente si l’on
considère un autre échantillon. À partir de ces n variables aléatoires, on peut alors définir une nouvelle
variable : l’estimateur.

L’estimateur de la moyenne sera ainsi :


Pn
i =1 X i
X=
n
Notation :

Paramètre θ population Estimateur θ̂ Réalisation de l’échantillon


(inobservable) (v.a.r.) (valeur obtenue)

Moyenne µ X x
Variance σ2 S ′2 s ′2
Proportion p p̂ f

7
Méthodes Quantitatives Avancées pour la Finance – Rappel – 2022/2023

Population Échantillon Échantillon


µ, σ2 , p taille n x, s ′2 , f
Échantillonnage Déduction
aléatoire Statistique descriptive

Inférence statistique

Loi de X
En définissant la v.a. X qui à chaque n-échantillon associe sa moyenne échantillonnale, on examine
ainsi "jusqu’à quel point" la moyenne d’un échantillon unique s’approche de la moyenne de la population.

Pour cela, on a besoin de la distribution théorique de la v.a. X :


n n n
µ ¶ µ ¶
³ ´ 1 P 1 1 P 1
E(X i ) = nµ = µ, étant donné que les v.a. suivent
P
− E X =E Xi = E Xi =
n i =1 n i =1 n i =1 n
toutes la même loi
⇒ La moyenne de la distribution d’échantillonnage des moyennes est égale à la moyenne de la
population.
n n n σ2
µ ¶ µ ¶
³ ´ 1 P 1 1 P 1
V(X i ) = 2 nσ2 =
P
− V X =V Xi = 2 V Xi = 2
n i =1 n i =1 n i =1 n n
⇒ Lorsque n augmente, V(X) diminue. À mesure que la taille de l’échantillon augmente, on a
accès à une plus grande quantité d’information pour estimer la moyenne de la population. Ainsi
l’étendue des valeurs possibles de la moyenne échantillonnale diminue, et par conséquent la disper-
sion de la distribution est réduite.

Convergence en loi
En fonction de la nature de la variable aléatoire continue X, de la taille de l’échantillon n et de la
connaissance que nous avons sur le paramètre σ, la variable centrée réduite construite avec X converge
vers différentes lois de probabilité :

X−µ
− Si σ connu (cas rare) : loi normale, σ ∼ N (0, 1)
p
n

X−µ
− Si σ inconnu : loi de Student à n − 1 degrés de liberté, ∼ Tn−1
s′
p
n
1 P n ¡ ¢2 n
L’estimation ponctuelle de σ2 est en effet s ′2 = xi − x = × s2.
n − 1 i =1 n −1
Mais :

− Si l’échantillon est grand (n ≥ 30), on pourra utiliser la loi normale en application du Théorème
Central Limite ;

8
Méthodes Quantitatives Avancées pour la Finance – Rappel – 2022/2023

− Si le tirage est réalisé sans remise, un coefficient d’exhaustivité fait son apparition :

X−µ X−µ
∼ N (0, 1) ou ∼ Tn−1
σ ′
r r
N−n s N−n
p × p ×
n N−1 n N−1

Lors de tirage avec remise, l’échantillon est en effet dit non exhaustif, et les tirages suivants sont
indépendants des précédents. Mais lors de tirage sans remise, l’échantillon est alors qualifié d’
exhaustif (épuiser toutes les possibilités). La non remise fait que les probabilités relatives aux
tirages suivants changent. Dans ce cas, ils dépendent des précédents tirages.

Remarque : ce coefficient sera négligé lorsque la population est dite "infinie" (N > 20n). Le coefficient
d’exhaustivité est en effet alors très proche de 1.
r
10 000 000 − 1 000
Ex : si N = 10 000 000 et n = 1 000, alors = 0, 99995
10 000 000 − 1
Nous ne rappellerons pas ici la loi de l’estimateur d’une proportion, ni d’une variance, l’objectif étant
seulement de rappeler l’idée générale.

B. Estimation par Intervalle de Confiance


L’inconvénient de l’estimation ponctuelle est de généraliser les valeurs d’un échantillon à toute la
population. L’estimateur peut donc être assez loin de la vraie valeur du fait des fluctuations aléatoires
d’échantillonnage. L’intervalle de confiance, lui, va permettre de prendre en compte cette incertitude
aléatoire.

À partir des résultats d’un échantillon, on définit ainsi un intervalle (ou fourchette) pour les paramètres
de la population afin de tenir compte des fluctuations aléatoires d’échantillonnage. L’amplitude de
l’intervalle dépend de la précision demandée :

IC = [est i mat eur ± ε]

avec ε = erreur d’échantillonnage

L’intervalle est ensuite associé à un niveau de confiance 1–α. Plus le niveau de confiance est élevée,
plus l’IC est grand, et plus le risque α que le paramètre ne soit pas compris dans l’IC est faible.

Si vous me demandez de deviner votre âge, je peux vous répondre soit :

− Qu’à 100% je suis sûr que vous avez entre 0 et 130 ans.
⇒ Réponse très fiable mais bien trop large pour être intéressante.

− Qu’à 50% je suis sûr que vous avez entre 30 et 50 ans car je vous vois et je sais que vous n’êtes
pas trop portée Botox, que vous êtes sportive etc.
⇒ Réponse moins fiable mais plus précise.

De même l’amplitude d’un IC réduira à mesure que la taille d’échantillon augmente (et donc qu’elle
se rapproche de la taille de la population).

9
Méthodes Quantitatives Avancées pour la Finance – Rappel – 2022/2023

Ex : Prenons un niveau de confiance de 95%. Il y a donc 95% de chance pour que la valeur du
paramètre de la population soit comprise dans l’IC. Ainsi si l’on construit mettons 50 intervalles, l’objectif
µ sera correctement encadré à 95% environ :

Distribution
de la moyenne
Ce que
de l’échantillon
l’ont sait
mais que le
statisticien
ignore
X
67 71
69

70
1er intervalle
68,2 X
2e intervalle
X 69,4
etc. (jusqu’ici,
67,8 X encadrement Intervalles
de µ par tous d’estimation
X les intervalles) calculés par
..
. le statisticien
66,4 Un de ses
rares échecs
X ..
.
68
50e intervalle
X

Comment associer un intervalle à un niveau de confiance ?

Pour associer un intervalle à un niveau de confiance, on utilisera le quantile z provenant d’une table :

σ
· ¸
¡ ¢
IC0,95 x = x ± z α/2 × p
n

10
Méthodes Quantitatives Avancées pour la Finance – Rappel – 2022/2023

Ex : 50 adultes francophones ont fait l’objet d’une expérience de mémoire. Le temps pris pour
apprendre une liste de 5 verbes allemands a été enregistré pour chaque personne. Ceci a donné les
résultats suivants (en minutes) :

− Soient x 1 , x 2 , . . . , x 50 les temps d’apprentissage respectifs des 50 personnes


P50 P50 2
− i =1 x i = 261, 5 et i =1 x i = 1 376, 37

Quel est l’IC à 95% du temps moyen nécessaire ?

• Paramètres population : pop infinie et σ inconnu

• Statistiques échantillon : échantillon grand (n = 50 ≥ 30)


1 P n 261, 5
x= xi = = 5, 23
n i =1 50
1 P n ¡ ¢2 1 P n 1 376, 37
s2 = xi − x = x i2 − x 2 = − 5, 232 = 0, 1745
n i =1 n i =1 50
n 50
et s ′2 = × s2 = × 0, 1745 = 0, 1781
n −1 49
1 P n ¡ ¢2 1 P n n 1 376, 37 50
ou directement s ′2 = xi − x = x i2 − x2 = − ×5, 232 = 0, 1781
n − 1 i =1 n − 1 i =1 n −1 49 49

p
soit s = 0, 1781 = 0, 42

• Table : z α/2 = 1, 96
s′
· ¸
Par conséquent : IC0,95 (µ) = x ± z α/2 × p = [5, 23 ± 0, 12] = [5, 11; 5, 35]
n

On souhaite à présent réduire la marge d’erreur de façon à ce que le temps d’apprentissage moyen ne
s’éloigne pas de plus de 0,1 minute de la vraie valeur avec un niveau de confiance de 95%. Quelle devrait
alors être la taille d’échantillon en supposant que l’écart-type observé reste le même ?

ε ≤ 0, 1
s′
⇔ z α/2 × p ≤ 0, 1
n
0, 42
⇔ 1, 96 × p ≤ 0, 1
n
p
⇔ 0, 8271 ≤ 0, 1 × n
⇔ n ≥ 68, 40

En prenant la valeur par excès, l’échantillon devrait donc comporter 69 individus pour que l’erreur
d’échantillonage dans l’estimation du temps d’apprentissage moyen ne soit pas supérieure à 0,1 mn au
risque de 5%.

11
Méthodes Quantitatives Avancées pour la Finance – Rappel – 2022/2023

III. Rappel sur les Propriétés Souhaitables des Estimateurs


Biais
Soit θ̂n un estimateur sans biais du paramètre θ. θ̂n est sans biais ssi :

E θ̂n = θ
¡ ¢

où θ est la valeur exacte mais inconnue du paramètre à estimer.


Ainsi un estimateur est non biaisé lorsque sa moyenne est égale à la vraie valeur.

Si E θ̂n ̸= θ, l’estimateur est biaisé et le biais est E θ̂n − θ.


¡ ¢ ¡ ¢

sans biais biaisé

biais

θ = E θ̂n θ E θ̂n
¡ ¢ ¡ ¢

Remarque : asymptotiquement non biaisé ssi : lim E θ̂n = θ


¡ ¢
x→∞

Ex : Chacun des 200 000 adultes d’une ville est supposé avoir pris X repas de type "fast-food" au cours
de la semaine précédente. On effectue une enquête par téléphone. Un échantillon choisi au hasard de
200 appels téléphoniques permettra un retour d’environ 50 réponses dont la moyenne r servira à estimer
µ. Quel est son biais sachant que :

Sous-population de ceux
Population totale
qui acceptent de répondre
µ = 0,9 repas µR = 0,4 repas

La moyenne de l’échantillon r provenant de la sous-population comporte un biais évident dû à un


manque de réponse. Elle tend à être très faible parce que les gros acheteurs des repas de type fast-food
sont vraisemblablement peu enclins à répondre.
³ ´
Biais = E R − µ = µR − µ = 0, 4 − 0, 9 = −0, 5

Le biais est donc important avec une sous-estimation de 0,5 repas/semaine.

Convergence
L’estimateur θ̂ doit tendre vers la valeur réelle du paramètre θ lorsque le nombre d’individus étudiés
augmente. L’estimateur est alors dit convergent.

θ̂n converge en probabilité vers θ ssi :

P θ − ε < θ̂n < θ + ε → 0 lorsque n → ∞


¡ ¢

12
Méthodes Quantitatives Avancées pour la Finance – Rappel – 2022/2023

La probabilité de s’éloigner de la valeur à estimer de plus de ε tend vers 0 quand la taille de l’échantillon
n augmente. Ce qui équivaut à remplir les deux conditions suivantes :

1. E θ̂n = θ ou E θ̂n → θ
¡ ¢ ¡ ¢

2. V θ̂n → 0
¡ ¢

Ex : X est un estimateur convergent de µ

n = 100

n = 50

µ
³ ´ ³ ´
Lorsque l’on observe la densité de X, on constate bien que E X = µ et que V X diminue à mesure
que n augmente.

Variance Minimale
En plus de l’absence de biais, on souhaite que la distribution d’un estimateur soit fortement concentrée.

Ex : A est un meilleur estimateur pour la moyenne que B

Estimateur efficace (A) Estimateur inefficace (B)

µ µ

L’efficacité relative d’un estimateur sans biais A comparée à celle de B est :

V(B)
e=
V(A)

Récapitulatif
L’estimateur θ̂ d’un paramètre θ est dit non biaisé si sa distribution d’échantillonnage se concentre
autour de façon à ce que la moyenne de tous les θ̂ possibles est égale à θ.

S’il existe plusieurs estimateurs non biaisés d’un même paramètre, celui qui possède la distribution
d’échantillonnage dont la variance est la plus petite est considéré comme l’estimateur le plus efficace.

13
Méthodes Quantitatives Avancées pour la Finance – Rappel – 2022/2023

Graphiquement :

− L’estimateur dont la distribution est A est non biaisé alors que celui dont la distribution est
B est biaisé

− L’estimateur dont la distribution est A est plus efficace que celui dont la distribution est C

A B

IV. Rappel sur le Théorème Central Limite


Le théorème central limite établit la convergence en loi de la somme d’une suite de variables aléatoires
vers la loi normale.
Soit X 1 , X 2 , . . . , X n n v.a. indépendantes suivant la même loi d’espérance µ et d’écart-type σ. Si n ≥ 30
alors :
p
X 1 + X 2 + · · · + X n ∼ N n × µ, n × σ
¡ ¢

et
σ
µ ¶
X1 + X2 + · · · + Xn
X= ∼ N µ, p
n n

En d’autres termes, la loi normale est la loi limite d’autres lois : si des v.a. ne suivent pas une loi
normale, leur somme et leur moyenne le peuvent si l’échantillon est suffisamment grand (n ≥ 30) et que
ces v.a. sont Indépendantes et Identiquement Distribuées (règle i.i.d.).

14
Méthodes Quantitatives Avancées pour la Finance – Rappel – 2022/2023

V. Rappel sur la Loi Normale


Une loi normale se présente sous cette forme en cloche :

Distribution normale µ = Moyenne


(Courbe en cloche) σ = Écart-type
Fréquence

68, 5%

Queue épaisse Queue épaisse

95, 4%
99, 7%
−3σ −2σ −1σ µ +1σ +2σ +3σ

Les valeurs sont concentrées autour de la moyenne et les queues de distribution sont fines, ce qui
signifie que les évènements extrêmes sont peu probables.

Il existe des tables construites pour la loi normale centrée-réduite. Pour transformer une loi normale
quelconque en loi normale centrée réduite, rien de plus simple ! On la centre en enlevant la moyenne,
puis on réduit en divisant par l’écart-type :

X−µ
Z= ∼ N (0, 1)
σ
Les tables se présentent généralement de la façon suivante :

z 0 0,01 0,02 0,03 0,04 0,05

0,0 0,5000 0,5040 0,5080 0,5120 0,5160 0,5199


0,1 0,5398 0,5438 0,5478 0,5517 0,5557 0,5596
0,2 0,5793 0,5832 0,5871 0,5910 0,5948 0,5987
0,3 0,6179 0,6217 0,6255 0,6293 0,6331 0,6368
0,4 0,6554 0,6591 0,6628 0,6664 0,6700 0,6736
0,5 0,6915 0,6950 0,6985 0,7019 0,7054 0,7088
0,6 0,7257 0,7291 0,7324 0,7357 0,7389 0,7422
0,7 0,7580 0,7611 0,7642 0,7673 0,7704 0,7734

Celle-ci donne la probabilité F(z) de trouver une valeur inférieure au quantile z :


f (z)

F(z)

0 z

15
Méthodes Quantitatives Avancées pour la Finance – Rappel – 2022/2023

où f (z) est la fonction de densité de la v.a. Z :

1 2
f (z) = p e −z /2

et F(z) est sa fonction de répartition (aussi appelée fonction de distribution cumulative), représentant
l’aire sous la courbe, qui associe à tout réél z la probabilité d’obtenir une valeur inférieure ou égale :
Z z Z z
1 2
F(z) = P(Z ≤ z) = f (z) dz = p e −z /2 dz
−∞ 2π −∞

Trouver le quantile z
La table ci-dessus donne la probabilité telle que P (Z ≤ z) = 1–α, or ce que l’on cherche pour constuire
un intervalle de confiance, c’est la probabilité telle que P (−z α/2 < Z < z α/2 ) :

1−α
α/2 α/2

−z α/2 0 z α/2

Une loi normale étant symétrique, on peut facilement obtenir ce résultat après quelques manipulations
basiques :

P(−z α/2 < Z < z α/2 ) = 1–α


⇔ 2 × P (0 < Z < z α/2 ) = 1–α (symétrie)
⇔ 2 × [P(Z < z α/2 ) − P(Z < 0)] = 1–α
⇔ 2 × [P(Z < z α/2 ) − 0, 5] = 1–α
⇔ 2 × P(Z < z α/2 ) − 1 = 1–α
α
⇔ P(Z < z α/2 ) = 1–
2
Ainsi si l’on souhaite un niveau de confiance de mettons 95%, on cherchera en fait dans la table
ci-dessus le quantile correspondant à une probabilité de 97,5% :

... 0,06 ...


..
.
1,9 ... 0,9750 ...
..
.

La table se lisant à l’envers, on trouve un quantile correspondant de 1,96.

16
Méthodes Quantitatives Avancées pour la Finance – Rappel – 2022/2023

Les quantiles pour les principaux niveaux de confiance sont ainsi :

Niveau de confiance Probabilité à chercher dans Quantile correspondant


(1 − α) la table P (Z < z α/2 ) z α/2
0,99 0,995 2,575
0,95 0,975 1,96
0,90 0,95 1,645

Ex : Pour 1−α = 0, 95 et z α/2 = 1, 96, le graphique ci-après représente la distribution de la moyenne de


³ ´ fixe mais inconnu µ. 95% de la probabilité est contenue à l’intérieur
l’échantillon autour du paramètre
de ±1, 96 fois l’erreur-type σ X :

pour chaque
queue,
2, 5%
X
³ ´ µ ³ ´
µ − 1, 96 × σ X µ + 1, 96 × σ X

17
Méthodes Quantitatives Avancées pour la Finance – Rappel – 2022/2023

VI. Rappel sur la Loi de Student


X−µ
Si X suit une loi normale N µ, σ , alors on dit que la variable définie par T = p suit une loi de
¡ ¢
σ/ n
Student à n − 1 degrés de liberté (ddl), avec :

ddl = Nb d’observations indépendantes dans l’échantillon – Nb de paramètres de la population à estimer

Ex : si σ inconnu

− Test de conformité d’une moyenne : ddl = n − 1

− Test de comparaison de deux moyennes : ddl = n A + n B − 2

Une table de Student fonctionne de façon inverse par rapport à une table de la loi normale : pour un
nombre de degrés de liberté donné, elle part des probabilités et donne les quantiles . Celle-ci donne
la valeur de t α/2 ayant la probabilité α d’être dépassée en valeur absolue :

Probabilité
p 0,8 0,6 0,5 0,4 0,3 0,2 0,1
ν
1 0,325 0,727 1,00 1,38 1,96 3,08 6,31
2 0,289 0,617 0,816 1,06 1,39 1,89 2,92
3 0,277 0,584 0,765 0,978 1,25 1,64 2,35
Degrés de 4 0,271 0,569 0,741 0,941 1,19 1,53 2,13
liberté 5 0,267 0,559 0,727 0,920 1,16 1,48 2,02
6 0,265 0,553 0,718 0,906 1,13 1,44 1,94
7 0,263 0,549 0,711 0,896 1,12 1,41 1,89
8 0,262 0,546 0,706 0,889 1,11 1,40 1,86
9 0,261 0,543 0,703 0,883 1,10 1,38 1,83

Soit P(−t α/2 < T < t α/2 ) = 1 − α :

1−α
α/2 α/2

−t α/2 0 t α/2

18
Méthodes Quantitatives Avancées pour la Finance – Rappel – 2022/2023

Mais, là encore, vous trouverez des tables construites de façon à donner différentes probabilités,
comme :

• Les valeurs de t α ayant la probabilité 1 − α d’être inférieures, P(T < t α ) = 1 − α :


p 0,9 0,95 0,975 0,99 0,995
ν
1 3,08 6,31 12,71 31,82 63,66
2 1,89 2,92 4,30 6,96 9,92
3 1,64 2,35 3,18 4,54 5,84
1−α α 4 1,53 2,13 2,78 3,75 4,60
5 1,48 2,02 2,57 3,36 4,03
0 tα 6 1,44 1,94 2,45 3,14 3,71

• Les valeurs de t α ayant la probabilité α d’être dépassées, P(T > t α ) = α :


p 0,1 0,05 0,025 0,01 0,005
ν
1 3,08 6,31 12,71 31,82 63,66
2 1,89 2,92 4,30 6,96 9,92
3 1,64 2,35 3,18 4,54 5,84
1−α α 4 1,53 2,13 2,78 3,75 4,60
5 1,48 2,02 2,57 3,36 4,03
0 tα 6 1,44 1,94 2,45 3,14 3,71

Ex : On souhaite déterminer le quantile correspondant à une probabilité de 5% à droite pour 6 degrés


de liberté. Que l’on regarde dans la première table qui donne une probabilité bilatérale à p = 10%, de
façon à avoir le quantile ayant une probabilité de 5% d’être dépassé, ou dans la seconde à p = 95% avant,
ou encore dans la dernière avec 5% après, on trouve bien évidemment la même valeur, à savoir t α = 1, 94.

Comparaison entre la loi normale centrée réduite et la loi de Student

Comparaison des fractiles


d’une loi de Student et normale centrée réduite

T suit une loi de Student avec n = 5 T suit une loi de Student avec n = 25
Z suit N (0, 1) Z suit N (0, 1)
P(−1, 96 < Z < 1, 96) = 95% P(−1, 96 < Z < 1, 96) = 95%
P(−2, 57 < T < 2, 57) = 95% P(−2, 06 < T < 2, 06) = 95%

À mesure que le ddl augmente, la loi de Student converge en distribution vers la loi normale. Et
lorsque n est suffisamment grand (≥ 30), la loi normale constitue une approximation acceptable de la loi
de Student (TCL).

19
Méthodes Quantitatives Avancées pour la Finance – Rappel – 2022/2023

VII. Rappel sur la Loi du Khi-deux


La loi du Khi-deux, notée χ2 , est la loi de la somme de carrés de v.a. indépendantes suivant des lois
normales centrées réduites. Elle dépend d’un seul paramètre qui est son nombre de degrés de liberté.

La loi du χ2 est une distribution asymétrique avec étalement sur la droite, toutefois elle tend à devenir
symétrique quand le nombre de degré de liberté augmente :

0.25 n=3
n=4
0.2 n=5
fonction de densité

n=6
n=7
0.15
n=8

0.1

0.05

0 5 10 15
v.a.

On l’utilisera comme distribution pour la statistique du test d’une variance.

Démonstration
Soit {X 1 , X 2 , . . . , X n } un échantillon issu d’une loi normale N µ, σ2 . Sa variance lorsque µ est connue
¡ ¢

est :
1X n ¡ ¢2
S2 = Xi − µ
n i =1

Comme X 2 ∼ χ21 lorsque X ∼ N (0, 1), on a :


¶2
Xi − µ
µ
∼ χ21
σ

Or si deux v.a. indépendantes suivent des lois du Khi-deux à respectivement ν1 et ν2 degrés de liberté,
leur somme suit une loi du Khi-deux à (ν1 + ν2 ) degrés de liberté. Il suit :

n µ X − µ ¶2
i
∼ χ2n
X
i =1 σ

Et en réarrangeant les termes :

Pn ¡ ¢2 n × 1 Pn ¡X − µ¢2
n µ X − µ ¶2
i X i − µ n i =1
i
= i =1 2
X
=
i =1 σ σ σ 2

Soit :
n × S2
∼ χ2n
σ2

20
Méthodes Quantitatives Avancées pour la Finance – Rappel – 2022/2023

VIII. Rappel sur la Loi de Fisher-Snedecor


Soit U et V deux v.a. indépendantes telles que U ∼ χ2nu et V ∼ χ2n v , alors :

U/n u
W= ∼ Fnu ,n v
V/n v

Et si W ∼ Fnu ,n v , on déduit que 1/W ∼ Fn v ,nu .

La loi de Fisher-Snedecor est une distribution asymétrique avec étalement sur la droite :

0.8
n A = 4, nB = 4
n A = 10, nB = 4
n A = 10, n B = 10
fonction de densité

0.6 n A = 4, n B = 10

0.4

0.2

0
0 1 2 3 4
v.a.

On l’utilisera comme distribution lors des tests de comparaison de deux variances. En effet, la statistique
de test est alors égale au rapport de la variance la plus grande (numérateur) sur la variance la plus petite
(dénominateur).
n A × S 2A n B × S 2B
Or on sait que la distribution de probabilité de la variable aléatoire , respectivement ,
σ2A σ2B
est une distribution du χ2 à n A degrés de liberté, respectivement n B degrés de liberté.

De plus, les échantillons ayant été prélevés indépendament l’un de l’autre, ces deux v.a. sont indépendantes.

Par conséquent :
S 2A
σ2A
F= ∼ Fn A ,nB
S 2B
σ2B

Enfin, comme sous H0 , σ2A = σ2B , on obtient :

S 2A
F= ∼ Fn A ,nB
S 2B

21
Méthodes Quantitatives Avancées pour la Finance – Rappel – 2022/2023

IX. Rappel sur les Matrices


A. Définition
Une matrice de dimension (n × p) est un tableau de nombres réels (appelés coefficients) à n lignes et
p colonnes. On note a i j l’élément de la matrice A situé à l’intersection de la ligne i et de la colonne j (la
ligne est toujours nommée en premier) :
 
a 11 a 12 . . . a 1p
 a 21 a 22 . . . a 2p 
 
A=  .. .. .. .. 
 . . . . 

a n1 a n2 ... a np

B. Quelques Matrices Particulières


• Si n = 1 ou p = 1, la matrice est appelée vecteur (et plus précisément vecteur-ligne et vecteur-
colonne).

• Si n = p alors la matrice est dite carrée.

• Matrice identité (ou unité) de dimension n : matrice carrée avec des 1 sur la diagonale et des 0
partout ailleurs.  
1 0 ... 0
0 1 . . . ... 
 
In =  .
 
. .. ..

. . . 0

 
0 ... 0 1

• Matrice diagonale de dimension n : matrice carrée dont les coefficients en dehors de la diagonale
principale sont nuls.  
a 11 0 ... 0
 .. .. 
 0 a
22 . . 
A= .
 
.. ..

 .
 . . . 0

0 ... 0 an

• Matrice symétrique de dimension n : matrice carré égale à sa propre transposée, autrement dit les
coefficients sont symétriques par rapport à la diagonale principale (a i j = a j i pour tous i , j ). Ex :

1 4 6
 

A = 4 7 5 
6 5 0

• Matrice triangulaire de dimension n : matrice carrée dont une partie triangulaire des valeurs,
délimitée par la diagonale principale, est nulle.
 
a 11 a 12 . . . a 1n
 0 a 22 . . . a 2n 
 
A=  .. .. .. .. 
 . . . . 

0 ... 0 a nn

22
Méthodes Quantitatives Avancées pour la Finance – Rappel – 2022/2023

C. Calcul Matriciel
• Addition, soustraction : réalisée terme à terme sur des matrices de même dimension
µ ¶ µ ¶ µ ¶
2 7 0 5 8 −2 7 15 −2
+ =
3 6 −1 4 6 3 7 12 2

• Multiplication par un nombre (appelé scalaire) : chaque terme est multiplié par le scalaire
µ ¶ µ ¶
2 7 0 4 14 0
2× =
3 6 −1 6 12 −2

• Multiplication : le nombre de colonnes de la première matrice doit être égal au nombre de lignes
de la seconde pour que le calcul soit possible. Le produit de la matrice A (n × p) par la matrice B
(p × q) est la matrice C (n × q) telle que l’élément c i j est égal au produit scalaire de la ligne i de la
matrice A par la colonne j de la matrice B.

B : p lignes q colonnes
 

 b 11 b 12 ... b 1q 

 
 
 

 b 21 b 22 ... b 2q 

 
12

 
b

.. .. ..
×

 
 .. 
. . . .
21
+

22

 
a

 
×

 
22

 
b p1 b p2 ... b pq
a

 
..
.+

2
bp
×
p
a2

   
 a 11 a 12 ... a 1p   c 11 c 12 ... c 1q 
   
   
   
a 21 a 22 ... a 2p c 21 c 22 ... c 2q
   
   
   
   
   
 .. .. .. ..   .. .. .. .. 

 . . . . 


 . . . . 

   
   
 a n1 a n2 ... a np   c n1 c n2 ... c nq 

A : n lignes p colonnes C = A × B : n lignes q colonnes

Ex :
5 −2
 
µ ¶ µ ¶ µ ¶
2 1 0  2×5+1×4+0×1 2 × −2 + 1 × 6 + 0 × 8 14 2
× 4 6 =
 =
3 6 −1 3 × 5 + 6 × 4 + −1 × 1 3 × −2 + 6 × 6 + −1 × 8 38 22
1 8

23
Méthodes Quantitatives Avancées pour la Finance – Rappel – 2022/2023

Le produit matriciel est :

− Associatif : ABC = (AB)C = A(BC)


− Distributif par rapport à l’addition : A(B + C) = AB + AC
− Non commutatif : AB n’est pas égal à BA en général.

• Transposition : la transposée AT (aussi notée A′ ) d’une matrice A est la matrice obtenue en échangeant
les lignes et les colonnes de A

2 3
 
µ ¶
2 7 0
A= ⇔ AT = 7 6
3 6 −1
0 −1

• Déterminant d’une matrice carrée : noté det(A) ou |A|

◦ Matrice de dimension 2 :
µ ¶
a b
Soit A = alors |A| = ad − bc
c d

◦ Matrice de dimension 3 :

n
a i j Ai j (−1)i + j
X
|A| =
j =1

Pas de panique ! Ai j sont appelés les mineurs de la matrice A, et se calculent comme le


déterminant d’une matrice d’ordre 2 une fois les lignes i et j supprimées :

a b c
 
¯ ¯
¯e f ¯¯
A11 =  d e f  = ¯¯ = ei − f h
h i¯
g h i

Quant au terme (−1)i + j , il signifie simplement que l’on alternera de signe, en commençant
par + ((−1)1+1 = 1) :
 
+ − +
 − + −
+ − +

Soit :
¯ ¯ ¯ ¯ ¯ ¯
¯e f ¯¯ ¯¯d f ¯¯ ¯¯d e ¯¯
|A| = a 11 A11 −a 12 A12 +a 13 A13 = a ¯¯ −b +c = aei −a f h+b f g −bd i +cd h−ceg
h i ¯ ¯g i ¯ ¯g h¯

24
Méthodes Quantitatives Avancées pour la Finance – Rappel – 2022/2023

◦ Matrice de dimension ≥ 4 : le principe est identique mais les calculs augmentent...


 
a b c d ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯
 e f g h ¯ f g h¯ ¯ e g h¯ ¯ e f h¯ ¯e f g ¯¯
¯ ¯ ¯ ¯ ¯ ¯ ¯
Soit A =   alors |A| = a ¯¯ j k l ¯¯ − b ¯¯ i k l ¯¯ + c ¯¯ i j l ¯¯ − d ¯¯ i j k ¯¯
 
i j k l ¯n e f ¯ ¯m e f ¯ ¯m n f ¯ ¯m n e¯
m n e f
µ ¯ ¯ ¯ ¯ ¯ ¯¶
¯k h ¯
¯− g ¯ j l ¯+h ¯ j j¯ −b ...
¯ ¯ ¯ ¯
= a f ¯¯
e l ¯ ¯n f ¯ ¯ n e¯

◦ Quelques propriétés :
− |A| = |AT |
− |AB| = |A| × |B|
◦ Cas particulier : le déterminant d’une matrice triangulaire est égal au produit des élements
de sa diagonale principale, |A| = ni=1 a i i
Q

• Inversion d’une matrice carrée : une matrice carrée A est dite inversible s’il existe une matrice
carrée A−1 (appelée matrice inverse) telle que :

A × A−1 = A−1 × A = I

Si A−1 n’existe pas, la matrice A est dite singulière. Quelques propriétés :

− (A−1 )−1 = A
− (AT )−1 = (A−1 )T
− (AB)−1 = B−1 A−1

Méthode des cofacteurs :

1
A−1 = × cof(A)T
|A|

où cof(A) la matrice des cofacteurs de A :


 
A11 A12 ... A1p
 A21 A22 ... A2p 
 
cof(A) = 
 .. .. .. .. 
 . . . . 

An1 An2 ... Anp

◦ Matrice de dimension 2 :
µ ¶ µ ¶T µ ¶
a b 1 d −c 1 d −b
Soit A = alors A−1 = × = ×
c d |A| −b a ad + bc −c a

On constate qu’une matrice est donc inversible si et seulement si det(A) ̸= 0.

25
Méthodes Quantitatives Avancées pour la Finance – Rappel – 2022/2023

◦ Matrice de dimension 3 :
 ¯ ¯ ¯ ¯ ¯ ¯T
¯e f ¯¯ ¯d f ¯¯ ¯d e ¯¯
+ ¯ h − ¯¯ + ¯¯
¯
i ¯ g i ¯ g h ¯
a b c
   ¯ ¯ ¯ ¯ ¯ ¯
1   ¯b c ¯¯ ¯a c ¯¯ ¯a b ¯¯
Soit A = d e f alors A−1 = ×  − ¯¯ + ¯¯ − ¯¯
 
h i¯ g i¯ g h ¯

|A| 
g h i  ¯ ¯ ¯ ¯ ¯ ¯
 ¯b c¯ ¯ ¯ a c¯ ¯ ¯ a b ¯¯
+ ¯¯ − ¯¯ + ¯¯
e f¯ d f¯ d e¯

Ce qui devient vite laborieux pour des matrices de dimension ≥ 4...

Méthode du pivot de Gauss :


Cette technique consiste à transformer la matrice A en une matrice identité via des calculs élémentaires
sur les lignes (multiplier une ligne par un nombre, additionner ou soustraire le multiple d’une ligne
à une autre, permuter 2 lignes...), et de reporter ces mêmes opérations élémentaires au fur et à
mesure sur une matrice identité qui deviendra la matrice inverse de A, une fois A complètement
transformée en I :
(A | I) → I | A−1
¡ ¢

Ex :

3 −2 4 1 0 0 L1 1 0 2 0 1 0 L 1 ⇄ L2
   

(A | I3 ) = 1 0 2 0 1 0  L2 = 0 1 0 0 0 1
0 1 0 0 0 1 L3 3 −2 4 1 0 0 L 2 ⇄ L3
1 0 2 0 1 0 1 0 2 0 1 0
   

= 0 1 0 0 0 1 = 0 1 0 0 0 1
0 −2 −2 1 −3 0 L3 ← L3 − 3L1 0 0 −2 1 −3 2 L3 ← L3 + 2L2
1 0 0 1 −2 2 L 1 ← L1 + L 3
 

I | A−1
¡ ¢
= 0
 1 0 0 0 1  =
0 0 1 −1/2 3/2 −1 L3 ← L3 / − 2

26

Vous aimerez peut-être aussi