Académique Documents
Professionnel Documents
Culture Documents
Modélisation et développement du
portefeuille obligataire et application des
outils de Machine Learning
Réalisé par :
EL Kharmoudi Abir
Soutenu le : 06 Juin 2023
Devant le jury composé de :
1
Dédicace
Abir El kharmoudi
2
Remerciements
3
Résumé
4
Abstract
5
jÊÓ
éJ KA¾Ó@ iJK IJ HAJ
k ,PAÒJB@ j.K@Q@ ú¯ AÖÞ Ag @PðX H@Y JË@ èP@X@ I.ªÊK
ÈCg áÓ é¢®jÖÏ @ à P@ñK úΫ A®mÌ '@ð Q£AjÖÏ @ èP@X@ ð áºÜØ YKA« úæ¯ @ J ®m '
é¯Q« ú¯ úk. Qm' ¨ðQåÓ PA£@ áÖÞ . H@Y JË@ @ ñ @ ú¯ ékA JÖÏ @ Q®Ë@ ÈCªJ@
JË@ èP@X@ ú¯ úÍ B@ ÕΪJË @ HAJ
. H@Y ¯ ,úæªË@
J® K J J.¢K . IÔ ø Q»QÖÏ @ ½JJ.ËAK. Èð@YJË@
.
颮jÒÊË ÉJÓ B@ áK ñºJË@ ©¯ñ JË P@Ym' B@ :úÍ B@ ÕΪJÊË ág XñÖß QK ñ¢JK IÔ
. . ¯
jJÖÏ @ HAJ
éÓY ÓPP@ñmÌ '@ ÉÒ . H@Y
JË@ ú¯ Èð@YJË@ Q¯ YK YjJË JJË@ð
PAm. @ð úæk
. ñÊË@ P@Ym' B@ð éJ K@ñªË@ HAK . AªË@ð éJ «AJ¢B@ éJ .ªË@ HA¾J
. Ë@
©K PñK ám' ú¯ Q¢Ë@ £ @ . éJ K@ñªË@
è Yë éJ Ê«A¯ l. ' AJJË@ HQê HAK
. AªË@ð P@Q®Ë@
JË@ ú¯ Èð@YJË@ ÈAm.× ú¯ èQJÓ
. H@Y H@ P @Q¯ XAm' @ð Èñ B@
- úÍ @ ÕΪK Ëð@YJË@ HA«A
¯ êJÓPP@ñk - H@Y JË@ ꢮm× ½JK. : éJ kAJ®Ó HAÒÊ¿
. ñJ.K - HA KAJK. - J
6
Tables des matières
Dédicace 2
Remerciements 3
Résumé 4
Abstract 5
Résumé en arabe 6
Introduction 11
7
Génie MIS Ecole Mohammedia d’Ingénieurs
Conclusion 77
Bibliographie 78
8
Liste des figures
9
Génie MIS Ecole Mohammedia d’Ingénieurs
10
Introduction
11
Génie MIS Ecole Mohammedia d’Ingénieurs
12
Chapitre 1
Dans ce chapitre, nous allons parler brièvement sur le Groupe BCP, et ensuite
nous allons présenter la salle des marché de ce Groupe en introduisant ses
pôles ainsi que ses différentes activités. Nous allons aborder par la suite
la partie dédiée au contexte général du projet et ceci en introduisant d’une
manière générale le marché obligataire marocain et en cadrant notre projet
de fin d’étude par une problématique et des ojectifs précis.
13
Génie MIS Ecole Mohammedia d’Ingénieurs
14
Génie MIS Ecole Mohammedia d’Ingénieurs
15
Génie MIS Ecole Mohammedia d’Ingénieurs
Ainsi,une obligation à taux fixe génère chaque année un revenu d’intérêt con-
stant, à fréquence prédéterminée. Le détenteur de l’obligation reçoit le même
montant chaque année ou chaque mois, selon le calendrier de versement des
intérêts. En effet, le taux d’intérêt est fixé à ce moment là et ne changera
pas au cours du temps. Les caractéristiques d’une obligation à taux fixe sont
les suivantes:
- Date d’émission: Il s’agit de la date effective de la souscription et de la
libération du titre. C’est aussi la date à partir de laquelle les intérêts com-
mencent à courir.
- Date de jouissance: C’est la date d’anniversaire des coupons. Autrement
dit, c’est la date de versement des intérêts et/ou du principal.
- Date d’échéance: Date de fin de vie de l’obligation.
- Date de valorisation: C’est la date où l’on cherche à valoriser l’obligation.
- Taux nominal ou Taux Facial: C’est le taux appliqué au nominal pour le
calcul des intérêts ou coupons.
- Maturité: C’est la durée de vie de l’obligation. Il s’agit de la durée séparant
la date d’émission de la date d’échéance.
- Valeur Nominale: C’est également la valeur du principal à rembourser à
16
Génie MIS Ecole Mohammedia d’Ingénieurs
l’échéance.
- Modalités d’amortissement: Généralement, l’amortissement est in fine,
c’est-à-dire que le principal est remboursé à l’échéance du prêt. Mais il ex-
iste d’autres modalités de remboursement à savoir: le remboursement par
annuités constantes dont le remboursement du capital et les coupons sont
identiques pour chaque année et le remboursement par séries égales; dans
ce type de remboursement l’obligataire percevra une fraction identique du
principal chaque période, par conséquent, les intérêts versés dimunueront.
- Périodicité de paiement des coupons: Généralement, les coupons sont
payés annuellement.
- Spread ou la prime de risque: C’est l’écart entre le taux de rendement
actuariel d’une obligation privée et celui du bon de trésor de même durée.
Plus l’investissement est risqué, plus la prime de risque est élevée.
- Ligne simple et ligne atypique: Lorsque la date de jouissance est différente
de la date d’émission du titre, l’emprunt est dit atypique.
Tandis qu’un emprunt obligataire à taux variable est un ensemble de titres
de dette dont l’échéancier de flux est indexé sur un taux observable (Taux de
référence). Ainsi, l’obligation à taux variable aura les mêmes caractéristiques
que celles d’un emprunt obligataire à taux fixe mais avec les éléments suiv-
ants:
- Indice de référence: C’est l’indice qui représente une base de calcul du
taux du coupon à une échéance déterminée selon les règles précisées dans le
contrat d’émission
- Période de référence: C’est la durée au cours de laquelle est calculé le
taux de référence.
- Marge faciale: C’est le pourcentage rajouté ou retranché au taux de
référence pour déterminer le taux du coupon.
Dans le reste du chapitre nous adopterons les notations suivantes:
- tf : Taux facial.
- N: Valeur nominale.
- Dem : Date d’émission de l’obligation.
- Dech : Date d’échéance de l’obligation.
- Djoui : Date de jouissance de l’obligation.
- Dval : Date de valorisation de l’obligation.
- M: maturité en jours.
- Mr : maturité résiduelle en jours
- R: Taux de rendement ou taux d’actualisation.
- S: Spread d’émission ou prime de risque.
17
Génie MIS Ecole Mohammedia d’Ingénieurs
• Construire la courbe des taux par la méthode direct ainsi que les
modèles stochastiques;
Conclusion
Dans ce chapire, nous avons cadré notre projet de fin d’étude à travers la
présentation de l’organisme d’acceuil et le marché obligataire marocain, ainsi
que l’identification du contexte général de ce projet.
18
Chapitre 2
19
Génie MIS Ecole Mohammedia d’Ingénieurs
L’État emprunte une somme aux investisseurs, lesquels achètent des obliga-
tions moyennant une rémunération qui dépendra de la durée du prêt et du
profil de risque de l’État. Pour déterminer les taux de rendement pour des
maturités spécifiques, on procède par interpolation linéaire. Cette méthode
est utilisée pour calculer la valeur d’un taux inconnu sur la courbe de taux,
en calculant une moyenne pondérée des valeurs de deux taux connus qui
l’entourent. Soit t la maturité pour laquelle on souhaite calculer le taux de
rendement r(t), sachant que t est comprise entre t0 et t1 et r(t1 ) et r(t0 ) sont
connus. La formule de l’interpolation linéaire s’exprime alors comme suit :
t0 −t
r(t) = r(t0 ) + t0 −t1
(r(t1 ) − r(t0 ))
Cependant, pour pouvoir interpoler entre deux points de la courbe, ces
derniers doivent avoir la même base d’intérêt d’où la nécessité de la con-
version des taux monétaires en taux actuariels ou inversement. Ainsi, la
formule pour le calcul du taux monétaire est exprimée par:
N bj ours
1 + Tm × 360
N bj ours
(1 + Ta ) base
20
Génie MIS Ecole Mohammedia d’Ingénieurs
21
Génie MIS Ecole Mohammedia d’Ingénieurs
n
X CFi N
N= i
+
i=1
(1 + ZCi ) (1 + ZCn )n
Où CFi sont les cash flows annuels et ZCi représente le taux zéro coupon
correspondant à la maturité i.
22
Génie MIS Ecole Mohammedia d’Ingénieurs
n
X r r+1
1= i
+
i=1
(1 + ZCi ) (1 + ZCn )n
r+1 1
ZCn = ( n )n − 1
X r
1−
i=1
(1 + ZCi )i
1 1
ZCN = ( N −1 )N − 1
X 1 1 1
( i
− i
)+
i=1
(1 + ri ) (1 + ZCi ) (1 + rN )N
Figure 2.3: Les taux zéro coupon par maturités pleines correspondantes au
18/03/2019
23
Génie MIS Ecole Mohammedia d’Ingénieurs
Z t
−at
r(t) = b + (r(0) − b)e +σ e−a(t−u) dWu (2.5)
0
24
Génie MIS Ecole Mohammedia d’Ingénieurs
Rt
r(t) = b + (r(0) − b)e−at + σ 0
e−a(t−u) dWu
rt = αrt−1 + β + ξ
Avec :
α = e−adt
β = b(1 − exp (−adt)
(2.7)
σ 2 1 − exp (−2adt)
∼ N (0, (
ξ ))
2 2a
25
Génie MIS Ecole Mohammedia d’Ingénieurs
n−1
Y
L(a, b, σ) = f (ri+1 \ri , a, b, σ)
i=1
Maximiser la fonction de vraisemblance consiste à maximiser également le
logarithme de vraisemblance:
n−1
X
ln(L(a, b, σ)) = f (ri+1 \ri , a, b, σ)
i=1
On remplace f du modèle de Vasiçek par son expression :
n−1
X
ln(L(a, b, σ)) = − n−1
2
(ln(2π) − ln(σ)) − 1
2σ 2
(ri+1 − ri e−a − b(1 − e−a ))2
i=1
Les conditions du premier ordre sont :
∂L(a, b, σ
=0
∂a)
∂L(a, b, σ
=0 (2.9)
∂b)
∂L(a, b, σ
=0
∂σ)
26
Génie MIS Ecole Mohammedia d’Ingénieurs
On note : n
X
Sx = ri−1
i=2
n
X
Sy = ri
i=1
n−1
X
Syy = ri2 (2.11)
i=1
n
X
Sxy = ri ri−1
i=2
n
X
2
Sxc = ri−1
i=2
On obtient ainsi :
Sxy − θSy − Sy + nθ2
a = − ln( )
Sxx − 2θSx + nθ2
Sy Sxx − Sx Syy
b=
n(Sxx − Sxy ) − (Sx2 − Sx Sy
σ 2 = 1 (Syy − 2e−a Sxy + e−2a Sxx − 2b(1 − e−a )(Sy − e−a Sx ) + nb2 (1 − e−2a ))
n
(2.12)
27
Génie MIS Ecole Mohammedia d’Ingénieurs
28
Génie MIS Ecole Mohammedia d’Ingénieurs
29
Génie MIS Ecole Mohammedia d’Ingénieurs
30
Génie MIS Ecole Mohammedia d’Ingénieurs
On remarque que cette erreur est presque nulle et que la racine carré de
l’erreur quadratique moyenne est de l’ordre de 10−4 c’est à dire qu’elle est
presque négligeable et le coefficient de détermination est supérieur à 90% . Ce
qui explique que l’estimation de notre modèle est performante. Cependant,
comme la plupart des modèles mathématiques, le modèle Vasicek est un
modèle général et il ne représente pas parfaitement le mouvement des marchés
financiers en raison de plusieurs limitations, à savoir :
31
Génie MIS Ecole Mohammedia d’Ingénieurs
Où :
1
Rτ
R(t, T ) = τ 0
f (s)ds
−λτ −λτ
R(t, T ) = β0 + β1 ( 1−eλτ ) + β2 ( 1−eλτ − e−λτ )
32
Génie MIS Ecole Mohammedia d’Ingénieurs
33
Génie MIS Ecole Mohammedia d’Ingénieurs
n
X
λ̂ = argmin( (R(t, Ti )obs − R(t, Ti )N S )2 ) (2.14)
i=0
Avec:
34
Génie MIS Ecole Mohammedia d’Ingénieurs
35
Génie MIS Ecole Mohammedia d’Ingénieurs
36
Chapitre 3
Ce chapitre nous allons voir comment valoriser une obligation et nous allons
réaliser un pricer sous Python qui permet d’évaluer les emprunts obligataires,
nous allons également introduire les caractéristiques générales du portefeuille
obligataire.
37
Génie MIS Ecole Mohammedia d’Ingénieurs
M
Cpu = tf × N × 360
N +Cp u
Pdirty = 1+r× M r
360
38
Génie MIS Ecole Mohammedia d’Ingénieurs
Cpu = tf × N
39
Génie MIS Ecole Mohammedia d’Ingénieurs
M
X Cpu N
Pdirty = Dcoup(j) −Dval + Dcoup(M ) −Dval
j=i (1 + r) k(j) (1 + r) k(M )
Figure 3.4: Interface du Pricer dans le cas cas 2 : Date valorisation est après
la date du 1er coupon
40
Génie MIS Ecole Mohammedia d’Ingénieurs
Figure 3.5: Interface du Pricer dans le cas cas 2 : Date valorisation est avant
la date du 1er coupon
Dcoup(1) −Dem
Cpu1 = tf × N times k(1)
41
Génie MIS Ecole Mohammedia d’Ingénieurs
Cpu = tf × N
Dval −Dem
Ccu = tf × N × k
Où K=365, s’il n’ y a pas un 29 février entre Dcoup(i) et Dcoup(i−1) , sinon elle
vaut 366.
Par contre, si la date de valorisation est après la date du premier coupon
(figure 3.7), le coupon plein est exprimé alors par ce qui suit:
Cpu = tf × N
42
Génie MIS Ecole Mohammedia d’Ingénieurs
Dval −Dcoup(i−1)
Ccu = tf × N × k(i)
M
X Cpu N
Pdirty = Dcoup(j) −Dval + Dcoup(M ) −Dval
j=i (1 + r) k(j) (1 + r) k(M )
43
Génie MIS Ecole Mohammedia d’Ingénieurs
Cpu = tf × N
Le coupon couru est exprimé par la formule suivante:
44
Génie MIS Ecole Mohammedia d’Ingénieurs
N +Cp u
Pdirty = 1+r× M r
360
m
X Ci
Car le prix d’une obligation s’exprime comme suit: P =
i=1
(1 + tr )i
Avec:
- Ci est le ième coupon
- m est la maturité de l’obligation
- tr est le taux de rendement
45
Génie MIS Ecole Mohammedia d’Ingénieurs
On note que plus la duration d’une obligation est élevée plus son prix est
volatil, et donc sa détention est risquée car elle est plus sensible à une
variation de taux qu’une obligation qui a une duration moins
46
Génie MIS Ecole Mohammedia d’Ingénieurs
Avec:
- Rp : La rentabilité du portefeuille
- wi : Les proportions qui composent le portefeuille d’obligations.
- Ri : La rentabilité de l’ième obligation
47
Chapitre 4
Outils et techniques du
machine learning utilisés
48
Génie MIS Ecole Mohammedia d’Ingénieurs
données donnés. Les classes sont souvent appelées cibles, étiquettes (Labels)
ou catégories. La modélisation prédictive de la classification est la tâche
d’approximation de la fonction de cartographie des variables d’entrée aux
variables de sortie discrètes. L’objectif principal est d’identifier dans quelle
classe/catégorie les nouvelles données tomberont. Il existe deux grands types
de tâches de classification. Ce sont :
Tandis que la régression est l’un des types les plus courants de modèles de
Machine Learning, permet d’estimer les relations entre les variables. Alors
que les modèles de classification identifient la catégorie à laquelle appartient
une observation, les modèles de régression estiment une valeur numérique.
Dans le contexte du Machine Learning et de la Data Science, la régression fait
spécifiquement référence à l’estimation d’une variable dépendante continue ou
d’une réponse à partir d’une liste de variables d’entrée, ou de caractéristiques.
49
Génie MIS Ecole Mohammedia d’Ingénieurs
50
Génie MIS Ecole Mohammedia d’Ingénieurs
51
Génie MIS Ecole Mohammedia d’Ingénieurs
52
Génie MIS Ecole Mohammedia d’Ingénieurs
53
Génie MIS Ecole Mohammedia d’Ingénieurs
Arbre de décision: La méthode des arbres de décision est très facile à lire
et à interpréter. Elle illustre le fait que l’apprentissage automatique n’est
pas toujours synonyme de modèles statistiques mais il peut aussi cibler des
objets symboliques. Un arbre de décision se lit de la racine aux feuilles. Les
feuilles sont associées aux classes alors que les nœuds correspondent aux tests
54
Génie MIS Ecole Mohammedia d’Ingénieurs
sur les valeurs des attributs. La figure 4.6 illustrue un exemple d’un arbre
de décision.
55
Génie MIS Ecole Mohammedia d’Ingénieurs
Par la suite, nous allons se baser sur les métriques de performance pour
les deux types des modèles de l’apprentissage automatique - Régression et
Classification- afin de choisir le meilleur modèle pour chacun d’eux.
56
Génie MIS Ecole Mohammedia d’Ingénieurs
1
(ypred − ytrue )2
P
n
Avec :
-n: nombre d’échantillon.
-ypred : les valeurs prédites par le modèle de régression.
-ytrue : les valeurs réelles.
La racine de l’erreur quadratique moyenne (RMSE): La RMSE
est simplement la racine carrée du MSE. Elle représente l’erreur
quadratique moyenne dans les prédictions du modèle, exprimée dans la
même unité que la variable cible. La RMSE est généralement préférée
au MSE car elle est plus facile à interpréter.Elle est exprimée par :
√
RM SE = M SE
57
Génie MIS Ecole Mohammedia d’Ingénieurs
1
P
n
|ypred − ytrue |
)2
P
(y −y
R2 = 1 − P pred true 2
(ytrue −ymean )
58
Génie MIS Ecole Mohammedia d’Ingénieurs
V P +V N
Accuracy= V P +V N +F P +F N
F P +F N
Taux d’erreur = V P +V N +F P +F N
Sensibilité= V PV+F
P
N
VP
Précision = V P +F P
Conclusion
Dans ce chapitre, nous avons brièvement ce que c’est le Machine Learning et
quelles sont ses branches ainsi que les différentes techniques que nous allons
adopté pour réaliser ce projet de fin d’étude.
59
Chapitre 5
60
Génie MIS Ecole Mohammedia d’Ingénieurs
61
Génie MIS Ecole Mohammedia d’Ingénieurs
Dans cette partie, nous avons sélectionné les variables d’entrée et la variable à
prédire, on a également effectué la normalisation des données et la divison de
la BDD en base de donnée test et base de données d’entraı̂nement. En effet,
en Machine Learning, il ne faut jamais évaluer la performances d’un modèle
sur les mêmes données qui ont servi à son entraı̂nement. Car, si on entraı̂ne
un modèle avec des donnés d’entraı̂nement puis on évalue la performance de
modèle sur les mêmes données; l’algorithme va bien prédire la sortie puisqu’il
l’a déjà vu la sortie. En revanche, ce qui est plus intéressant c’est de tester
le modèle sur des données qu’il n’a jamais vu. Ainsi on aura une idée sur la
performance future. Pour cette raison, on divise notre échantillon en deux
parties: nous avons consacré 80% de notre échantillon pour l’entraı̂nement,
et les 20% restantes pour le test.
62
Génie MIS Ecole Mohammedia d’Ingénieurs
63
Génie MIS Ecole Mohammedia d’Ingénieurs
64
Génie MIS Ecole Mohammedia d’Ingénieurs
65
Génie MIS Ecole Mohammedia d’Ingénieurs
66
Génie MIS Ecole Mohammedia d’Ingénieurs
67
Génie MIS Ecole Mohammedia d’Ingénieurs
68
Génie MIS Ecole Mohammedia d’Ingénieurs
69
Génie MIS Ecole Mohammedia d’Ingénieurs
70
Génie MIS Ecole Mohammedia d’Ingénieurs
Nous remarquons que notre base de données est équilibrée par rapport au
nombre total des observations. On a en effet 736 observations pour le signal
d’achat et 723 observations pour le signal de vente.
Ensuite, nous allons suivre la même démarche de la base de données des
modèles de régression. On va séléctionner les variables représentant la ma-
turité, le coupon ainsi que le rendement comme étant des variables d’entrée,
et la variable ’Signal’ comme étant la variable à prédire. Ensuite nous allons
divisier cette BDD en 80 % d’entraı̂nement et 20% pour le test.
71
Génie MIS Ecole Mohammedia d’Ingénieurs
72
Génie MIS Ecole Mohammedia d’Ingénieurs
73
Génie MIS Ecole Mohammedia d’Ingénieurs
74
Génie MIS Ecole Mohammedia d’Ingénieurs
75
Génie MIS Ecole Mohammedia d’Ingénieurs
Conclusion
Dans ce chapitre, nous avons démontré les avantages des modèles de
régression et de classification en apprentissage automatique. Ces modèles
peuvent être bénéfiques dans la mesure où ils permettent de prédire la com-
position optimale d’un portefeuille obligataire et d’identifier les opportunités
de trading pour chaque obligation.
76
Conclusion
77
Bibliographie
[1] https://www.bkam.ma/
[2] https://www.ibm.com/cloud/learn/machine-learning
[3] https://www.jedha.co/formation-ia/arbre-de-decision-random-forest
[4] https://scikit-learn.org/stable/index.html
[5] https://www.soa.org/globalassets/assets/library/newsletters/risk-man-
agement-newsletter/2019/september/rm-2019-iss-45-fr-leiser-kerbeshian.pdf
[6] https://www.ammc.ma/
[7] https://www.math.univ-toulouse.fr/ pontier/statproc.pdf
78