Vous êtes sur la page 1sur 10

Prédiction des prix des

actions des boursiers en


Malaisie

Travaille réalisé par :

Souid Ghada Oueslati Chahinez


1. Introduction :
La maladie à coronavirus, ou COVID-19, est une maladie infectieuse qui a été
découverte pour la première fois à Wuhan, en Chine, en décembre 2019. La
maladie est devenue la maladie qui se propage le plus rapidement, et les
statistiques montrent que plus de deux millions de personnes sont décédées en
raison de la COVID-19. À ce jour, la Malaisie est actuellement classée au 29e
rang dans la liste des pays ayant le plus de cas de COVID-19 au cours d'une
période de deux semaines, selon les données de l'Université Johns Hopkins basée
aux États-Unis. La Malaisie a également enregistré le deuxième plus grand
nombre cumulatif de cas de COVID-19 par million d'habitants dans l'ASEAN.
Outre l'impact majeur sur la santé et la vie des gens, la crise a également eu un
impact significatif sur le marché financier mondial, y compris en Malaisie. Par
conséquent, comprendre l'impact de la COVID-19 sur les cours des actions est
devenu une question importante, et sa prédiction à l'aide d'une méthode appropriée
de séries temporelles est extrêmement cruciale. Par exemple, une prédiction
précise des cours des actions fournira aux investisseurs des informations utiles
pour la prise de décision et la maximisation de leurs profits.
La Bourse de Malaisie, Bursa Malaysia, précédemment connue sous le nom de
Bourse de Kuala Lumpur (KLSE), joue un rôle important en permettant la
négociation des titres malaisiens, y compris les services de compensation, de
négociation, de cotation et de règlement. Elle comprend les 30 plus grandes
sociétés cotées et représente environ 60 % de la Bourse de Malaisie, souvent
utilisée comme référence pour la performance globale du marché des actions
malaisiennes [5]. Le 26 mars 2020, Bursa Malaysia a annoncé des mesures de
soulagement supplémentaires visant un groupe plus large de participants sur le
marché des capitaux. Ces mesures sont conçues pour aider à alléger la charge
financière et fournir une plus grande flexibilité pour faire face à la période difficile
posée par la pandémie de COVID-19 [6].

Dans la section suivante, les prix de clôture des actions de Bursa Malaysia sont
prédits à l'aide de diverses méthodes d'apprentissage automatique. Les techniques
de prévision classiques telles que la moyenne mobile et lissage exponentiel ne
sont pas prises en compte dans cette étude, car les prix des actions de Bursa
Malaysia pour la période 2020-2021 sont hautement volatils, dynamiques et
complexes. Les données historiques (du 2/1/2020 au 19/1/2021), téléchargées
depuis Yahoo Finance, sont collectées et trois modèles sont utilisés pour prédire
le prix de clôture de Bursa Malaysia. Les modèles sont l'Auto-Regressive
Integrated Moving Average (ARIMA), le Réseau Neuronal (NN) et le réseau de
mémoire à court et long terme (LSTM).

2. Dataset

Dans cet article, des données historiques de trading, couvrant la


période du 2 janvier 2020 au 19 janvier 2021 pour les prix de clôture de la
Bourse de Malaisie (Bursa Malaysia), ont été utilisées. Les données
contiennent des informations commerciales sur le prix le plus haut, le prix
le plus bas, le prix d'ouverture, le prix de clôture, le prix de clôture ajusté
et le volume de transactions, mais seule la valeur du prix de clôture ajusté
a été utilisée dans cette étude. En se basant sur le graphique en série
temporelle des prix de clôture de la Bourse de Malaisie (Bursa Malaysia)
présenté dans la figure 2, la performance des prix des actions était stable
au début de l'année 2020, car le nombre de cas de COVID-19 en Malaisie
est resté faible [16]. À partir de mars 2020, le nombre de cas de COVID-
19 en Malaisie a fortement augmenté, ce qui a entraîné une tendance
significativement baissière des prix des actions en mars-avril 2020. Cette
chute spectaculaire du marché boursier est également due à la croissance
rapide des cas de COVID-19 dans le monde. Par la suite, le prix de clôture
du KLCI est revenu au niveau de 1600 en janvier 2021. *
3. Méthode
Pour évaluer les performances de chaque modèle de prévision, les données sont
divisées en deux parties : 70 % des données (du 1er février 2020 au 28 septembre
2020) sont utilisées pour entraîner et optimiser les paramètres des modèles, tandis
que les 30 % restants (du 29 septembre 2020 au 19 janvier 2021) sont utilisés pour
tester les performances des modèles sur un jeu de données "non vu". Deux
modèles de prévision sont appliqués dans cette étude : le modèle autorégressif
intégré à moyenne mobile (ARIMA), le modèle de mémoire à court et long terme
(LSTM).
a. Modèle autorégressif intégré à moyenne mobile (ARIMA)
Un modèle autorégressif intégré à moyenne mobile (ARIMA) est un modèle qui
utilise des données de séries temporelles pour effectuer des prédictions. Il est
caractérisé par 3 termes : p, d, q où p représente l'ordre du terme AR, q représente
l'ordre du terme MA et d représente l'ordre de la différenciation pour transformer
une série non stationnaire en série stationnaire. La méthodologie commence par
l'identification des modèles basés sur le comportement des graphiques
d'autocorrélation (ACF) et d'autocorrélation partielle (PACF). Une fois qu'un
modèle est spécifié, les paramètres du modèle sont estimés et un contrôle
diagnostique de l'adéquation du modèle est effectué en utilisant le test statistique
de Ljung-Box. Si le modèle est adéquat, il peut procéder à la prévision.
b. Réseau de Mémoire à Long Terme et Court Terme
Le réseau de mémoire à long terme et court terme (LSTM) est un type de réseau
de neurones récurrent capable d'apprendre les dépendances d'ordre dans les
problèmes de prédiction de séquences. Tous les réseaux de neurones récurrents
ont la forme d'une chaîne de modules répétitifs de réseau neuronal. Les LSTM ont
également cette structure en chaîne, mais le module répétitif a une structure
différente. Il existe quatre couches de réseaux de neurones interagissant comme
suit.
1-Porte d'Entrée

La première étape dans les LSTM consiste à déterminer ou contrôler les


informations que nous allons supprimer de l'état de la cellule ou de la mémoire.
Cela est décidé par la première couche sigmoïde appelée la "couche de porte
d'oubli".

2- Porte d'Entrée
La prochaine étape consiste à déterminer quelles nouvelles informations nous allons stocker
dans l'état de la cellule à partir de l'entrée actuelle. Il existe deux parties appelées 'couche de
la porte d'entrée' (input gate layer) et 'couche tanh'. La porte d'entrée est une autre couche
sigmoïde dont les sorties sont comprises entre 0 et 1 et qui décide des valeurs que nous allons
mettre à jour. La couche tanh va créer un vecteur de nouvelles valeurs candidates, Ct, qui sera
utilisé pour mettre à jour l'état de la cellule. Ces deux couches sont combinées pour créer une
mise à jour de l'état.

La prochaine étape consiste à mettre à jour l'ancien état de la cellule, Ct−1, en le remplaçant
par le nouvel état de la cellule, Ct.

3- Porte de Sortie
Pour décider quelles parties de l'état de la cellule nous allons extraire de la
mémoire, nous devons d'abord exécuter une couche sigmoïde, où la sortie sera
basée sur notre état de cellule. Ensuite, une couche tanh est utilisée pour placer
l'état de la cellule afin de pousser les valeurs entre -1 et 1, puis le multiplier par la
sortie de la porte sigmoïde.

Pour évaluer les performances de chaque modèle de prévision dans la prédiction du cours de
clôture de Bursa Malaysia, l'erreur quadratique moyenne (RMSE) et l'erreur de pourcentage
moyen absolu (MAPE) sont sélectionnées. L'équation de chaque indicateur est présentée :

Là où Yi représente les observations réelles, 𝑌̂𝑖 est la valeur prédite obtenue à partir du modèle
de prévision proposé, et N est le nombre de valeurs de prévision. Le modèle présentant le
RMSE et le MAPE les plus faibles sera choisi comme le meilleur modèle de prévision.

La Figure 3 montre les graphiques d'autocorrélation (ACF) et d'autocorrélation partielle (PACF)


pour les données d'entraînement après avoir effectué le premier différenciement non
saisonnier (I(1)). En se basant sur le comportement des graphiques ACF et PACF, des modèles
de marche aléatoire et de marche aléatoire avec dérive sont proposés étant donné la présence
d'un phénomène de processus de bruit blanc dans les deux graphiques. De plus, les modèles
ARIMA(1,1,1) et ARIMA(2,1,2) sont également proposés puisqu'un phénomène de décroissance
exponentielle avec une onde sinusoïdale est observé dans les deux graphiques."

Pour vérifier l'adéquation des modèles ARIMA proposés, le test de Ljung-Box est appliqué pour
examiner l'autocorrélation des résidus. Par exemple, le modèle est adéquat si la valeur p du
test est supérieure à 𝛼 = 0,05. Le Tableau 1 montre les résultats des modèles de marche
aléatoire, de marche aléatoire avec dérive, ARIMA(1,1,1) et ARIMA(2,1,2) sur les données
d'entraînement et de test. Selon les résultats, ARIMA(2,1,2) est préféré car les valeurs RMSE et
MAPE sont les plus basses. Tous les modèles ARIMA sont adéquats car les valeurs p du test de
Ljung-Box sont supérieures à 0,05. Cependant, tous les modèles ont tendance à surajuster les
données en raison des valeurs élevées de RMSE et MAPE dans les données de test par rapport
aux données d'entraînement. Sur la figure 4, il est clairement montré que aucun des modèles
n'est capable de produire une bonne prévision sur les données de test car la prévision à k pas
suit exactement la dernière valeur de prévision (une ligne droite horizontale), sauf pour
ARIMA(2,1,2) qui parvient à produire une prévision suivant une ligne descendante.

Modèle LSTM
Des modèles LSTM avec deux et trois couches cachées sont utilisés pour la comparaison.
Par exemple, l'unité de chaque couche cachée dans les deux modèles LSTM est conçue
pour être de 100 et un neurone dans l'état de sortie. D'autres paramètres utilisés pour
construire les LSTM comprennent la fonction d'activation linéaire rectifiée (ReLU) et
l'algorithme d'optimisation Adam. Le Tableau 3 montre les résultats des modèles LSTM sur
les données d'entraînement et de test.
Conclusion
Dans cet article, deux modèles d'apprentissage automatique pour la prévision sont utilisés,
notamment ARIMA, et des modèles LSTM pour prédire les prix de clôture des actions de la
Bourse de Malaisie du 2 janvier 2020 au 19 janvier 2021. Cette période de temps est choisie
car c'était la période où le nombre de cas de COVID-19 a augmenté de manière spectaculaire
en Malaisie, déclenchant également des mouvements imprévisibles des prix des actions en
2020. Pour choisir le meilleur modèle d'apprentissage automatique, le MAPE (Erreur relative
moyenne absolue) et le RMSE (Erreur quadratique moyenne) sont sélectionnés. Parmi les deux
modèles, le modèle LSTM a la meilleure performance dans la prédiction des prix des actions
de la Bourse de Malaisie car il présente les valeurs les plus faibles de MAPE et de RMSE. Par
exemple, le modèle LSTM est capable de générer non seulement plus de 90 % de précision,
mais aussi d'expliquer les mouvements imprévisibles des prix des actions pendant cette
période de pandémie. À l'avenir, il est recommandé d'inclure des indicateurs financiers pour
améliorer la précision des prévisions, car ces indicateurs peuvent influencer les mouvements
des prix des actions. Il est également recommandé d'utiliser une analyse de sentiment avec le
modèle LSTM pour réaliser de meilleures prédictions.

Vous aimerez peut-être aussi