Académique Documents
Professionnel Documents
Culture Documents
Dans la section suivante, les prix de clôture des actions de Bursa Malaysia sont
prédits à l'aide de diverses méthodes d'apprentissage automatique. Les techniques
de prévision classiques telles que la moyenne mobile et lissage exponentiel ne
sont pas prises en compte dans cette étude, car les prix des actions de Bursa
Malaysia pour la période 2020-2021 sont hautement volatils, dynamiques et
complexes. Les données historiques (du 2/1/2020 au 19/1/2021), téléchargées
depuis Yahoo Finance, sont collectées et trois modèles sont utilisés pour prédire
le prix de clôture de Bursa Malaysia. Les modèles sont l'Auto-Regressive
Integrated Moving Average (ARIMA), le Réseau Neuronal (NN) et le réseau de
mémoire à court et long terme (LSTM).
2. Dataset
2- Porte d'Entrée
La prochaine étape consiste à déterminer quelles nouvelles informations nous allons stocker
dans l'état de la cellule à partir de l'entrée actuelle. Il existe deux parties appelées 'couche de
la porte d'entrée' (input gate layer) et 'couche tanh'. La porte d'entrée est une autre couche
sigmoïde dont les sorties sont comprises entre 0 et 1 et qui décide des valeurs que nous allons
mettre à jour. La couche tanh va créer un vecteur de nouvelles valeurs candidates, Ct, qui sera
utilisé pour mettre à jour l'état de la cellule. Ces deux couches sont combinées pour créer une
mise à jour de l'état.
La prochaine étape consiste à mettre à jour l'ancien état de la cellule, Ct−1, en le remplaçant
par le nouvel état de la cellule, Ct.
3- Porte de Sortie
Pour décider quelles parties de l'état de la cellule nous allons extraire de la
mémoire, nous devons d'abord exécuter une couche sigmoïde, où la sortie sera
basée sur notre état de cellule. Ensuite, une couche tanh est utilisée pour placer
l'état de la cellule afin de pousser les valeurs entre -1 et 1, puis le multiplier par la
sortie de la porte sigmoïde.
Pour évaluer les performances de chaque modèle de prévision dans la prédiction du cours de
clôture de Bursa Malaysia, l'erreur quadratique moyenne (RMSE) et l'erreur de pourcentage
moyen absolu (MAPE) sont sélectionnées. L'équation de chaque indicateur est présentée :
Là où Yi représente les observations réelles, 𝑌̂𝑖 est la valeur prédite obtenue à partir du modèle
de prévision proposé, et N est le nombre de valeurs de prévision. Le modèle présentant le
RMSE et le MAPE les plus faibles sera choisi comme le meilleur modèle de prévision.
Pour vérifier l'adéquation des modèles ARIMA proposés, le test de Ljung-Box est appliqué pour
examiner l'autocorrélation des résidus. Par exemple, le modèle est adéquat si la valeur p du
test est supérieure à 𝛼 = 0,05. Le Tableau 1 montre les résultats des modèles de marche
aléatoire, de marche aléatoire avec dérive, ARIMA(1,1,1) et ARIMA(2,1,2) sur les données
d'entraînement et de test. Selon les résultats, ARIMA(2,1,2) est préféré car les valeurs RMSE et
MAPE sont les plus basses. Tous les modèles ARIMA sont adéquats car les valeurs p du test de
Ljung-Box sont supérieures à 0,05. Cependant, tous les modèles ont tendance à surajuster les
données en raison des valeurs élevées de RMSE et MAPE dans les données de test par rapport
aux données d'entraînement. Sur la figure 4, il est clairement montré que aucun des modèles
n'est capable de produire une bonne prévision sur les données de test car la prévision à k pas
suit exactement la dernière valeur de prévision (une ligne droite horizontale), sauf pour
ARIMA(2,1,2) qui parvient à produire une prévision suivant une ligne descendante.
Modèle LSTM
Des modèles LSTM avec deux et trois couches cachées sont utilisés pour la comparaison.
Par exemple, l'unité de chaque couche cachée dans les deux modèles LSTM est conçue
pour être de 100 et un neurone dans l'état de sortie. D'autres paramètres utilisés pour
construire les LSTM comprennent la fonction d'activation linéaire rectifiée (ReLU) et
l'algorithme d'optimisation Adam. Le Tableau 3 montre les résultats des modèles LSTM sur
les données d'entraînement et de test.
Conclusion
Dans cet article, deux modèles d'apprentissage automatique pour la prévision sont utilisés,
notamment ARIMA, et des modèles LSTM pour prédire les prix de clôture des actions de la
Bourse de Malaisie du 2 janvier 2020 au 19 janvier 2021. Cette période de temps est choisie
car c'était la période où le nombre de cas de COVID-19 a augmenté de manière spectaculaire
en Malaisie, déclenchant également des mouvements imprévisibles des prix des actions en
2020. Pour choisir le meilleur modèle d'apprentissage automatique, le MAPE (Erreur relative
moyenne absolue) et le RMSE (Erreur quadratique moyenne) sont sélectionnés. Parmi les deux
modèles, le modèle LSTM a la meilleure performance dans la prédiction des prix des actions
de la Bourse de Malaisie car il présente les valeurs les plus faibles de MAPE et de RMSE. Par
exemple, le modèle LSTM est capable de générer non seulement plus de 90 % de précision,
mais aussi d'expliquer les mouvements imprévisibles des prix des actions pendant cette
période de pandémie. À l'avenir, il est recommandé d'inclure des indicateurs financiers pour
améliorer la précision des prévisions, car ces indicateurs peuvent influencer les mouvements
des prix des actions. Il est également recommandé d'utiliser une analyse de sentiment avec le
modèle LSTM pour réaliser de meilleures prédictions.