Vous êtes sur la page 1sur 106

Analyse des signaux EEG pour la détection automatique

des crises d’épilepsie par des méthodes paramétriques


Mahamat Ali Issaka

To cite this version:


Mahamat Ali Issaka. Analyse des signaux EEG pour la détection automatique des crises d’épilepsie
par des méthodes paramétriques. Applications [stat.AP]. Université Gaston Berger, 2016. Français.
�NNT : �. �tel-01504058�

HAL Id: tel-01504058


https://hal.archives-ouvertes.fr/tel-01504058
Submitted on 8 Apr 2017

HAL is a multi-disciplinary open access L’archive ouverte pluridisciplinaire HAL, est


archive for the deposit and dissemination of sci- destinée au dépôt et à la diffusion de documents
entific research documents, whether they are pub- scientifiques de niveau recherche, publiés ou non,
lished or not. The documents may come from émanant des établissements d’enseignement et de
teaching and research institutions in France or recherche français ou étrangers, des laboratoires
abroad, or from public or private research centers. publics ou privés.
UNIVERSITÉ GASTON BERGER DE SAINT-LOUIS
U.F.R DES SCIENCES APPLIQUÉES ET TECHNOLOGIES

Ecole Doctorale des Sciences et des Technologies

THÈSE
Pour l’obtention du grade de
DOCTEUR DE L’UNIVERSITÉ GASTON BERGER

Discipline : Mathématiques Appliquées


Spécialité : Statistique

Présentée par

Mahamat Ali Issaka

Analyse des signaux EEG pour la détection


automatique des crises d’épilepsie par des méthodes
paramétriques

Soutenue publiquement le 29 novembre 2016 devant le jury :

Pr. Youri KOUTOYANTS Professeur Titulaire, Université du Maine, France Président


Pr. Ali Souleymane DABYE Professeur Titulaire, Université Gaston Berger, Sénégal Directeur
Pr. Lamine GUEYE Professeur Titulaire, Centre Hospitalier Universitaire de Fann, Sénégal Co-encadreur
Pr. Ahmadou ALIOUM Professeur Titulaire, Université de Bordeaux, France Rapporteur
Pr. Serguei DACHIAN Professeur Titulaire, Université de Lille 1, France Rapporteur
Pr. Papa NGOM Maı̂tre de Conférences, Université Cheikh Anta Diop de Dakar, Sénégal Rapporteur
Pr. Aliou DIOP Professeur Titulaire, Université Gaston Berger, Sénégal Examinateur
Pr. Koina RODOUMTA Maı̂tre de Conférences, Université de N’Djamena, Tchad Examinateur
i

Dédicace

A toi mon très cher Oncle Mahadjir,


Qu’ALLAH t’accueille dans le paradis d’alfirdos

A tous les enfants du Tchad


ii

Remerciements

Je tiens à rendre grâce à notre Seigneur, le Tout Puissant et l’Unique digne d’adora-
tion pour tous ses bienfaits.

Je tiens à remercier plus que chaleureusement mon directeur de thèse, Professeur


Ali Souleyman Dabye de m’avoir donné l’occasion de travailler sur ce sujet captivant et
transversal. Sa disponibilité, ses conseils et son humanisme m’ont été très utile durant
ces années de thèse. Merci infiniment.

Je tiens également à exprimer toute ma gratitude à Professeur Youri Koutoyants qui


m’a accueilli durant mes deux séjours de recherche en France dans le Laboratoire Manceau
des Mathématiques. Ses précieux conseils, sa disponibilité et sa rigueur dans le domaine
de la statistique et des mathématiques ont été très déterminantes pour l’aboutissement
de cette thèse.

J’adresse mes sincères remerciements aux membres du jury pour l’acceptation de


l’évaluation de mes travaux malgré leur charge. J’exprime ma gratitude aux rapporteurs
Professeur Ahmadou ALIOUM (Université de Bordeaux), Professeur Serguei Dachian
(Université de Lille 1) et Professeur Papa Ngom (Université Cheikh Anta Diop) pour les
critiques et remarques constructives.Je voudrais remercier Pr Aliou DIOP de l’UGB qui
est examinateur pour les remarques de fond et de formes très intéressantes. Aussi, je suis
très reconnaissant envers mon compatriote Pr Koina RODOUMTA pour avoir pris le soin
d’examiner cette thèse.

Mes remerciements s’adressent aussi à Professeur Lamine Gueye pour son encadre-
ment très précieux dans le domaine médical. Je me sens obligé de rappeler que, c’est lui
qui m’a motivé de travailler sur ce domaine suite à mon stage de D.E.A sous sa direction
dans le service de neurologie du Centre Hospitalier Universitaire de Dakar. Merci pour
tout.
iii

Toute ma reconnaissance au Ministère de l’Enseignement Supérieur et de la Recherche


Scientifique, et à l’Agence Universitaire de la Francophonie pour le financement de mes
séjours de recherche au Sénégal et en France dans le cadre de cette thèse. Je voudrai
exprimer toute ma gratitude envers Pr Claude Lishou qui, à travers le projet Horizons
Francophone ’Mathématiques et Informatique’ de l’AUF n’a ménagé aucun effort pour la
formation au niveau doctoral des enseignants et chercheurs partout en Afrique.

Aussi, mes remerciements les plus chaleureux vont à ma tendre mère, mon père, mes
chers parents maternels et mon épouse qui m’ont toujours encouragé à aller de l’avant,
chacun à sa manière. Enfin, mes remerciements et ma pensée à mon très cher Oncle
Mahadjir qui a toujours cru en moi, et qui nous as laissé orphelins pendant que nous
avions besoin de ses conseils et de sa présence. Le Tout Puissant en a décidé ainsi, qu’Il
t’accueille dans le paradis le plus élevé. Toute ma gratitude à mon complice et grand frère
Hamit Ali pour ses conseils sages et ses encouragements dans mes projets.
Mes remerciements à tous mes amis et frères de la France, du Sénégal et du Tchad pour
les encouragements durant ces années de thèse.
iv

Résumé

Le cadre scientifique de cette thèse est la modélisation des signaux électrophysiolo-


giques par des outils modernes de la statistique et des mathématiques pour une bonne
prise en charge des patients. Par conséquent, nous avons proposé dans une première ap-
proche, une détection de rupture multiple en amplitude de l’évolution temporelle par un
modèle basé sur la dispersion des valeurs maximales théoriques et locales compte tenue
de la moyenne mobile, de la variance et de l’écart-type des dérivations EEG.
Les résultats ainsi que l’évaluation de ce modèle sur des données réelles et simulées
confirment bien les interprétations des neurologues.
Par la suite, nous considérons une approche spectrale d’un modèle autorégressif AR per-
mettant de discriminer les signaux EEG des patients épileptiques et normaux dans le
domaine fréquentiel. Il a été prouvé que ce modèle caractérise bien les signaux EEG sui-
vant la bande de fréquence rythmique (delta, thêta, alpha,..).
Ces deux modèles proposés dans le cadre de cette thèse contribuent de manière efficiente
à une amélioration sur l’aspect interprétation médicale de la plateforme du signal EEG
par la localisation précise de la zone épileptogene.
Les études de simulations ont été effectuées avec le logiciel « R ».

Mots clés : détection de rupture, estimation des paramètres, test d’hypo-


thèse, maximum, moyenne mobile, modèle autorégressif (AR), analyse spec-
trale, EEG, épilepsie.
v

Abstract

The scientific framework of this thesis is the modeling of electrophysiologicals signals by


modern tools of statistics and mathematics for a better care of patients. Therefore, we
proposed in the first approach, a multiple change-point detection in amplitude of the
temporal evolution by a model based on the dispersion of local maximum value accor-
ding to the moving average, the variance and the standard deviation of EEG derivations.
The results and evaluation of this model on real and simulated data confirm clearly the
interpretations of neurologists. Subsequently, we consider a spectral approach of an auto-
regressive AR model in order to discriminate the EEG of epileptic patients and normal at
the frequency domain. It has been proven that this model characterizes the EEG signals
following the rhythmic frequency band (delta, theta, alpha, ..).
These two models proposed in the framework of this thesis contribute to an improvement
of the platform of the EEG signal by the localization of the epileptogenic area.
The simulation studies were performed with the software R.

Keywords : change point, hypothesis testing, maxima, moving average,


parameter estimation, spectral analysis, autoregressive model, electroence-
phalography (EEG), epilepsy.
Table des matières i

Table des matières

Dédicace i

Remerciements ii

Résumé iv

Abstract v

Notations 1

1 Introduction 2
1.1 Contexte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2 Anatomie et symptôme de l’épilepsie . . . . . . . . . . . . . . . . . . . . 3
1.2.1 Données cliniques . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2.2 Classification des épilepsies . . . . . . . . . . . . . . . . . . . . . 4
1.2.3 Données anatomiques et fonctionnelles . . . . . . . . . . . . . . . 5
1.2.4 Données electrophysiologiques . . . . . . . . . . . . . . . . . . . . 6
1.2.5 Méthode d’acquisition des données . . . . . . . . . . . . . . . . . 8
1.3 État de l’art sur le sujet . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.4 Problématique de la thèse . . . . . . . . . . . . . . . . . . . . . . . . . . 13
1.5 Contribution de la thèse . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.6 Organisation de la thèse . . . . . . . . . . . . . . . . . . . . . . . . . . . 15

2 Détection automatique des crises d’épilepsie par extraction statistique 17


2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.2 Extraction des caractéristiques statistiques par une fenêtre mobile . . . . 19
2.2.1 Caractérisation par une moyenne mobile entre les observations . . 19
2.2.2 Caractérisation par la variance . . . . . . . . . . . . . . . . . . . . 23
2.2.3 Caractérisation par l’écart-type . . . . . . . . . . . . . . . . . . . 25
2.2.4 Commentaire sur la moyenne, la variance et l’écart-type . . . . . 26
2.3 Critère de détection . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
2.3.1 Formalisation du critère . . . . . . . . . . . . . . . . . . . . . . . 26
2.3.2 Segmentation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.3.3 Formalisation statistique en test d’hypothèse . . . . . . . . . . . . 27
Table des matières ii

2.3.4 Estimation des paramètres du critère . . . . . . . . . . . . . . . . 28


2.4 Résultats sur des données simulées et celles de l’EEG . . . . . . . . . . . 31
2.4.1 Résultats sur des données simulées . . . . . . . . . . . . . . . . . 31
2.4.2 Résultats sur des données réelles du signal EEG . . . . . . . . . . 33
2.4.3 Évaluation du critère de rupture proposé . . . . . . . . . . . . . . 38
2.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

3 Aperçu sur les séries chronologiques 41


3.1 Quelques concepts de base . . . . . . . . . . . . . . . . . . . . . . . . . . 41
3.1.1 Processus stochastique . . . . . . . . . . . . . . . . . . . . . . . . 41
3.1.2 Propriétés statistiques du processus . . . . . . . . . . . . . . . . . 42
3.1.3 Stationnarité . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
3.1.4 Fonction d’autocovariance et d’autocorrélation . . . . . . . . . . . 43
3.1.5 Fonction d’autocovariance et d’autocorrélation empirique . . . . . 44
3.2 Sur les processus autorégressifs et leurs propriétés usuelles . . . . . . . . 46
3.2.1 Densité spectrale des processus . . . . . . . . . . . . . . . . . . . 54

4 Détection par une approche basée sur la moyenne de la densité spectrale


de puissance du signal EEG 59
4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
4.2 Approche spectrale de la détection proposée . . . . . . . . . . . . . . . . 61
4.2.1 Estimation des paramètres par le maximum de vraisemblance . . 62
4.2.2 Estimation par la moyenne quadratique . . . . . . . . . . . . . . . 65
4.2.3 Estimation des paramètres par la méthode de Yule-Walker . . . . 67
4.2.4 Estimation des paramètres par la méthode de Burg . . . . . . . . 68
4.2.5 Critère de selection de l’ordre optimal du modèle . . . . . . . . . 69
4.3 Application du modèle et présentation des résultats . . . . . . . . . . . . 70
4.3.1 Sélection de l’ordre optimal . . . . . . . . . . . . . . . . . . . . . 70
4.3.2 Résultats sur des données EEG réelles . . . . . . . . . . . . . . . 71
4.3.3 Évaluation du modèle de détection proposée . . . . . . . . . . . . 78
4.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 80

5 Conclusion et perspectives 81

6 Annexe 83

Bibliographie 94
1

Notations

Notations générales Signification


EEG Électroencéphalogramme
DSP Densité Spectrale de Puissance
AR Autoregressive model
IRM Imagerie par Résonance Magnétique
IRMf Imagerie par Résonance Magnétique fonctionnelle
CUSUM Cumulative Sum
FFT Fast Fourier Transform
AIC Akaike Information Criterion
BIC Bayesian Information Criterion
EMV Estimateur du Maximum de Vraisemblance
CHU Centre Hospitalier Universitaire
ARMA Autoregressive Moving Average

Notations mathématiques Signification


R Ensemble des réels et Rd = R × ... × R, d fois, d ∈ N∗
N Ensemble des entiers naturels
N∗ Ensemble des entiers naturels non nuls
Z Ensemble des entiers relatifs
|x| valeur absolue de la variable x
P(A) Probabilité de l’événement A
E(X) Espérance mathématique de la variable X
1X Fonction indicatrice de la variable X
max(X) Maximum de la variable X
N (0, 1) Loi normale centrée réduite
N (µ, σ 2 ) Loi normale de moyenne µ et de variance σ 2
2

Chapitre 1

Introduction

1.1 Contexte
Dans ce travail, nous allons aborder l’essor de la statistique et des outils mathéma-
tiques pour une meilleure contribution à l’interprétation des signaux electrophysiologiques
pour la détection des crises d’épilepsie chez des patients épileptiques. Cependant, nous
allons préciser les motivations initiales dans le cadre de cette thèse.
L’épilepsie est une trouble neurologique chronique et complexe qui se caractérise par des
crises qui peuvent durer de quelque secondes à une minute. Presque 1% de la population
de par le monde souffre de l’épilepsie et la plupart ne sont pas prise en charge sur l’aspect
médical.
Littéralement, le mot épilepsie vient du grec epilêpsia qui désigne une attaque subite, un
arrêt soudain, mais l’origine était connue des égyptiens avant même le premier traité sur
l’épilepsie attribué à Hippocrate.
Depuis longtemps, cette pathologie a été considérée comme une maladie démoniaque em-
pêchant ainsi toute progression scientifique. Les préjugés négatifs qui entourent la maladie
sont des obstacles à la bonne prise en charge des malades, leur épanouissement et leur
intégration sociale.
Par la suite, c’est au début du dix-huitième siècle que Tissot avait abordé cette maladie
sous une approche scientifique dans un traité d’épilepsie en 1770.
Puis, vers la fin du 18 ème siècle, l’avancée technologique dans le domaine médical a
contribuée à la compréhension de cette maladie de manière objective.
Dans cette ère moderne, l’invention qui a le plus marqué la compréhension et l’interpré-
tation de l’épilepsie est celle de Hans Berger en 1924. En effet, ce dernier a mis en place
un appareil dénommé électroencéphalographie (EEG) qui permet de recueillir l’activité
électrique du cerveau en surface avec un appui des outils de la physique moderne. L’acqui-
sition de l’activité cérébrale par l’EEG est recueillie grâce à des petites électrodes placées
sur le cuir chevelu.
En effet, l’EEG fournit des informations sur l’activité électrique générée par les cellules
nerveuse du cortex cérébral en temps réel et avec une excellente résolution temporelle de
1.2. Anatomie et symptôme de l’épilepsie 3

l’ordre de la dizaine de millisecondes.


Depuis, la maladie n’a cessé d’être l’objet de recherches dans tous les domaines, aussi
bien médicaux que dans le domaine de la statistique et des mathématiques. Cela a per-
mis d’améliorer les traitements proposés aux patients grâce à l’essor des technologies de
l’information en statistique d’une part et de la pharmacologie et de la neurochirurgie
d’autre part. Les nouvelles découvertes technologiques ainsi que l’amélioration des mé-
thodes d’imagerie ont perfectionnée le diagnostic.

1.2 Anatomie et symptôme de l’épilepsie


Pour le diagnostic de cette pathologie, un ensemble d’examens seront effectués afin de
déterminer le plus précisément possible, la zone cérébrale responsable du déclenchement
des crises d’épilepsie. Cet ensemble comporte des données cliniques, des données anato-
miques et enfin des données electrophysiologiques. Pour confirmation, un examen d’EEG
sera effectué et dans un cas plus complexe un IRM viendra en appui.

1.2.1 Données cliniques


Les données cliniques sont les premières informations recueillies lorsqu’un patient se
présente pour se faire consulter dans un service. Elles regroupent les résultats d’un en-
semble de tests et de questions permettant de donner rapidement des pistes sur le type
d’épilepsie ou de privilégier certains axes de recherche des causes de la maladie. On peut
distinguer 4 catégories [24]:
– L’historique de la maladie du patient : Le neurologue essaie, en interrogeant
le patient et sa famille, de déterminer les origines éventuelles de la maladie (âge
d’apparition des premiers symptômes, chutes, traumatismes crâniens, antécédents
familiaux, etc...),
– La sémiologie d’une crise type: Le patient et son entourage tentent de décrire le
déroulement des crises (spasmes, absences, chutes, convulsions, ...). Cette sémiologie
sera à nouveau décrite par les neurologues lors de l’hospitalisation en EEG-vidéo,
afin de l’affiner. La manière dont se déroulent les crises permet dans bien des cas
de donner une approximation de la localisation du foyer épileptogène,
– L’examen neurologique: Il consiste en une batterie de tests qui servent à détermi-
ner les déficits éventuels dans les fonctions neurologiques du patient. Les fonctions
1.2. Anatomie et symptôme de l’épilepsie 4

testées sont principalement les fonctions motrices et sensorielles,


– L’examen neuropsychologique: Celui-ci est indissociable de l’examen neurolo-
gique. Il est axé sur le test des fonctions supérieures (langage, capacités visuelles et
spatiales, fonctions exécutives et principalement mémoire). Des déficits dans l’une
ou l’autre de ces fonctions permettent d’émettre un diagnostic quant à la zone
hémisphérique dans laquelle se situe le siège des crises.

1.2.2 Classification des épilepsies


Sur le plan physiologique, l’épilepsie correspond à une activité électrique anormale
dans des groupes de neurones. Tout d’abord, de manière discrète (absence de signes cli-
niques) et en dehors des crises, on peut remarquer dans des enregistrements EEG de
surface ou de profondeur, des activités transitoires pointues, appelées pointes ou pointes
ondes en raison de leurs morphologies, et qui peuvent se détacher plus ou moins nettement
de l’activité de fond. Ce qui est caractéristique d’un EEG normal. La figure 1.3 illustre
parfaitement un cas d’EEG normal d’un patient.
Ensuite, à l’approche des crises, en leur début, et durant leur déroulement, on peut fré-
quemment observer des activités paroxystiques telles que des paquets de pointes, des acti-
vités anormalement rapides, des oscillations de grande amplitude. La figure 1.2 montre un
exemple d’activité typiquement observée. Se référant par exemple à des enregistrements
EEG de profondeur qui capturent les activités électriques avec une bien meilleure résolu-
tion spatiale qu’en surface, il est possible d’observer simultanément un grand nombre de
sites. On peut alors constater dans de nombreux cas qu’au début d’une crise les activi-
tés critiques apparaissent d’abord sur certains sites, donc au sein de groupes neuronaux
inclus dans certaines structures, pour ensuite se propager à d?autres structures, voire à
l’ensemble du cerveau. Ce type de scénario correspond à celui des épilepsies dites par-
tielles : il existe un réseau initial de groupes neuronaux sur lequel la crise s’initie avant
de se propager plus largement. C’est ce réseau qui est appelé réseau épileptogène.
1.2. Anatomie et symptôme de l’épilepsie 5

Figure 1.1 – Évolution du signal EEG en fonction de l’état du cerveau du patient

Les épilepsies partielles peuvent elles-mêmes être classées suivant la localisation de la


région initiatrice : épilepsies temporales, épilepsies centrales, frontales, etc.
D’autres épilepsies sont dites généralisées car on y constate au début de chaque crise
une activité paroxystique qui s’installe pratiquement sans délai dans toutes les régions
cérébrales. Ces crises ne sont d’ailleurs généralement pas enregistrées en profondeur car
leur absence de structuration spatio-temporelle peut être constatée au moyen des seuls si-
gnaux de surface, ce qui constitue une contre-indication à une analyse plus fine au moyen
d’électrodes.
Donc en bref, nous avons deux principales types d’épilepsies qui sont les épilepsies par-
tielles les plus fréquentes et les épilepsies généralisées.

1.2.3 Données anatomiques et fonctionnelles


Les données anatomiques permettent de mettre en évidence l’existence ou non de
structures cérébrales endommagées et donc de connaı̂tre le foyer lésionnel susceptible de
générer les crises d’épilepsie. Ces données sont enregistrées grâce à plusieurs modalités
1.2. Anatomie et symptôme de l’épilepsie 6

d’imagerie cérébrale telles que les images radiologiques, les scanners ou encore les Imagerie
par Résonance Magnétique(IRM). Grâce aux progrès faits dans le domaine de l’imagerie
encéphalite ces dernières années, il est aujourd’hui possible d’enregistrer les zones de
fonctionnement de certaines parties du cerveau grâce à l’IRMf.

1.2.4 Données electrophysiologiques


Ce processus sera effectué par l’électroencéphalographie qui est l’examen clinique non
invasif, permettant d’apprécier l’activité électrique corticale. L’enregistrement des don-
nées électroencéphalographiques est l’unique moyen de mise en évidence de l’activité
épileptique. En effet, l’EEG permet d’enregistrer de manière directe l’activité électrique
produite au niveau le plus élémentaire par les neurones. Contrairement aux autres tech-
niques d’enregistrement, l’EEG fournit des informations en temps réel et avec une excel-
lente résolution temporelle de l’ordre de la dizaine de millisecondes (voir figure 1.2). Cet
examen est incontournable pour le diagnostic et la classification des épilepsies.

Physiologiquement, quatre types d’ondes sont présents :


– Le rythme δ, caractéristique du sommeil lent d’amplitude importante (> 30µV )
mais de basse fréquence (< 4Hz)
– Le rythme θ, de 4 à 7 Hz, et d’amplitude de 20µV , présent lors des états de veille
et de sommeil paradoxal
– le rythme α de 8 à 13 Hz et d’amplitude moyenne de 50µV : il correspond à une
veille calme
– le rythme β de fréquence plus élevée (entre 14 et 30 Hz) mais d’amplitude moindre
(< 20µV ), c’est un état de veille active ou de sommeil paradoxal
1.2. Anatomie et symptôme de l’épilepsie 7

Figure 1.2 – Tracé original d’un patient souffrant d’une crise postérieure (P4O2)
1.2. Anatomie et symptôme de l’épilepsie 8

Figure 1.3 – Tracé original d’un patient présentant une activité normale

1.2.5 Méthode d’acquisition des données


Les données utilisées dans cette étude ont été collectée par les infirmiers et techniciens
du Centre Hospitalier Universitaire de Fann à Dakar au Sénégal. Les sujets considérés
sont les patients internes et externes consultés au service de neurologie.
Par ailleurs, les signaux EEG appartiennent à un échantillon de 10 patients âgée entre 15
et 59 ans dont 6 femmes et 4 hommes.
Il s’agit de l’enregistrement de l’activité électrique du cerveau sur l’appareil électroencé-
phalogramme en plaçant des électrodes sur le cuir chevelu des patients. L’enregistrement
se fait en plusieurs étapes (sommeil, veille avec ou sans surveillance vidéo) et à plusieurs
fréquences. Le placement des électrodes se fait de manière très pragmatique en indiquant
à base des chiffres les différentes parties de la tête du patient comme indiqué sur la figure
1.4. En fait, les lettres contenant les chiffres pairs concernent les électrodes placées sur
la partie droite par exemple F8F4, T4C4 ainsi de suite et ceux ayant les chiffres impairs
(F3F7, C3T3) constituent les électrodes de la partie gauche du cerveau. La différence est
également faite à la partie centrale de la tête.
1.2. Anatomie et symptôme de l’épilepsie 9

Figure 1.4 – Fonctionnement de l’EEG

Une fois les électrodes placées sur le cuir chevelu du patient, le dispositif ainsi que l’ap-
pareil génère les données ayant permis la représentation sous forme de signal de chacune
des parties du cerveau comme énoncé ci-dessous.
1.2. Anatomie et symptôme de l’épilepsie 10

Figure 1.5 – Génération des données EEG


1.3. État de l’art sur le sujet 11

Patient Sexe Age Type de Crise Durée de l’examen (en minutes)


1 M 20 Épilepsie partielle 20
2 M 15 Épilepsie partielle 55
3 M 15 Épilepsie partielle (EPCT) 60
4 F 59 Épilepsie partielle 22
5 M 30 Épilepsie partielle 23
6 F 32 Épilepsie partielle 20
7 F 18 Épilepsie généralisée 20
8 F 16 Épilepsie partielle 21
9 F 18 Épilepsie partielle 40
10 F 19 Épilepsie partielle 60

Table 1.1 – Répartition des patients

1.3 État de l’art sur le sujet


Depuis l’invention de l’EEG par Hans Berger, l’acquisition et le traitement des données
électrophysiologiques a été l’objet d’exploration dans de nombreuses études et branche
de la statistique.
Parmi les premiers travaux dans le domaine de la détection de rupture, nous pouvons
mentionner le test de Girshick-Rubin et la carte de contrôle de Shewhart [20, 41], et la
détection par la somme cumulative de Page [28, 29]. Quant à la détection de rupture à
posteriori, une première approche de Page consistait à l’application du ratio du maximum
de vraisemblance avec un test d’hypothèse sur le changement de rupture.
La littérature sur la détection de rupture est très vaste: le livre de référence de Basse-
ville et Nikiforov [8] considère la détection de rupture comme des changements brusques,
Brodsky et Darkhovsky [10] ont traité la détection de rupture par des méthodes non
paramétriques, Chen et Gupta [18] ont utilisé les propriétés des paramètres statistiques
pour détecter la rupture.
Il existe différentes méthodes proposées pour détecter la rupture. Nous avons la méthode
de segmentation par le plus proche voisin proposée par Auger et Lawrence [7]. Un algo-
rithme de programmation dynamique alternative a été proposé par l’approche optimale
de partitionnement de Jackson et al. [16].
Nous pouvons citer aussi la segmentation binaire proposée par Scott et Knott [40], qui
est sans doute la méthode de détection de rupture la plus utilisée.
1.3. État de l’art sur le sujet 12

Parmi les récents défis dans ce domaine, nous avons la détection de rupture appelée dans la
littérature anglo-saxonne change point par les propriétés statistiques (moyenne, variance,
statistique de test) ainsi que l’analyse des signaux EEG dans le domaine fréquentiel et
temporel. Particulièrement, il a été question de la détection rétrospective de la crise après
acquisition des données, de la détection en ligne et voire même la prévision de la crise
d’épilepsie.

Comme article de revue, nous avons le premier travail remarquable de Sen A. et


Srivastava M.S. [3] qui aborde le problème par des tests pour détecter les changements
dans la moyenne des observations. S’agissant des travaux qui ont traité la détection de
changement dans le signal EEG, nous avons Boris E. Brodsky et al. [9] qui a proposé
une nouvelle méthode de segmentation de l’EEG basée sur une analyse statistique non
paramétrique.

Dans une deuxième approche, nous aborderons l’analyse des signaux EEG par une ap-
proche de détection fréquentielle avec l’appui des modèles autoregressifs (abrégé AR) en
série chronologique en calculant la densité spectrale de puissance du processus considéré.
Historiquement, c’est par la publication des travaux pionniers de Slutsky [39] et Yule [46]
qu’est née la modélisation par autoregression des processus. Après ces deux articles, de
nombreux autres auteurs ont travaillé sur ce domaine de la statistique mathématique.
Comme article de revue, et surtout les travaux qui ont traité le modèle AR par l’analyse
du signal EEG et parmi les travaux les plus récents, on peut citer Wang T.W., Guohui W.
et Huanqing F. [42]. Nous avons également le premier travail remarquable de J. Wright,
Kydd R. et Sergejew A. [44] qui considère les propriétés des paramètres (fréquences na-
turelles et amortissement des coefficients) obtenus à partir d’une analyse autorégressive
segment par segment des ECoG de rat. Maintenant, en ce qui concerne les auteurs qui
ont travaillé sur l’estimation de la densité spectrale puissance des signaux EEG par les
méthodes AR, nous avons Abdulhamit Subasi [4] qui a proposé une étude comparative
sur la base des méthodes AR et la puissance spectrale de l’EEG afin d’analyser et de
caractériser les décharges épileptiformes sous forme de pointes et d’ondes complexes de 3
Hz chez les patients souffrant de crises d’absence.
Nous avons egalement O. Faust, R.U. Acharya, A.R. Allen et C.M. Lin [27] qui ont pro-
posé une étude comparative basée aussi sur la puissance spectrale obtenue à partir des
signaux EEG des patients normaux, épileptiques et alcoolisés. Les spectres de la densité
de probabilité ont été calculé en utilisant la transformée de Fourier rapide (FFT) par la
méthode de Welch et par un modèle autorégressif (AR) avec la méthode de Yule-Walker
1.4. Problématique de la thèse 13

et la méthode de Burg.

1.4 Problématique de la thèse


De manière générale, la motivation la plus préoccupante dans le cadre de ce travail
est basée beaucoup plus sur l’acquisition et l’analyse des données par les outils modernes
de la statistique et des mathématiques.
En effet, il est évident que l’EEG ne fournit pas les informations sur les figures physio-
logiques et leur fréquence, ainsi que les éléments aigus en foyer. L’EEG renseigne essen-
tiellement sur l’amplitude, la continuité et le temps d’enregistrement. A cela, il faudra
ajouter le fait que les crises peuvent être surestimées lors des mouvements du patient
entrainant ainsi des artefacts musculaires.
La plupart des travaux en statistique et en mathématiques qui ont traité ce sujet de
recherche se basent beaucoup plus sur l’extraction des propriétés statistiques, l’analyse
dans le domaine fréquentiel et temporel de manière séparée.
Nous avons les travaux de Sen A., Srivastava M.S. [3] et Chen, Gupta [18] qui traitent
respectivement de la détection par la moyenne des observations, par la moyenne et la
variance, et par une technique de discrimination par groupe.

Toutefois, compte tenu du temps d’enregistrement du signal EEG des patients qui
varie de vingt (20) minutes à une heure, une analyse sur le comportement des propriétés
statistiques excluant un paramètre de discrimination n’est pas convaincante en ce sens
que le temps de détection ou la fenêtre de détection ne dépasse pas vingt (20) secondes (i.e
2560 observations) comme le cas des travaux de Boris E. Brodsky, Boris S. Darkhovsky,
Alexander Ya.Kaplan [9] et Scott R.J., Knott M. [40].

S’agissant des travaux qui traitent l’analyse du signal EEG par l’estimation de la
puissance spectrale, nous avons l’article de Abdulhamit Subasi [4] et de O. Faust, R.U.
Acharya, A.R. Allen, C.M.Lin [27] qui proposent respectivement une étude comparative
sur la base des méthodes AR et la puissance spectrale de l’EEG afin d’analyser et de
caractériser les décharges épileptiformes sous forme de pointes et d’ondes complexes de 3
Hz chez les patients souffrant de crises d’absence, et une étude comparative basée aussi
sur la puissance spectrale obtenue à partir des signaux EEG des patients normaux, épi-
leptiques et alcoolisés.
1.5. Contribution de la thèse 14

Cependant, ces deux analyses contribuent à l’amélioration de la détection des points de


départ d’une crise dans le domaine fréquentiel, mais ne tiennent pas compte du fait que
les signaux EEG des patients épileptiques présentent des tendances de non stationnarité.
C’est pourquoi, il sera difficile de détecter les transitions entre les bandes de fréquences
pour des patients normaux et les patients présentant une crise d’épilepsie.

En effet, tous ces éléments influencent sur la détection des zones pathogènes par les
neurologues et pourraient entrainer un biais dans la conclusion de l’examen.
Cependant, des recherches scientifiques sont nécessaires pour mieux comprendre les pa-
ramètres statistiques déterminants pour la détection des troubles dans le cerveau. C’est
cette problématique que nous aborderons dans le cadre de cette thèse.

1.5 Contribution de la thèse


L’objet principal de cette thèse est de fournir des méthodes mathématiques et sta-
tistiques permettant d’extraire les informations spécifiques et significatives de l’activité
électrique du cerveau afin de détecter les ruptures dans les signaux electrophysiologiques
pour pouvoir prédire les crises et par la suite situer les zones épileptogènes pour une
bonne prise en charge du patient.
De manière scientifique, il consiste donc à examiner les signaux electrophysiologiques avec
les méthodes précitées en améliorant les critères d’évaluation afin de trouver une bonne
représentation du signal qui contient les informations nécessaires pour classer avec préci-
sion l’activité électrique des patients épileptiques en temps et en fréquence.

Dans une première contribution, nous combinons à la fois les propriétés statistiques
des paramètres, le test d’hypothèse et la segmentation binaire pour détecter les ruptures
multiples dans les signaux EEG traités séparément dans [3], [18] et [40].
L’approche proposée est innovatrice, en ce sens qu’elle permet d’extraire et de détecter
automatiquement le départ d’une crise d’épilepsie dans les signaux EEG en se basant sur
l’évolution en amplitude des observations.
Cette démarche est motivée par le fait que l’interprétation des signaux se fait de manière
visuelle par les médecins praticiens en se basant sur l’évolution de l’amplitude dans le
temps des signaux EEG des patients.

Dans une deuxième approche, nous aborderons l’analyse des signaux EEG par une
1.6. Organisation de la thèse 15

nouvelle approche de détection fréquentielle avec l’appui des modèles autorégressifs (abrégé
AR) en série chronologique en calculant la densité spectrale de puissance du processus
considéré.
L’innovation relativement aux [4] et [27] est que, compte tenu du fait que les signaux EEG
sont souvent non stationnaire dans la pratique, nous avons enlevé les tendances de non
stationnarité des données avec une technique de différenciation afin d’avoir la stationna-
rité qui est pratique pour pouvoir modéliser avec le modèle autorégressif (AR). Par la
suite, nous avons utilisé le critère de choix de l’ordre tels que l’AIC, le BIC et l’AICc afin
d’obtenir un ordre optimal et convenable pour l’estimation des paramètres du modèle.
Par conséquent, nous avons utiliserons des méthodes d’estimation paramétrique telles que
le maximum de vraisemblance (EMV), la méthode de Burg, la moyenne quadratique et
la méthode de Yule-Walker pour estimer la densité spectrale de puissance.
Ainsi, nous pouvons détecter l’activité électrique correspondant à une anomalie d’épilep-
sie entre les bandes de fréquences cliniques et physiologiques de l’EEG avec le critère de
détection proposé.
En plus, cette approche est motivée par le fait que l’analyse de l’enregistrement EEG par
les médecins praticiens est basée sur l’analyse visuelle des signaux (rythme delta, thêta,
alpha, gamma, bêta).
Ces deux modèles proposés dans le cadre de cette thèse contribuent à la détection du point
de départ de crise ainsi que la localisation précise de la zone epileptogene du cerveau.

1.6 Organisation de la thèse


Le plan de cette thèse est le suivant.
Dans le premier chapitre, nous avons utilisé les propriétés statistiques en tendance cen-
trale et en dispersion pour détecter les ruptures de crise en amplitude des signaux EEG.
Ces critères de dispersion sont appuyé par un modèle qui caractérise l’amplitude des
signaux par rapport à la valeur maximale théorique et locale. Par la suite, nous avons
formalisé ce modèle sous la forme d’un test d’hypothèse afin de discriminer les signaux
épileptiques contre les normaux. Les résultats du modèle ainsi que l’évaluation du critère
seront présenté sur des données simulées et réelles.
Le second chapitre est un cadre introductif des concepts fondamentaux sur les séries chro-
nologiques nécessaire pour l’étude des processus sous-jacents.
Par la suite, dans le troisième chapitre, nous présenterons dans une première phase, une
méthode de détection de rupture basée sur la densité spectrale de puissance en liaison
1.6. Organisation de la thèse 16

avec les bandes de fréquence electrophysiologiques. De ce fait, il sera aussi question de


la présentation d’une base théorique renfermant l’analyse spectrale et les méthodes d’es-
timation des paramètres du modèle proposé. Les densités spectrales de puissance des
signaux EEG des patients épileptiques seront présentées afin de caractériser les zones
épileptiques en bande de fréquence.

A la fin, un bilan de cette étude est effectué et des développements futurs sont envi-
sagés dans la conclusion.
17

Chapitre 2

Détection automatique des crises


d’épilepsie par extraction statistique

Dans la bibliographie, nous avons deux grandes familles de méthodes permettant


la modélisation du signal EEG : la modélisation du signal EEG par des méthodes pa-
ramétriques et non-paramétriques. Ces deux méthodes seront décrites et analysées pour
pouvoir faire une comparaison afin de choisir celle qui est la plus performante. Les critères
de comparaisons se baseront sur l’aspect quantitatif (moyenne, variance, corrélation,...)
et qualitatif (mise en oeuvre du dispositif, temps de calcul, ...). D’autres critères de clas-
sification de l’EEG tels que la précision, la sensibilité et la spécificité seront également
évalués.

2.1 Introduction
La détection de point de rupture ou le problème de rupture qui est une des branches
de la statistique communément appelé change-point problem dans la littérature anglo-
saxonne a été l’objet de recherche dans plusieurs disciplines telles que la médecine, la
biologie, l’astronomie et le contrôle de qualité en industrie.
Du point de vue statistique, il y a une rupture au cours du temps s’il y a une variation
dans la distribution ou les propriétés statistiques du problème considéré ou des séquences
des observations d’un instant t à un instant t + 1.
Cette rupture pourrait être traitée de deux conceptions de base. La première est une
étape décisionnelle c’est-à-dire il s’agit de vérifier s’il y a une rupture ou pas dans les
séquences des observations. Il s’agit donc d’un test d’hypothèse. La deuxième consiste à
détecter la position du rupture s’il y a eu. C’est la théorie de l’estimation.

Parmi les premiers travaux dans le domaine de la détection de rupture, nous pouvons
mentionner la détection par la somme cumulative de Page (CUSUM), le test de Girshick-
Rubin et la carte de contrôle de Shewhart. Quant à la détection de rupture à posteriori,
2.1. Introduction 18

une première approche de Page consistait à l’application du ratio du maximum de vrai-


semblance avec un test d’hypothèse sur le changement de rupture.
La littérature sur la détection de rupture est très vaste comme énoncée dans l’état de
l’art sur le sujet de recherche de cette thèse parmi lesquelles [8], [10] et [18] et. Parmi les
travaux effectué sur le sujet de maniere spécifique, nous avons [7], [16] et [40].

Dans cette étude, nous allons présenter un critère de détection de rupture multiple
basé sur la dispersion entre les valeurs maximales et les propriétés statistiques classiques
(moyenne, variance, écart-type) des observations pour pouvoir caractériser les signaux
EEG des patients normaux et ceux qui présentent des crises afin de mieux prendre en
charge le patient. La discrimination des signaux est obtenue grâce à une segmentation
binaire compte tenu du critère considéré. Cette démarche s’inspire des travaux [3], [18] et
[40] qui abordent respectivement les propriétés statistiques des paramètres, le test d’hy-
pothèse et la segmentation binaire pour détecter le changement de rupture singulière et
multiples dans les signaux EEG.
Notre contribution dans cette étude consiste à implémenter une méthode sous forme d’al-
gorithme afin de pouvoir détecter de manière automatique les pointes de crises après
enregistrement du tracé EEG. Cette démarche est motivée par le fait que l’interprétation
des signaux se fait de manière visuelle par les médecins praticiens en se basant sur l’évo-
lution de l’amplitude dans le temps des signaux EEG des patients.
2.2. Extraction des caractéristiques statistiques par une fenêtre mobile 19

2.2 Extraction des caractéristiques statistiques par


une fenêtre mobile
Soit x = (x1 , x2 , ..., xn ) les échantillons des observations recueillies après enregistre-
ment des signaux EEG des patients qui sont générée sous forme de séries temporelles avec
une fréquence d’échantillonnage de 128 observations par seconde.
Dans une phase préliminaire, nous avons procédé à l’extraction de quelques caractéris-
tiques statistiques des observations en faisant un lissage en moyenne mobile arithmétique,
en variance et écart-type empirique pour comprendre les tendances (stationnaires ou non
stationnaires) des séries temporelles contenant les enregistrements EEG originaux.

2.2.1 Caractérisation par une moyenne mobile entre les obser-


vations
La moyenne mobile est un outil très efficace pour l’analyse de la tendance des séries
temporelles. Elle contribue également à la réduction du bruit et des valeurs aberrantes
dans un processus stochastique.
Une moyenne mobile permet de « lisser » une série de valeurs exprimées en fonction du
temps (série chronologique). Elle permet d’éliminer les fluctuations les moins significa-
tives. Il s’agit de calculer les moyennes mobiles d’ordre 1, d’ordre 2, d’ordre 3, etc. L’ordre
est le nombre de périodes (années, trimestres, mois...) sur lesquelles la moyenne mobile
est calculée.

Définition 2.2.1 On appelle moyenne mobile d’ordre h la moyenne arithmétique d’un


terme avec les k termes voisins.
– si h est impair, c’est-à-dire s’écrit sous la forme h = 2p + 1 alors on remplace
chaque terme par la moyenne de ce terme, des p termes suivants et des p termes
précédents ;
– Si h est pair, c’est-à-dire s’écrit sous la forme h = 2p, c’est moins évident: on
remplace chaque terme par la moyenne de ce terme, des p termes suivants et des p
termes précédents mais les termes extrêmes sont affectés d’un coefficient 1/2.

Formellement, elle sera définie par:


h
1X
M̂h (t) = xt+i , t = 1, ...n (2.1)
h i=1
2.2. Extraction des caractéristiques statistiques par une fenêtre mobile 20

avec h la fenêtre mobile et n la taille de l’échantillon.

Autrement dit, il s’agit plus précisément de calculer les moyennes des h termes consé-
cutifs pour les instants

t1 + ... + th t2 + ... + th+1 tT −h+1 + ... + tT


, , ...,
h h h
pour les variables
x1 + ... + xh x2 + ... + xh+1 xT −h+1 + ... + xT
, , ...,
h h h
De ce fait, nous utiliserons la forme de la moyenne définie par (2.1) pour constater si
une rupture pourrait être détecté avec une fenêtre mobile qui bouge pour h = 128, 256, ob-
servations compte tenue de la fréquence d’échantillonnage en amplitude des signaux EEG.

La Fig. 2.1 illustre la moyenne mobile de l’activité électrique de surface du cerveau


de trois patients souffrant respectivement d’une épilepsie partielle en centro-temporale,
temporale et fronto-centrale (bi-fronto rolandique).
2.2. Extraction des caractéristiques statistiques par une fenêtre mobile 21

Patient 1 F8−T4
30
Amplitude
0 10
−20

0 1000 2000 3000 4000 5000


Observation

Patient 2 F4−C4
30
Amplitude
0 10
−20

0 1000 2000 3000 4000 5000


Observation

Patient 3 F3−C3
30
Amplitude
0 10
−20

0 1000 2000 3000 4000 5000


Observation

Figure 2.1 – Moyenne mobile (en rouge ) et théorique (en bleu )de l’EEG (40s soit 5120
observations) avec une fenêtre h = 128.

Regardons par la suite l’évolution de la moyenne entre les observations de manière


temporelle, chaque seconde correspondant à une génération de 128 observations. Soit la
forme de la moyenne ponctuelle définie par

h h
1X 1X
M̂h (t) = xti = xi (t) (2.2)
h i=1 h i=1

Dans ce cas, nous aborderons le calcul des moyennes des h termes consécutifs pour
les instants

t1 , ..., th , th+1 , ..., tT −h , ..., tT −h+1 , ..., tT


Ce qui donne les moyennes
xt1 + ... + xth xth+1 + ... + xtT −h xt + ... + xtT
, , ..., T −h+1
h h h
2.2. Extraction des caractéristiques statistiques par une fenêtre mobile 22

En utilisant la forme de la moyenne définie par (2.2), nous obtenons la Fig. 2.2 qui
illustre la moyenne mobile ponctuelle pour h = 128 de l’activité électrique de surface
du cerveau de trois patients souffrant respectivement d’une épilepsie partielle en centro-
temporale, temporale et fronto-centrale (bi-fronto rolandique). Il s’agit toujours de ca-
ractériser les signaux EEG pour constater si une rupture pourrait être détecté avec une
fenêtre mobile qui bouge pour chacune des h = 128 observations.

Patient 1 F8−T4
30
Amplitude
0 10
−20

0 500 1000 1500 2000 2500


Observation

Patient 2 F4−C4
20
10
Amplitude
0
−20

0 500 1000 1500 2000 2500


Observation

Patient 3 F3−C3
20
10
Amplitude
0
−20

0 500 1000 1500 2000 2500


Observation

Figure 2.2 – Moyenne mobile (en rouge) de l’EEG (40s soit 5120 observations) sur
chaque fenêtre h = 128
2.2. Extraction des caractéristiques statistiques par une fenêtre mobile 23

2.2.2 Caractérisation par la variance


Dans la même démarche, nous allons calculer pour chaque seconde dont 128 observa-
tions sont générée, la variance mobile de ces observations en utilisant la moyenne mobile
(2.1) calculée précédemment soit

h
1X
σ̂h2 (t) = (xi − M̂h (t))2 , t = 1, ...n (2.3)
h i=1

Patient 1 F8−T4
Variance en Amplitude
200
50 100
0

0 1000 2000 3000 4000 5000


Observation

Patient 2 F4−C4
150
Variance en Amplitude
100
50
0

0 1000 2000 3000 4000 5000


Observation

Patient 3 F3−C3
Variance en Amplitude
120
80
40
0

0 1000 2000 3000 4000 5000


Observation

Figure 2.3 – Variance mobile (en rouge ) et théorique (en bleu) de l’EEG d’un tracé
(40s soit 5120 observations)

Par la suite, nous étudierons le comportement de la variance du signal EEG dans


chacune des fréquences d’échantillonnage h = 128.
De ce fait, la variance mobile sur chacune des fenêtres sera définie en utilisant (2.2) par :
h
1X
σ̂h2 (t) = (xi (t) − M̂h (t))2 , t = 1, ...20s (2.4)
h i=1
Voici la courbe montrant l’allure de la variance entre les observations du signal EEG
centro-pariétal (noté C4P4 sur le signal EEG original) sur les 20 premières secondes.
2.2. Extraction des caractéristiques statistiques par une fenêtre mobile 24

Patient 1 F8−T4
120
Variance Amplitude
80
40

0 500 1000 1500 2000 2500


Observation

Patient 2 F4−C4
140
Variance Amplitude
100
60
20

0 500 1000 1500 2000 2500


Observation

Patient 3 F3−C3
Variance Amplitude
50
30
10

0 500 1000 1500 2000 2500


Observation

Figure 2.4 – Variance mobile (en rouge) sur chacune des fenêtres du tracé
2.2. Extraction des caractéristiques statistiques par une fenêtre mobile 25

2.2.3 Caractérisation par l’écart-type

Patient 1 F8−T4
30
Amplitude
0 10
−20

0 1000 2000 3000 4000 5000


Observation

Patient 2 F4−C4
30
Amplitude
0 10
−20

0 1000 2000 3000 4000 5000


Observation

Patient 3 F3−C3
30
Amplitude
0 10
−20

0 1000 2000 3000 4000 5000


Observation

Figure 2.5 – Écart-type mobile (en rouge) et théorique (en bleu) du tracé

Patient 1 F8−T4
30
Amplitude
0 10
−20

0 500 1000 1500 2000 2500


Observation

Patient 2 F4−C4
20
10
Amplitude
0
−20

0 500 1000 1500 2000 2500


Observation

Patient 3 F3−C3
20
10
Amplitude
0
−20

0 500 1000 1500 2000 2500


Observation

Figure 2.6 – Écart-type (en rouge) sur chacune des fenêtres du tracé
2.3. Critère de détection 26

Les figures 2.5 et 2.6 montrent l’évolution de l’écart-type mobile sur une fenêtre mobile
et sur une fenêtre ponctuelle de h = 128 utilisant les moyennes mobiles (2.1) et (2.2).

2.2.4 Commentaire sur la moyenne, la variance et l’écart-type


Nous remarquons pour la caractérisation du signal suivant la moyenne mobile que la
plupart des observations sont au-dessus de la moyenne théorique en amplitude.
Mieux, les perturbations de départ de crise d’épilepsie en moyenne mobile sont situées
au-dessus de la moyenne théorique.
Pour la caractérisation des signaux EEG en terme de variance mobile et en écart-type
mobile, nous constatons (sur les figures 2.3 et 2.5) qu’il y a une forte variation en amplitude
à chaque départ de crise d’épilepsie ou de décharge pour tous les patients considérés.
Finalement, nous pouvons dire que la caractérisation en moyenne, variance et écart-type
mobile permet de lisser les observations suivant une fenêtre mobile. Par contre, l’allure de
cette caractérisation est presque homogène par rapport à l’évolution en amplitude surtout
en moyenne mobile. C’est pourquoi, il serait intéressant de discriminer les observations
présentant des pics ou des oscillations de crise à celle qui sont normales par un critère
beaucoup plus consistant.

2.3 Critère de détection


L’analyse basée sur l’extraction des propriétés statistiques classiques n’étant pas dé-
cisive en termes de détection de rupture de manière longitudinale, nous avons sélectionné
un critère basé sur l’évolution temporelle en amplitude des signaux. Ce critère permettra
de classifier les signaux des sujets normaux contre ceux qui présentent des crises par un
modèle de segmentation binaire basé sur un test d’hypothèse.

2.3.1 Formalisation du critère


Compte tenue de la forme des amplitudes qui sont des observations continues X =
(X1 , ..., Xn ), ce critère ne pourrait se baser que sur la dispersion entre les valeurs maxi-
males et les propriétés statistiques classiques (moyenne, variance, écart-type) en valeur
absolue définie par

C = max |Xi | − |µ| (2.5)


1≤i≤n
2.3. Critère de détection 27

et

D = max |Xi | − |σX | (2.6)


1≤i≤n

avec µ = Mh (t), σX = σ̂h2 (t) et h sont respectivement la moyenne empirique mobile


dans le, l’écart-type des signaux considérés et la fenêtre de calcul.

2.3.2 Segmentation
Par ailleurs, nous considérons la détection de crise comme un problème de classification
binaire dans le but de discriminer les tracés contenant une activité épileptique contre ceux
qui sont normales.
Ainsi, nous pouvons définir deux fonctions indicatrices pour la détection de rupture en
moyenne et en écart-type.
(
1 si Xi > C
1Xi =
0 si Xi ≤ C
et
(
0 1 si Xi > D
1Xi =
0 si Xi ≤ D.
Cette approche nous permettra de détecter automatiquement l’anormalité dans les séries
temporelles des signaux considérés. En outre, pour contrôler les cas de fausse détection,
après discussion avec les médecins praticiens du CHU, nous déclarons qu’il y a crise que
si l’algorithme détecte plus de deux pointes.

2.3.3 Formalisation statistique en test d’hypothèse


En plus, pour formaliser ce modèle de détection sous forme de problème statistique,
nous allons définir deux tests d’hypothèses composites pour les paramètres du critère
considéré tel que:
(
H 0 : Xi ≤ C
H1 : ∃ Xi | Xi > C, ∀ i = 1, ...n
et
2.3. Critère de détection 28

( 0
H0 : Xi ≤ D
0
H1 : ∃ Xi | Xi > D, ∀ i = 1, ...n
En effet, il s’agit de détecter la rupture dans les amplitudes en moyenne et en écart-type
en adoptant la règle de décision suivante :
– si l’observation xi est inférieur ou égale à C (resp. D) qui est la différence entre la
valeur maximale locale et la moyenne (resp. ecart type) mobile (resp. locale), alors
il n’y a pas de rupture,
– par contre si l’observation xi est supérieur à C (resp. D) qui est la différence entre
la valeur maximale locale et la moyenne (resp. écart type) mobile (resp. locale),
alors il y a rupture.

2.3.4 Estimation des paramètres du critère


Nous supposons que les données observées X ont le comportement asymptotique d’une
distribution normale après avoir effectué plusieurs tests classiques de normalité.
2
Ainsi, X N (µ, σX ) implique que la densité de probabilité sera définie par

1 1
f (x, µ, σX ) = p exp{− 2
(xi − µ)2 } (2.7)
2
2πσX 2σX

Donc, nous pourrons utiliser l?estimateur du maximum de vraisemblance pour pouvoir


estimer les paramètres d’interêts compte tenue de la forme paramétrique de la distribu-
tion des séries temporelles considérées.

Sous l’hypothèse nulle H0 , nous avons


n n
2
Y 1 1 X
L(x; µ, σX ) = f (x, µ, σX ) = p exp{− 2 (xi − µ)2 } (2.8)
i=1
2 n
( 2πσX ) 2σX i=1
2
Les estimateurs du maximum de vraisemblance de la moyenne µ et de la variance σX
sont respectivement donné par
n n
1X 2 1X
µ̂ = xi , et, σ̂X = (xi − µ̂)2
n i=1 n i=1
Ainsi, sous H0 , nous aurons
n
1X
Ĉ = max |xi | − |µ̂| = max |xi | − |xi | (2.9)
1≤i≤n 1≤i≤n n i=1
2.3. Critère de détection 29

v
u n
u1 X
D̂ = max |xi | − |σ̂X | = max |xi | − t (|xi | − µ̂)2 (2.10)
1≤i≤n 1≤i≤n n i=1

Sous l’hypothèse alternative H1 compte tenu du changement de la valeur de la moyenne


avec une variance connue, nous aurons la fonction de vraisemblance définie par

k n
2 1 1 X 2
X
L(x; µ1 , µn , σX )= p exp{− 2
( (x i − µ 1 ) + (xi − µn )2 )} (2.11)
2 n
( 2πσX ) 2σ X i=1 i=k+1

En utilisant la méthode d’estimation par la vraisemblance, nous aurons les estimateurs


2
de µ1 , µn et σX donnés respectivement par

k n
1X 1 X
µ̂1 = xi , µ̂n = xi (2.12)
k i=1 n − k i=k+1

k n
2 1 X 2
X
σ̂X = [ (xi − µ̂1 ) + (xi − µ̂n )2 ] (2.13)
n i=1 i=k+1

Maintenant, la rupture en écart-type sous l’hypothèse alternative H1 avec une moyenne


µ connue sera déterminée avec l’ EMV par
v
u k
u1 X
σ̂1 = t (xi − µ̂)2 , (2.14)
k i=1

v
u n
u 1 X
σ̂n = t (xi − µ̂)2 (2.15)
n − k i=k+1

Finalement, la vraisemblance de la densité de probabilité concernant la rupture en


moyenne et en écart-type dans les cas où ces dernières sont inconnues est donnée par

k n
1 1 X 1 X
L(x; µ1 , µn , σ12 , σn2 ) = p exp{− 2 2
(xi − µ1 ) − 2 (xi − µn )2 } (2.16)
2 n
( 2πσX ) 2σ 1 i=1 2σn i=k+1
2.3. Critère de détection 30

Ce qui donne en utilisant l’ EMV, les estimateurs des paramètres σ12 , σn2 d’autant plus
que µ1 et µn ont été estimé dans (2.12):

k
1X
σ̂12 = (xi − µ̂1 )2 , (2.17)
k i=1

n
1 X
σ̂n2 = (xi − µ̂n )2 (2.18)
n − k i=k+1

Cependant, en utilisant ces paramètres estimé dans l’hypothèse alternative, nous pour-
rons détecter la rupture dans l’approche du critère proposée par:

Ĉ1 = max |xi | − |µ̂1 | (2.19)


1≤i≤n

Ĉn = max |xi | − |µ̂n | (2.20)


1≤i≤n

D̂1 = max |xi | − |σ̂1 | (2.21)


1≤i≤n

D̂n = max |xi | − |σ̂n | (2.22)


1≤i≤n

En effet, dans la partie suivante, nous allons présenter les résultats de la détection des
pointes ou le point de départ de la crise en utilisant ces paramètres estimés µ̂1 , µ̂n , σ̂12 , σ̂n2
2
et σ̂X .
2.4. Résultats sur des données simulées et celles de l’EEG 31

2.4 Résultats sur des données simulées et celles de


l’EEG
2.4.1 Résultats sur des données simulées
Dans cette partie, nous allons présenter les résultats de l’application du critère de
détection de rupture considérée sur les données simulées.
En effet, comme dans cette partie nous nous intéressons à la rupture en moyenne mobile
et en écart-type par les amplitudes, nous utiliserons les propriétés statistiques des ampli-
tudes des signaux réels pour générer les données de la simulation. En outre, le modèle de
simulation est un modèle de génération des données qui suit une loi normale.
En effet, nous avons simulé des données qui auront le même comportement en terme de
caractéristiques statistiques que les données d’acquisition des signaux EEG.

Modèle de simulation de la derivation F4C4


20
10
Amplitude
0
−10

0 500 1000 1500 2000 2500


Observation

Figure 2.7 – Détection de rupture en moyenne et en écart-type sur les données simulées
(en rouge= rupture réelle, bleu= rupture simulée)
2.4. Résultats sur des données simulées et celles de l’EEG 32

40
20 Modèle de simulation de la derivation C4P4
Amplitude
0
−20
−40

0 500 1000 1500 2000 2500


Observation

Figure 2.8 – Détection de rupture en moyenne et en écart-type sur les données simulées
(en rouge= rupture réelle, bleu= rupture simulée)

En effet, il s’agit dans cette partie de tester la précision de détection de rupture du


modèle proposé sur des données simulées.
Nous constatons par une analyse visuelle de la Figure 2.7 et 2.8 que la rupture est à la
même instance que les données réelles du signal EEG (en rouge= rupture réelle, bleu=
rupture simulée).
2.4. Résultats sur des données simulées et celles de l’EEG 33

2.4.2 Résultats sur des données réelles du signal EEG


Nous avons appliqué l’algorithme de détection de rupture sur les données des patients
épileptiques et non épileptiques. Les Figure 2.9 et 2.10 montrent les signaux EEG des
patients épileptiques tandis que la figure 2.11 représente le signal d’un patient sain.

Change in the Mean and the Standard deviation for F8T4


30
20
Amplitude

10
0
−20

0 500 1000 1500 2000 2500

Number of Samples

Change in the Mean and the Standard deviation for T4T6


5 10
Amplitude

−5 0
−15

0 500 1000 1500 2000 2500

Number of Samples

Change in the Mean and the Standard deviation for Fp1F7


20
10
Amplitude

5
0
−10

0 500 1000 1500 2000 2500

Number of Samples

Figure 2.9 – Signal EEG d’un patient épileptique (épilepsie partielle temporale droite
antérieur).

Change in the Mean and the Standard deviation for T4T6


20
10
Amplitude

0
−10
−20

0 500 1000 1500 2000 2500

Number of Samples

Change in the Mean and the Standard deviation for F4C4


30
20
10
Amplitude

0
−20

0 500 1000 1500 2000 2500

Number of Samples

Change in the Mean and the Standard deviation for C4P4


30
20
Amplitude

10
0
−20

0 500 1000 1500 2000 2500

Number of Samples

Figure 2.10 – Signal EEG d’un patient épileptique (épilepsie partielle en centro-
temporale ).
2.4. Résultats sur des données simulées et celles de l’EEG 34

Change in the Mean and the Standard deviation for F8T4

30
10
Amplitude

−10
−30 0 500 1000 1500 2000 2500

Number of Samples

Change in the Mean and the Standard deviation for T4T6


10 20 30
Amplitude

−10
−30

0 500 1000 1500 2000 2500

Number of Samples

Change in the Mean and the Standard deviation for T3T5


40
20
Amplitude

0
−20
−40

0 500 1000 1500 2000 2500

Number of Samples

Figure 2.11 – Signal EEG d’un patient non épileptique

Pour le Patient 1 qui souffre d’une épilepsie partielle sur la partie fronto-centrale du
cerveau avec les électrodes (F8T4, C4P4, Fp2F4, F4C4, FzCz, F7T3, F3C3,...) représentée
sur la Figure 2.15, le critère proposé détecte cent soixante-sept pointes de crises sur un
enregistrement de 20 minutes. Ainsi en terme de nombre de rupture, nous avons deux
pointes pour F8T4, trois pour F4C4, neuf pour C4P4, douze pour FzCz et soixante une
pour CzPz (voir Tableau 2.2).

Change in the Mean and the Standard deviation for T4T6


20
10
Amplitude

0
−10
−20

0 500 1000 1500 2000 2500

Number of Samples

Change in the Mean and the Standard deviation for F4C4


30
20
10
Amplitude

0
−20

0 500 1000 1500 2000 2500

Number of Samples

Change in the Mean and the Standard deviation for C4P4


30
20
Amplitude

10
0
−20

0 500 1000 1500 2000 2500

Number of Samples

Figure 2.12 – Détection de rupture pour un patient épileptique en centro-temporal


2.4. Résultats sur des données simulées et celles de l’EEG 35

Rupture en moyenne et en ecart type du F8T4

0.8
Amplitude
0.4
0.0

0 500 1000 1500 2000 2500


Nombre d"echantillon

Rupture en moyenne et en ecart type du T4T6


0.8
Amplitude
0.4
0.0

0 500 1000 1500 2000 2500


Nombre d"echantillon

Rupture en moyenne et en ecart type du Fp1F7


0.8
Amplitude
0.4
0.0

0 500 1000 1500 2000 2500


Nombre d"echantillon

Figure 2.13 – Rupture pour un patient épileptique en temporale antérieur droit

Pour le second patient avec une épilepsie partielle sur la partie centro-temporale du
cerveau avec les électrodes (F8T4, T4T6, T6O2, C4P4, T3T5, F3C3, F7T3, T5O1), le
critère proposé détecte deux cent quatre-vingt-six pointes de crises sur un temps d’enre-
gistrement d’une heure sur la Figure 2.14 et le tableau 2.2. Pour la caractérisation par
électrode, nous avons trois pointes pour l’électrode T4T6, dix-neuf pour T6O2, cent vingt-
cinq pointes pour C4P4, cinquante-trois pour CzPz, trente-neuf pour T5O1 et trente-huit
pour l’électrode F3C3.
2.4. Résultats sur des données simulées et celles de l’EEG 36

Rupture en moyenne et en ecart type du T4T6


0.8
Amplitude
0.4
0.0

0 500 1000 1500 2000 2500


Nombre d"echantillon

Rupture en moyenne et en ecart type du F4C4


0.8
Amplitude
0.4
0.0

0 500 1000 1500 2000 2500


Nombre d"echantillon

Rupture en moyenne et en ecart type du C4P4


0.8
Amplitude
0.4
0.0

0 500 1000 1500 2000 2500


Nombre d"echantillon

Figure 2.14 – Rupture pour un patient épileptique en centro-temporal avec le critère


considéré

Finalement, pour le troisième patient de l’étude souffrant d’une épilepsie partielle en


temporal droit, nous avons vingt-neuf pointes de crises sur la Figure 2.13 et le tableau
2.2. Cependant, nous avons seize pointes sur l’électrode F8T4, deux sur T4T6 et onze
pointes sur l’électrode Fp1F7.
2.4. Résultats sur des données simulées et celles de l’EEG 37

Rupture en moyenne et en ecart type du F8T4


0.8
Amplitude
0.4
0.0

0 500 1000 1500 2000 2500


Nombre d"echantillon

Rupture en moyenne et en ecart type du F4C4


0.8
Amplitude
0.4
0.0

0 500 1000 1500 2000 2500


Nombre d"echantillon

Rupture en moyenne et en ecart type du C4P4


0.8
Amplitude
0.4
0.0

0 500 1000 1500 2000 2500


Nombre d"echantillon

Figure 2.15 – Rupture pour un patient épileptique en fronto-central avec le critère


considéré

Sur la Figure 2.13, 2.14 et 2.15, nous avons représenté particulièrement les points de
rupture pour les signaux des patients épileptiques avec l’approche du critère proposé Ĉ
et D̂ dans cette étude.

Par ailleurs, tout comme nous remarquons de manière visuelle sur la Figure 2.16, le
critère ne détecte aucune pointe de crise sur les signaux EEG d’un patient ayant un signal
EEG ne présentant pas de crise du point de vue de l’interprétation des neurologues du
CHU.
2.4. Résultats sur des données simulées et celles de l’EEG 38

Change in the Mean and the Standard deviation for T4T6

1.0
Amplitude

0.0
−1.0
0 500 1000 1500 2000 2500

Number of Samples

1.0
Change in the Mean and the Standard deviation for P4O2
Amplitude

0.0
−1.0

0 500 1000 1500 2000 2500

Number of Samples

Change in the Mean and the Standard deviation for T5O1


1.0
Amplitude

0.0
−1.0

0 500 1000 1500 2000 2500

Number of Samples

Change in the Mean and the Standard deviation for P3O1


1.0
Amplitude

0.0
−1.0

0 500 1000 1500 2000 2500

Number of Samples

Figure 2.16 – Rupture pour un patient non épileptique avec le critère considéré

2.4.3 Évaluation du critère de rupture proposé


Dans cette section, nous allons évaluer la performance de l’approche de rupture propo-
sée en utilisant les critères de performance statistiques qui sont la sensibilité, la spécificité
et la précision.
En effet, ces critères classiques sont défini par:
nombre des vrais décisions positives
sensibilité = , (2.23)
nombre des cas positifs actuels
nombre des fausses décisions positives
spécificité = , (2.24)
nombre des cas negatifs actuels
nombre des décisions correctes
précision = (2.25)
nombre total des cas
Ainsi, nous avons sélectionné trois patients souffrant respectivement d’une épilepsie
en fronto-centrale, en centro-temporale et en temporale droite pour lesquelles nous déter-
minerons les critères cité ci-dessus. Les résultats sont donné sur le tableau 2.1.

Sensibilité (%) Spécificité (%) Précision (%)


Patient 1 88.89 66.67 77.78
Patient 2 75 66.66 70.83
Patient 3 50 64.28 57.14
Moyenne 71.30 65.87 68.85

Table 2.1 – Performance du critère proposé


2.5. Conclusion 39

Patient 1 Patient 2 Patient 3


Fp2-F8 3 11 0
F8-T4 2 0 16
T4-T6 0 3 2
T6-O2 3 19 0
Fp2-F4 9 116 10
F4-C4 3 0 0
C4-P4 9 125 0
P4-O2 0 0 0
Fz-Cz 12 0 0
Cz-Pz 61 53 4
Fp1-F7 14 0 11
F7-T3 32 7 0
T3-T5 3 2 1
T5-O1 0 39 3
Fp1-F3 5 0 31
F3-C3 39 38 0
C3-P3 0 0 0
P3-O1 0 13 0

Table 2.2 – Résultats de détection de crise (en rouge= électrode épileptique, en noir=
électrode non épileptique)

2.5 Conclusion
Dans cette partie, nous avons contribué à l’amélioration de l’interprétation de l’acti-
vité électrique en surface du cerveau par la détection des points de rupture de crises, le
nombre de rupture ainsi que la localisation de la zone épileptogene malgré la complexité
des signaux EEG avec un critère basé sur la dispersion entre les valeurs maximales et les
propriétés statistiques classiques (moyenne, variance, écart-type) des observations. L’ap-
proche proposée combine à la fois les caractéristiques statistiques, le test d’hypothèse
ainsi que la segmentation binaire pour pouvoir détecter les ruptures multiples en ampli-
tude avec une sensibilité de 71.30%, une spécificité de 65.87% et une précision de 68.85%.
Ce modèle a été implémenté sous forme d’algorithme de détection en utilisant le logiciel
statistique R.
2.5. Conclusion 40

En outre, la précision de détection relativement faible pourrait être due à la taille


très réduite de l’échantillon pour l’application du modèle proposé. Par conséquent, cette
contribution est très innovatrice et utile pour les médecins praticiens puisque l’interpré-
tation des signaux après enregistrement se fait par une analyse visuelle en amplitude des
signaux.

En perspective à ce travail, il serait intéressant de travailler sur un critère qui permet-


trait de prévoir une crise par incorporation d’un paramètre temporel d’autant plus que
cette étude est basée sur une approche rétrospective.
41

Chapitre 3

Aperçu sur les séries chronologiques

Dans ce chapitre, nous relaterons les concepts fondamentaux pour les modèles de la
théorie des séries temporelles. Il s’agit en particulier d’introduire les concepts de proces-
sus aléatoire ou stochastique, de propriétés statistiques (Moyenne, variance, covariance,
de fonction d’autocorelation, de test d’indépendance et de normalité) et de stationna-
rité. Par la suite, nous parlerons également des techniques d’élimination des tendances de
non stationnarité et d’estimation des paramètres du modèle, très déterminant en pratique.

3.1 Quelques concepts de base


Dans cette sous-section, nous allons décrire les notations ainsi que les concepts et
définitions souvent utilisé dans le traitement des séries chronologiques.

3.1.1 Processus stochastique


Soit un espace probabilisé (Ω, A, P) avec Ω l’espace fondamental des réalisations, A la
classe des réalisations et P la probabilité de réalisation des événements.

Définition 3.1.1 On appelle « processus stochastique » une famille de variables aléa-


toires Xt définies sur (Ω, A, P), indexées par t ∈ T ⊂ Z et à valeurs dans A qui
est la classe de réalisations des événements. Pour toute réalisation ω ∈ Ω, la famille
(xt = Xt (ω)) est une « trajectoire » du processus.

Comme T ⊂ Z , alors Xt est bien considérée comme une série temporelle ou chrono-
logique. En effet, l’indice t est souvent interprété comme le temps. Le processus est en
temps continu si T est continu (e.g., T = [0, 1]), et en temps discret si T est discret (e.g.,
T = 0, 1, 2, ...).
Lorsque t est continu, on note souvent Xt par X(t). On supposera ici que Xt prend ses
valeurs dans Rd .
3.1. Quelques concepts de base 42

3.1.2 Propriétés statistiques du processus


Dans cette sous-section, nous rappellerons les caractéristiques de tendance centrale
ainsi que celles de dispersion d’un processus stochastique à tendance chronologique.

3.1.2.1 Moyenne

Pour un processus stochastique (Xt )t∈Z , la fonction de la moyenne des observations


est définie par

n
1X
µt = E(Xt ), avec E(Xt ) = xi (t) (3.1)
n i=1

Autrement dit, cette fonction de moyenne permet de caractériser les moyennes empi-
riques du processus sur différentes périodes i.e. en tout temps t.

3.1.2.2 Variance

La fonction de variance de (Xt )t∈Z est également définie par

n
1X
V ar(Xt ) = (xi (t) − µt )2 (3.2)
n i=1

3.1.3 Stationnarité
Un processus stochastique indexé dans le temps est dit stationnaire s’il reste invariant
dans son comportement statistique durant l’évolution de sa trajectoire dans le temps.
Pour cela, nous allons définir les deux cas d’hypothèses de stationnarité posés sur les
processus. La première est une hypothèse très forte et très difficile à vérifier basée sur la
loi de probabilité des variables aléatoires constituant le processus, tandis que la seconde
moins stricte, est fondée sur les propriétés statistiques.

Définition 3.1.2 Un processus (Xt )t∈Z est dit fortement ou strictement stationnaire si
∀t1 , ..., tn ∈ Z, ∀k ∈ Z et n = 1, 2, ... , la loi du vecteur (Xt1 , ..., Xtn ) est identique à la
loi du vecteur (Xt1 +k , ..., Xtn +k ), i.e. toutes les lois de dimension finie du processus sont
identiques.

Définition 3.1.3 Un processus (Xt )t∈Z est dit faiblement stationnaire ou du second ordre
si:
3.1. Quelques concepts de base 43

– E(|Xt |2 ) < +∞, ∀t ∈ Z


– E(Xt ) = µ, ∀t ∈ Z
– Cov(Xt , Xt+k ) est indépendante de t pour chaque valeur de k

Remarque:

– La stationnarité faible est bien plus facile à étudier et à vérifier que la stationnarité
stricte.
– Un processus stationnaire n’est pas obligatoirement borné ou ’sympathique’ (par
exemple, un bruit blanc).
– Pour un processus du second ordre, la stationnarité stricte implique la stationnarité
faible. La réciproque est fausse (elle n’est vraie que pour les processus gaussiens).

3.1.4 Fonction d’autocovariance et d’autocorrélation


Définition 3.1.4 Soit (Xt )t∈Z un processus tel que V ar(Xt ) < +∞. On appelle fonction
d’autocovariance de (Xt )t∈Z , la fonction

γ(r, s) = Cov(Xr , Xs ) = E[(Xr − E(Xr ))(Xs − E(Xs ))], ∀ r, s ∈ T (3.3)

Remarque:
Si (Xt )t∈Z est stationnaire alors γ(r, s) = γ(r − s, 0), ∀ r, s ∈ Z. Il est donc plus agréable
de redéfinir la fonction d’autocovariance d’un processus stationnaire comme une fonction
d’une seule variable définie par

γ(h) = γ(h, 0) = Cov(Xt+h , Xt ), h ∈ Z

Proposition 3.1.1 Si γ est la fonction d’autocovariance d’un processus stationnaire


(Xt )t∈Z , alors
i) γ(0) ≥ 0,
ii) |γ(h)| ≤ γ(h), ∀h ∈ Z,
iii) γ(h) = γ(−h), ∀h ∈ Z(γ paire)

Preuve:

i) γ(0) = V ar(Xt ) ≥ 0
3.1. Quelques concepts de base 44

ii) En utilisant l’inégalité de Cauchy-Schwartz,

|γ(h)| = |E{(Xt − E(Xt ))(Xt+h − E(Xt+h ))}| ≤ Var(Xt )1/2 Var(Xt+h )1/2

iii) γ(−h) = Cov(Xt , Xt−h ) = Cov(Xt , Xt+h ) = γ(h)

Définition 3.1.5 La fonction d’autocorrélation d’un processus stationnaire (Xt )t∈Z de


moyenne µt = E(Xt ) , notée ρ(h) ou ρh , est définie par ∀h ∈ Z :

γ(h)
ρ(h) = ρh = (3.4)
γ(0)

avec ρh ∈ [−1; 1] , et où γ(h) désigne la fonction d’autocovariance.

3.1.5 Fonction d’autocovariance et d’autocorrélation empirique


Considérant les observations x1 , ..., xn d’une série chronologique stationnaire Xt , nous
aurons souvent besoin d’estimer la fonction d’autocovariance γ(.) du processus sous-jacent
Xt afin de mieux comprendre sa structure de dépendance.

Définition 3.1.6 La fonction d’auto-covariance empirique des x1 , ..., xn du processus


(Xt )t∈Z est définie par

n−h
1 X
γ̂n (h) = (xi − x̄)(xi+h − x̄), ∀h = 0, ..., n − 1 (3.5)
n − h i=1

Par ailleurs, la fonction d’auto-covariance entre la variable Xt et Xt+h sera définie


par
n−h
1 X
γ̂n (h) = (xt − x̄t )(xt+h − x̄t+h ), ∀h = 0, ..., n − 1 (3.6)
n − h t=1

avec x̄t = µt et x̄t+h = µt+h

Définition 3.1.7 L’ estimateur de la fonction d’autocorrélation d’un processus station-


naire (Xt )t∈Z de moyenne µt = E(Xt ) sera donné par

γ̂(h)
ρ̂(h) =
γ̂(0)
3.1. Quelques concepts de base 45

Définition 3.1.8 On appelle matrice d’autocorrelation de (Xt , ..., Xt−h+1 ) avec h ∈ N,


la matrice définie par :

 
1 ρ(1) ... ρ(h − 1)
 ρ(1) 1 ... ... 
Γh =  (3.7)
 

 ... ... ... ρ(1) 
ρ(h − 1) ... ρ(1) 1

Définition 3.1.9 La fonction d’autocorrelation partielle de retard h du processus est


définie comme la corrélation entre (Xt −Xt∗ ) et (Xt−h −Xt−h∗
) où Xt∗ désigne la régression
de Xt sur les (h − 1) valeurs Xt−1 , Xt−2 , ..., Xt−h+1 par :


Cov(Xt − Xt∗ , Xt−h − Xt−h )
τh = Corr(Xt − Xt∗ , Xt−h − ∗
Xt−h ) =p ∗ ∗
V ar(Xt − Xt )V ar(Xt−h − Xt−h )
Ph−1
avec Xt∗ = k=1 ∗
= h−1
P
αk Xt−k et Xt−h k=1 βk Xt−k
où α et β désignent les coefficients des régressions.

Cependant, l’ estimateur de cette fonction d’autocorrelation partielle n’admet pas une


forme explicite. Par contre, les autocorrelations partielles sont généralement estimée par
la récurrence d’une fonction d’autocorrelation. Or, nous avons que τ2 vaut

Corr(Xt , Xt−2 ) − Corr(Xt , Xt−1 )Corr(Xt−2 , Xt−1 )


τ2 = p
(1 − Corr(Xt , Xt−1 )2 )(1 − Corr(Xt−2 , Xt−1 )2 )
Ainsi, en utilisant les propriétés de la stationnarité pour le processus considéré, nous
obtenons l’ estimateur de la fonction d’autocorrelation partielle sous la forme :

ρ̂2 − ρ̂21
τ̂2 = (3.8)
1 − ρ̂21
Ph
De ce qui précède, en considérant le fait que Xt∗ = k=1 φk (h)Xt−h , nous avons:
   
ρ(1) φ1 (h)
 ρ(2)  φ (h)
 2 
 = Γh 
 
 
 ...   ... 
ρ(h) φh (h)
En utilisant l’algorithme de Durbin-Levinson, nous obtenons une forme générale de τ
définie par φ1 (h) = ρ(1) et
3.2. Sur les processus autorégressifs et leurs propriétés usuelles 46

Ph−1
ρ(h) − ρ(h − i)φi (h − 1)
∀h > 2, τh = φh (h) = Pi=1
h−1
(3.9)
1 − i=1 ρ(i)φi (h − 1)

3.2 Sur les processus autorégressifs et leurs proprié-


tés usuelles
Cette partie ainsi que les suivantes présentent les modèles proposés par Box et Jen-
kins. Ils sont utilisé pour traiter de nombreuses séries temporelles.

Soit (Xt ) un processus de L2 (Ω, A, P) stationnaire indexé par Z, et deux paramètres


(p, q) ∈ N.

Définition 3.2.1 Le processus stochastique (Xt ) est dit bruit blanc de moyenne nulle et
de variance σ 2 et noté Xt ∼ BB(0, σ 2 ) si et seulement si
– (Xt ) est une suite de variables aléatoires indépendantes et identiquement distribuées
(i.i.d),
– ∀t ∈ Z, E(Xt ) = 0, V ar(Xt2 ) = σ 2 , Cov(Xt , Xt+h ) = 0 ∀h ∈ Z.

Ce processus renferme l’information qui n’est pas directement observable. Il est souvent
appelé le terme d’innovation dans la littérature des séries temporelles. Par ailleurs, la
distribution probabiliste d’un processus est déterminée par l’ensemble fini de toutes ses
observations. Dans le cas où toutes les distributions sont Gaussiennes, le processus est
appelé processus Gaussien ou normal. Mieux puisque toutes les variables aléatoires non
corrélée sont aussi indépendantes, un processus de bruit blanc Gaussien est en fait, une
séquence des variables aléatoires normales i.i.d. .
La Fig. 3.1 montre le comportement d’un bruit blanc Gaussien de moyenne nulle et de
variance σ 2 = 1.
3.2. Sur les processus autorégressifs et leurs propriétés usuelles 47

3
2
1 Bruit Blanc Gaussien
x
0
−1
−2

0 100 200 300 400 500


Observation

Figure 3.1 – Bruit blanc Gaussien.

Définition 3.2.2 Le processus (Xt ) admet une représentation ARMA (p,q) si, pour tout
t ∈ Z, il est défini par la relation récursive
p q
X X
Xt − φi Xt−i = θi εt−i + εt (3.10)
i=1 i=1

où (εt ) est un bruit blanc de variance σ 2 > 0, φ ∈ Rp et θ ∈ Rq .


Lorsque q = 0, le modèle admet la représentation AR(p) donnée par ∀t ∈ Z,
p
X
Xt = φi Xt−i + εt (3.11)
i=1

et l’on dit que Xt est un « processus autorégressif » d’ordre p.


Lorsque p = 0, le modèle admet la représentation MA(q) donnée par ∀t ∈ Z,
q
X
Xt = θi εt−i + εt (3.12)
i=1
3.2. Sur les processus autorégressifs et leurs propriétés usuelles 48

et l’on dit que Xt est une « moyenne mobile » d’ordre q.

L’équation ci-dessus peut être réécrite de façon symbolique comme suit

φ(L)Xt = θ(L)εt , ∀t ∈ Z (3.13)

où
φ(z) = 1 − φ(1)z − ... − φ(p)z p
θ(z) = 1 + θ(1)z + ... + θ(q)z q
et L est un opérateur de retard défini par:

Lj Xt = Xt−j , ∀j ∈ Z (3.14)

Exemple 3.2.1 :Processus MA(q)

Si φ(z) ≡ 1, alors Xt = θ(L)εt et Xt est appelé processus à moyenne mobile d’ordre


q. Ainsi défini, Xt est un processus stationnaire. En effet,
q
X
E(Xt ) = θi E(εt−i ) = 0 (3.15)
i=0

où θ0 = 1 et
(
σ 2 q−|h|
P
i=0 θi θi+|h| si |h| 6 q
Cov(Xt+h , Xt ) =
0, si |h| > q

Exemple 3.2.2 :Processus AR(p)

Si θ(z) ≡ 1, alors φ(L)Xt = εt . Nous examinerons le cas où p = 1, ce qui donne


φ(z) = 1 − φ1 z. Par conséquent, le processus autorégressif sera défini par

Xt = φ1 Xt−1 + εt

En plus, en itérant cette équation nous obtenons,

Xt = εt + φ1 εt−1 + φ21 Xt−2


...
Xt = εt + φ1 εt−1 + ... + φk1 εt−k + φk+1
1 Xt−k−1
3.2. Sur les processus autorégressifs et leurs propriétés usuelles 49

Nous allons maintenant essayer d’établir l’existence et l’unicité d’une solution station-
naire de ce processus autorégressif.

Si |φ1 | < 1, on en déduit qu’au sens de la convergence dans L2 qu’on a



X
Xt = φj1 εt−j . (3.16)
j=0

Puisque Xt est une solutionh stationnaire, i


kXt − kj=0 φj1 εt−j k22 = E (Xt − kj=0 φj1 εt−j )2 = φ2k+2 2
P P
1 E(Xt−k−1 ) −→ 0, lorsque
k −→ ∞.
Vérifions maintenant qu’une telle solution de (3.16) est bien stationnaire puisque cette
condition est nécessaire pour toute la suite de la thèse en particulier pour l’usage de la
phase autorégressives des processus.

Ainsi, en utilisant la continuité du produit scalaire dans L2 défini par < X, Y >=
E(XY ) : si Xn converge vers X dans L2 (k Xn − X k2 −→ 0) et Yn converge vers Y dans
L2 alors limn→∞ < Xn , Yn >=< X, Y >.

D’où, en écrivant < Xn , Yn >=< (Xn −X)+X, (Yn −Y )+Y >, on obtient en utilisant
l’inégalité de Cauchy-Schwarz

| < Xn , Yn > − < X, Y > | ≤ | < (Xn − X), (Yn − Y ) > | + | < (Xn − X), Y > |
+| < X, (Yn − Y ) > |
≤ kX − Xn k2 kY − Yn k2 + kX − Xn k2 kY k2 + kY − Yn k2 kXk2
−→ 0.

On en déduit alors que E(Xt ) = limk→∞ E( kj=0 φj1 εt−j ) = 0 et par la suite
P

" n
! n
!# ∞ |h|
X X |h|
X φ1
γ(h) = Cov(Xt+h , Xt ) = lim E φj1 εt+h−j φk1 εt−k = σ 2 φ1 φ2j
1 =σ 2
n→∞
j=0 k=0 j=0
1 − φ21

Pour vérifier maintenant l’unicité de la solution, soient Xt et Yt deux solutions de


l’équation Xt = φ1 Xt−1 + εt .
3.2. Sur les processus autorégressifs et leurs propriétés usuelles 50

On peut écrire encore


Xt − φ1 Xt−1 = Yt − φ1 Yt−1
⇐⇒Xt − Yt = φ1 (Xt−1 − Yt−1 )
...
⇐⇒Xt − Yt = φk1 (Xt−k − Yt−k )
Par conséquent,
E(|Xt − Yt |) = |φk1 |E(|Xt−k − Yt−k |) ≤ |φk1 |(σX + σY ) −→ 0, lorsque k −→ ∞
Ce qui prouve l’unicité de la solution.

Modèle autoregressif AR(1)


5
0
x
−5

0 100 200 300 400 500


Observation

Modèle autoregressif AR(2)


4
2
−2 0
x
−6

0 100 200 300 400 500


Observation

Figure 3.2 – Exemple d’une trajectoire AR(1) stable.

De ce qui précède, nous pouvons définir ce que c’est qu’un processus autoregressif avec
les propriétés sous-jacents.
Définition 3.2.3 Soit εt , t ∈ Z un bruit blanc (faible) de variance σ 2 . On dit qu’un pro-
cessus Xt , t ∈ Z est un processus autorégressif ou encore processus AR (AutoRegressive)
d’ordre p, noté AR(p), si :
1. Xt , t ∈ Z est stationnaire,
2. Xt = pi=1 φi Xt−i + εt
P

avec (φ1 , ..., φp ) sont des constantes et φp 6= 0


3.2. Sur les processus autorégressifs et leurs propriétés usuelles 51

3.2.0.1 Condition de stationnarité et d’invertibilité

L’exemple précédent nous permet de poser les conditions de stationnarité et d’inversi-


bilité nécessaire respectivement dans les processus autorégressifs et les moyennes mobiles.
La question est alors de savoir sous quelles conditions sur les paramètres des polynômes
θ(L) et φ(L) ces processus sont-ils stationnaires. Nous allons en outre introduire la notion
d’inversibilité qui consiste à déterminer s’il existe une représentation MA (respectivement
AR) équivalente pour un AR (respectivement pour un MA).

Théorème 3.2.1 Un processus (Xt , t ∈ Z) satisfaisant une représentation AR(p) est


toujours inversible. Il est stationnaire lorsque toutes les racines du polynôme de retard
A(L) notées λj ∈ C, ∀j ≤ p sont de module strictement supérieur à l’unité.

p
X
A(L) = φi Li = 0 ⇐⇒ 1 − φ1 L − ... − φp Lp = 0 (3.17)
i=0
p p
X Y 1
⇐⇒ A(λj ) = φi λij ⇐⇒ (1 − L) = 0, |λj | > 1, ∀j (3.18)
i=0 j=1
λj

Théorème 3.2.2 Un processus (Xt , t ∈ Z) satisfaisant une représentation AR(p) est


toujours inversible. Il est stationnaire lorsque toutes les racines du polynôme caractéris-
tique notées φ(z) sont de module strictement inférieur à l’unité.

p
X
φ(z) = φi z p−i = 0 ⇐⇒ z p − φ1 z p−1 − ... − φp−1 z − φp = 0, φ0 = 1 (3.19)
i=0

Ces deux théorèmes indiquent que lorsque les racines du polynôme de retard (resp.
caractéristique) autorégressif sont toutes supérieures (resp. inférieures) à l’unité en mo-
dule, le processus satisfait les trois conditions de la stationnarité du second ordre.

1
Proposition 3.2.1 Si z est une racine du polynôme retard alors z
est une racine du
polynôme caractéristique.

Preuve
Nous avons que z est une racine du polynôme de retard si et seulement si A(z) = 0
c’est-à-dire
3.2. Sur les processus autorégressifs et leurs propriétés usuelles 52

1 − φ1 z − φ2 z 2 − ... − φp z p = 0
Par la suite, en factorisant le terme précédent par z puisque z 6= 0, nous aurons:
 
p 1 p 1 p−1 1 p−2 1 p
z ( ) − φ1 ( ) − φ2 ( ) − ... − φp−1 ( ) − φp = 0
z z z z
Du fait que le second terme de l’équation est un polynôme caractéristique, nous ob-
tenons:
1
z p φ( ) = 0
z
Maintenant, compte tenu du fait que z 6= 0, pour que l’égalité ait un sens, il faut que
φ( z1 ) s’annule. Par conséquent, φ( z1 ) = 0 si et seulement si z1 est racine du polynôme
caractéristique.
Exemple

Considérons trois processus autorégressifs et vérifions s’ils remplissent les conditions


de stationnarité du second ordre.

x1,t = 3x1,t−1 − 2x1,t−2 + εt


x2,t = 4x2,t−1 − 3x2,t−2 + 5x2,t−3 + εt
1 1
x3,t = − x3,t−1 + x3,t−2 + εt
4 2

Les trois polynômes de retard associés aux processus autorégressifs sont:


3.2. Sur les processus autorégressifs et leurs propriétés usuelles 53

1 1 1 1
φ1 (L) = 1 − 3L + 2L2 ⇐⇒ (1 − L)(1 + L) = 0 ⇐⇒ φ1 = et φ2 = −
3 2 6 6
2 3
φ2 (L) = 1 − 4L + 3L − 5L
1 1 1
⇐⇒ (1 − L)(1 + L)(1 − L) = 0
4 3 5
7 6 2 1 3
⇐⇒ (1 − L − L + L ) = 0
60 60 60
7 6 1
⇐⇒ φ1 = − , φ2 = , φ3 =
60 60 60
1 1 3
φ3 (L) = 1 + L − L
4 2
⇐⇒ (1 + 4L)(1 − 2L) = 0
⇐⇒ (1 + 2L − 8L2 ) = 0
⇐⇒ φ1 = 2 et φ2 = −8

En effet, le processus (x1,t , t ∈ Z) est non stationnaire puisque les deux racines sont
inférieures à l’unité. Le processus (x2,t , t ∈ Z) est aussi non stationnaire puisque toutes
ses racines sont de module strictement inférieures à un. Seul le processus (x3,t , t ∈ Z) est
stationnaire puisque ses deux racines sont de module strictement supérieures à l’unité.

Modèle autoregressif stationnaire AR(2)


4
2
0
−2
−4

0 50 100 150 200


Observation

Figure 3.3 – Exemple d’une trajectoire AR(2) stationnaire du second ordre.


3.2. Sur les processus autorégressifs et leurs propriétés usuelles 54

3.2.1 Densité spectrale des processus


L’analyse spectrale considère le problème de la détermination du contenu spectral (par
exemple, la contribution des contenus en termes de fréquence) d’une série temporelle sur
un ensemble de mesures finies, par l’intermédiaire des techniques paramétriques et non
paramétriques. L’histoire de l’analyse spectrale en tant que discipline établie a commen-
cée il y a plus d?un siècle avec le travail de Schuster sur la détection de comportement
cyclique dans les séries chronologiques.
Cependant, plusieurs domaines scientifiques ont fait usage de l’analyse spectrale bien que
dans des contextes un peu nuancé. En économie, météorologie et astronomie, l’analyse
spectrale pourrait révéler la périodicité cachée dans l’étude des données. Dans l’analyse
du langage, les modèles spectrales sont bénéfiques pour la compréhension des processus
de production de la parole et même de la reconnaissance des voix. En médecine, l’ana-
lyse spectrale des divers signaux recueillis sur des patients, tels que l’électrocardiogramme
(ECG) ou l’électroencéphalogramme (EEG) constituent des outils très utiles pour le diag-
nostic.

3.2.1.1 Définition et propriétés

Définition 3.2.4 Soit un processus (Xt , t ∈ Z) stationnaire de fonction d’auto-covariance


γ(.). Alors, pour tout λ ∈ T, on appelle « densité spectrale » du processus, la fonction

+∞
1 X
f (λ) = γ(h)e−ihλ (3.20)
2π h=−∞

Si γ(h) satisfait
+∞
X
|γ(h)| < ∞ (3.21)
h=−∞

alors elle aura la représentation

Z
γ(h) = f (λ)eihλ dλ, h ∈ Z (3.22)
T

De ce qui précède, nous pouvons énoncer un théorème fondamental qui combine la notion
de densité spectrale et de fonction d’auto-covariance.
3.2. Sur les processus autorégressifs et leurs propriétés usuelles 55

Théorème 3.2.3 Pour tout processus stationnaire (Xt , t ∈ Z) admettant comme densité
spectrale f , nous avons
Z
γ(h) = f (λ)eihλ dλ, h ∈ Z (3.23)
T

Par conséquent, la densité spectrale d’un processus est l’équivalent de la fonction de


densité de probabilité. De ce fait, comme γ(h) est définie non-négative,

f (λ) ≥ 0, ∀λ.

Par ailleurs, nous avons aussi que

f (λ) = f (−λ) et f (λ) = f (1 − λ)

Exemple 3.2.3 Soit (εt , t ∈ Z) un bruit blanc de variance σ 2 . Nous aurons alors:
(
σ 2 si h = 0
γ(h) =
0 sinon
On en déduit donc :
σ2
f (λ) =

La Fig. 3.4 illustre la densité spectrale d’un bruit blanc de moyenne nulle et de variance
constate σ 2 = 1

Densité spectrale d'un bruit blanc


1.4
1.2
Spectre
1.0
0.8

0.0 0.1 0.2 0.3 0.4 0.5


frequence

Figure 3.4 – Densité spectrale d’un bruit blanc gaussien de moyenne nulle et de variance
constante.
3.2. Sur les processus autorégressifs et leurs propriétés usuelles 56

En effet, nous pouvons dorénavant énoncer la représentation spectrale d’un processus


ARMA de manière générale et approfondir particulièrement celle d’un processus autoré-
gressif qui est l’objet cette thèse.

Théorème 3.2.4 Soit (Xt , t ∈ Z) un processus ARMA(p,q) (pas nécessairement causal


ou inversible) satisfaisant

φ(L)Xt = θ(L)εt , ∀t ∈ Z (3.24)

où
φ(z) = 1 − φ(1)z − ... − φ(p)z p
θ(z) = 1 + θ(1)z + ... + θ(q)z q
Alors, (Xt , t ∈ Z) a pour densité spectrale

σ 2 |θ(e−iλ )|2
f (λ) = , λ ∈ [−π, π] (3.25)
2π |φ(e−iλ )|2

Autrement dit, si f (λ) est la densité spectrale de ce processus, nous pouvons réécrire
(3.25) sous la forme de

σ 2 | qs=0 θs e−iλ(q−s) |2
P
f (λ) = (3.26)
2π| pr=0 φr e−iλ(p−r) |2
P

Exemple 3.2.4 Densité spectrale d’un MA(1)

Si Xt = θ1 εt−1 + εt , où εt est un bruit blanc d’espérance nulle et de variance σ 2 alors

σ2 σ2
f (λ) = |1 + θ1 e−iλ |2 = (1 + 2θ1 cos(λ) + θ2 )
2π 2π
Exemple 3.2.5 Densité spectrale d’un AR(1)

Si Xt = φ1 Xt−1 + εt , où εt est un bruit blanc d’espérance nulle et de variance σ 2 alors

σ2 σ2
f (λ) = =
2π|1 − φ1 e−iλ |2 2π|1 − 2φ1 cos(λ) + φ21 |
3.2. Sur les processus autorégressifs et leurs propriétés usuelles 57

Exemple 3.2.6 Densité spectrale d’un AR(2)

Si Xt = φ1 Xt−1 + φ2 Xt−2 + εt , où εt est un bruit blanc d’espérance nulle et de variance


σ 2 alors

σ2
f (λ) =
2π|e−i2λ + φ1 e−iλ + φ2 |2
σ2
=
2π[1 + φ21 + φ22 + 2φ1 (1 + φ2 ) cos(λ) + 2φ2 cos(2λ)]
σ2
=
2π[φ21 + (1 − φ2 )2 + 2φ1 (1 + φ2 ) cos(λ) + 4φ2 cos2 (λ)]
σ2
=
(1 − φ2 )2 (4φ2 − φ21 )
2π{4φ2 [cos(λ) + φ1 (1+φ
4φ2
2) 2
] + }
4φ2

Densité spectrale AR(2) par autoregression


200
150
Spectre
100
50
0

0.0 0.1 0.2 0.3 0.4 0.5


frequence

Figure 3.5 – Densité spectrale par autorégression du processus.

Pour illustrer les exemples précédents, nous avons considéré le processus autorégressif
AR(2) définie par

xt = φ1 xt−1 + φ2 xt−2 + εt (3.27)


3.2. Sur les processus autorégressifs et leurs propriétés usuelles 58

avec φ1 = 1 et φ2 = −.9
Par conséquent, la Fig. 3.5 et Fig. 3.6 illustrent respectivement la densité spectrale
du processus par autorégression des observations et par les racines du polynôme caracté-
ristique.
Par ailleurs, la Fig. 3.7 illustre la convergence de la densité spectrale dont les coefficients
sont estimé par un processus autorégressif.

Densité spectrale AR(2) par les racines


0.060
0.055
Spectre
0.050
0.045

−3 −2 −1 0 1 2 3
Frequence

Figure 3.6 – Densité spectrale du processus par les racines des polynômes avec λ ∈
[−π, π].

Densité spectrale originale/ simulée


10
8
Densité spectrale
6
4
2
0

0 100 200 300 400 500


Frequence

Figure 3.7 – Densité spectrale du processus stationnaire avec φ1 = −1.4, φ2 = 1.2, φ3 =


−2 fixé (en noir) contre la densité spectrale dont les paramètres sont estimé par un modèle
AR pour le même processus (en rouge).
59

Chapitre 4

Détection par une approche basée


sur la moyenne de la densité
spectrale de puissance du signal
EEG

4.1 Introduction
L’histoire du développement de l’analyse des séries chronologiques et notamment la
modélisation autoregressive (AR) a commencée dans le domaine temporel par les deux
articles de Slutsky [39] et Yule [46] en termes de théorie et de méthodologie.
Après ces deux articles, de nombreux auteurs ont travaillé sur ce domaine des statistiques
mathématiques. Par la suite, ces deux méthodes pionnières ont été l’objet de recherche
des travaux de Walker (1931), Barlett (1948), Parzen (1957), Blackman et Tukey (1958),
et Burg (1967).
La littérature sur la modélisation AR et l’estimation de la puissance spectrale est assez
vaste. L’ouvrage de Box et Jenkins (1970) est le premier livre traitant systématiquement
l’analyse des séries chronologiques par les processus nommé Autorgressive and Moving
Average (ARMA). L’ouvrage d’Anderson (1971) a été adapté spécifiquement à des sta-
tisticiens n’ayant pas une bonne base en mathématiques. Brillinger (1981) et Priestley
(1981) offrent une large couverture ainsi qu’une étude en profondeur de l’analyse spectrale
des séries chronologiques. Nous pouvons également citer le livre de Fan et Yao (2003) qui
traite presque de tous les aspects des séries chronologiques avec des applications sur des
données simulées.
Comme article de revue, nous avons le premier travail remarquable de Wright, Kydd
R. et A. Sergejew [44] qui considère les propriétés des paramètres (fréquences naturelles
et les coefficients d’amortissement) obtenus à partir de l’analyse des ECoG de rat segment
par segment . Parmi les travaux récents, nous pouvons citer Wang T.W., Guohui W. et
Huanqing F. [42].
4.1. Introduction 60

Par ailleurs, concernant l’analyse spectrale des signaux EEG par un modèle autoregressif
(AR), nous avons Abdulhamit Subasi [4] qui a proposé une étude comparative sur la base
des méthodes AR ainsi que l’estimation de la puissance spectrale de l’EEG afin d’analyser
et de caractériser les décharges épileptiques dans la forme de pics et d’ondes complexes de
3 Hz chez les patients présentant des crises d’absence. Toujours dans le même sens, nous
avons O. Faust, R.U. Acharya, A.R. Allen et C.M. Lin [27] qui ont proposé une étude
comparative de la densité spectrale de puissance (DSP) obtenue à partir des signaux
EEG normaux, épileptiques et alcoolisés. Les spectres de la puissance spectrale ont été
calculé en utilisant la transformée de Fourier rapide (FFT) par la méthode de Welch, de
Yule-Walker et de Burg.

Dans ce travail, l’innovation relativement aux travaux antérieurs [4] et [27] est que
compte tenu du fait que les signaux EEG sont souvent non stationnaire dans la pra-
tique, nous avons traité les données par une technique de différenciation afin d’avoir la
stationnarité qui est convenable pour le modèle autorégressif (AR). Par la suite, nous
avons utilisé les critères tels que le critère de l’AIC, BIC et AICc afin d’obtenir un ordre
convenable pour le modèle autoré gressif. Par conséquent, nous avons utilisé les méthodes
d’estimation telles que le Maximum de vraisemblance, la méthode de Burg, la méthode
des moindres carrées et la méthode de Yule-Walker afin d’estimer les paramètres du mo-
dèle proposé.
Enfin, nous avons utilisé ces méthodes en proposant une nouvelle approche basée sur la
moyenne de la densité spectrale pour détecter le rythme dans le domaine fréquentiel afin
de discriminer les signaux EEG épileptiques des signaux EEG normaux.
En outre, cette approche est motivée du fait que l’analyse de l’enregistrement EEG par les
praticiens en neurologie est basée sur l’analyse visuelle des signaux selon le rythme delta,
thêta, alpha, bêta et gamma dont la classification clinique et physiologique est comprise
entre 0,5 et 30 Hz. Cette gamme est divisée en quatre bandes de fréquence comme suit:
delta (< 4 Hz), thêta (4-8 Hz), alpha (8-14 Hz) et bêta (14 − 30 Hz) .

Dans la suite de ce chapitre, nous allons présenter le critère de dé tection proposé.
Par suite, nous allons approfondir avec une base théorique, les méthodes d’estimation des
paramètres du modèle. En dernière position, nous présenterons les résultats du modèle
sur des données simulées et par la suite sur des données réelles des signaux EEG recueillis
au niveau du CHU de Fann à Dakar.
4.2. Approche spectrale de la détection proposée 61

4.2 Approche spectrale de la détection proposée


Soit X = (X1 , X2 , ..., Xn ) les variables aléatoires représentant l’échantillon des obser-
vations recueillies générée par un processus autoré gressif d’ordre p notée AR(p) et dont
les observations sont définie par
p
X
x(n) = a(i)x(n − i) + ε(n) (4.1)
i=1

avec ε(n) ∼ N (0, σε2 ), a(i) ∈ R, a(0) = 1 et a(i) ∈ R+ sont les coefficients du modèle à
estimer.

Soit la densité spectrale de puissance définie par [6, 37]

σε2
P (f ) = (4.2)
|A(f )|2
où A(f ) = 1 + a(1)e−j2πf + ... + a(p)e−j2πf p est la réponse de la fréquence du filtre,
f la fréquence d’échantillonnage, j la partie imaginaire et σε2 est la variance du terme de
l’innovation ε(n).

Ainsi, nous proposons le critère de détection basé sur la moyenne de la DSP sous
forme d’une proposition définie par:

Proposition 4.2.1 Soit P (f ) la densité spectrale du processus (Xt , t ∈ Z) avec f la


fréquence d’échantillonnage. Alors, nous avons:
(
P (f ) si P (f ) ≥ P̄ (f )
PM (f ) =
0 sinon
avec
1
Pf
P̄ (f ) = f l=1 P (l)

Ainsi, cette approche permettra de classifier les signaux EEG des épileptiques et nor-
maux compte tenu de l’évolution rythmique en bande de fréquence ( delta, thêta, alpha,
gamma, bêta) utilisée par les médecins praticiens pour l’interprétation des signaux.

Dans la section suivante, nous allons présenter et approfondir les méthodes d’estima-
tion des paramètres du modèle proposé.
4.2. Approche spectrale de la détection proposée 62

4.2.1 Estimation des paramètres par le maximum de vraisem-


blance
Nous supposons que la distribution des observations générée par la machine Micromed
du CHU de Fann est d’une forme gaussienne, indépendante et identiquement distribuée.
En effet, cette hypothèse est confirmée par les tests d’adéquation de normalité comme
illustrée sur la Fig. 4.1 .

Normal Q−Q Plot Normal Q−Q Plot Normal Q−Q Plot Normal Q−Q Plot Normal Q−Q Plot Normal Q−Q Plot

200
●●● ●●● ●●● ●●●
● ●●● ●
●●
●●

●●
●●●●

50
●● ●● ●
100 200

●● ●● ●
●●
● ●
●●
● ●
● ●


●●

●●
●●

●●

● ●● ●
●●

●● ●● ●●

● ●


●●




● ●
● ●
●●

●●
● ●
●●●


●●

● ●
● ●
●●

● ●

●●


●●


●●




● ●●


●●
● ●


●●
● ●● ●

●●


●●


●●
● ●
● ●
● ● ●

●●
●●
●●

100
● ●● ● ● ●●



●●

●●
● ●
100



● ●


●●

● ●


● ●
● ●●●
●●
●●
●●

●●


●●

●●
●●
● ●●
●●

●●
●●
●●

●●

●●

●●
●●
●●




●● ● ●●


●●


● ●

● ●●


● ● ●


●●
●●

●●


●●

●●

●●
●●
●●

●●
● ●
●●


●●
●●

●●

●●
●● ●●

●●

●●

●●




● ●
● ●

●●


●●

● ●

●● ●
●●

● ●

●●
● ●
●●

●●

●●

●●
●●
●●
●●

●●

●● ●
●●

●●
●●
●●
●●
● ●●

●●
●●
●●

●●
●●

●●
●●


●●


● ●●


●● ● ●



●●

●●



●●
● ●
●●
●● ●


●● ●


●●
● ●●


●●



●●●

50


● ●
●●
● ●

●●
●●

●●
● ●
● ●

● ●

−200

● ● ●

●● ●
● ● ●●
Fp2F4

Fp2F8

●●
● ●


●● ●●
●●●
●●

●●

●●
● ●
● ●

● ●

P4O2
● ● ● ● ●

C4P4
●●

0
● ●
F4C4

●● ● ●●

● ● ● ●

F8F8


●●


●●

● ●

●●
● ●
●●●

●●

●●

●●
●●

●● ●●

●●

●●

●●

●●

● ●
●●


● ●●


●●

● ●

●●

●●
●●



●●
●●

●●
●●

●●

●●

●●
● ● ●


●● ●●●

●●

●●

●●
●●

●●
● ●●

●●
●●

●●
●●

●●
●●
●●
● ●


●●
● ●


●●

● ●
●●
● ●●

●●

●●
●●

●●

●●

●●
●●

●●
●● ●

●●
●●

●●
●●

●●

●●
● ●●


● ●
●●
●●



●●

●●
●●
● ● ●


●●


● ●


●●


● ●


●●
● ● ●●
● ● ●
0

●●
●●

●●
●●

●●

●●
●●
●●
●●


●●
● ●●
●●

●●
●●
●●

●●
●●

●● ●

●●
● ●●


●●


● ●●


●●

● ●


●●

● ●

●●

●● ● ●
● ●

0




●●
● ●

●●●
●●

●●

●●
● ●●


●●


● ●


●●

●●
●●
● ●
●●


●●

● ●

●●