Vous êtes sur la page 1sur 210

No dordre : 3267

Thse
prsente

devant lUniversit de Rennes I


pour obtenir

le grade de : Docteur de lUniversit de Rennes I

Mention : Traitement du signal et telecommunications

par

Stphane BRUNO

quipe daccueil : quipe R2D2, IRISA Lannion


cole doctorale : MATISSE
Composante universitaire : Structure et Proprit de la Matire (SPM)

Modlisation de signaux physiologiques en vue dune


classification automatique du sommeil

soutenue le 26 janvier 2006 devant la commission dexamen :

Prsident : Mr. Lotfi SENHADJI Professeur lUniversit de Rennes 1


Rapporteurs : Mr. Jacques PRADO Matre de Confrences lENST Paris
Mr. Herv RIX Professeur lUniversit de Nice-Sophia Antipolis
Examinateurs : Mr. Jean-Marc BOUCHER Professeur lENST Bretagne
Mr. Jrme BOUDY Ingnieur dtude lINT vry
Directeur : Mr. Pascal SCALART Professeur lUniversit de Rennes 1
Invit : Mr. Philippe COSQUER P-DG de APHYCARE Technologies
Remerciements

Avant dentrer dans le vif du sujet, je souhaite remercier chaleureusement Pascal


SCALART, Professeur `a lUniversite de Rennes 1, pour avoir encadre ce travail depuis ses
origines (ou presque) et permis que celui-ci se termine favorablement. Jai particuli`erement
apprecie sa serenite et son esprit innovant tout au long de notre collaboration.

Je tiens aussi `a remercier tr`es sinc`erement Jacques PRADO, Matre de Conference ` a



lEcole Nationale Superieure des Telecommunications de Paris et Herve RIX, Professeur ` a
lUniversite de Nice-Sophia Antipolis, davoir bien voulu accepter la charge de rapporteur.

Merci aussi `a Lotfi SENHADJI, Professeur `a lUniversite de Rennes 1, de mavoir


fait lhonneur de presider le jury dexamen. Merci egalement `a Jean-Marc BOUCHER,

Professeur `a lEcole Nationale Superieure des Telecommunications de Bretagne et Jerome
BOUDY, Ingenieur de Recherche ` a lInstitut National des Telecommunications, pour leur
active participation `a ce meme jury.

Je remercie bien s ur aussi Philippe COSQUER, P-DG dAPHYCARE Technologies,


davoir permis le deroulement de cette th`ese et lensemble de ses salaries (Clement,
Guillaume, Thomas, Laurent(x2), Pierre-Yves, Marc, Bruno, Isabelle) pour lambiance
sympathique qui y r`egne. Je salue egalement les membres du laboratoire R2D2 (Daniel (x2),
Sebastien, Hel`ene, Olivier (x2), Kacem, Michel, Mich`ele, Herve, Benoit, Orlane, Claude)
pour laccueil dont jai toujours beneficie dans leurs locaux, et tout particuli`erement les
e, Im`ene, Jean-Marc...), avec qui nous avons pu echanger sur nos etats
doctorants (Cyril, Eku
dames au cours de la th`ese.

Ce travail naurait pu aboutir sans limplication des equipes medicales avec qui nous
avons collabore, et plus specifiquement Beatrice NOGUES au centre Hospitalier Laennec de
Nantes, et Damien LEGER et Maxime ELBAZ, `a lHotel-Dieu de Paris et cest pourquoi je
tiens ici `a leur temoigner ma reconnaissance.

Je ne saurais conclure cette page sans adresser des remerciements tout particuliers `a
Noel CHATEAU, chercheur au sein de France Telecom R&D, qui ma permis de decouvrir
les application pratiques du traitement du signal et donne envie, par le travail que nous
avons realise ensemble, de poursuivre dans cette voie.

Enfin, merci `a Sandrine et `a toute ma famille pour mavoir offert un cadre propice `
a
laccomplissement de cette th`ese...
R
esum
e

Cette th`ese sinscrit dans le cadre de letude dun syst`eme de classification automatique
du sommeil base sur un bracelet multicapteur. Celui-ci permet, entre autre, lacquisition
du signal de variation de pression de lart`ere radiale. Ce signal est decoupe en epoques de
trente secondes, que lon caracterise par un vecteur de param`etres. Le syst`eme propose classe
ces vecteurs dans lun des six etats de vigilance (eveil, stades de sommeil 1 `a 4, sommeil
paradoxal).

Les frequences cardiaque et respiratoire sont des variables importantes pour la classifica-
tion. Cest pourquoi nous nous sommes interesses `a leur estimation `a partir du signal acquis
par le bracelet. Nous etudions, dans un premier temps, lestimation de ces param`etres ` a
partir dune modelisation du syst`eme physiologique de generation des battements cardiaques.
Les resultats sont interessants mais limplantation de lalgorithme dans un syst`eme embarque
tel que le bracelet necessite quelques adaptations.

Dans un deuxi`eme temps nous proposons deux estimateurs, lun de la frequence


cardiaque, lautre de la frequence respiratoire, exploitant une modelisation du signal de
variation de pression arterielle. Nous developpons un algorithme base sur une estimation en
deux phases successives. La premi`ere vise `a utiliser le signal de frequence instantanee, delivre
par loperateur de demodulation de Teager, pour estimer le rythme cardiaque. La seconde
phase consiste `a utiliser cette estimation pour isoler une composante respiratoire additive,
presente au sein du signal de variation de pression arterielle, puis `a estimer la frequence
respiratoire `a laide dun algorithme adaptatif visant `a poursuivre la composante principale
de la decomposition de Karhunen-Lo`eve de cette composante additive. Ces deux estimateurs
fournissent des resultats satisfaisants (faible biais et variance acceptable, entre 7 et 15%).

Dans une derni`ere partie nous etudions les techniques envisageables pour realiser
loperation de classification automatique en stades de sommeil. Nous en retenons deux : lune
utilise un classifieur bayesien sappuyant sur une modelisation monogaussienne, et lautre, un
reseau de neurone de type perceptron multicouche. Nous proposons egalement deux methodes
de rescorage permettant de corriger les erreurs de classification. Il ressort des essais realises
que si les deux techniques de classification envisagees sav`erent, dans le cadre des bases de
donnees utilisees, inadequates pour realiser la classification de nuits ne participant pas ` a
lapprentissage, elles sont toutes deux performantes lorsquelles sont appliquees `a un seul
individu.
Summary

This PhD work fits in line with the development of an automatic sleep staging system,
based on a multisensor wriststrap allowing the measure of pressure variations in the radial
artery. This signal is segmented into thirty-second epochs, which are characterized by a
vector of parameters. Each vector is classified among the six sleep stages (awake / NREM
sleep 1-4 / REM).

As cardiac and respiratory frequencies are of main importance in sleep classification, the
first part of this work deals with the estimation of such parameters from the observation
of the arterial signal. A first respiratory frequency estimator is based on a model of the
physiological system that generates heart beats. Promising results are presented but further
improvements are required to get an efficient implementation in an embedded target.

In a second time we propose two estimators, one of the cardiac rhythm and the other
one of the respiratory rhythm. Both estimators are built on a two-stage processing unit,
based on a modelling of the arterial signal. In a first step, cardiac rhythm is determi-
ned from an estimation of the instantaneous frequency of arterial signal, performed by
Teager demodulation operator. The second step takes advantage of this estimation in
order to isolate the additive respiratory component that is part of the arterial signal.
Then, respiratory frequency is estimated with the help of an adaptive algorithm following
the eigenvector associated to the largest eigenvalue of this component. Both estimators
yield satisfying results : low bias (less than 3%) and acceptable variance (between 7 and 15%).

The last part of the manuscript is dedicated to the selection of a sleep classification tech-
nique. Two of them are selected : the Bayesian rule, based on a single-Gaussian model, and
neural networks by the way of a multilayer perceptron. We also propose two rescoring me-
thods in order to correct classification mistakes. Experiments show that both classification
techniques lead to poor results, in terms of sleep staging, when the learning database incor-
porates nights from different patients. However, our proposed techniques prove to be efficient
when applied to database recorded from a single person.
Table des mati`
eres

1 Le sommeil et ses m ethodes dinvestigations : utilisation du bracelet mul-


ticapteur pour lanalyse du sommeil 21
1.1 Le sommeil . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
1.1.1 Une nuit de sommeil . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
1.1.2 Influence du sommeil sur les rythmes physiologiques . . . . . . . . . . 23
1.2 Lanalyse du sommeil . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
1.2.1 Lactimetrie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
1.2.2 La polysomnographie classique . . . . . . . . . . . . . . . . . . . . . . 25
1.2.3 Le lit `a charge statique . . . . . . . . . . . . . . . . . . . . . . . . . . 26
1.2.4 Les donnees cardio-respiratoires . . . . . . . . . . . . . . . . . . . . . . 26
1.3 Le scorage automatique du sommeil . . . . . . . . . . . . . . . . . . . . . . . 26
1.3.1 Exploitation des donnees actimetriques . . . . . . . . . . . . . . . . . 26
1.3.2 Exploitation des donnees electro-encephalographiques . . . . . . . . . 27
1.3.3 Exploitation des donnees cardio-respiratoires . . . . . . . . . . . . . . 30
1.4 Conclusions concernant letude menee dans ce document . . . . . . . . . . . . 31

2 Exploitation de la mod elisation physiologique du signal de variation de


pression art
erielle pour lestimation des rythmes cardiaque et respiratoire 33
2.1 Modelisation de la generation des battements cardiaques . . . . . . . . . . . . 34
2.2 Obtention des signaux generateurs `a partir du signal de battements . . . . . . 35
2.2.1 Le mod`ele TVTIPFM . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
2.2.2 Mise en uvre pratique . . . . . . . . . . . . . . . . . . . . . . . . . . 38
2.3 Algorithme destimation des variables du mod`ele . . . . . . . . . . . . . . . . 48
2.3.1 Presentation de lalgorithme . . . . . . . . . . . . . . . . . . . . . . . . 48
2.3.2 Choix des param`etres du mod`ele . . . . . . . . . . . . . . . . . . . . . 48
2.4 Resultats . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
2.4.1 Validation du mod`ele `a partir de signaux synthetiques . . . . . . . . . 50
2.4.2 Estimation de la frequence respiratoire `a partir du mod`ele TVTIPFM 50
2.4.3 Application `a des signaux ECG reels . . . . . . . . . . . . . . . . . . . 54
2.4.4 Application au signal de variation de pression arterielle . . . . . . . . 55
8 `
TABLE DES MATIERES

2.5 Conclusions sur lemploi du mod`ele TVTIPFM pour la determination des si-
gnaux respiratoires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

3 Utilisation de la d
emodulation AMFM et de la decomposition en vecteurs
propres pour lestimation des rythmes cardiaque et respiratoire 61
3.1 Le signal de variation de pression arterielle est module AMFM . . . . . . . . 61
3.2 Demodulation AMFM du signal de variation de pression arterielle par
loperateur de Teager . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
3.2.1 Extraction du produit des modulants . . . . . . . . . . . . . . . . . . . 63
3.2.2 Separation des modulants . . . . . . . . . . . . . . . . . . . . . . . . . 64
3.2.3 Algorithme discret . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
3.3 Application au signal de variations de pression arterielle . . . . . . . . . . . . 65
3.3.1 Determination du domaine de validite theorique . . . . . . . . . . . 65
3.3.2 Pourquoi on peut aller au-del`a du domaine defini par les contraintes . 67
3.3.3 Domaine de validite experimental de la methode AMFM . . . . . . 69
3.4
Evaluation sur des signaux reels . . . . . . . . . . . . . . . . . . . . . . . . . . 72
3.4.1 Estimation du rythme cardiaque par utilisation du signal de frequence
instantanee . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72
3.4.2 Estimation du rythme respiratoire par analyse du signal de frequence
instantanee . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
3.4.3 Estimation du rythme respiratoire par analyse du signal damplitude
instantanee . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
3.4.4 Conclusions concernant cette methode destimation des param`etres
cardio-respiratoires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
3.5 Determination de la frequence respiratoire `a partir du signal de variation de
pression arterielle filtre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
3.5.1 Estimation non parametrique de la frequence respiratoire : utilisation
dun periodogramme . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
3.5.2 Estimation parametrique de la frequence respiratoire : modelisation du
signal residuel par une sinusode bruitee . . . . . . . . . . . . . . . . . 77
3.5.3 Estimation parametrique de la frequence respiratoire : modelisation du
signal residuel par une somme de sinusodes bruitees . . . . . . . . . . 84
3.6 Conclusions sur lutilisation de la demodulation AMFM pour lestimation des
rythmes cardiaque et respiratoire . . . . . . . . . . . . . . . . . . . . . . . . . 94

4 Classification 97
4.1 Contexte de lexperimentation . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
4.1.1 La collaboration avec les centres de sommeil . . . . . . . . . . . . . . . 97
4.1.2 Description generale de la chane de traitement . . . . . . . . . . . . . 98
4.1.3 Bases de donnees retenues . . . . . . . . . . . . . . . . . . . . . . . . . 99
4.2 Selection des param`etres utilises par la classification . . . . . . . . . . . . . . 99
`
TABLE DES MATIERES 9

4.2.1 Param`etres initiaux . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100


4.2.2 Selection des param`etres pertinents . . . . . . . . . . . . . . . . . . . . 101
4.2.3
Elimination des param`etres redondants . . . . . . . . . . . . . . . . . 103
4.3 Description generale de la classification . . . . . . . . . . . . . . . . . . . . . . 104
4.3.1 Les reseaux de neurones . . . . . . . . . . . . . . . . . . . . . . . . . . 105
4.3.2 Les surfaces separatrices lineaires . . . . . . . . . . . . . . . . . . . . . 105
4.3.3 Les methodes bayesiennes . . . . . . . . . . . . . . . . . . . . . . . . . 107
4.4 Classification gaussienne . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
4.4.1 Principe theorique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
4.4.2 Analyse du caract`ere gaussien des param`etres . . . . . . . . . . . . . . 111
4.4.3 Premiers resultats de la classification par modelisation gaussienne . . 112
4.4.4 Combinaison des param`etres par fonctions lineaires discriminantes . . 115
4.4.5 Suivi de patient . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119
4.4.6 Conclusions sur la classification gaussienne . . . . . . . . . . . . . . . 120
4.5 Classification connexioniste . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
4.5.1 Description generale dun reseau de neurones . . . . . . . . . . . . . . 122
4.5.2 Mise en oeuvre dun reseau de neurones . . . . . . . . . . . . . . . . . 124
4.5.3 Resultats de la classification connexioniste . . . . . . . . . . . . . . . . 128
4.5.4 Utilisation des fonctions lineaires discriminantes . . . . . . . . . . . . 128
4.5.5 Changement de configuration du reseau . . . . . . . . . . . . . . . . . 129
4.5.6 Suivi de patient . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
4.5.7 Detection actimetrique . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
4.5.8 Conclusions sur le scorage par reseau de neurone . . . . . . . . . . . . 131
4.6 Rescorage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
4.6.1 Le rescorage par r`egles . . . . . . . . . . . . . . . . . . . . . . . . . . . 132
4.6.2 Modelisation Markovienne de la nuit . . . . . . . . . . . . . . . . . . . 136
4.6.3 Comparaison des deux methodes de rescorage . . . . . . . . . . . . . . 138
4.6.4 Conclusions sur le rescorage . . . . . . . . . . . . . . . . . . . . . . . . 140
4.7 Utilisation dun arbre de decision . . . . . . . . . . . . . . . . . . . . . . . . . 141
4.8 Conclusion sur letape de classification . . . . . . . . . . . . . . . . . . . . . . 142

5 D
eveloppements mat
eriels et logiciels li
es au cadre CIFRE 145
5.1 Le bracelet SmartMedia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145
5.1.1 Realisation electronique du bracelet . . . . . . . . . . . . . . . . . . . 146
5.1.2 Le programme de gestion . . . . . . . . . . . . . . . . . . . . . . . . . 149
5.1.3 Probl`emes rencontres et solutions apportees . . . . . . . . . . . . . . . 151
5.1.4 Realisation dune nouvelle version de la carte electronique superieure . 152
5.1.5 Realisation du botier . . . . . . . . . . . . . . . . . . . . . . . . . . . 153
10 `
TABLE DES MATIERES

5.1.6 Realisation du botier de lecture de la SmartMedia . . . . . . . . . . . 156


5.2 Gestion des donnees . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 158
5.2.1 Pretraitement des donnees enregistrees `a Nantes . . . . . . . . . . . . 158
5.2.2 Pretraitement des donnees enregistrees `a Paris . . . . . . . . . . . . . 159
5.2.3 Traitement des nuits . . . . . . . . . . . . . . . . . . . . . . . . . . . . 160
5.3 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 163

6 Conclusion et perspectives 165

A Param`
etres quantitatifs retenus 173

B S
election des param`
etres pertinents : cas g
en
eral 175

C S
election des param`
etres pertinents : cas du suivi de patient 177

D R
esultats du mod`
ele gaussien 179
D.1 Classification en six stades, BA . . . . . . . . . . . . . . . . . . . . . . . . . . 179
D.2 Classification en six stades, BT . . . . . . . . . . . . . . . . . . . . . . . . . . 180
D.3 Classification en quatre groupes, BA . . . . . . . . . . . . . . . . . . . . . . . 180
D.4 Classification en quatre groupes, BT . . . . . . . . . . . . . . . . . . . . . . . 180
D.5 Suivi de patient (Calculs sur une nuit et moyenne geometrique des resultats) :
Classification en six stades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180
D.6 Suivi de patient (Calculs sur une nuit et moyenne ponderee des resultats) :
Classification en quatre groupes . . . . . . . . . . . . . . . . . . . . . . . . . . 180
D.7 Combinaison des param`etres par les FLD. Classification en six stades, BA . . 181
D.8 Combinaison des param`etres par les FLD. Classification en six stades, BT . . 181
D.9 Combinaison des param`etres par les FLD. Classification en quatre groupes, BA 181
D.10 Combinaison des param`etres par les FLD. Classification en quatre groupes, BT 181

E Apprentissage dun r
eseau de neurones 183

F R
esultats des r
eseaux de neurones 187
F.1 Classification en six stades, BA . . . . . . . . . . . . . . . . . . . . . . . . . . 187
F.2 Classification en six stades, BT . . . . . . . . . . . . . . . . . . . . . . . . . . 187
F.3 Regroupement des stades physiologiquement proches : classification en quatre
groupes, BA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187
F.4 Regroupement des stades physiologiquement proches : classification en quatre
groupes, BT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 188
F.5 Combinaison des param`etres par les FLD. Classification en six stades, BA . . 188
F.6 Combinaison des param`etres par les FLD. Classification en six stades, BT . . 188
F.7 Combinaison des param`etres par les FLD. Classification en quatre groupes, BA 188
`
TABLE DES MATIERES 11

F.8 Combinaison des param`etres par les FLD. Classification en quatre groupes, BT 189
F.9 Suivi de patient (Calculs sur une nuit et moyenne ponderee des resultats) :
Classification en six stades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 189

G R
esultats dun r
eseau de neurones simplifi
e 191
G.1 Reseau de type E/6/5/4. Classification en quatre classes. Combinaison des
param`etres par les FLD. BA . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191
G.2 Reseau de type E/6/5/4. Classification en quatre classes. Combinaison des
param`etres par les FLD. BT . . . . . . . . . . . . . . . . . . . . . . . . . . . . 191
G.3 Reseau de type E/6/5/4. Classification en six stades (pas dutilisation des
FLD), BA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192
G.4 Reseau de type E/6/5/4. Classification en six stades (pas dutilisation des
FLD), BT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192
G.5 Reseau de type E/8/7/6. Classification en six stades (pas dutilisation des
FLD), BA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192
G.6 Reseau de type E/8/7/6. Classification en six stades (pas dutilisation des
FLD), BT . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192

H R
esultats des r
eseaux de neurones pour une classification en trois stades 193
H.1 Classification en trois classes, BA . . . . . . . . . . . . . . . . . . . . . . . . . 193
H.2 Classification en trois classes, BT . . . . . . . . . . . . . . . . . . . . . . . . . 193

I Matrices de confusion issues du scorage par arbre de d


ecision 195
I.1 Rescorage global par r`egle. Gestion des epoques non classees par statistiques
locales. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195
I.2 Rescorage global par r`egle. Gestion des epoques non classees par le rescorage
global. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195
I.3 Rescorage global par HMM. Gestion des epoques non classees par le rescorage
global. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 196

J Hypnogrammes de la base de test : scorage par m


ethode gaussienne ou
connexioniste et rescorage par r`
egles 197

K Interface graphique de gestion de la classification 203

L Interface graphique de mesure des rythmes cardiaques et respiratoires 205


Table des figures

1 Le bracelet Sereoz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2 Positionnement du bracelet de classification du sommeil par rapport `a lexistant 18

1.1 Exemple dhypnogramme dun adulte jeune en bonne sante (issu de [1]) . . . 24

2.1 Mod`ele TVTIPFM de generation des battements cardiaques . . . . . . . . . . 34


2.2 Signaux 2.81 et 2.82, injectes dans le mod`ele TVTIPFM et signaux reconstruits

par lalgorithme decrit en 2.3.1. (a) : (t) et (t). (b) : a(t) et a
(t). . . . . . . 50
2.3 Comparaison de la frequence delivree par lestimateur 2.83 et la frequence
reelle du signal a(t) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
2.4 Visulisation de leffet du decentrage de la fenetre dobservation . . . . . . . . 52
2.5 Estimation dune frequence respiratoire de 0.25Hz pour differentes valeurs de
f . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
2.6 Estimation de la frequence respiratoire lorsquon emploie une excursion
frequentielle superieure `a celle definie par (2.79) . . . . . . . . . . . . . . . . . 53
2.7 (a) : Signal a(t), de frequence 0.25Hz et son estimation a (t). (b) : Spectre
associe au signal a
(t) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
2.8 Estimation de la frequence respiratoire `a partir dun signal de battements
donne par ECG . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
2.9 Estimation de la frequence respiratoire `a partir du signal composite par uti-
lisation du mod`ele TVTIPFM. Chaque estimation correspond `a une epoque
dune duree de trente secondes. . . . . . . . . . . . . . . . . . . . . . . . . . . 56
2.10 Illustration du comportement de la methode de detection des battements car-
diaques `a partir du signal composite. . . . . . . . . . . . . . . . . . . . . . . . 57
2.11 Determination de lapproximation de la matrice
par observation dun saut
dans la distribution des valeurs propres. . . . . . . . . . . . . . . . . . . . . . 58
2.12 Determination de lapproximation de la matrice
par utilisation de la norme
de Frobenius. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

3.1 Exemple de signal de variation de pression arterielle (Fe =128Hz) . . . . . . . 62


3.2 Periodogramme dune section de signal respiratoire . . . . . . . . . . . . . . . 66
3.3 Vingt secondes du signal module AMFM genere `a partir de lequation (3.38). 68
3.4 (a) : Signal de frequence instantanee obtenu par demodulation AMFM du
signal de la figure 3.3. (b) : Periodogramme de ce signal de frequence instantanee. 68
14 TABLE DES FIGURES

3.5 Chane de traitement du signal composite par demodulation FM. . . . . . . . 69


3.6 Estimation de la frequence porteuse du signal module. (a) : utilisation de filtres
glissants. (b) : utilisation de filtres fixes. Lerreur dans la zone de maillage
horizontal nexc`ede pas 1%. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
3.7 Estimation de la frequence du signal de modulation de frequence. (a) : utilisa-
tion de filtres glissants. (b) : utilisation de filtres fixes. Lerreur dans la zone
de maillage horizontal nexc`ede pas 1%. . . . . . . . . . . . . . . . . . . . . . 71
3.8 Estimation de la frequence du signal de modulation damplitude. (a) : utilisa-
tion de filtres glissants. (b) : utilisation de filtres fixes. Lerreur dans la zone
de maillage horizontal nexc`ede pas 1%. . . . . . . . . . . . . . . . . . . . . . 72
3.9 Resultats de lestimation cardiaque operee sur 9 signaux.(a) : vue densemble.
(b) : detail de la premi`ere courbe pour visualiser le decalage temporel. . . . . 73
3.10 Estimation de la frequence respiratoire par analyse du signal de frequence
instantanee filtre selon le gabarit [0.2; 0.5]Hz . . . . . . . . . . . . . . . . . . 74
3.11 Estimation de la frequence respiratoire par analyse du signal de frequence
instantanee filtre en frequences asservies par la frequence cardiaque (Fc ).(a) :
utilisation dun filtre passe-bande de gabarit [Fc /5; Fc /3]. (b) : utilisation dun
filtre passe-bande de gabarit [Fc /5; Fc /4]. . . . . . . . . . . . . . . . . . . . . 75
3.12 Estimation de la frequence respiratoire obtenue par analyse dun signal residuel
issu de lannulation par un filtre adaptatif de la composante cardiaque dans le
signal de variation de pression arterielle. . . . . . . . . . . . . . . . . . . . . . 76
3.13 Exemple de signal residuel obtenu apr`es filtrage adaptatif du signal de variation
de pression arterielle. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 76
3.14 Resultat de lestimation de la frequence respiratoire obtenue par
periodogramme du signal residuel. Application aux signaux de la base de
Nantes. (a) : Vue densemble. (b) : Detail. . . . . . . . . . . . . . . . . . . . . 78
3.15 Filtre v donnant lerreur dapproximation (3.48). . . . . . . . . . . . . . . . . 79
3.16 Estimation dun signal sinusodal de frequence 50Hz, additionne dun bruit
blanc (RSB = 40dB, F e = 256Hz) . . . . . . . . . . . . . . . . . . . . . . . . 81
3.17 Erreur destimation dune sinusode bruitee par un bruit blanc gaussien
(RSB = 20dB). (a) : Fe = 256Hz. (b) : Fe = 1Hz. . . . . . . . . . . . . . . . 82
3.18 Estimation de la frequence respiratoire par application de lestimateur de So
et Chan sur le signal residuel sous-echantillonne `a 1Hz (Base de Nantes). (a) :
estimation standard. (b) : conservation des param`etres entre les epoques et
utilisation de la mediane. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
3.19 Resultat de lestimateur lorsque le signal etudie comporte deux sinusodes . . 84
3.20 Determination adaptative des zeros correspondant `a s(n) = cos(0.25n) +
cos(0.75n) + (n) o`
u (n) est un bruit blanc gaussien centre, de rapport signal
`a bruit 0dB. (a) : Valeurs instantanees des zeros. (b) : Trajectoire des zeros
dans le plan complexe. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
3.21 Estimation du vecteur propre maximum . . . . . . . . . . . . . . . . . . . . . 87
3.22 (a) Signal issu du filtre rejecteur de la composante cardiaque. (b) Estimation
du vecteur propre maximum de ce signal. . . . . . . . . . . . . . . . . . . . . 89
TABLE DES FIGURES 15

3.23 Chane de traitement destimation de la frequence respiratoire par analyse de


la composante additive du signal de variation de pression arterielle . . . . . . 90
3.24 Resultats de la chane de traitement de la figure 3.23 dans lestimation de la
frequence respiratoire. Base de donnees de Nantes. (a) : Vue densemble. (b) :
Detail . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
3.25 Resultats de la chane de traitement de la figure 3.23 dans lestimation de la
frequence respiratoire. Base de donnees de Paris. (a) : Vue densemble. (b) :
Detail . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
3.26 (a) Representation en nuage de points des estimations de la frequence respira-
toire. (b) Representation en densite de ces points. . . . . . . . . . . . . . . . . 93
3.27 Regression lineaire des medianes verticales . . . . . . . . . . . . . . . . . . . . 94

4.1 Chane de classification . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 98


4.2 Representation des techniques de classification . . . . . . . . . . . . . . . . . 105
4.3 Separation lineaire `a trois classes . . . . . . . . . . . . . . . . . . . . . . . . . 106
4.4 Le mod`ele de Markov observable `a deux etats et ses probabilites de transition 109
4.5 Distribution des valeurs du param`etre 1 (periode cardiaque moyenne de lepoque.112
4.6 Distribution du param`etre issu de lemploi de la deuxi`eme fonction lineaire . 118
4.7 Valeur de la frequence respiratoire en fonction de la valeur de la frequence

cardiaque. Epoques issues de la base dapprentissage . . . . . . . . . . . . . . 121
4.8 Modelisation dun neurone . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122
4.9 Fonction dactivation de type sigmode . . . . . . . . . . . . . . . . . . . . . . 123
4.10 Architecture dun reseau de type perceptron multicouche . . . . . . . . . . . . 124
4.11 Donnees utilisees pour la mise au point du reseau de neurones. (a) Base dap-
prentissage. (b) Base de test. . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
4.12 Comparaison des apprentissage selon la fonction dactivation utilisee. Appren-
tissage de cinq cents fois la base dapprentissage. (a) Fonction sigmode. (b)
Fonction tangente hyperbolique. . . . . . . . . . . . . . . . . . . . . . . . . . 127
4.13 Principe du rescorage par utilisation dinformations globales : une epoque de
stade 4 entouree depoques de stade 2 est rescoree en stade 2. . . . . . . . . . 132
4.14 Histogramme des distributions des valeurs de confiance de la classification
gaussienne : `a gauche, le cas des epoques bien classees. A droite le cas des
epoques mal classees. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 134
4.15 Histogramme des distributions des valeurs de confiance de la classification par
reseau de neurones : `a gauche, le cas des epoques bien classees. A droite le cas
des epoques mal classees. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
4.16 Representation du HMM utilise pour le rescorage . . . . . . . . . . . . . . . . 137
4.17 Comparaison qualitative sur une nuit des rescorage par r`egle et rescorage mar-
kovien. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 140

5.1 Le bracelet utilise pour lenregistrement des signaux de Nantes . . . . . . . . 145


16 TABLE DES FIGURES

5.2 Vue des deux cartes composant le bracelet utilise pour lenregistrement des
signaux de Nantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
5.3 Exemples de batteries Ni-Mh (a) et Lithium-ion (b) . . . . . . . . . . . . . . 148
5.4 Courbe de decharge de laccumulateur ML2032 Maxell, pour differentes inten-
sites continues de decharge. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 149
5.5 Schema de connexion utilise pour la detection de linsertion de la carte Smart-
Media . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150
5.6 Le botier realise initialement . . . . . . . . . . . . . . . . . . . . . . . . . . . 153
5.7 Le botier realise apr`es correction des defauts du botier . . . . . . . . . . . . 155
5.8 Version 3 du botier : modifications operes sur lentretoise (a) et le capot (b). 155
5.9 Version 4 du botier : modifications de lentretoise (a) et assemblage final (b). 156
5.10 Schema de principe du botier de relecture des cartes SmartMedia . . . . . . 157
5.11 Procedure dintegration dune nuit dans la base de donnees . . . . . . . . . . 161
5.12 Schema de larchitecture du programme supervisant lexploitation des donnees 162

E.1 Representation des vecteurs dentree et de sortie du reseau . . . . . . . . . . . 183

J.1 Nuit n 1 de la base de test : classification par mod`ele gaussien et rescorage par
r`egle. Le taux daccord global est de 17%. . . . . . . . . . . . . . . . . . . . . 198
J.2 Nuit n 2 de la base de test : classification par mod`ele gaussien et rescorage par
r`egle. Le taux daccord global est de 26% . . . . . . . . . . . . . . . . . . . . 198
J.3 Nuit n 3 de la base de test : classification par mod`ele gaussien et rescorage par
r`egle. Le taux daccord global est de 36% . . . . . . . . . . . . . . . . . . . . 199
J.4 Nuit n 4 de la base de test : classification par mod`ele gaussien et rescorage par
r`egle. Le taux daccord global est de 21%t . . . . . . . . . . . . . . . . . . . . 199
J.5 Nuit n 5 de la base de test : classification par mod`ele gaussien et rescorage par
r`egle. Le taux daccord global est de 21% . . . . . . . . . . . . . . . . . . . . 200
J.6 Nuit n 1 de la base de test : classification par reseau de neurone et rescorage
par r`egle. Le taux daccord global est de 38%. . . . . . . . . . . . . . . . . . . 200
J.7 Nuit n 2 de la base de test : classification par reseau de neurone et rescorage
par r`egle. Le taux daccord global est de 31% . . . . . . . . . . . . . . . . . . 201
J.8 Nuit n 3 de la base de test : classification par reseau de neurone et rescorage
par r`egle. Le taux daccord global est de 24% . . . . . . . . . . . . . . . . . . 201
J.9 Nuit n 4 de la base de test : classification par reseau de neurone et rescorage
par r`egle. Le taux daccord global est de 18%t . . . . . . . . . . . . . . . . . . 202
J.10 Nuit n 5 de la base de test : classification par reseau de neurone et rescorage
par r`egle. Le taux daccord global est de 28% . . . . . . . . . . . . . . . . . . 202

K.1 Interface graphique de gestion de la classification . . . . . . . . . . . . . . . . 203

L.1 Interface graphique de gestion de la classification . . . . . . . . . . . . . . . . 205


Introduction

Nous assistons, ces derni`eres annees, `a une plus grande exposition mediatique du sommeil.
Nombreuses sont les personnes `a se plaindre de la mauvaise qualite de leurs nuits. Si ce
facteur est important, cest quil conditionne la qualite de la journee : on sait aujourdhui
quun mauvais sommeil peut entraner un manque dattention, des troubles de la memoire,
une irritabilite [2]... Pourtant, il nexiste actuellement que peu de syst`emes, accessibles
au grand public, permettant de renseigner les personnes sur la qualite de leur sommeil.
Lobjectif de cette th`ese est precisement de presenter les etudes prealables au developpement
dun tel syst`eme.

Fig. 1 Le bracelet Sereoz

Dans cette entreprise, nous nous appuyons sur le bracelet multicapteur SereoZ, commer-
cialise par la societe APHYCARE technologies, dont lobjectif est dassurer la securite de la
personne agee isolee par la detection automatique des chutes. Il est compose dune membrane
souple remplie dun gel qui transmet les contraintes physiques `a trois capteurs :
Un capteur de pression statique, qui permet de connatre la pression continue appliquee
`a la membrane. Cette donnee permet de quantifier le serrage du bracelet,
Un capteur de temperature, qui permet de recueillir une indication sur la temperature
cutanee du poignet,
Enfin, les variations de pression sont recueillies par un capteur de type piezo-electrique.

Cest ce dernier capteur qui nous interesse plus particuli`erement. Deux types de perturba-
tions sont susceptibles de faire varier la pression appliquee `a la membrane : les mouvements
du poignet et la pression arterielle radiale. Dans le premier cas, ce sont les mouvements
des tendons qui modifient le diam`etre global du poignet. Comme celui-ci est entoure par
le bracelet elastique, il en resulte une augmentation de la force appliquee par celui-ci en
chaque point du poignet et notamment au niveau de la membrane. Cette force est transmise
`a la surface du capteur par le biais du gel dont elle est remplie. Le meme phenom`ene se
18 CHAPITRE 0. INTRODUCTION

produit lors de larrivee de londe de pression cardiaque. Celle-ci provoque un accroissement


du volume des vaisseaux, qui se traduit par une augmentation du diam`etre du poignet. De
fait, le signal recueilli par le capteur de pression dynamique est la somme de ces deux contri-
butions. Elles sont separees par un circuit analogique adequat, de sorte que lon recup`ere,
dune part, un signal lie au mouvement dans lequel la contribution de la pression arterielle
est quasi-nulle, et, dautre part, un signal retracant les variations de pression arterielle.
Cependant, la contribution de londe de pression arterielle au signal enregistre est nettement
moins energetique que celle issue des mouvements du poignet et cest pourquoi tout mouve-
ment alt`ere la qualite du signal de variation de pression arterielle en provoquant sa saturation.

Le signal de variation de pression arterielle contient des informations cardiaque et


respiratoire dont levolution est correlee avec celle du sommeil [3, 4]. La possibilite de
mesurer ces informations ainsi que lactimetrie du porteur nous a amene au souhait
devaluer la possibilite dutiliser le bracelet multicapteur SereoZ pour realiser une ana-
lyse automatique du sommeil. Nous savons demblee que le syst`eme final ne sera pas
en mesure de realiser un hypnogramme de qualite medicale. Cest pourquoi nous envi-
sageons un syst`eme permettant la distinction entre la veille, le sommeil orthodoxe et le
sommeil paradoxal, voire, `a linterieur du second, entre les sommeils lent leger et lent profond.

Ce sujet interesse la societe APHYCARE Technologies, dans la mesure o` u il offre


la perspective du developpement dune nouvelle famille de produits, basee sur le noyau
multicapteur quelle exploite dej`a. comme mentionne precedemment, il nexiste que peu de
produits lies au sommeil accessibles au grand public. Il sagit principalement dactim`etres,
mesurant lactivite motrice du poignet et permettant de distinguer les periodes de veille de
celles de sommeil. Notre ambition est de realiser un produit aussi simple quun actim`etre
mais aux performances etoffees par rapport `a celui-ci, comme le precise la figure 2. Pour
cette raison, les travaux presentes ci-apr`es se sont deroules principalement au sein de la
societe APHYCARE Technologies, dans le cadre dune convention CIFRE etablie avec le
laboratoire R2D2 de lENSSAT.

Fig. 2 Positionnement du bracelet de classification du sommeil par rapport `a lexistant

La realisation de cette etude de faisabilite passe aussi par la recherche de solutions algo-
19

rithmiques innovantes permettant dobtenir une estimation fiable des frequences cardiaque
et respiratoire `a partir des signaux existants. Les travaux passes ont en effet montre les
limites des methodes classiques, residant essentiellement soit dans leur mauvaise immunite
aux bruits auxquels est soumis le signal (bouges, tremblements . . . ), soit dans leur cout
calculatoire ou memoriel trop important.

Nous debutons la presentation de cette etude par un apercu, au sein dun premier
chapitre, des methodes detude du sommeil, afin de recueillir des informations permettant
dorienter au mieux nos travaux. Puis, nous detaillons deux estimateurs des frequences
cardiaque et respiratoire.

Le second chapitre presente un estimateur sappuyant sur un mod`ele physiologique


regissant la generation des battements cardiaques et integrant, en tant que param`etre
dentree, le signal respiratoire. Les liens mathematiques permettant de determiner les entrees
du mod`ele `a partir de la connaissance du signal de battement cardiaque sont decrits. Puis,
nous adaptons progressivement cette methode `a lexploitation du signal de variation de
pression arterielle.

Le chapitre 3 est consacre `a lexploitation des modulations damplitude et de frequence


dont fait lobjet le signal de variation de pression arterielle. Nous avons choisi de realiser
une demodulation instantanee de ce signal, en utilisant loperateur developpe par Teager.
Comme le signal de variation de pression arterielle ne satisfait pas les conditions theoriques
exigees pour lemploi de cet operateur, nous determinons un nouveau domaine de validite, en
lien avec les param`etres mesures. Nous poursuivons ensuite letude des signaux modules pour
developper un estimateur de la frequence respiratoire. Dans un second temps, nous utilisons
lestimateur de la frequence cardiaque pour isoler, dans le signal de variation de pression
arterielle, une composante respiratoire additive, dont on se servira pour estimer la frequence
respiratoire. Nous presentons differentes techniques permettant destimer `a moindre co ut la
frequence de ce signal.

Enfin le chapitre 4 est dedie au probl`eme de la classification automatique du sommeil `


a
partir, entre autres, des estimateurs presentes precedemment. Deux principales techniques
de classification sont etudiees. La premi`ere repose sur une modelisation monogaussienne de
la distribution des param`etres, exploitee par un classifieur bayesien. La seconde utilise un
reseau connexionniste du type perceptron `a deux couches cachees. Nous detaillons egalement
dans cette partie deux methodes de rescorage permettant dameliorer les resultats de la
classification.

Enfin, nous abordons dans une derni`ere partie certains des developpements materiels et
logiciels qui se sont averes necessaires pour recueillir les donnees sur lesquelles sappuient ces
travaux.
Chapitre 1

Le sommeil et ses m ethodes


dinvestigations : utilisation du
bracelet multicapteur pour
lanalyse du sommeil

Les connaissances sur le sommeil ne cessent de progresser `a mesure que les techniques
detudes se developpent. Dans le meme temps, des questions aussi fondamentales que linteret
du sommeil pour lhomme restent encore `a letat dhypoth`eses. Afin dy voir plus clair nous
allons, dans ce chapitre, realiser un tour dhorizon des techniques et connaissances concernant
le sommeil. Ceci nous am`enera `a situer et preciser le sujet de nos travaux.

1.1 Le sommeil
` cette epoque, il etait considere
Le sommeil est surtout etudie depuis le debut du si`ecle. A
comme une inhibition des centres nerveux deveil, une mise au repos du cerveau. Aujourdhui,
nous savons que cela nest pas vrai, et que le sommeil est un phenom`ene actif, notamment
lors des periodes de reve o`u le cerveau consomme au moins autant denergie que durant
leveil [5, 6].

Cela dit, meme aujourdhui on ne connat toujours pas bien les raisons du sommeil. Le
sommeil `a ondes lentes (stades 1, 2, 3 et 4) serait un heritage genetique des periodes o` u
lhomme fut place dans regions o`u la nourriture etait insuffisante et le sommeil lent serait
en fait une sorte de mini-hibernation, permettant deconomiser les ressources energetiques [6].

Le sommeil paradoxal quant `a lui, serait apparu avec lacquisition de lhomeothermie et


aurait pour but de permettre au cerveau de ranger dans la memoire les informations quil
a apprises, le cerveau etant en effet compl`etement coupe du monde exterieur durant cette
periode [7]. On constate dailleurs une augmentation de la duree du sommeil paradoxal
lorsque le sujet a ete soumis `a des situations nouvelles ou inhabituelles [5].

Lintervalle entre deux periodes de sommeil paradoxal est fonction de la taille de lanimal
22
CHAPITRE 1. LE SOMMEIL ET SES METHODES DINVESTIGATION

(de 10 minutes chez la souris `a 120 minutes chez lelephant en passant par les 90 minutes de
lhomme), ce qui lui sugg`ere une origine metabolique. La duree de sommeil paradoxal depend
des reserves energetiques de lanimal, reserves qui seront reconstituees lors du sommeil lent.
Plus lanimal est petit et plus ces reserves seront petites et donc reconstituees rapidement
ce qui entranera un rythme rapide. De plus, la duree quotidienne de sommeil paradoxal
est fonction du metabolisme de lanimal. Un herbivore devra passer beaucoup de temps `a
consommer sa nourriture car elle est peu energetique. Lanimal ne peut donc se permettre
que peu de sommeil paradoxal, `a linverse dun carnivore. Cest ce qui expliquerait que le
sommeil dune vache comprend quinze minutes seulement de sommeil paradoxal contre deux
cents minutes pour le chat [6].

1.1.1 Une nuit de sommeil

Cest en 1937 que fut proposee par Loomis et al [8] la premi`ere classification des stades du
sommeil. Celle-ci etait differente de celle que nous connaissons aujourdhui. Elle distinguait
cinq stades mais ne comprenait pas le sommeil paradoxal, lequel etait confondu avec le stade
1 daujourdhui. Puis dautres classifications virent le jour, `a mesure que les performances
techniques des electrodes et de leurs electroniques associees progressaient. Par exemple celle
de Dement et Kleitman ne comprenait que quatre stades, dont le premier etait parfois
associe `a des mouvements oculaires rapides (caracteristiques, en fait, du sommeil paradoxal),
mais pas toujours. Il fallu attendre que Jouvet et Michel [9] enregistrent les muscles de la
nuque pour que soit decouvert le sommeil paradoxal, en 1959. Cependant, il existait encore
trop de differences entre les scorages de sommeil dun laboratoire `a lautre et ce nest quen
1968 que furent standardisees les procedures denregistrement et de scorage du sommeil par
Rechtschaffen et Kales [10, 11], procedures toujours appliquees aujourdhui. Lenregistrement
polysomnographique standard comprend depuis lors un electro-encephalogramme (EEG), un
electro-myogramme (EMG) du menton et un electro-oculogramme (EOG) et cest `a partir
de ces signaux quest analyse le sommeil.

Une nuit de sommeil se decoupe en plusieurs cycles (quatre `a cinq), de 90 minutes environ,
chacun respectant le meme schema. On distingue dans chaque cycle plusieurs phases que lon
peut reconnatre essentiellement `a partir de lanalyse des traces electroencephalographiques
(EEG).

Ainsi, au tout debut de la nuit, le sujet est en eveil les yeux fermes. LEEG enregistre
des ondes tr`es rapides (8-12Hz) et de tr`es faibles amplitudes, appelees alpha. Puis le
sujet passe doucement dans le stade 1. On observe alors sur lEEG un ralentissement
des ondes electriques jusqu`a une frequence de 4 `a 6Hz, ce sont les ondes theta. Ce stade
est assez proche de leveil. Dailleurs, reveille `a ce moment, le patient affirmera ne pas dormir.

Puis le sujet bascule dans le stade 2, que lon peut veritablement considerer comme le
debut du sommeil. Ce stade se retrouve sur lEEG par lapparition de fuseaux, bouffees
dondes rapides (10-15Hz), et de complexes K, grandes ondes lentes. Lactivite electrique va
encore se ralentir, puis apparaissent des ondes delta ( 3Hz) de grande amplitude.

On consid`ere que le sujet est passe en stade 3 lorsquau moins 20% du trace est occupe
par des ondes delta. Lorsque ce chiffre depasse 50%, on consid`ere quil est en stade 4. Les
1.1. LE SOMMEIL 23

stades 3 et 4 sont souvent regroupes sous lappellation de sommeil lent profond. Lent,
car les ondes y sont tr`es lentes, profond, car un sujet reveille pendant cette periode sera
compl`etement desoriente dans le temps et dans lespace, comme sil etait profondement
enfoui dans son sommeil.

Mais au bout dun moment, lactivite du sujet change radicalement. Lactivite cardiaque
et respiratoire, reguli`ere et lente jusqualors, saccel`ere et devient irreguli`ere. La tension
arterielle subit egalement de brusques variations. Les yeux se meuvent tr`es rapidement de
gauche `a droite ou de haut en bas, alors que, dans le meme temps, le sujet atteint un niveau
de relaxation musculaire totale (les muscles de la nuque se relachent), et une profondeur de
sommeil accrue (la stimulation sonore necessaire `a son reveil doit etre encore plus importante
que dans le sommeil lent profond). Cette contradiction dans les symptomes a donne son
nom `a ce stade, le sommeil paradoxal. Cette observation visuelle se confirme sur lEEG.
Le trace devient en effet tr`es proche de letat de veille, yeux ouverts (ondes tr`es rapides
et de faible amplitude), alors que des electromyogrammes indiquent une absence totale de
tonus musculaire, `a lexception des yeux. A lissue de cette periode ou, parfois juste avant,
le patient se reveille pour se rendormir presque aussitot [11, 10, 1].

Une nuit de sommeil est constituee en moyenne de 5% de stade 1, 50% de stade 2, 25%
de stade 3 et 4, et 20% de sommeil paradoxal. Toutefois, la repartition nest pas homog`ene
dans la nuit. Ainsi, dans le debut de la nuit, les periodes de sommeil lent profond sont
predominantes par rapport au sommeil paradoxal, et cette tendance sinverse au fil de
la nuit. La raison en en est que le sommeil paradoxal est dependant du cycle circadien
ou cycle jour/nuit, car est conditionne par la temperature corporelle. Ainsi, il survient
` linverse du sommeil paradoxal, le temps passe en
preferentiellement entre 6H et 12H00. A
sommeil lent profond nest pas augmente par un sommeil prolonge dans la matinee.

Le graphe reprenant le trace des stades de sommeil dans lequel est plonge le patient au
cours de la nuit sappelle un hypnogramme. Loperation qui consiste `a realiser un hypno-
gramme `a partir des donnees issues des capteurs medicaux sappelle le scorage du sommeil.
` titre dexemple, lhypnogramme dun adulte jeune en bonne sante est donne sur la figure
A
1.1. On retrouve en ordonnee lindication des stades de sommeil (veille, sommeil paradoxal
puis stades 1 `a 4) et en abscisse le temps en heure. La structure cyclique du sommeil est clai-
rement mise en evidence. Chaque cycle (six ici) est marque par une proportion de sommeil
orthodoxe suivi dun episode paradoxal. On note egalement la preponderance du sommeil lent
profond en debut de nuit, qui decrot au fur et `a mesure pour finalement disparatre en fin
de nuit. A linverse, on constate la montee en puissance du sommeil paradoxal, qui devient
le stade le plus important de la fin de nuit.

1.1.2 Influence du sommeil sur les rythmes physiologiques

Les rythmes physiologiques dont on a le plus etudie la variation avec le sommeil sont le
rythme cardio-respiratoire et la pression arterielle. Cette deni`ere diminue au fur et `a mesure
de lendormissement, jusqu`a atteindre des valeurs de 5 `a 15% inferieures `a letat de veille
pour le sommeil lent profond [12]. Par contre, elle ne varie pas plus au cours du sommeil
paradoxal, voire augmente un peu. De la meme facon, la frequence cardiaque decrot ` a
mesure que le sujet senfonce dans le sommeil pour atteindre sa valeur minimale durant le
sommeil lent profond. Mais surtout on constate une baisse de la variabilite de celle-ci [13].
24
CHAPITRE 1. LE SOMMEIL ET SES METHODES DINVESTIGATION

Fig. 1.1 Exemple dhypnogramme dun adulte jeune en bonne sante (issu de [1])

Par contre, `a la difference de la pression arterielle, le rythme cardiaque devient compl`etement


desordonne et saccel`ere en moyenne durant le sommeil paradoxal, ce qui dailleurs peut se
reveler dangereux pour les patients ayant ete victimes dun infarctus du myocarde, leur cur
nayant plus la meme capacite `a suivre ces variations [14].

En ce qui concerne la respiration, on constate une variation periodique de lamplitude


ventilatoire, avec une periode de soixante `a quatre-vingt-dix secondes, au cours de lendor-
missement, et tant que le sommeil nest pas atteint de facon stable [15]. Lorsque cest le cas,
le sommeil devient extremement regulier et le debit respiratoire baisse denviron 15%. Tout
comme pour le rythme cardiaque, un net changement sop`ere lors du sommeil paradoxal.
Ainsi, la ventilation devient irreguli`ere, avec des variations brusques de son amplitude et de
sa frequence.

En ce qui concerne les gaz du sang, la pression partielle de CO2 dans le sang sel`eve
durant le sommeil lent mais celle de lO2 reste constante [10]. Quant `a la temperature
corporelle, elle baisse durant le sommeil lent [5, 6]. En outre, lendormissement est plus facile
lorsquil a lieu sur la portion descendante du cycle thermique [7].

Enfin, le tonus musculaire, lui, varie selon les muscles concernes. Ainsi, les muscles
du cou et du menton se relachent totalement lors du passage au sommeil paradoxal, ce
qui explique la chute de la tete dun dormeur assis. A linverse, les muscles du tronc ne
voient pas leur tonus evoluer au cours de la nuit. Toutefois, de mani`ere generale les mouve-
ments du corps sont de moins en moins nombreux `a mesure que lon senfonce dans le sommeil.

1.2 Lanalyse du sommeil

La reference en mati`ere de scorage du sommeil est la polysomnographie classique, telle


que nous la decrirons au paragraphe 1.2.2. Seulement, celle-ci est peu confortable pour le
patient, et des methodes plus confortables ont ete recherchees. Plusieurs voies sont explorees
pour atteindre cet objectif. Ainsi, certains cherchent `a alleger le syst`eme classique en ne
conservant quune voie dEEG. Dautres cherchent plutot `a remplacer les classiques EEG,
EOG et EMG par des variables tout autant representatives des stades du sommeil mais en
nombre moins grand et surtout dun acc`es plus aise (ECG par exemple). Enfin une autre voie
1.2. LANALYSE DU SOMMEIL 25

vise `a eliminer totalement linstrumentation du patient ce qui a conduit au developpement


du lit `a charge statique. Toutefois, lobservation de certains troubles du sommeil peut se faire
au travers dinstruments plus simples tels quun actim`etre.

1.2.1 Lactim
etrie

Lactimetrie represente la methode la plus simple de surveillance du sommeil. Celle-


ci consiste en un petit botier, porte le plus souvent au poignet, du type dun bracelet
montre. Lactim`etre se compose en general dun accelerom`etre qui permet denregistrer ` a
la fois la quantite et lintensite des mouvements quil subit. Ce type de produit ne permet
generalement quune distinction entre activite et inactivite que lon peut traduire en detection
veille/sommeil.

1.2.2 La polysomnographie classique

Lenregistrement polysomnographique classique comprend des signaux


electroencephalographiques, un electro-oculogramme obtenu par deux electrodes aux
angles externes des yeux qui enregistrent les mouvements oculaires, et un electromyogramme
qui enregistre lactivite electrique des muscles du menton [1]. Cet appareillage, associe aux
r`egles de scorage de Reschtschaffen et Kales est considere comme la reference en mati`ere de
scorage du sommeil.

Cette polysomnographie presente linconvenient detre relativement lourde et non


portable. Lourde parce quun minimum de sept electrodes doit etre dispose sur la tete du
patient. Non portable parce que le placement de ces electrodes doit etre soigne et requiert
donc une intervention medicale. En consequence, les nuits denregistrements se deroulent le
plus souvent `a lhopital, ce qui aura pour effet de perturber les habitudes de coucher du
patient. La nuit enregistree sera donc differente de la nuit type du patient, et ce, dabord
parce quil nest pas chez lui, et ensuite, parce quil sera gene par les cables des electrodes et
les electrodes elles-memes. Cest pourquoi il est parfois necessaire de demander au patient
de se presenter durant deux nuits consecutives, la premi`ere netant souvent pas exploitee
dans ce cas.

Or, le fait denregistrer une nuit plus perturbee que de coutume est tr`es genant pour
la detection des troubles du sommeil. Comment, en effet, savoir si le grand nombre de
micro-reveils observes sur lhypnogramme est une materialisation des troubles dont souffre
le patient ou si ces reveils ne sont que le reflet de la gene occasionnee par le changement
denvironnement et son instrumentation.

Cest pourquoi on voit apparatre des versions allegees de la polysomnographie classique.


Ainsi, beaucoup dauteurs ont developpe des techniques danalyse basees uniquement sur
lEEG [16, 17]. En effet, EMG et EOG nont pour seul but que de differencier le sommeil
paradoxal de leveil. Aujourdhui, le nombre de voies EEG enregistrees tend `a etre reduit au
maximum, jusqu`a ne comporter parfois quune seule voie [18]. Dautres conservent lEOG
ou lEMG en plus de lEEG [19, 20].
26
CHAPITRE 1. LE SOMMEIL ET SES METHODES DINVESTIGATION

1.2.3 Le lit `
a charge statique

Le lit `a charge statique (ou SCSB pour Static Charge Sensitive Bed) se resume en fait `a un
matelas comprenant une epaisseur electrostatique, placee au-dessus de feuilles de metal. Les
mouvements du corps vont alors modifier la repartition des charges et induire une difference
de potentiel entre les plaques. Les mouvements qui gen`erent le signal ainsi recueilli sont les
mouvements respiratoires, les mouvements du coeur, et bien s ur les mouvements amples du
corps (lorsque le patient bouge). Un filtrage approprie permet de separer ces trois compo-
santes. Lavantage principal de cette methode est quelle lib`ere totalement le patient dune
quelconque instrumentation. De plus elle permet des enregistrements `a domicile.

1.2.4 Les donn


ees cardio-respiratoires

Certaines equipes mesurent uniquement les variables cardio-respiratoires. Elles utilisent


generalement un electro-cardiogramme pour enregistrer lactivite cardiaque. Lactivite respi-
ratoire est enregistree au moyen dune sonde nasale ou dune sangle abdominale ou thoracique.
Souvent ces trois moyens sont utilises car les signaux permettent alors de detecter la nature
des apnees.

1.3 Le scorage automatique du sommeil

La recherche dune technique de scorage automatique du sommeil existe depuis les


premiers enregistrements de sommeil. Cela se comprend lorsquon sait quen moyenne, une
nuit de sommeil gen`ere trois cents m`etres de listing et requiert pour son decryptage de
deux `a six heures de travail dun technicien experimente [17]. On concoit alors tout de suite
linteret dune methode permettant de fournir de facon automatique un hypnogramme `a
partir des signaux.

Dune mani`ere generale, on constate que les methodes de scorage automatique proc`edent
en deux etapes. Dabord, un classifieur attribue le morceau de nuit selon sa proximite avec
lechantillon de reference, et ce pour tous les echantillons de la nuit. Ceci fait, un second
traitement reattribue ou corrige certaines decisions par des r`egles du type x ou moins
minutes de stade S entouree de y ou plus minutes de stade Z sont rescorees Z ou bien
eliminera certaines transitions improbables.

Le gros probl`eme du scorage du sommeil est la variation inter-individuelle mais aussi intra-
individuelle. Ainsi les signaux physiologiques (et en particulier lEEG) varient beaucoup dune
personne `a une autre. Do` u lidee dintroduire des techniques adaptatives comme la logique
floue et plus recemment les reseaux de neurones. Ceux-ci presentent en effet une grande
robustesse vis `a vis de ces variations.

1.3.1 Exploitation des donn


ees actim
etriques

La plupart du temps le resultat recherche nest pas le trace dun hypnogramme mais la
detection veille/sommeil. Celle-ci est generalement bonne (environ 80% daccord avec un
specialiste exploitant des donnees polysomnographiques [21, 22, 23, 24]).
1.3. LE SCORAGE AUTOMATIQUE DU SOMMEIL 27

La valeur brute fournie par lactim`etre est une acceleration (le capteur est un piezo-
electrique). Toutefois, celui-ci realise en general un pretraitement des donnees. Ainsi, la
donnee couramment exploitee est le nombre de passages par zero. Cette valeur est obtenue
en comptant sur une periode de temps le nombre de fois o` u le signal dacceleration passe par
zero. Cest une estimation du nombre de mouvements appelee lactivite.

De cette donnee sont extraites plusieurs variables comme la moyenne dactivite sur
une fenetre (une minute par exemple), la variance, le temps moyen pour lequel lactivite
superieure `a un seuil, etc. La determination veille/sommeil de la fenetre est alors realisee
en calculant une combinaison lineaire de ces variables. Si la valeur obtenue est superieure
`a un seuil, lepoque est classee (scoree) en eveil ; si elle est inferieure, elle est scoree sommeil.

Neanmoins, linconvenient majeur des actim`etres est lie au decalage qui existe entre lac-
tivite physique et letat physiologique. Ainsi, `a lendormissement, le patient arrete de bouger
avant detre endormi, de meme quil peut ne pas bouger tout en etant eveille. Lactim`etre
a donc une tendance `a scorer des zones deveil comme periodes de sommeil. Mullaney et al.
[23] ont donc mis au point des r`egles du type apr`es x ou plus minutes scorees eveil, les y
premi`eres minutes de sommeil sont rescorees eveil ou encore y ou moins minutes scorees
sommeil entourees de x ou plus minutes deveil sont rescorees eveil qui tiennent aujourdhui
lieu de reference pour la correction des donnees actimetriques. En pratique, lactim`etre realise
un premier scorage et ce scorage est ensuite corrige en appliquant les r`egles de Mullaney.

1.3.2 Exploitation des donn


ees
electro-enc
ephalographiques

La polysomnographie consiste en lenregistrement simultane des signaux EEG, EOG et


EMG. Cest donc lanalyse de ces signaux que lon a cherche `a automatiser en premier. Le
signal le plus discriminant etant lEEG, cest surtout ce signal qui est exploite. Les signaux
dEOG et dEMG servent en general en dernier lieu pour departager deux stades proches ou
confirmer une decision prise `a partir de lEEG.

La structure g
en
erale

Comme pour lactimetrie, ces techniques proc`edent en deux etapes. Apr`es une premi`ere
classification realisee sur des segments denregistrements (des epoques de longueur typique
de trente secondes), des r`egles prenant en compte les etats anterieurs et posterieurs sont
appliquees, permettant une correction de lhypnogramme [17, 25, 26, 19].

Espace temporel et espace fr


equentiel

On distingue deux grandes familles de methodes : celles qui uvrent dans lespace tempo-
rel [17, 20, 27] et celles qui uvrent dans lespace frequentiel [26, 18, 28]. Historiquement, cest
lespace temporel qui a ete privilegie en raison du co
ut calculatoire prohibitif des techniques
frequentielles [26]. De plus, ces methodes decoulaient logiquement dun processus dautoma-
tisation du scorage manuel, o` u lexpert se base sur un signal temporel. Dailleurs, lutilisation
de chanes de Markov cachees [29, 30] modelise assez bien la decomposition du sommeil que
pratique le medecin scoreur. Par la suite, des methodes analysant le signal dans le domaine
frequentiel sont apparues. Le probl`eme majeur pose par leur utilisation concerne la station-
narite des signaux. Cest pourquoi il existe generalement une analyse sur le court terme pour
28
CHAPITRE 1. LE SOMMEIL ET SES METHODES DINVESTIGATION

la detection des ev`enements transitoires (complexe K, fuseaux. . . ) et une autre sur le long
terme, pour la caracterisation des types dondes (alpha, delta. . . )[31].

La r`
egle de classification

On distingue deux grandes methodes de classification. La premi`ere consiste `a reproduire


le mod`ele de Rechtschaffen et Kales (R&K). Les ev`enements cles comme la presence ou
labsence de fuseaux, dondes alpha, le depassement dun seuil en amplitude pour le signal
EEG ou EMG sont reperes. Un arbre logique permet ensuite de fournir un stade de sommeil
`a partir de la combinaison de ces informations binaires [19, 20, 32].

La deuxi`eme grande methode consiste `a extraire un certain nombre de param`etres


numeriques du signal, et `a les classer selon des proprietes statistiques apprises durant une
phase dapprentissage. Bien souvent, les donnees auxquelles sont appliquees ce type de clas-
sifieur sont les energies relatives de differentes bandes de frequences, que lon regroupe sous
la forme dun vecteur presente au classifieur [19, 33, 13].

Utilisation de la logique floue

Les techniques travaillant dans lespace temporel realisent le plus souvent une detection
dev`enements cles, par exemple une bouffee dondes alpha, ou un complexe K [17]. Elles
cherchent en fait `a realiser un travail de decoupage le plus proche possible de ce que fait un
expert humain. Mais se pose alors le probl`eme de ladaptabilite. Ainsi, selon les r`egles R&K,
leveil est defini par au moins trente secondes dondes alpha, sur une epoque dune minute.
Mais un expert humain scorera eveil meme si, sur un enregistrement, la duree nest que de
vingt neuf secondes. Les seuils ne sont pas des limites fixes mais seulement des guides. Leur
implementation peut donc provoquer de grandes discordances entre un scorage manuel et un
scorage automatique. Il existe toutefois un moyen dobtenir de bons resultats en utilisant les
principes de la logique floue.

La logique floue definit des r`egles qui associent `a un ev`enement une probabilite sur letat
qui la engendre. Prenons un exemple avec la methode de Principe et al. [17] : les r`egles
R&K nous indiquent quun stade 2 est defini par au moins deux fuseaux dondes sigma.
La detection de deux fuseaux sur une epoque attribuera une probabilite de 0.9 au fait que
lepoque soit du stade 2. Si ce sont trois fuseaux qui sont detectes, cette probabilite sera de
0.95. Et si aucun fuseau nest detecte, la possibilite detre dans un stade 2 ne sera accreditee
que dune probabilite de 0.1. En agissant de meme pour plusieurs param`etres, on obtiendra
pour lepoque une probabilite associee `a chaque stade possible. Le stade ayant la plus forte
probabilite sera finalement retenu pour classer lepoque.

Dans cet exemple, la probabilite est attribuee de facon logicielle mais cette operation est
parfois realisee de facon materielle. Cest dailleurs pour cela que la logique floue a ete tr`es
tot utilisee. Ainsi, Kumar [26] en 1977 utilise ce principe de fronti`ere floue, quil applique `a
lamplitude moyenne des signaux EEG en utilisant des comparateurs `a hysteresis. Aujour-
dhui, ces methodes sont toujours employees et des techniques tr`es elaborees se basent sur
cet outil, comme par exemple Berthomier et al. [34] qui definissent un degre dappartenance
`a partir densembles de reference flous.
1.3. LE SCORAGE AUTOMATIQUE DU SOMMEIL 29

Utilisation des r
eseaux de neurones

Les techniques `a base de reseaux de neurones (aussi appelees connexionistes) sont de plus
en plus utilises aujourdhui pour le scorage du sommeil en raison du fait quils apparaissent
comme une methode de scorage robuste vis `a vis des grandes variabilites inter et intra
individuelles des signaux physiologiques quils traitent.

Les reseaux de neurones sont utilises de differentes facons. Parfois, leur role se cantonne
a` reperer dans le signal electro-encephalographique des formes dondes particuli`eres comme
les ondes alpha, les fuseaux, les pointes vertex [35, 36]. Dautres se concentrent sur la
reconnaissance de certains stades du sommeil exclusivement, comme le sommeil paradoxal
dans le syst`eme de Grozinger et al. [37]. Dautres enfin realisent une veritable classification
du sommeil [38, 39, 40, 41].

Les donnees fournies en entree du reseau sont des param`etres calcules `a partir des
signaux electro-encephalographiques pour la plupart, mais aussi electro-myographique (yeux
et menton) et respiratoire pour certains. Dune mani`ere globale, les signaux sont decoupes
en fenetres et les param`etres sont calcules sur ces fenetres. En ce qui concerne lEEG,
les param`etres les plus souvent rencontres concernent lenergie des differentes bandes de
frequence composant le signal electro-encephalographique et des param`etres statistiques
exprimant la dispersion de cette energie au cours du temps [16, 37, 35]. Le signal respiratoire
est, lui, generalement caracterise par sa frequence (moyenne et variance) [39]. Enfin, le signal
electromyographique fait lobjet dun calcul denergie, de frequence moyenne et de dispersion
spectrale [38].

Les reseaux employes sont relativement simples et sont constitues dune couche dentree
comportant autant de neurones que de variables dentree (entre 5 et 20), dune couche
cachee comprenant de 5 `a 20 neurones et autant de neurones de sortie que de classes
souhaitees [16, 37, 38, 42]. Ils sont du type compl`etement connectes cest `a dire que
chaque neurone dune couche est connecte `a tous les neurones de la couche suivante. Ils
utilisent pour leur apprentissage la retropropagation du gradient de lerreur. On remarque
toutefois des originalites. Ainsi, Robert et al. [40] ont utilise un reseau comprenant trois
fois plus de neurones dentree que de variables. Les variables de chaque epoque sont alors
presentees au reseau en meme temps que celles de lepoque suivante et de lepoque precedente.

Il est interessant de noter quune augmentation du nombre de neurones dans la couche


dentree ou dans la couche cachee nentrane pas forcement une amelioration du resultat
[37, 16]. Au contraire, il existe une configuration optimale et toute variation, dans un sens
comme dans lautre, du nombre de neurones entrane une baisse des performances.

Les r
esultats

Le resultat dun syst`eme automatique de classification du sommeil est generalement


evalue par le taux daccord (ou taux dagrement) epoque par epoque avec un expert. Ce
taux est obtenu en comparant la classe attribuee `a chaque epoque de la nuit par le syst`eme
automatique dune part, et par lexpert dautre part. Le pourcentage depoques dont la classe
donnee est identique determine le taux daccord (ou dagrement). Les taux annonces sont
souvent entre 80 et 90% [17, 26, 39, 38]. Cette valeur est `a comparer avec le taux dagrement
30
CHAPITRE 1. LE SOMMEIL ET SES METHODES DINVESTIGATION

entre deux experts issus dun meme laboratoire, qui est en moyenne de 90% pour un
patient sain, moins pour un patient souffrant dune pathologie. Ces taux peuvent descendre `a
50% pour des patients au sommeil altere scores par des experts issus de laboratoires differents.

Les difficultes eprouvees par les algorithmes de scorage automatique resident dans la
distinction entre les stades 3 et 4 [17] dune part et les stades 1 et 3 [19, 42] dautre part.
Toutefois, il est `a noter que la distinction entre les stades 3 et 4 est une des plus grandes
sources de desaccord entre experts. De plus, les stades 1 et 3 sont des stades de transition
(entre leveil et le premier vrai stade de sommeil pour le premier et entre le sommeil lent
leger et le sommeil lent profond pour le second). Enfin, il ne faut pas perdre de vue que le
scorage du sommeil est un decoupage en stades discrets dun processus qui est lui plutot
continu. Il est donc evident que cette discretisation se fera au prix derreurs.

On notera pour terminer deux nuances `a apporter aux donnees numeriques. La premi`ere
concerne limportance de la taille des classes. Ainsi, une nuit de sommeil etant constituee
approximativement de 5% de stade 1, 50% de stade 2, 25% de stades 3 et 4 et 20% de
sommeil paradoxal, il est possible dobtenir un taux daccord de 80% quand les stades
de sommeil paradoxal sont mal classes, alors que ce taux descendra `a 50% si ce sont les
stades 2 qui sont mal classes. La nature du stade mal classe, de part sa proportion plus ou
moins importante, influence grandement le taux dagrement global et il convient de ne pas
se limiter `a cette seule variable pour juger de lefficacite dun syst`eme de scorage automatique.

Enfin, le taux dagrement exprime le pourcentage depoques scorees de la meme facon


par la methode automatique et par lexpert, ce qui ne signifie pas en soit le pourcentage
depoques scorees correctement par la methode automatique. Il est possible que parmi les
epoques de desaccord, ce soit la reponse de lautomate qui soit la plus proche de la realite
physiologique et non celle de lexpert, et ce dautant plus que le regard de lexpert est biaise :
lhomme percot beaucoup plus facilement des variations damplitudes que des variations de
frequence.

1.3.3 Exploitation des donn


ees cardio-respiratoires

Les techniques exploitant des donnees cardio-respiratoires ne cherchent pas `a se substituer


a` la polysomnographie. Cest pourquoi elles sont moins developpees que lautomatisation de
cette derni`ere, qui reste la reference medicale. Dans la plupart des cas, le scorage attendu
est du type veille/sommeil lent (stades 1, 2, 3 et 4)/sommeil paradoxal.

Les donnees les plus couramment exploitees sont le rythme cardiaque (mediane, variance,
signal RR), le rythme respiratoire (mediane, variance) ou le nombre de mouvements.
La repartition frequentielle du signal cardiaque (ou du signal RR)[43, 44] et du signal
respiratoire[45] est tr`es etudiee, notamment car elle refl`ete lactivite du syst`eme parasym-
pathique [46]. Ces donnees sont ensuite traitees par un classificateur Bayesien [16, 47], un
mod`ele de Markov cache [48] ou bien des r`egles plus empiriques [49]. Les resultats sont en
general assez bons, aux environs de 80 `a 85% [50, 49, 51].

Les informations cardiorespiratoires peuvent aussi etre recueillies `a partir dun lit `a charge
statique. Le signal composite est alors parfois utilise tel quel [16], parfois filtre en trois bandes

1.4. CONCLUSIONS CONCERNANT LETUDE DANS CE DOCUMENT
MENEE 31

[51, 52] afin den extraire le signal cardiaque, le signal respiratoire et le signal actimetrique. Les
resultats sont beaucoup plus variables que dans le cas de la polysomnographie automatique.
[16] indique un taux dagrement de 52 `a 75% pour un scorage classique en six classes .
Enfin, les donnees cardiorespiratoires sont tr`es utilisees pour la detection automatique des
apnees du sommeil [53, 54, 55].

1.4 Conclusions concernant l


etude men
ee dans ce document
Cette etude des methodes de scorage du sommeil fait ressortir un certain nombre
dinformations utiles pour la suite de notre travail.

Dabord, nous savons que les techniques de scorage automatique du sommeil basees sur
letude des signaux de mouvement et des param`etres cardio-respiratoires, bien que moins
developpees que les techniques polygraphiques, offrent des perspectives interessantes de
resultats. Notamment, la discrimination des etats de veille, sommeil lent et de sommeil
orthodoxe atteint parfois un taux daccord de 80%. Ce type de syst`eme sappuie parti-
culi`erement sur des param`etres calcules `a partir des valeurs medianes et des variances des
rythmes cardiaque et respiratoire.

La principale difficulte rencontree par les syst`emes de classification automatique du


sommeil reside dans la determination des stades de sommeil 1 et 3, ce qui sexplique par le
fondement physiologique de ces stades, qui sont essentiellement definis comme des transitions
entre les stades 0 et 2 pour le premier, 2 et 4 pour le second.

Lutilisation de syst`emes de classification autorisant une certaine souplesse dans la prise


de decision (comme les methodes floues ou connexionistes) sont generalement `a privilegier.
Les reseaux de neurones sont particuli`erement recommandes pour leur robustesse. Ceux-ci
utilisent generalement une couche cachee, comprenant une quinzaine de neurones.

Enfin, nous retiendrons que la classification est souvent operee en deux etapes. Dans la
premi`ere, la classification de lepoque est basee sur une observation locale dattributs. Lorsque
la nuit est enti`erement classee de cette mani`ere, une seconde phase, dite de rescorage, est
effectuee. Certaines epoques sont alors requalifiees en fonction de levolution globale de la nuit.
Chapitre 2

Exploitation de la mod elisation


physiologique du signal de variation
de pression arterielle pour
lestimation des rythmes cardiaque
et respiratoire

Dans un premier temps, nous avons recherche la reponse au probl`eme de lestimation des
rythmes cardiaque et respiratoire du cote des methodes classiques destimation spectrale.
Nous avons notamment utilise plusieurs estimateurs bases sur le periodogramme. Ceux-ci
ne nous apportant pas une totale satisfaction (particuli`erement pour lestimation de la
frequence respiratoire), nous nous sommes tournes vers une autre famille de methodes : les
methodes parametriques. Ces derni`eres se distinguent par la definition dun mod`ele dont
la sortie est conditionnee par les param`etres appliques `a son entree. Lutilisation courante
de la modelisation consiste `a determiner les param`etres dentree du mod`ele `a partir de la
connaissance du mod`ele et de lobservation de sa sortie. Dans notre cas, cest le signal de
variation de pression arterielle qui represente lobservation disponible.

Une modelisation a particuli`erement retenu notre attention. Il sagit du mod`ele TV-


TIPFM pour Time-Varying Threshold Integral Pulse Frequency Modulation. Celui-ci simule
les mecanismes aboutissant `a la generation des battements cardiaques. Il prend en compte
deux signaux biologiques regulant le rythme de sortie des battements. Le premier refl`ete la
contribution du syst`eme nerveux autonome. Cest ce syst`eme qui adapte le rythme cardiaque
global aux besoins du corps. Le second explique les accelerations et ralentissements, correles
au rythme respiratoire, que lon peut observer sur un signal electrocardiographique [56, 57].
Celles-ci sont dues aux contraintes mecaniques exercees par les poumons sur le nud
sinoatrial, `a lorigine des battements cardiaques. Celui-ci poss`ede en effet la propriete de
se comporter comme un quartz, cest-`a-dire quil ralentit ou accel`ere son oscillation propre
selon les contraintes mecaniques dont il est lobjet.

Le mod`ele TVTIPFM que lon se propose dutiliser permet justement de determiner


ces deux signaux biologiques `a partir de la suite des battements cardiaques, observables

CHAPITRE 2. EXPLOITATION DE LA MODELISATION PHYSIOLOGIQUE DU
34
SIGNAL DE VARIATION DE PRESSION ARTERIELLE

sur le signal de variation de pression arterielle. De cette mani`ere, nous acc`ederions dune
part `a une image du signal respiratoire et dautre part `a une image de la contribution du
syst`eme nerveux autonome. A court terme, cest surtout le premier qui nous interesse mais
le second peut saverer utile pour lanalyse du sommeil. En effet, lequilibre entre lactivite
du syst`eme nerveux sympathique et celle du syst`eme nerveux parasympathique (les deux
formant ensemble le syst`eme nerveux autonome) varie au cours de la nuit [58]. Or cette
evolution est source dinformation sur le stade de sommeil [46, 59]. Encore faut-il quelle soit
lisible sur le signal estime.

Nous detaillons dans ce chapitre lexploitation de la modelisation TVTIPFM en vue des-


timer la frequence respiratoire. Pour cela nous presentons en premier lieu les fondements
theoriques de ce mod`ele. Dans un second temps, nous expliquons comment obtenir, `a partir
de la localisation des battements cardiaques, les signaux qui en sont `a lorigine. Enfin, lal-
gorithme exploitant ce mod`ele ainsi que ses performances sont detailles dans une derni`ere
partie.

2.1 Mod
elisation de la g
en
eration des battements cardiaques
Le mod`ele TVTIPFM, developpe par Seidnejad et Kitney [60], est un mod`ele de
generation de battements cardiaques. Les battements cardiaques presentent la particularite
davoir une periode entre battements qui varie au cours du temps. Il est communement admis
que ces variations sont le reflet de la contribution du syst`eme nerveux autonome. Cependant,
lintroduction dagents bloquants ou la dissection de ces nerfs ne suppriment pas totalement
cette variation, ce qui suppose lexistence dune deuxi`eme contribution `a ces variations. Il
est admis que la variation residuelle de rythme est due `a la deformation du nud sinoatrial
(region du coeur `a lorigine des impulsions generant les battements cardiaques) sous leffet
du retour veineux du sang mais surtout de la respiration [61]. La variation de type sinusodal
du signal decart entre battements (aussi appele signal HRV pour Heart Rate Variability)
est appelee arythmie sinusale respiratoire.

Fig. 2.1 Mod`ele TVTIPFM de generation des battements cardiaques

Nous avons choisi de caracteriser les contributions des signaux `a lorigine des battements
ERATEURS
2.2. OBTENTION DES SIGNAUX GEN ` PARTIR DU SIGNAL DE
A
BATTEMENTS 35

cardiaques par le mod`ele TVTIPFM, represente sur la figure 2.1. Le signal (t) simule la
contribution du syst`eme nerveux autonome `a la generation des battements cardiaques, tandis
que le signal a(t) represente celle de la deformation du noeud sinoatrial, laquelle est liee,
rappelons-le, `a la respiration. Le signal (t) est integre, et la valeur de cette integration
est comparee au signal a(t). Lorsque lintegration de (t) depasse la valeur de seuil donnee
par a(t), un battement cardiaque est genere, et la valeur dintegration est remise `a zero.
Connaissant le signal de battements cardiaques, ainsi que le mod`ele qui la genere, il nous
est a priori possible de retrouver les signaux (t) et a(t) qui, appliques au mod`ele, ont ete `
a
lorigine de la generation de ce signal de battements cardiaques.

2.2 Obtention des signaux g


en
erateurs `
a partir du signal de
battements

2.2.1 Le mod`
ele TVTIPFM

Dapr`es la figure 2.1, la premi`ere impulsion sera produite `a linstant t1 lorsque legalite
suivante sera verifiee :
Z t1
(t)dt = a(t1 ) (2.1)
0

La deuxi`eme impulsion sera, elle, generee `a linstant t2 , caracterisee par lexpression :


Z t2
(t)dt = a(t2 )
t1
Z t2 Z t1
= (t)dt (t)dt
0 0
Z t2
= (t)dt a(t1 ) (2.2)
0

On peut caracteriser de la meme facon la k i`eme impulsion :


Z tk
(t)dt = a(tk ) (2.3)
tk1
Z tk Z tk1
= (t)dt (t)dt . . .
0 0
Z tk k1
X
= (t)dt a(tj ) (2.4)
0 j=1

En combinant les expressions (2.3) et (2.4) on obtient lexpression suivante qui servira de
point de depart `a notre methode de calcul :
Z tk k1
X
(t)dt a(tj ) = a(tk )
0 j=1
Z tk k
X
= (t)dt = a(tj ) k = 1, 2, . . . , K (2.5)
0 j=1

CHAPITRE 2. EXPLOITATION DE LA MODELISATION PHYSIOLOGIQUE DU
36
SIGNAL DE VARIATION DE PRESSION ARTERIELLE

o`u K represente le nombre de battements observes. Afin de pouvoir reconstruire les signaux
(t) et a(t), nous allons considerer leur decomposition en une somme ponderee de fonctions
issues des bases {i , i = 0 . . . L} et {i , i = 0 . . . L} :
L
0
X
(t) = i i (t) (2.6)
i=0
XL
a(t) = i i (t) (2.7)
i=0

0
Les fonctions i (t) etant supposees derivables telles que i (t) = di (t)/dt. De cette facon,
la connaissance des param`etres indetermines i et i permet de reconstruire les fonctions (t)
et a(t). Pour cela, continuons notre developpement en substituant les expressions (2.6) et (2.7)
dans lexpression (2.5), soit :

L Z tk L k
0
X X X
i i (t)dt = i (tj ) k = 1, 2, . . . , K (2.8)
i=0 0 i=0 j=1

En notant (t) la fonction telle que i (t) = i (t) i (0), lexpression (2.8) peut etre
exprimee de la facon suivante :

XL L
X Xk
i i (tk ) = i (tj ) k = 1, 2, . . . , K (2.9)
i=0 i=0 j=1

Soit encore, sous forme matricielle :



0
0 (t1 ) 1 (t1 ) . . . L (t1 ) 0 (t1 ) 1 (t1 ) ... L (t1 )
2 2 2

1
..
X X X

0 (t2 ) 1 (t2 ) . . . L (t2 ) 0 (tj ) 1 (tj ) . . . L (tj ) .

j=1 j=1 j=1 L
= 0(2.10)
.. .. .. .. .. .. .. ..
0
. . . . . . . .



XK XK XK
1

0 (tK ) 1 (tK ) . . . L (tK ) 0 (tj ) 1 (tj ) . . . L (tj ) ..
.
j=1 j=1 j=1
L

Pour plus de simplicite dans les notations, definissons les matrices suivantes :

i (t1 ) i+1 (t1 ) . . . L (t1 )
i (t2 ) i+1 (t2 ) . . . L (t2 )
(t1 , tK , i, L) = (2.11)

.. .. .. ..
. . . .
i (tK ) i+1 (tK ) . . . L (tK )

(t ) (t ) ... (t )

P2 i 1 P2 i+1 1 P2 L 1
j=1 i (tj ) j=1 i+1 (tj ) . . . j=1 L (tj )

(t1 , tK , i, L) = (2.12)

.. .. .. ..
. . . .
PK PK PK
j=1 i j (t )
j=1 i+1 j(t ) . . . j=1 L (tj )
ERATEURS
2.2. OBTENTION DES SIGNAUX GEN ` PARTIR DU SIGNAL DE
A
BATTEMENTS 37

Et les vecteurs 0,L et 0,L caracterisant les decompositions de (t) et a(t).

 T
0,L = 0 1 . . . L (2.13)
 T
0,L = 0 1 . . . L (2.14)

Lexpression (2.10) devient alors :


" #
  0,L
(t1 , tK , 0, L) (t1 , tk , 0, L) =0 (2.15)
0,L

Pour obtenir les i et i , il nous faut convertir ce syst`eme dequations homog`ene en un


syst`eme non homog`ene. Pour cela, il est necessaire demettre des hypoth`eses sur les termes de
lequation (2.15), et plus particuli`erement sur les fonctions 0 et 0 . En effet, par construction,
le mod`ele TVTIPFM fait intervenir des signaux a(t) et (t) possedant chacun une compo-
0
sante continue. Nous supposerons que dans notre mod`ele, seules les fonctions 0 (t) et 0 (t)
poss`edent une composante continue, do` u:
0
dc = 0 0 (t) (2.16)
adc = 0 0 (t) (2.17)

La composante continue de ces signaux etant par definition une constante, les fonctions
0
0 (t) et 0 (t) sont choisies egales `a 1, ce qui implique que 0 (t) = t. Les valeurs de 0 et de
0 seront determinees par le signal de battements. Cette hypoth`ese nous permet dextraire
0
de lequation (2.15) les termes impliquant 0 (t) et 0 (t).


1
1 (t1 ) . . . L (t1 ) 1 (t1 ) ... L (t1 )
2 2

2
..
X X
0 t1 + 0

1 (t2 ) . . . L (t2 ) 1 (tj ) . . . L (tj ) .
0 t2 + 20
j=1 j=1 L

.. .. .. .. .. .. = .. (2.18)

1

. . . . . . .



XK XK
2
0 tK + K0
1 (tK ) . . . L (tK ) 1 (tj ) . . . L (tj ) ..
.
j=1 j=1
L

Soit, sous forme simplifiee :


" #
  1,L  
(t1 , tK , 1, L) (t1 , tK , 1, L) = 0 (t1 , tK , 0, 0) + 0 (t1 , tK , 0, 0) (2.19)
1,L

0 et 0 etant determines par la moyenne des intervalles entre battements, lexpression


(2.19) nous permettra dacceder aux i et i . Il nous reste maintenant `a definir les fonc-
0
tions i (t) et i (t). Le choix se porte sur des fonctions trigonometriques. Hormis linteret de
vehiculer lidee de composante frequentielle, elles presentent linteret de fournir une solution
unique `a lequation (2.18) en assurant la generation de colonnes lineairement independantes.

CHAPITRE 2. EXPLOITATION DE LA MODELISATION PHYSIOLOGIQUE DU
38
SIGNAL DE VARIATION DE PRESSION ARTERIELLE

De plus, leur derivation donne aussi une fonction trigonometrique, assurant par-l`a la conser-
vation de ces proprietes. Plus precisement, les fonctions choisies sont definies par les relations :
0
i (t) = cos(2(flow + pf )t)
0
i+1 (t) = sin(2(flow + pf )t)
i1
i = 1, 3, 5, . . . , L 1 p= (2.20)
2
i (t) = sin(2(flow + pf )t)
i+1 (t) = cos(2(flow + pf )t)
i1
i = 1, 3, 5, . . . , L 1 p= (2.21)
2
f represente la resolution frequentielle choisie et flow la plus petite des frequences dex-
cursion.
Les fonctions de base etant choisies, il est possible de resoudre lequation (2.19),
puis de reconstruire les signaux (t) et a(t) `a laide des i et i determines. Cette
operation est, en principe, simple : il suffit, dapr`es lequation (2.19) dinverser la matrice
[ (t1 , tK , 1, L) (t1 , tK , 1, L) ] et de la multiplier `a [ 0 (t1 , tK , 0, 0) + 0 (t1 , tK , 0, 0) ]
pour obtenir les i et i . Cependant, il nest pas possible de proceder de cette facon car cette
methode ne fournit un resultat fiable uniquement dans le cas o` u les temps ti sont parfai-
tement connus et o` u les signaux (t) et a(t) se decomposent parfaitement en une somme
0
ponderee des fonctions de base, i (t) et i (t). Mais dans notre cas, aucune de ces conditions
nest remplie et cest pourquoi cette methode se rev`ele inappropriee. Lequation (2.19) devra
donc etre resolue dune autre mani`ere : par la methode des moindres carres.

2.2.2 Mise en uvre pratique

Le probl`eme consiste `a chercher le vecteur de coefficients [ 1,L 1,L ]T qui, mul-


tiplie par la matrice de donnee [ (t1 , tK , 1, L) (t1 , tK , 1, L) ], donne le vecteur dob-
servation [ 0 (t1 , tK , 0, 0) + 0 (t1 , tK , 0, 0) ]. Pour gagner en simplicite de nota-
tion, nous allons temporairement renommer le vecteur [ 1,L 1,L ]T en x, la matrice
 
[ (t1 , tK , 1, L) (t1 , tK , 1, L) ] en A, et le vecteur 0 (t1 , tK , 0, 0) + 0 (t1 , tK , 0, 0)
en y. De plus, afin de conserver la possibilite dutiliser les resultats dans le cas le plus large
possible, nous considerons que la matrice A est supposee de taille m n avec m et n quel-
conques. Les vecteurs x et y auront, eux, pour dimensions respectives n 1 et m 1. Avec
ces nouvelles notations, nous cherchons donc `a determiner le vecteur de coefficient x qui
satisfasse :

Ax = y (2.22)

Cette expression na generalement, dans le contexte dapplication qui est le notre, pas de
solution. Plusieurs raisons expliquent cela et notamment les erreurs de mesure des instants
de battements. On qualifie un tel syst`eme dequation dinconsistant. En consequence, nous
allons plutot chercher le vecteur de coefficients x tel que le vecteur Ax soit le plus proche
possible du vecteur y. Il existe plusieurs definitions de plus proche possible et nous avons
choisi dutiliser la distance L2. Son ecriture formelle est :

dL2 (Ax, y) = kAx yk2


= x A Ax x A y y Ax y y) (2.23)
ERATEURS
2.2. OBTENTION DES SIGNAUX GEN ` PARTIR DU SIGNAL DE
A
BATTEMENTS 39

O`u (.) designe loperateur de conjugaison transposition. Nous cherchons donc `a determiner
le vecteur x qui minimisera cette expression.

D
ecomposition de la matrice de donn
ees A

Soit B, une base de meme dimension que le rang r de la matrice A (r = min(m, n)) et
qui engendre le meme sous espace vectoriel que la matrice A. Tout vecteur compris dans
le sous espace engendre par A pourra donc sexprimer comme une combinaison lineaire de
A ou de B. De ce fait, tous les vecteurs colonnes de A pourront sexprimer comme une
combinaison lineaire des vecteurs de B. Si lon construit une matrice B de dimension m r
par concatenation des vecteurs de la base B, alors il existe une matrice R de taille r n
qui permet dexprimer la matrice A `a partir des vecteurs de la matrice B, ce qui secrit
formellement [62] :

A = BR (2.24)

La matrice B netant pas obligatoirement carree, il nous faut, pour obtenir la matrice de
coefficients R, premultiplier les deux cotes de lequation par B , puis par linverse de [B B],
qui elle, est carree, et de plus Hermitienne ([B B] = [B B]) donc inversible.

R = [B B]1 B A (2.25)

En remplacant R par son expression dans lexpression (2.24) on obtient :

A = PA A (2.26)

avec :

PA = B[B B]1 B (2.27)

Comme B est de rang plein par construction, lespace darrivee de la projection orthogonale
est identique `a celui de B, qui est le meme que celui de A. PA est une matrice de projection
orthogonale et poss`ede la particularite detre idempotente et Hermitienne, soit :

PA = (B[B B]1 B )
= B([B B]1 ) B = PA (2.28)
PA2 = PA PA
= B([B B]1 ) B B([B B]1 ) B = PA

(2.29)

Nous allons utiliser ces proprietes pour poursuivre notre developpement.

Th
eor`
eme de Pythagore

Remarquons que nous pouvons ecrire y comme une somme de sa projection dans lespace
de projection de PA , et de sa projection dans un espace supplementaire `a PA :

y = y + PA y PA y
= PA y + [I PA ]y (2.30)

CHAPITRE 2. EXPLOITATION DE LA MODELISATION PHYSIOLOGIQUE DU
40
SIGNAL DE VARIATION DE PRESSION ARTERIELLE

Les vecteurs PA y et [I PA ]y sont en fait orthogonaux car leur produit scalaire est nul :

[PA y] [I PA ]y = y PA [I PA ]y
= y PA [I PA ]y
= y [PA PA PA ]y
= 0 (2.31)

Lespace, que nous noterons R(A), engendre par PA y est, nous lavons dit plus haut, identique
a` celui engendre par A. Appelons alors R(A) lespace engendre par [I PA ]y. Lerreur
quadratique sexprime alors de la facon suivante :

kAx yk2 = kAx (PA y + [I PA ]y)k2


= k(Ax PA y) + ([I PA ]y)k2 (2.32)

Or les vecteurs Ax et PA y sont contenus dans R(A) et [I PA ]y est contenu dans R(A) .
Ces espaces etant orthogonaux, le theor`eme de Pythagore peut sappliquer au calcul de la
norme de lerreur soit :

kAx yk2 = k(Ax PA y) + ([I PA ]y)k2


= kAx PA yk2 + k[I PA ]yk2 (2.33)

Comme Ax et PA y sont contenus dans le meme espace vectoriel, il est toujours possible de
determiner un vecteur x0 tel que Ax0 = PA y et donc dannuler le premier terme de lequation
(2.33). Le vecteur x0 qui satisfait cette condition permet de minimiser la norme de lerreur
quadratique, qui vaut alors k[I PA ]yk2 .

Minimisation de lerreur quadratique

Parmi lensemble de solutions, il apparat raisonnable de selectionner le vecteur x0 qui


poss`ede la plus petite norme. Le vecteur x0 qui minimise la norme de lerreur quadratique
est donc tel quil minimise lexpression x x sous la contrainte Ax = PA y. Afin de resoudre
ce probl`eme doptimisation, nous allons utiliser la methode des multiplicateurs de Lagrange.
Pour cela, reecrivons le probl`eme `a resoudre :

x0 = arg min x x

(2.34)
s.c.q Ax PA y = 0


Ecrivons ensuite le lagrangien de cette expression :

l(x, ) = x x + (Ax PA y) (2.35)

Afin de determiner les points stationnaires du lagrangien, il nous faut commencer par
calculer ses gradients :

l
= 2x + A (2.36)
x
l
= Ax PA y (2.37)

ERATEURS
2.2. OBTENTION DES SIGNAUX GEN ` PARTIR DU SIGNAL DE
A
BATTEMENTS 41

Cherchons maintenant les points qui annulent ces gradients.

l
= 0 2x0 + A = 0
x

x0 = A (2.38)
2
Remplacons maintenant x0 par son expression donnee par lequation (2.38) dans la deuxi`eme
equation annulatrice du gradient :


Ax0 = PA y AA = PA y
2

AA = B[B B]1 B y (2.39)
2

` partir de cette expression, nous allons effectuer un certain nombre de manipulations


A
qui ont pour but de parvenir `a lexpression de x0 . Precisons, car cela est important pour les
manipulations qui vont suivre, quune condition necessaire et suffisante pour quune matrice
soit inversible est que sa dimension egale son rang. Or dans notre cas, B est une matrice
m r, de rang r, et R est une matrice r n de rang r. Elles ne sont donc pas, a priori,
inversibles. Par contre, les matrices B B et R R sont toutes deux carres de dimension r. De
plus, leur rang est r car quelque soit une matrice M , son rang est egal `a celui de M , tout
comme `a celui de M M et de M M . Elles sont donc toutes deux inversibles. En inserant 2.24
dans 2.39, il vient :


AA = B[B B]1 B y
2

= (BRR B ) = B[B B]1 B y
2

= (B B)(RR B ) = (B B)[B B]1 B y
2

= (RR B ) = [B B]1 B y
2

= [RR ] (RR )B
1
= [RR ]1 [B B]1 B y
2

= B = [RR ]1 [B B]1 B y
2

= A = R [RR ]1 [B B]1 B y (2.40)
2

Et lexpression (2.38) nous permet de conclure sur la solution optimale :

x0 = R [RR ]1 [B B]1 B y (2.41)

Le vecteur x0 qui minimise la norme de lerreur quadratique kAx PA yk2 est donc :

x0 = A y (2.42)

Avec A , linverse de Moore-Penrose de la matrice A defini par :

A = R [RR ]1 [B B]1 B (2.43)



CHAPITRE 2. EXPLOITATION DE LA MODELISATION PHYSIOLOGIQUE DU
42
SIGNAL DE VARIATION DE PRESSION ARTERIELLE

D
ecomposition en valeurs singuli`
eres

Le calcul du vecteur x0 necessite la manipulation de matrices B et R, qui decoulent du


choix dune base B permettant de generer le meme espace vectoriel que A. Bien quil existe
une infinite de bases qui conviennent, il est intuitivement interessant den utiliser une qui
soit la plus appropriee possible au signal.

Pour cela, interessons-nous `a A A, appelee matrice de Gram associee `a A. Elle est Hermi-
tienne et donc diagonalisable. De plus, elle est definie semi-positive ce qui assure une positivite
de ses valeurs propres, notees k2 , avec k = 1, . . . , n. Si on nomme vk ses n vecteurs propres,
alors on peut ecrire :

A Avk = k2 vk 1kn (2.44)

Concernant les valeurs propres k2 (le carre signifiant quelles sont positives), definissons-
les lignes par ordre decroissant de sorte que k2 > k+1
2 . Comme A est de rang r, nous pouvons

preciser que les nr derni`eres valeurs propres sont nulles. De plus, de par le fait que la matrice
decomposee est symetrique, on a :

vi vk = ki ,o`
u ki = 1 si k = i, 0 sinon (2.45)

Maintenant, premultiplions (2.44) par A. On obtient :

AA Avk = k2 Avk 1<k<n (2.46)

On deduit de cette egalite que les r premiers vecteurs Avk sont les vecteurs propres de la
matrice AA , et que celle-ci poss`ede les memes valeurs propres que la matrice A A [62, 63].
Creons maintenant les vecteurs uk tels que uk = Avk /k . Ces vecteurs sont normes comme
le montre le calcul suivant :

vk A Avk
kuk k2 =
k k
1
= vk A Avk
k2
1 2
= vk k vk
k2
= 1 (2.47)

Les vecteurs propres orthonormes de la matrice AA associes aux valeurs propres k2 sont
donc les vecteurs uk definis par la relation (2.48) :

Avk = k uk 1kr (2.48)

En postmultipliant la relation (2.48) par vk et en sommant les r egalites on a :

r
X r
X

Avk vk = k uk vk (2.49)
k=1 k=1
ERATEURS
2.2. OBTENTION DES SIGNAUX GEN ` PARTIR DU SIGNAL DE
A
BATTEMENTS 43

Comme, dapr`es la relation (2.44), lon sait que les n r derni`eres valeurs propres de Avk
sont nulles, on peut augmenter lindice de somme de r `a n. On obtient alors :
n
X r
X
A vk vk = k uk vk (2.50)
k=1 k=1

Or les vk forment une base orthonormale (relation (2.45)). De ce fait la matrice V de


dimension m n composee des vecteurs colonne vk est orthonormale, et donc on a V V =
V V = I :
r
X
A = k uk vk
k=1
= U V (2.51)

O`u est la matrice diagonale constituee des valeurs propres k . Ceci constitue la
decomposition en valeurs singuli`eres de la matrice A. Precisons que les vecteurs de U et
de V sont orthonormaux cest `a dire que U U = V V = I.

Moore Penrose et valeur singuli`


ere

Linteret de la decomposition en valeur singuli`ere devient evident lorsque lon revient `


a
notre probl`eme. En effet, en se rappelant lexpression (2.24) et en posant B = U et R = V ,
on obtient :

A = R [RR ]1 [B B]1 B
= V [V V ]1 [U U ]1 U
= V 1 U (2.52)

O`u est une matrice diagonale donc tr`es facilement inversible. Ainsi, le vecteur x0 qui
minimise la norme euclidienne de lerreur definie par (2.23) est facilement obtenu en effectuant
une decomposition en valeurs singuli`eres de A, et en calculant dapr`es lexpression 2.42 :

x0 = V 1 U y (2.53)

R
eduction du bruit : rehaussement de matrice

En fait, la modelisation Ax = y constitue une approximation de la modelisation reelle.


En effet, du `a la precision limitee des instants ti , la matrice A comporte des imprecisions,
de meme que la matrice y. De ce fait, appliquer telle quelle cette methode peut conduire
`a des resultats mediocres. Il est cependant possible de ladapter de sorte `a minimiser les
perturbations induites par les imprecisions. Pour cela, commencons par modeliser de facon
plus adequate le probl`eme : limprecision de la mesure se traduit par un bruit sur lobservation.

y = y + w (2.54)

Le probl`eme que lon cherche `a resoudre se formule alors par :

y = Ax (2.55)

CHAPITRE 2. EXPLOITATION DE LA MODELISATION PHYSIOLOGIQUE DU
44
SIGNAL DE VARIATION DE PRESSION ARTERIELLE

Il ny a typiquement pas de raisons pour que le bruit se trouve dans le sous espace
vectoriel engendre par A. De ce fait, le probl`eme ci-dessus est typiquement inconsistant,
alors meme que le syst`eme Ax = y, est, lui, consistent (cest `a dire le syst`eme parfait, si lon
pouvait ne commettre aucune erreur de mesure).

Nous avons vu que lestimateur au sens des moindres carres du syst`eme (2.55) est donne
par :

LS = A y
x
= A Ax + A w (2.56)

Avec A , la matrice inverse de Moore-Penrose. Examinons maintenant la qualite de cet es-


timateur au travers de son biais et de sa variance. Pour les calculer, il nous faut poser des
hypoth`eses sur la nature du bruit. De facon classique, nous le choisissons blanc, centre et non
correle `a x.

Biais de lestimateur E[
xLS ]

En raison de lhypoth`ese que nous venons de poser sur le bruit, la moyenne de y prend
pour valeur :

E[
y ] = E[y + w]
= E[y] + E[w]
= y+0
= Ax (2.57)

Tandis que sa matrice de covariance vaut :

y E[
Ryy = E{[ y ]] }
y E[
y ]][
= E{[y + w y]][y + w y]] }
= E[ww ] = Rww (2.58)

On peut donc desormais calculer la moyenne de notre estimateur x


LS :

xLS ] = E[A y]
E[
= A E[
y]
= A Ax (2.59)

Dapr`es 2.51 et 2.52, cette expression est equivalente `a :

xLS ] = V 1 U U V x
E[
= V V x
Xr
= (vk x)vk (2.60)
k=1
ERATEURS
2.2. OBTENTION DES SIGNAUX GEN ` PARTIR DU SIGNAL DE
A
BATTEMENTS 45

Le biais de cet estimateur peut alors etre calcule :

b = x E[xLS ]
Xr
= In x (vk x)vk
k=1
n
X r
X

= (vk x)vk (vk x)vk
k=1 k=1
Xn
= (vk x)vk (2.61)
k=r+1

On apprend alors que cet estimateur est non biaise seulement si la matrice A(m n) est
de rang n. Interessons-nous maintenant `a la variance de cet estimateur. De deux estimateurs
ayant le meme biais, celui ayant la plus faible dispersion autour de la valeur moyenne sera le
plus fiable et cest cette qualite de dispersion des valeurs autour de la moyenne que caracterise
la variance.

xLS ]
Variance de lestimateur E[

Calculons donc la matrice de covariance de x


LS :

RxLS xLS xLS E[


= E[ xLS ]][ xLS ]]
xLS E[
= E[A Ax + A w A Ax][A Ax + A w A Ax]
= E[A ww A ]
= A Rww A (2.62)

Interessons-nous maintenant `a la valeur de lerreur quadratique moyenne de lestimation :

xLS ]k2 } = E{kA Ax + A w A Axk2 }


xLS E[
E{k
= E{kV 1 U wk2 }
= E{(V 1 U w) (V 1 U w)} (2.63)

Or, on sait que, pour deux vecteurs colonnes x et y de meme taille, on a legalite suivante :
x y = Tr(yx ), o`u Tr(.) represente loperateur trace. De ce fait :

xLS ]k2 } = E{Tr(V 1 U w)(w U 1 V )}


xLS E[
E{k
= Tr(V 1 U Rww U 1 V ) (2.64)

Le bruit etant blanc, on a Rww = 2 In . En remplacant la covariance de w par sa valeur,


on obtient :

xLS ]k2 } = 2 Tr(V 1 1 V )


xLS E[
E{k
r
2
X 1
= Tr(vk vk )
k2
k=1
r
2
X 1
= (2.65)
k2
k=1

CHAPITRE 2. EXPLOITATION DE LA MODELISATION PHYSIOLOGIQUE DU
46
SIGNAL DE VARIATION DE PRESSION ARTERIELLE

Afin de limiter les perturbations liees `a ces faibles valeurs propres, on peut imaginer de
ne pas les inclure dans la reconstruction de la matrice A . Ainsi, supposons que les p r
derni`eres valeurs propres sont suffisamment faibles pour etre considerees comme du bruit.
Considerons alors la matrice de rang reduit A(p) , de rang p :
p
X
A(p) = k uk vk (2.66)
k=1

Sa matrice inverse de Moore-Penrose secrit alors :


p
(p)
X 1
A = vk uk (2.67)
k
k=1

Voyons maintenant les performances de lestimateur utilisant la matrice de rang reduit


A(p) :
(p)
LS = A(p) y
x
= A(p) Ax + A(p)!w
p p p
! !
X 1
X

X 1
= vk uk k uk vk x + vk uk w
k k
k=1 k=1 k=1
p p
! !
v u
X 1 X k k
= vk uk (1 u1 v1 + 2 u2 v2 + . . . + r ur vr )x + w (2.68)
k k
k=1 k=1

Comme les uk sont des vecteurs orthonormaux, les produits vk uk ui vi sont nuls si k 6= i,
et valent vk vk sinon. De ce fait, 2.68 est equivalent `a :
p p
!
(p)
X

X vk uk
xLS = vk vk x + w
k
k=1 k=1
n n p
!
v u
X X X k k
= vk vk x + vk vk x + w
k
k=1 k=p+1 k=1
n p
!
v u
X X k k
= x+ (vk x)vk + w (2.69)
k
k=p+1 k=1

La valeur moyenne de cet estimateur est alors :


n p
(p)
X

X vk uk
E[
xLS ] = E[x + (vk x)vk + w]
k
k=p+1 k=1
n
X
= x+ (vk x)vk (2.70)
k=p+1

De cette valeur moyenne, nous deduisons le biais de lestimateur :


(p)
b(p) = x x
LS
Xn
= (vk x)vk (2.71)
k=p+1
ERATEURS
2.2. OBTENTION DES SIGNAUX GEN ` PARTIR DU SIGNAL DE
A
BATTEMENTS 47

Et il nous reste `a le comparer au biais obtenu precedemment en 2.61 :


n
X n
X

kb (p) 2
k kbk 2
= k 2
(vk x)vk k k (vk x)vk k2 (2.72)
k=p+1 k=r+1

Comme les vecteurs vk sont orthonormaux, le theor`eme de Pythagore peut leur etre
applique. Ainsi, la norme au carre dune somme de ces vecteurs est egale `a la somme des
normes au carre de chacun de ces vecteurs. De plus, leur norme est unitaire donc :
n
X n
X
kb(p) k2 kbk2 = k(vk x)vk k2 k(vk x)vk k2
k=p+1 k=r+1
Xn n
X
= kvk xk2 kvk xk2
k=p+1 k=r+1
Xr
= kvk xk2 (2.73)
k=p+1

Il apparat alors que cette difference est superieure `a 0 d`es lors quun au moins des produits
scalaires entre les vecteurs vk et x est non-nul. En dautres termes, cet estimateur poss`ede
un biais plus important que lestimateur `a matrice pleine xLS d`es lors que x poss`ede des
composantes non nulles dans le sous espace vectoriel defini par les vecteurs {vp+1 , . . . , vr }.
Examinons maintenant lerreur quadratique moyenne de lestimateur :
2
r p w r
2
X

X u k X


E{k
xLS E[
xLS ]k } = E x
(vk x)vk + vk x
(vk x)vk

k
k=p+1 k=1 k=p+1
2
p
X uk w
= E vk

k
k=1
( p )
X uk w 2
= E
k

k=1
p
X E[(uk w)(uk w) ]
=
k2
k=1
p
X uk Rww uk
=
k2
k=1
p
X 1
= 2 (2.74)
k2
k=1

On observe donc que lerreur quadratique moyenne de lestimateur utilisant la matrice


de rang reduite ninclut plus les r p plus faibles valeurs propres dont on avait supposees
quelles etaient dues au bruit. En consequence, il est possible de diminuer lerreur quadratique
de lestimation en supprimant les rp plus faibles valeurs propres. Toutefois, cette suppression
des plus faibles valeurs propres doit etre raisonnable car elle se fait au prix dune augmentation
du biais.

CHAPITRE 2. EXPLOITATION DE LA MODELISATION PHYSIOLOGIQUE DU
48
SIGNAL DE VARIATION DE PRESSION ARTERIELLE

2.3 Algorithme destimation des variables du mod`


ele

2.3.1 Pr
esentation de lalgorithme

Dapr`es les derivations presentees ci-avant, nous pouvons conclure que la solution au
(p)
probl`eme destimation (2.22) qui minimise le carre de lerreur quadratique est xLS = A(p) y,
avec, A(p) , lapproximation au rang p de la matrice A , elle-meme etant la matrice inverse
de Moore-Penrose de la matrice A. Nous avons donc tous les elements en main pour resoudre
notre probl`eme de depart qui concerne la resolution de lequation (2.19). La facon de
proceder est alors la suivante :

1. Les frequences fh et fl sont definies, en accord avec la contrainte (2.79). On definit de


meme la resolution frequentielle.
2. On en deduit `a laide de la relation (2.77) le nombre de battements `a prendre en compte
et de ce fait la duree Tl de lenregistrement.
3. La matrice de donnees [ (t1 , tK+2 , 1, L) (t1 , tK+2 , 1, L) ] est cal-
culee. Puis on determine sa decomposition en valeur singuli`ere
([ (t1 , tK+2 , 1, L) (t1 , tK+2 , 1, L) ] = U V ). T

4. On construit le vecteur dobservation [ 0 (t1 , tK+2 , 0, 0) + 0 (t1 , tK+2 , 0, 0) ].


5. "
On calcule
# le vecteur de param`etres
1L
= V 1(p) U T [ 0 (t1 , tK+2 , 0, 0) + 0 (t1 , tK+2 , 0, 0) ]
1,L
O`u (p) represente la matrice inverse de dont on a mis `a zero les r p plus faibles
valeurs propres.

6. On gen`ere le signal (t) `a laide des relations 2.6 et 2.20, et le signal a(t) `a laide de 2.6
et 2.21.

2.3.2 Choix des param`


etres du mod`
ele

On ne peut choisir librement les valeurs `a affecter aux differents param`etres interve-
nant dans lalgorithme. En effet, le principe dincertitude dHeinsenberg nous contraint `a
linegalite :
1
Tl (2.75)
f

O`u Tl est la duree de lenregistrement traite, et f la resolution frequentielle. Nous allons


voir que cette inegalite impose des restrictions `a nos param`etres. En effet, les relations (2.20)
et (2.21) donnent :

L2
fh = fl + f
2
2(fh fl )
L = +2 (2.76)
f

O`
u L est le nombre dinconnues. Or nous avons choisi pour nombre dequations K = 2L+2.

2.4. RESULTATS 49

De ce fait, K vaut :

K = 2L + 2
4(fh fl )
= +6 (2.77)
f

Dautre part, si nous considerons une duree denregistrement de Tl , et si T0 correspond


a` lintervalle moyen entre deux battements cardiaques (dans notre cas T0 vaut typiquement
une seconde), alors on peut ecrire que K Tl /T0 . De ce fait :
1
KT0
f
1
K
T0 f
4(fh fl ) 1
+6
f T0 f
1
4(fh fl ) 6f (2.78)
T0

En admettant f << 1/T0 , on obtient linegalite suivante regissant le compromis existant


entre lexcursion frequentielle et la periode moyenne entre deux battements cardiaques :
1
fh fl (2.79)
4T0

Typiquement, f0 = 1/T0 vaut 1Hz et cette inegalite nous autorise une excursion
frequentielle de 0.25Hz. En pratique, le nombre K de battements `a prendre en compte
pour le calcul des signaux intervenant dans le mod`ele TVTIPFM est impose par cette relation.

Le choix du rang p de la matrice reduite peut etre effectue de mani`ere iterative [60]. Dans
ce cas, on utilise la matrice non tronquee pour calculer les signaux (t) Ceux-ci sont
et a(t).
reinjectes dans le mod`ele TVTIPFM et la somme des carres des ecarts entre les instants de
battements reels, et ceux estimes est mesuree. Puis, la matrice est approximee au rang
inferieur, et lerreur est calculee de nouveau. Lalgorithme est arrete lorsque la courbe derreur
atteint un minimum. Pour des raisons de mise en uvre mais aussi et surtout de co ut de calcul,
nous avons procede differemment. En loccurrence, nous ne conservons que les plus grandes
valeurs propres, telles que leur somme aboutit `a 99% de la trace de la matrice . Cette valeur
de 99% a ete determinee experimentalement comme etant la valeur qui minimise la moyenne
et lecart-type moyens de lerreur commise sur lestimation de la frequence respiratoire :
p r
X 1 X 1
= 0.99 (2.80)
k k
k=1 k=1

2.4 R
esultats
La methode proposee permet de reconstruire les signaux a
(t) et (t) `a partir des trains
de battements cardiaques quils gen`erent lorsquils sont injectes dans un mod`ele TVTIPFM.
Nous avons, en premier lieu, cherche `a verifier la validite de ce mod`ele, en utilisant pour cela
des signaux synthetiques. Avec ces memes signaux nous avons, dans un second temps, analyse

CHAPITRE 2. EXPLOITATION DE LA MODELISATION PHYSIOLOGIQUE DU
50
SIGNAL DE VARIATION DE PRESSION ARTERIELLE

lestimation de la frequence respiratoire. Nous avons poursuivi lanalyse de cet estimateur


en employant un signal electrocardiographique reel, pour finir par lutilisation du signal de
variation de pression arterielle.

2.4.1 Validation du mod`


ele `
a partir de signaux synth
etiques

Pour cela, nous avons applique au mod`ele des signaux (t) et a(t) synthetiques, lesquels
ont genere des trains de battements cardiaques. A ` partir de ces battements, nous avons estime

les signaux (t) et a (t) susceptibles de les avoir engendre et nous les avons compares aux
signaux (t) et a(t) effectivement utilises. On peut le voir sur la figure 2.2 qui represente la
superposition des signaux (t) et a (t) reconstitues avec les signaux (t) et a(t) effectivement
appliques au mod`ele TVTIPFM, ces derniers etant definis par :

(t) = 1 + 0.4 sin(20.3t + /4) (2.81)


a(t) = 1 + 0.3 sin(20.2t) 0.3 cos(20.4t /3) (2.82)

On observe que les signaux reconstitues se superposent quasi parfaitement avec les signaux
originaux, ce qui nous permet de conclure `a la validite du mod`ele.

(a) (b)

Fig. 2.2 Signaux 2.81 et 2.82, injectes dans le mod`ele TVTIPFM et signaux reconstruits

par lalgorithme decrit en 2.3.1. (a) : (t) et (t). (b) : a(t) et a
(t).

2.4.2 Estimation de la fr
equence respiratoire `
a partir du mod`
ele TV-
TIPFM

Linteret du mod`ele TVTIPFM reside dans sa capacite `a determiner les signaux dac-
tivation sympathique, lesquels sont peut-etre en lien avec le sommeil. Seulement, nous ne
pouvons nous baser sur ces signaux pour valider la methode developpee dans la mesure
o`
u ceux ci nous sont inconnus car non enregistres dans le cas dun enregistrement de
sommeil (et meme non observables). Cest pourquoi nous nous sommes interesses, dans un
premier temps, `a une donnee plus directement observable et verifiable : le rythme respiratoire.

On sait par construction que le signal a(t) est essentiellement lie `a la respiration. En
consequence, le contenu spectral de ce signal doit presenter une raie damplitude importante
`a la frequence respiratoire. Or, les coefficients (i) associes aux fonctions (i) representent

2.4. RESULTATS 51

le contenu spectral du signal a(t). Nous avons donc choisi comme estimateur de la frequence
respiratoire la frequence `a laquelle est associe le coefficient (i) le plus fort en valeur absolue,
soit
i0 1
fr = flow + f , o`
u i0 = argk max (k) k {1, 3, 5, . . . , L 1}(2.83)
2
Cet estimateur nous evite de surcrot de proceder `a une co
uteuse reconstruction des signaux

(t) et a(t).

Estimation fr
equentielle sur la plage de fr
equence

Afin de sassurer que le coefficient (i) maximal correspond effectivement `a la frequence


de a(t) (laquelle donne la frequence respiratoire), nous observons quelle est la frequence fr
estimee lorsque la frequence du signal a(t) balaie la fenetre danalyse. Conformement `a 2.79,
la duree de la fenetre est de 0.25Hz, calee sur les frequences [0.18; 0.42]Hz, habituellement
observees durant le sommeil. Le pas frequentiel utilise pour ce test est de 0.01Hz. Les valeurs
donnees `a (t) et a(t) sont respectivement :

(t) = 1 + 0.4 sin(20.3t + /4) 0.3 cos(20.4t + /3) (2.84)


a(t) = 0.3 sin(2fa t) (2.85)

O`
u fa est la frequence du signal a(t). Le resultat est porte sur la figure 2.3. Dans ces

Fig. 2.3 Comparaison de la frequence delivree par lestimateur 2.83 et la frequence reelle
du signal a(t)

conditions cet estimateur sav`ere correct puisquil est centre et de variance negligeable, pour
peu que la frequence du signal a(t) fasse partie de la fenetre danalyse. Rappelons que les
valeurs estimees doivent theoriquement se superposer `a la droite dequation y = x.

Analyse de linfluence dun d


ecentrage de la fen
etre

Dans une seconde etude on sinteresse `a evaluer si la capacite de detection est identique sur
lensemble de la fenetre dobservation. Pour cela, on choisit une fenetre de dimension 0.24Hz
afin de respecter la contrainte (2.79). Puis, on definit la frequence basse (flow ) `a 0.12Hz.
La borne haute de la fenetre (fhigh ) prend donc la valeur 0.36Hz. On estime la frequence
de a(t) dans ces conditions et on decale de 0.01Hz la fenetre dobservation, qui passe ainsi

CHAPITRE 2. EXPLOITATION DE LA MODELISATION PHYSIOLOGIQUE DU
52
SIGNAL DE VARIATION DE PRESSION ARTERIELLE

a` [0.13; 0.37]Hz. On rep`ete loperation jusqu`a ce que flow atteigne la valeur 0.25Hz. Les
signaux sont definis comme suit :

(t) = 1 + 0.4 sin(20.3t + /4) 0.3 cos(20.4t /3) (2.86)


a(t) = 0.5 sin(20.25t) (2.87)

On observe les resultats sur la figure 2.4. Il apparat clairement sur celle-ci que lestimation
est correcte, tant que la fenetre dobservation comprend la frequence du signal a(t) (0.25Hz)
ce qui est, somme toute, logique. Neanmoins cette evidence nous impose soit dutiliser une ex-
cursion frequentielle suffisamment grande pour couvrir lensemble des frequences respiratoires
possible (environ 0.1 `a 0.5Hz), ce qui nest pas possible en raison de la limitation donnee par
la relation (2.79), soit de connatre au prealable la frequence respiratoire approximative afin
de pouvoir definir lexcursion frequentielle autour de cette raie, ce qui suppose de rajouter `a
notre syst`eme un dispositif prealable destimation grossi`ere de cette frequence.

Fig. 2.4 Visulisation de leffet du decentrage de la fenetre dobservation

Analyse de linfluence de la valeur de f

Nous nous sommes ensuite interesses `a evaluer limpact du choix du pas frequentiel f
sur la qualite de lestimation. Pour ce faire, nous avons repris les signaux donnes en (2.86)
et (2.87) et avons evalue la precision de lestimation de la frequence de a(t), pour differentes
valeurs de f . La figure 2.5 illustre cette etude. Sur celle-ci sont portes en noir les frequences
associes aux coefficients (i). Celles-ci sont evidemment plus ou moins proches selon la valeur
de f . On se rend bien compte sur la figure que la valeur estimee de la frequence de a(t)
est toujours celle qui est la plus proche possible de la valeur reelle, parmi celles formant la
base de decomposition. Le choix du pas frequentiel ne modifie pas la qualite de lestimation
autrement que par la quantification imposee par cette valeur.

Param
etrage de la dimension de la plage dexcursion fr
equentielle

Linegalite (2.79) est contraignante, on la dit, dans la mesure o` u la taille de la fenetre


utilisable est inferieure `a la plage de frequence que peut parcourir le signal a(t). Nous avons
alors cherche `a evaluer la degradation de lestimation lorsque lon emploie une fenetre de
taille superieure `a cette contrainte. Pour cela, on reprend les signaux (2.86) et (2.87). On
fixe flow `a 0.18Hz, f `a 0.01Hz et on fait evoluer fhigh entre 0.2Hz et 1.2Hz. A ` chaque

2.4. RESULTATS 53

Fig. 2.5 Estimation dune frequence respiratoire de 0.25Hz pour differentes valeurs de f

fois, on estime la frequence du signal a(t), laquelle est, dans le mod`ele, fixee `a 0.25Hz. On
se retrouve en dehors de la condition theorique (2.79) d`es lors que fhigh depasse la valeur
0.18 + 0.25 = 0.43Hz.

Fig. 2.6 Estimation de la frequence respiratoire lorsquon emploie une excursion


frequentielle superieure `a celle definie par (2.79)

Pourtant, comme on le voit sur la figure 2.6, lestimation reste correcte meme lorsque
la contrainte (2.79) nest pas satisfaite, ce qui a priori, nous laisserait penser que lon peut
augmenter la taille de la fenetre dobservation. Cependant, il sagit ici de signaux synthetiques,
et rien ne nous garantit que ce comportement sera observable sur les signaux reels.

Analyse de linfluence des erreurs de mesure sur les instants de battements

Une difference essentielle entre signaux synthetiques et signaux reels est limprecision
sur la mesure des instants de battements cardiaques. En effet, dans le cas dun signal reel,
suivant la forme du battement en lien avec la technique de detection utilisee, sa localisation
peut varier, et ce, quel que soit le signal utilise (ECG, oxymetrie ou bien encore le signal
de variation de pression arterielle). Avant demployer des signaux reels nous avons souhaite
evaluer le comportement de cette methode dans le cas o` u les battements comportent une
erreur raisonnable sur leur localisation.

CHAPITRE 2. EXPLOITATION DE LA MODELISATION PHYSIOLOGIQUE DU
54
SIGNAL DE VARIATION DE PRESSION ARTERIELLE

Pour cela, nous avons artificiellement introduit des erreurs dans les localisations des bat-
tements en les rapprochant plus ou moins, de facon aleatoire. Concr`etement, nous avons
applique au mod`ele les signaux (2.86) et (2.87). Puis, nous avons rajoute `a chaque localisa-
tion de battement une erreur aleatoire, definie comme suit :

e(n) = b(n) (2.88)

Cette erreur est le produit dun coefficient et dune valeur b(n) issue dun bruit blanc
uniforme de puissance unite. Les tests montrent que lestimation nest pas perturbee par
lintroduction de cette erreur, meme lorsque une valeur elevee est choisie pour . Une raison
`a cela est que la decomposition en valeur singuli`ere a justement pour but de limiter limpact
de ces erreurs. La reconstruction du signal a
(t) nest, par contre, pas exempte derreur comme
on peut en voir un exemple sur la figure 2.7(a). On observe cependant que le spectre de ce
signal presente quand meme un maximum `a la frequence recherchee (figure 2.7(b)), ce qui
assure, dans ce cas, une bonne detection par lestimateur 2.83. Tout comme nous le verrons
plus loin pour la demodulation AMFM, lerreur est presente mais la methode destimation
est insensible `a la forme quelle revet.

(a) (b)

Fig. 2.7 (a) : Signal a(t), de frequence 0.25Hz et son estimation a


(t). (b) : Spectre associe
au signal a
(t)

2.4.3 Application `
a des signaux ECG r
eels

Maintenant que la validite theorique de la methode destimation de la frequence respi-


ratoire est verifiee, nous pouvons lemployer sur des signaux reels. Dans un premier temps,
les instants de battements cardiaques sont determines sur un signal electrocardiographique
enregistre par un materiel medical `a la frequence dechantillonage de 256Hz. La difficulte fut
precisement de determiner les instants de battements cardiaques. Cette etape netant que
transitoire en vue de lapplication de la methode au signal composite, nous avons pris le parti
de nutiliser que des methodes simples de detection de battement, quitte `a ce que celles-ci se
rev`elent insuffisantes pour certains des signaux electrocardiographiques. Concr`etement, un
seuil etait determine dynamiquement sur chaque epoque du signal ECG (ce seuil est donne
par les deux tiers de lamplitude maximale prise par le signal derive `a lordre 5 du trace
electrocardiographique) et chaque fois que ce seuil est depasse dans le sens montant, on
declare etre en presence dun battement. Ce battement ne correspond donc pas strictement
`a londe R dun signal ECG mais les ecarts entre les battements sont conserves. La frequence

2.4. RESULTATS 55

respiratoire de reference est obtenue par le periodogramme du signal delivre par une sangle
thoracique de lepoque correspondante.

On observe le resultat sur la figure 2.8. Sil est vrai que le mod`ele ne permet pas de suivre
les valeurs hautes de la frequence respiratoire (voir notamment les environs de lindice 1200),
les variations comprises dans la fenetre dexcursion frequentielle sont, elles, relativement bien
suivies. Notons que le mod`ele ne peut, par construction, produire une estimation superieure
`a 0.42Hz, ce qui explique le mauvais suivi des valeurs hautes de frequence respiratoire. Le
resultat est donc globalement acceptable et nous encourage `a poursuivre avec lapplication
de la methode au signal composite.

Fig. 2.8 Estimation de la frequence respiratoire `a partir dun signal de battements donne
par ECG

2.4.4 Application au signal de variation de pression art


erielle

Lapplication du mod`ele TVTIPFM au signal de variation de pression arterielle necessite


de detecter les battements cardiaques sur ce signal. Or, nous lavons vu, ce signal est parti-
culi`erement bruite, ce qui rend la tache difficile. Cest pourquoi nous nous sommes concentres,
dans un premier temps, sur la detection de battements cardiaques lorsque le signal nest pas
trop bruite.

D
etection des battements

Pour cela, nous realisons loperation de filtrage y(n) = x(n) x(n N ), avec x(n) le
signal composite et N = 0.2/F e (F e est la frequence dechantillonnage). Ce filtrage sappuie
sur une propriete du signal composite qui est que la premi`ere partie dune surpression
arterielle liee au battement cardiaque setend sur 0.2 secondes environ. Physiquement,
lorsque lindice n correspond au sommet dune surpression liee `a un battement cardiaque, la
valeur y(n) est elevee. Elle est plus faible partout ailleurs. Ce filtrage realise donc une mise
en evidence des battements cardiaques. La limitation majeure de cette methode est quelle
amplifie egalement tout pic parasite, lie, cette fois, non plus `a un battement cardiaque mais
`a un bruit. Cette operation est ensuite repetee une seconde fois, de facon `a marquer encore

CHAPITRE 2. EXPLOITATION DE LA MODELISATION PHYSIOLOGIQUE DU
56
SIGNAL DE VARIATION DE PRESSION ARTERIELLE

plus la distinction entre les battements cardiaques et le reste du signal. Puis, on localise
ces battements en comparant les amplitudes de chacun des points `a un seuil, lequel est fixe
dynamiquement (il sagit de la variance du signal).

La validation de cette methode de localisation des battements cardiaques `a partir du signal


composite est difficile dans la mesure o` u nous ne disposons pas dune localisation precise et
exacte des battements cardiaques, `a laquelle nous aurions pu comparer nos localisations
estimees. Nous avons donc eu recours `a une validation visuelle des instants de detection. Sur
cette base de test, la detection des battements cardiaques `a partir du signal composite sest
averee efficace. Ainsi, sur un signal de cinq minutes comprenant 296 battements, on observe
seulement 0.6 secondes decart en moyenne par rapport `a la reference. Une etude plus precise
explique ces 0.6 secondes decart par la fausse detection de deux battements cest `a dire que
lalgorithme a detecte sur le signal composite deux battements qui nen etaient pas et donc
ne se retrouvaient pas sur le signal de reference. Les tests menes sur les autres signaux de
cette base de test ont abouti `a des resultats similaires. Ces bons resultats, bien que de portee
limitee, nous ont amenes `a utiliser cette methode de detection de battement pour tester le
mod`ele TVTIPFM sur les bases de donnees experimentales.

Premiers r
esultats sur signaux r
eels

La technique TVTIPFM est alors employee sur la base de donnee de Nantes, pour laquelle
le signal de variation de pression arterielle est echantillonne `a 128Hz. Le resultat de la base de
test, qui comprend quatre fichiers, est porte sur la figure 2.9. On remarque que lestimation
est globalement correcte. Ainsi, les grandes tendances de la courbe de reference sont suivies,
mais que des sauts `a des valeurs hautes ou basses se produisent. On calcule lerreur moyenne
PN fr (n)fr (n)
destimation par la relation = n=1 N . Celle-ci donne 1% ce qui signifie que
q
2
lestimateur est centre. Lecart-type de lerreur ( = (fr (n)f r (n))
N 1 ) nous renseigne ensuite
sur la dispersion des valeurs autour de cette moyenne. Celui-ci est de 20%, ce qui nest pas
negligeable.

Fig. 2.9 Estimation de la frequence respiratoire `a partir du signal composite par utilisation
du mod`ele TVTIPFM. Chaque estimation correspond `a une epoque dune duree de trente
secondes.

2.4. RESULTATS 57

Nous avons alors cherche `a comprendre les raisons de ces sauts de valeurs. Une premi`ere
hypoth`ese est la mauvaise detection des battements cardiaques (des battements seraient omis
ou bien des battements supplementaires seraient localises). Nous avons donc etudie de pr`es
la localisation estimee des battements cardiaques. Sil est vrai que des erreurs sont relevees,
`a lexemple de la periode reportee en figure 2.10, ces erreurs sont ponctuelles et la detection
des battements est globalement correcte. Cest donc une des sources derreurs possibles mais
certainement pas la seule, surtout dans la mesure o` u, nous lavons vu au paragraphe 2.4.2,
lapproximation de la matrice de decomposition permet de limiter linfluence de telles erreurs.

Fig. 2.10 Illustration du comportement de la methode de detection des battements car-


diaques `a partir du signal composite.

Nous avons alors recherche une autre hypoth`ese pour lorigine de ces erreurs. Il est pos-
sible que ce soit, en sus de lomission ou de lajout de battements cardiaques, la mauvaise
localisation de ceux qui sont bien detectes qui soit `a lorigine des erreurs. Normalement,
lapproximation de la matrice de Moore-Penrose, , a pour but de limiter linfluence de
telles erreurs. Mais peut-etre que le crit`ere utilise ne permet pas une approximation optimale
de la matrice selon ce point. Pour le verifier nous avons etudie dautres crit`eres, dont nous
presentons les performances ci-apr`es.

Autre crit`
ere darr
et de lalgorithme : d
etection dun saut dans les valeurs propres

La distribution des valeurs propres laisse generalement apparatre plusieurs sauts entre des
valeurs contig ues. Lhypoth`ese que nous posons est que le saut observe est d u `a la separation
entre les valeurs propres liees `a lespace signal et celles liees `a lespace bruit. Nous avons donc
realise un crit`ere de coupure base sur un saut de 25% dans la distribution des valeurs propres.
Cest `a dire que la distribution des valeurs propres est analysee et si une valeur propre est
inferieure de plus de 25% de la valeur propre la precedant, alors cette valeur propre et les
suivantes sont fixees `a zero. Precisons que le saut nest recherche que dans les deux derniers
tiers des valeurs propres, car un saut important existe dans les premi`eres valeurs propres alors
que lapproximation de la matrice `a ces premi`eres valeurs propres donne des resultats errones.
L`a encore, la valeur de 25% a ete determinee experimentalement parmi lintervalle [5 50]%
comme etant celle qui minimise lerreur destimation moyenne de la frequence respiratoire.

CHAPITRE 2. EXPLOITATION DE LA MODELISATION PHYSIOLOGIQUE DU
58
SIGNAL DE VARIATION DE PRESSION ARTERIELLE

Fig. 2.11 Determination de lapproximation de la matrice par observation dun saut


dans la distribution des valeurs propres.

Les resultats sont portes sur la figure 2.11. Ceux-ci se rev`elent de qualite leg`erement
inferieure `a larret obtenu par sommation des valeurs propres. En effet, la figure montre bien
que les sauts de frequence autour de la reference sont plus nombreux que precedemment.
Cette observation est confortee par les resultats statistiques qui donnent un ecart-type de
27% (au lieu de 20%), pour une erreur moyenne nulle.

Autre crit`
ere darr
et de lalgorithme : Norme de Frobenius

Nous avons egalement analyse linteret de la norme de Frobenius, definie par la relation :

kA A(p) k2F
(p) =
kAk2F
s
2
p+1 2
+ p+2 + . . . + r2
= (2.89)
12 + 22 + . . . + r2

Cette norme nous renseigne sur la qualite de lapproximation realisee dune matrice A
par une matrice A(p) , obtenue en tronquant la decomposition en valeurs singuli`ere de A `a
lordre p. Si la norme est proche de 0, respectivement 1, alors cette approximation est bonne,
respectivement mauvaise. La valeur de p est determinee comme etant lindice de la valeur
propre pour laquelle la norme de Frobenius de la matrice approximee devient inferieure `a 0.85,
la norme de Frobenius etant definie par la relation (2.89). On observe en figure 2.12 ce que
donne lemploi de cette norme. Les resultats sont comparables `a ce que donne le crit`ere base
sur la somme des valeurs propres (les ecart-types sont dailleurs identiques). On recommande
donc, du point de vue des resultats, lun ou lautre de ces deux crit`eres. Il est cependant `a
noter que le premier dentre eux est de mise en uvre plus aisee.
`
2.5. CONCLUSIONS SUR LEMPLOI DU MODELE TVTIPFM POUR LA

DETERMINATION DES SIGNAUX RESPIRATOIRES 59

Fig. 2.12 Determination de lapproximation de la matrice par utilisation de la norme


de Frobenius.

2.5 Conclusions sur lemploi du mod` ele TVTIPFM pour la


d
etermination des signaux respiratoires

Le mod`ele TVTIPFM fournit donc des premiers resultats interessants. Nous navons
cependant evalue `a ce stade quun seul param`etre, la frequence respiratoire. Bien que sujette
`a des erreurs, et donc, `a perfectionner, lestimation delivree par ce mod`ele est encourageante.
Nous possedons des hypoth`eses sur les raisons probables des mauvaises estimations et
celles-ci ne demandent qu`a etre explorees. Au rang de celles-ci nous pouvons citer la trop
faible efficacite de la detection des battements cardiaques.

Il reste que cette methode poss`ede un certain nombre de points faibles. Parmi ceux-ci
on trouve la decomposition en valeur singuli`ere quil faut operer. Cette operation est tr`es
complexe dun point de vue calculatoire et sa mise en uvre dans un dispositif embarque
sav`erera delicate. Il est cependant envisageable que cette methode soit reservee `a un
dispositif decentralise, moins contraint dun point de vue calculatoire et memoriel. Ajoutons
egalement que des methodes permettant de pratiquer une decomposition de Karhunen-Lo`eve
`a faible cout ont ete proposees [64], ce qui pourrait resoudre notre probl`eme. Nous ne les
avons cependant pas encore evaluees.

Une autre contrainte forte de cette methode est la duree dobservation requise. Ainsi,
la precision recherchee sur lestimation frequentielle impose de disposer de cent battements
cardiaques. En sommeil, la frequence cardiaque est generalement denviron 60bpm et descend
reguli`erement aux alentours de 50bpm, ce qui impose une duree dobservation denviron
deux minutes. Or cette duree est superieure `a la discretisation souhaitee pour le sommeil,
qui est de trente secondes. Cette technique ne permet donc pas dobtenir une information
sur les signaux excitant le cur suffisamment localisee pour pouvoir etre exploitee epoque
par epoque. De plus, de par les proprietes du syst`eme, il est peu probable que deux minutes
de signal ne soient pas ponctuellement perturbees par un bruit. Le nombre de mesures que
lon peut realiser est alors beaucoup plus limite que lorsquune fenetre plus courte, de trente
secondes par exemple, est utilisee.

CHAPITRE 2. EXPLOITATION DE LA MODELISATION PHYSIOLOGIQUE DU
60
SIGNAL DE VARIATION DE PRESSION ARTERIELLE

Enfin, une autre limite de cette methode concerne la faible fenetre dexcursion dans
laquelle elle est operationnelle. En effet, la frequence respiratoire varie couramment entre
0.1Hz et 0.5Hz, ce qui est superieur `a la fenetre dont on dispose qui est de 0.25Hz.
Cependant, il est possible de situer celle-ci de telle sorte quelle couvre la plupart des mesures
`a effectuer (par exemple [0.15 0.4]Hz).

Lemploi du mod`ele TVTIPFM est donc prometteur, dans la mesure o` u des resultats
interessants sont dej`a atteints, et des pistes pour lameliorer sont envisagees. Neanmoins, il
est, en letat actuel des choses, `a reserver `a un dispositif autorisant un volume calculatoire
eleve, ce qui le rend a priori incompatible avec un dispositif embarque.
Chapitre 3

Utilisation de la d
emodulation
AMFM et de la d ecomposition en
vecteurs propres pour lestimation
des rythmes cardiaque et
respiratoire

Dans un premier temps nous avons recherche la frequence respiratoire en utilisant une
modelisation du syst`eme generant le signal de variation de pression arterielle. Dans ce cha-
pitre, nous exposons une technique destimation des rythmes cardiaque et respiratoire qui
repose sur une modelisation du signal de variation de pression arterielle lui-meme.

3.1 Le signal de variation de pression art


erielle est modul
e
AMFM

Nous avons cherche, dans cette partie, `a exploiter de facon innovante une propriete que
poss`ede le signal de variation de pression arterielle : il est possible de le modeliser comme
une porteuse liee au rythme cardiaque, modulee en amplitude et en frequence par un signal
respiratoire.

La figure 3.1 represente une section du signal de variation de pression arterielle. On y


voit tr`es nettement un signal de type periodique, auquel sajoute une composante additive
(surlignee en rouge), dont la periode est denviron quatre secondes. Omettons, pour linstant,
la composante additive, `a laquelle nous nous interesserons plus loin dans ce chapitre. Chaque
maximum local du signal de variation de pression arterielle correspond `a un battement car-
diaque. Ce signal est module par lactivite respiratoire. En fait, le retour veineux du sang
est plus ou moins freine selon le volume des poumons [65], ce qui provoque une modulation
de lamplitude du signal donde de pression arterielle. Une autre modulation sexerce sur ce
signal. En effet, le volume des poumons module lexcitation de la zone sino-artriale du coeur,
qui est la region `a lorigine des battements cardiaques. La modulation de lexcitation de cette
zone module la frequence de generation des battements cardiaques [56, 57]. Cest larythmie
62
CHAPITRE 3. UTILISATION DE LA DEMODULATION AMFM

sinusale respiratoire. Plus les poumons sont gonfles, plus le noeud sino-artrial est compresse
et plus les battements sont rapides. Ainsi, le volume des poumons, lequel depend directement
des actes dinspiration et dexpiration, module egalement en frequence le signal de variation
de pression arterielle.

Fig. 3.1 Exemple de signal de variation de pression arterielle (Fe =128Hz)

En consequence, sous reserve de filtrage preliminaire du signal (notamment pour eliminer


la composante additive respiratoire), il est possible de le modeliser par la relation (3.1) qui
represente une porteuse sinusodale modulee en amplitude et en frequence :
 Z t 
a(t) cos[(t)] = a(t) cos c t + m q( )d + (3.1)
0

Dans cette relation, q(t) [1; 1]. La modulation damplitude (a(t)) est liee au retour
veineux tandis que la modulation de frequence (q(t)) est liee `a la compression du coeur par les
poumons. Lestimation de ces donnees permet donc, en theorie, dacceder `a des informations
cardiorespiratoires.

3.2 Demodulation AMFM du signal de variation de pression


art
erielle par lop
erateur de Teager
La demodulation dun signal module `a la fois en amplitude et en frequence nest pas
forcement une tache aisee. Nous avons choisi de realiser cette operation `a laide de loperateur
denergie de Teager-Kaiser. Sa definition, appliquee `a un processus continu x(t), est donnee
par [66] :

2
d2 x(t)
  
dx(t)
[x(t)] = x(t) (3.2)
dt dt2
2
= [x(t)]
x(t)
x(t) (3.3)

Cet operateur peut, sous certaines conditions, realiser une demodulation damplitude
et/ou de frequence. Pour etre plus exact, il permet dextraire du signal module le modulant
damplitude et la frequence instantanee du signal. Cette derni`ere peut etre interpretee
comme la somme de la frequence cardiaque (constante `a court terme) et du signal modulant

3.2. DEMODULATION AMFM DU SIGNAL DE VARIATION DE PRESSION

ARTERIELLE
PAR LOPERATEUR DE TEAGER 63

de frequence, image du signal respiratoire. Le modulant damplitude represente, quant ` a


lui, le signal respiratoire. Cet operateur est en fait proche de loperateur utilise par Pan et
Tompkins dans leur methode de detection des complexes QRS sur un electrocardiogramme
[67].

Loperateur de Teager fait appel `a des approximations. Pour que celles-ci soient valides,
il est necessaire que certaines contraintes theoriques portant sur les signaux utilises soient
satisfaites. Nous allons les detailler ci-apr`es.

3.2.1 Extraction du produit des modulants

Lapplication de loperateur de Teager `a un signal module en amplitude et en frequence


tel que donne par la relation (3.1) donne (les dependances au temps ont ete omises pour plus
de lisibilite) :

[a cos()] = (a)
2 + 0.5a2 sin(2) + cos2 ()[a] (3.4)
| {z } | {z }
D(t) E(t)

Avec les definitions suivantes


d(t)
=
dt
d2 (t)
=
dt2

On pourra se reporter `a [66] pour les details. La moyenne temporelle des erreurs dap-
proximation de [a cos()] par D(t) est donnee par la moyenne de la valeur absolue de lerreur
destimation. On la notera |Ex (t)|ave , avec ave pour average (moyenne). Comme = m q(t),

|Ex (t)|ave peut etre bornee superieurement par :

|Ex |ave 2(a arms )2 + 0.5 a2rms m f q (3.5)

o`
u a (respectivement (f ) correspond `a la frequence maximale du spectre du signal AM
(respectivement FM), a(t) (respectivement q(t)) et arms et q etant definis par (3.6) et (3.7) :
p
arms = (a2 (t)) (3.6)
Z ave
1
q = q |X()| d (3.7)
0

q represente le moment spectral dordre q tandis que arms donne lecart-type de a(t).
Interessons-nous maintenant `a D(t). Une etude de cette quantite donne :
2
D(t) = [a(t)(t)] (3.8)
= Dave (c m )2 a2rms (3.9)

Alors, si la condition 2a2 + 0.5 m f q  (c m )2 est remplie (soit Dave >> |Ex |ave ),
on peut ecrire :

[a(t) cos((t))] ave D(t) (3.10)


ave 2
[a(t)(t)] (3.11)
64
CHAPITRE 3. UTILISATION DE LA DEMODULATION AMFM

= i (t) = c + m q(t), on peut ecrire :


Comme (t)
[a(t) cos((t))] ave (a(t)i (t))2 (3.12)
Et finalement, loperateur de Teager nous donne lestimation du produit du signal modulant
damplitude par la frequence instantanee :
s   Z t 
a(t) cos c t + m q( )d + ave |a(t)|i (t) (3.13)
0

Cependant, ce resultat nest jamais quun produit de deux facteurs, dont aucun nest connu
par ailleurs. Il nest donc pas possible, `a ce stade, de separer ces deux termes en vue de
determiner la frequence instantanee dune part, et le signal modulant damplitude dautre
part. Cest sur ce point que porte le paragraphe suivant.

3.2.2 S
eparation des modulants

Soit x(t) le signal module AMFM donne dans lequation (3.1). Le spectre du modu-
lant damplitude (respectivement de frequence) est contenu dans [a , a ] (respectivement
[f , f ]). La derivee du signal x(t) est donnee par
x(t)
cos[(t)] a(t)i (t) sin[(t)]
= a(t) (3.14)
| {z } | {z }
y1 y2

Lapplication de loperateur de Teager defini par 3.2 sur ce signal x(t)


donne :
[x(t)]
= [y1 y2 ]
= [y2 ] + y1 2 y1 y1 2y1 y2 + y1 y2
+y1 y2 (3.15)
O`u la dependance au temps a ete omise dans la notation pour plus de clarte. En developpant
les termes de lexpression (3.15), on peut la reecrire sous la forme suivante :
= a2 i4 + Ex
[x] (3.16)
Avec Ex egal `a :
Ex = y1 2 y1 y1 2y1 y2 + y1 y2 + y1 y2 0.5a2 2 sin(2)
+ sin2 ()(a2 [] + 2 [a]) (3.17)

Une etude de ces termes (dont le detail est donne dans [66]) nous apprend que Ex peut
etre approxime par un terme nul si les contraintes suivantes sont satisfaites
O(a i3 )  O(i4 ) (3.18)
O(m f i2 )  O(i4 ) (3.19)
O(f2 i2 )  O(i4 ) (3.20)

Ainsi, `a la condition que les contraintes (3.18) `a (3.20) soient satisfaites, [x(t)]
peut
etre approxime par la quantite a2 (t)i4 (t) et les relations (3.21) et (3.22) peuvent alors etre
etablies :
[x(t)] ' a2 (t)i2 (t) (3.21)
2
[x(t)]
' a (t)i4 (t) (3.22)

3.3. APPLICATION AU SIGNAL DE VARIATIONS DE PRESSION ARTERIELLE 65

Ce qui nous permet de separer, `a partir de calculs bases sur loperateur de Teager, la frequence
instantanee du modulant damplitude en utilisant les relations (3.23) et (3.24), elles-memes
basees sur les relations (3.21) et (3.22) :
s
[x(t)]

i (t) ' (3.23)
[x(t)]
[x(t)]
|a(t)| ' p (3.24)
[x(t)]

3.2.3 Algorithme discret

Notons que lensemble des considerations theoriques portees ci-dessus traitent du cas
continu. Ce choix sexplique par un souci de facilite de comprehension. Cependant, toutes
les relations trouvent leurs equivalents dans le cas discret (voir [66], [68]) et les resultats
indiques restent valables. Plusieurs algorithmes sappuient sur ces resultats pour traiter le
cas des signaux discretises et nous avons choisi dutiliser lalgorithme DESA-1a [68] (pour
Discrete Energy Separation Algorithm. Le 1a signifie quil utilise une derivee asymetrique
calcule sur un intervalle de un echantillon). Dans cet algorithme, x(t) et son signal derive
x(t)
sont remplaces par :

x(t) 7 x(n) (3.25)


x(t)
7 (x(n) x(n 1)) /Te (3.26)

O`
u Te est la periode dechantillonnage. Dans cette configuration, [x(t)] devient [x(n)] :

[x(n)] = x2 (n 1) x(n)x(n 2) /Te2



(3.27)

3.3 Application au signal de variations de pression art


erielle

3.3.1 D
etermination du domaine de validit
e th
eorique

Loperateur de Teager permet donc de realiser la demodulation dont nous avons besoin,
`a la condition que les contraintes (3.18), (3.19) et (3.20) soient satisfaites. Afin de nous
assurer que cest bien le cas pour les signaux obtenus `a partir du capteur embarque sur le
bracelet, nous devons estimer les quantites f , m , f et c . Une premi`ere difficulte dans
cette entreprise concerne le fait que ces quantites varient avec le temps et ne sont pas,
comme dans le cas des communications numeriques par exemple, fixes. Cette difficulte est
contournee en estimant les valeurs maximales de f , m et f , et la valeur minimale de c .
En effet, si les contraintes (3.18), (3.19) et (3.20) sont satisfaites avec ces valeurs extremales,
alors elles le sont dans tous les cas.

Concernant c , on sait que la frequence respiratoire moyenne dun adulte jeune evolue
entre 50 et 150bpm (battement par minutes). Cependant, cette plage couvre aussi bien les
valeurs de repos (faibles) que les valeurs deffort intense (fortes). Dans le cas du sommeil,
ces valeurs se repartissent generalement entre 50bpm et 90bpm. La valeur minimale de c est
donc 2(fc )min = 5.24 rad.s1 .
66
CHAPITRE 3. UTILISATION DE LA DEMODULATION AMFM

(f )max correspond `a la frequence maximale du spectre du signal respiratoire modulant


la pression arterielle. Levaluation de cette quantite est, en theorie simple `a realiser. Il suffit
dobserver la densite spectrale du signal respiratoire modulant et de mesurer la frequence la
plus elevee. En pratique, trois limitations interviennent. Dabord, on ne dispose pas du signal
respiratoire modulant la pression arterielle. On dispose, dans le cas dune sangle abdominale
ou thoracique, dun signal refletant la compression dun capteur par le remplissage des pou-
mons. Mais les forces sexercant sur le capteur ne sont pas necessairement les memes que
celles sexercant sur le cur ou sur vaisseaux sanguins. On pose cependant lhypoth`ese que
le contenu frequentiel de ces deux informations est le meme dans la mesure o` u dans les deux
cas cest le meme phenom`ene qui en est `a lorigine. La mesure de (f )max peut donc etre
effectuee sur les signaux `a notre disposition. Un exemple du periodogramme calcule `a partir
du signal recueilli par une sangle respiratoire est donne `a la figure 3.2. La seconde limitation
est posee par le caract`ere non borne du spectre de ce signal. Nous avons alors choisi dattri-
buer `a (f )max la valeur de frequence au-del`a de laquelle une decroissance significative de la
puissance, en loccurrence 10dB, est observee. Enfin, la troisi`eme limitation concerne le choix
du signal representatif sur lequel effectuer cette mesure. En effet, plus le rythme cardiaque
est eleve et plus le rythme respiratoire lest aussi (en realite cest le rythme respiratoire qui
impose sa valeur au rythme cardiaque). En consequence, la valeur maximale de f doit etre
estimee sur un signal dont la valeur cardiaque est la plus elevee, dans le cadre de la fourchette
enoncee plus haut. En procedant de la sorte sur lensemble de la base de donnees `a notre
disposition, on aboutit `a lestimation (f )max = 12.5 rad.s1 .

Fig. 3.2 Periodogramme dune section de signal respiratoire

Le param`etre m est determine en utilisant une observation du signal RR (signal


representant levolution des intervalles de temps separant deux ondes R successives sur un
electrocardiogramme en fonction du temps). Ce signal met en evidence la modulation de
frequence des battements cardiaques. Lexpression de i nous permet de deduire le syst`eme
suivant :

(i )min = c m
i (t) = c + m q(t) = (3.28)
(i )max = c + m
Ce syst`eme permet dacceder `a la valeur wm `a partir des valeurs des frequences angulaires
instantanees du signal cardiaque. Pour cela, on construit le signal RR `a partir du signal
ECG. Puis, les valeurs minimales et maximales du signal RR sont determinees et converties
en frequences instantanees. Ensuite, leur difference est calculee et fm = m /2 est estimee
par la moitie de cette difference. Cependant le choix du signal sur lequel effectuer cette
mesure est, l`a aussi, une question delicate. En effet, on ne sait pas si la profondeur de
modulation varie avec le rythme cardiaque. Cest pourquoi nous avons repete cette operation
sur un ensemble representatif de signaux et nous avons moyenne les differentes estimations
de m . Le resultat donne m = 0.2rad.s1 .

3.3. APPLICATION AU SIGNAL DE VARIATIONS DE PRESSION ARTERIELLE 67

Lestimation de 0 est, elle, obtenue en calculant le moment dordre zero du signal x(n)
`a partir de sa representation spectrale X(n) (calculee sur N points) selon la relation (3.29) :
(N 1)/2
1 X
0 = |X(n)| (3.29)
N
n=0

Finalement, nous avons :

m = 0.2 rad.s1 (3.30)


1
f = 12.5 rad.s (3.31)
1
(i )min = c m 5 rad.s (3.32)

De plus, a = f car les modulants de frequence et damplitude sont tous deux issus
de la meme origine (respiratoire). Nous pouvons donc verifier si les param`etres de notre
signal AMFM satisfont les relations (3.18) `a (3.20). Dans ce but on calcule les ordres de
grandeurs O(a i ), O(m f ),O(f2 ) et O(i2 ), en utilisant les relations O(AB) = O(A)O(B)
et O(A + B) = max[O(A), O(B)] :

O(a i3 ) 1562 (3.33)


O(m f i2 ) 62.5 (3.34)
O(f2 i2 ) 3906 (3.35)
O(i4 ) 625 (3.36)

Si la contrainte (3.19) est satisfaite, il nen va pas de meme pour les contraintes (3.18)
et (3.20). Calculons alors les plages de frequences cardiaque et respiratoire pour lesquelles
les contraintes (3.18) `a (3.20) sont satisfaites. Nous appellerons ces plages de frequence le
domaine de validite. On obtient le domaine de validite en resolvant le syst`eme suivant :
 
a i  25 fa  0.8 Hz
= (3.37)
f2  25 ff  0.8 Hz

En supposant quun rapport de grandeur de 10 satisfait la condition tr`es inferieur ` a, on


deduit du syst`eme (3.37) que le spectre du signal respiratoire ne doit pas setaler au-del` a de
0.08Hz pour que lerreur de demodulation soit suffisamment faible pour etre negligee. Cette
valeur ne nous satisfait pas dans la mesure o` u la frequence respiratoire typique en sommeil
varie entre 0.2 et 0.3Hz et nest meme que rarement inferieure `a 0.1Hz. La demodulation
AMFM operee par cette methode sera donc entachee derreur. Cependant, ces resultats ne
nous indiquent pas que cette methode ne peut pas etre utilisee pour realiser la demodulation.
Ils nous indiquent uniquement que celle-ci comportera une erreur. Or, si la valeur quantitative
de lerreur est un param`etre important, les caracteristiques temporelles de celle-ci le sont tout
autant, eu egard `a la mani`ere dont sera traite le signal issu de la demodulation.

3.3.2 Pourquoi on peut aller au-del`


a du domaine d
efini par les contraintes

En depit du non respect des contraintes indiquees plus haut, des premiers tests nous ont
montre quil etait possible dobtenir de bons resultats avec cette methode de demodulation.
Afin de comprendre les raisons de ce phenom`ene, nous avons mene des tests sur des signaux
synthetiques, modules en amplitude et en frequence, en jouant sur les differents param`etres
68
CHAPITRE 3. UTILISATION DE LA DEMODULATION AMFM

intervenant dans les modulations. Nous avons dabord constate que linfluence liee `a m est
limitee au regard de celle des frequences de porteuse et de modulant. Mais surtout, nous
avons pu observer la materialisation de lerreur commise par la demodulation AMFM. Un
exemple est donne sur la figure 3.3.

Fig. 3.3 Vingt secondes du signal module AMFM genere `a partir de lequation (3.38).

La courbe donnee sur la figure 3.3 represente un signal module AMFM selon lexpression
suivante :
 Z t 
s(t) = (1 + 0.1 cos(2fa t)) cos 2fp t + 0.1 cos(2ff )d +
0

O`u fa = ff = 0.25Hz et fp = 0.5Hz. La frequence instantanee donnee par la


demodulation utilisant loperateur de Teager est donnee sur la figure 3.4(a). Dans cet exemple,
le signal de frequence instantanee devrait etre la somme dune valeur continue, la frequence
porteuse `a fp = 0.5Hz 30bpm et dune oscillation sinusodale de frequence fa = ff ,
representant la respiration. Or, on peut voir sur cette figure que la composante alternative
nest pas purement sinusodale comme elle aurait d u letre. Cest une materialisation de
lerreur de demodulation et donc du fait que les param`etres caracterisant le signal utilise
nappartiennent pas au domaine de validite. Cependant, on remarque aussi que la moyenne
de ce signal est bien fp , et que la frequence fondamentale de la composante alternative est
bien fa = ff = 0.25Hz, comme lindique le periodogramme donne `a la figure 3.4(b).

(a) (b)

Fig. 3.4 (a) : Signal de frequence instantanee obtenu par demodulation AMFM du signal
de la figure 3.3. (b) : Periodogramme de ce signal de frequence instantanee.

Aussi, bien que la demodulation ne se fasse pas sans erreur, et cela en accord avec le
non-respect des contraintes theoriques, il est possible dextraire du signal demodule des

3.3. APPLICATION AU SIGNAL DE VARIATIONS DE PRESSION ARTERIELLE 69

informations pertinentes, pourvu que lon sinteresse `a des param`etres qui ne sont pas
entaches derreur `a savoir en loccurrence la moyenne et la frequence fondamentale du signal
de frequence instantanee.

Ces observations expliquent les resultats des tests preliminaires : la forme que prend
lerreur de demodulation rend celle-ci potentiellement non genante. Tout depend dune part
des param`etres que lon cherche `a extraire du signal demodule et dautre part de la facon
dont ceux-ci sont estimes. En loccurrence, en utilisant comme estimateurs la moyenne du
signal de frequence instantanee, et la recherche de la frequence la plus energetique dans le
periodogramme de ce dernier, il est possible dutiliser cette methode de demodulation au-del`a
du cadre prevu par les contraintes (3.18) `a (3.20).

3.3.3 Domaine de validit


e exp
erimental de la m
ethode AMFM

Nous avons alors cherche `a connatre le domaine de validite de la methode cest-`a-dire les
configurations de frequences de porteuse et de modulant qui sont compatibles avec une esti-
mation correcte des param`etres qui nous interessent dans le cadre de la chane de traitement
utilisee. Cette chane de traitement est reportee sur la figure 3.5.

Fig. 3.5 Chane de traitement du signal composite par demodulation FM.

Le signal de variation de pression arterielle est dabord demodule par loperateur de


Teager. On obtient, en sortie de ce bloc, le signal damplitude instantanee (ai (n)) dune part,
et le signal de frequence instantanee (fi (n)) dautre part. Ce dernier signal est moyenne sur
trente secondes afin den extraire la frequence cardiaque. Formellement, en considerant que le
calcul est effectue sur une epoque de duree N points, lestimateur de la frequence cardiaque
applique `a lepoque m secrit :

mN +N
1 X
fc (m) = fi (n) (3.38)
N
n=mN +1

Le signal de frequence instantanee est aussi traite de sorte `a acceder `a la frequence respi-
ratoire. Pour cela, il est filtre afin dattenuer les contributions nappartenant pas `a la respi-
ration. Puis le periodogramme de ce signal filtre est calcule sur NF F T points. La raie la plus
70
CHAPITRE 3. UTILISATION DE LA DEMODULATION AMFM

energetique est recherchee et affectee `


a la frequence respiratoire selon lexpression :
mN +N
2
1 X
j2 nk

frf req (m) = argk=0,1,...,NF F T 1 max fi (n) exp (3.39)
N

N Te


n=mN +1

Enfin, on proc`ede de la meme facon `a partir du signal damplitude instantanee cette fois
pour estimer le rythme respiratoire. On obtient un second estimateur de cette frequence :
mN +N
2
1 X
j2 nk

framp (m) = argk=0,1,...,NF F T 1 max ai (n) exp (3.40)
N

N Te


n=mN +1

Afin devaluer le comportement de la methode, nous avons synthetise des signaux


modules `a la fois en amplitude et en frequence. Puis, nous les avons appliques au mod`ele,
en deux etapes. Lors de la premi`ere etape, les filtres utilises pour limiter la bande spectrale
observee etaient `a frequence glissante cest `a dire que leur gabarit etait lie `a la frequence
porteuse (plus precisement le gabarit etait [2/3fp ; 4/3fp ]). Cette etape permet devaluer la
capacite de la methode `a estimer une frequence (de porteuse ou de modulant) dans le cas
general dun signal module en amplitude et en frequence.

Dans une deuxi`eme etape, ces filtres etaient remplaces par des filtres fixes cest-`a-dire
dont le gabarit est fige (il sagissait du gabarit [0.1; 1]Hz). Cette deuxi`eme etape permet de
delimiter le domaine de validite de la methode appliquee `a notre contexte de signaux et de
frequences recherchees puisque cest le filtre que nous utiliserons pour traiter le signal de
variation de pression arterielle.

Estimation de la fr
equence cardiaque par la moyenne du signal de fr
equence
instantan
ee

Nous avons teste en premier lieu lestimateur de la frequence cardiaque (3.38). Pour cela,
nous avons fait varier la frequence du signal modulant de 0.1Hz `a 2Hz, et celle de la porteuse
de 0.7Hz `a 3Hz et en appliquant des filtres glissants. Il en ressort que sur lensemble de cette
zone, les erreurs destimation sont inferieures `a 0.01%, ce qui montre que, meme en dehors des
zones prevues par la theorie, la methode peut fonctionner. Lanalyse `a filtre fixe vient bien
s
ur limiter le domaine de fonctionnement, ainsi que nous le montre la figure 3.6. Toutefois, on
constate sur cette figure que la plage des frequences liees au sommeil, soit le domaine defini
par Dsommeil = {(fc ; fr ) [0.8; 1.5] [0.1; 0.5]}, produisent une erreur inferieure `a 2%.

Estimation de la frequence respiratoire par le p


eriodogramme du signal de
fr
equence instantan
ee

Nous nous sommes ensuite interesses `a lestimation de la frequence respiratoire donnee


par lestimateur 3.39. Les resultats sont reportes sur la figure 3.7. Lutilisation des filtres
glissants nous apprend que la methode fonctionne bien dans le domaine Dsommeil . Sur cette
plage, des erreurs significatives (cest-` a-dire superieures `a 1%) napparaissent que pour une
porteuse de frequence inferieure `a 1Hz avec un modulant de frequence superieure `a 1.5Hz
ce qui est un cas de figure que nous ne pourrons rencontrer, la frequence respiratoire etant
toujours inferieure `a la frequence cardiaque. Lanalyse par filtre fixe laisse apparatre, comme

3.3. APPLICATION AU SIGNAL DE VARIATIONS DE PRESSION ARTERIELLE 71

(a) (b)

Fig. 3.6 Estimation de la frequence porteuse du signal module. (a) : utilisation de filtres
glissants. (b) : utilisation de filtres fixes. Lerreur dans la zone de maillage horizontal nexc`ede
pas 1%.

on peut le voir sur la figure 3.7(b), une zone denuee derreur lorsque la frequence porteuse
est comprise entre 0.7 et 1.4Hz et la frequence modulant entre 0.1 et 1.6Hz, ce qui couvre
les plages de frequences rencontrees habituellement en sommeil.

(a) (b)

Fig. 3.7 Estimation de la frequence du signal de modulation de frequence. (a) : utilisation


de filtres glissants. (b) : utilisation de filtres fixes. Lerreur dans la zone de maillage horizontal
nexc`ede pas 1%.

Estimation de la fr
equence respiratoire par le p
eriodogramme du signal dampli-
tude instantan
ee

Enfin, lestimateur dont la definition est donnee par la relation 3.40 fonctionne bien d`es
lors que la frequence du modulant est inferieure `a 0.7 fois la frequence de la porteuse, ainsi
quon peut le voir sur la figure 3.8(a). Les tests avec filtres fixes confirment ce resultat, en
apportant toutefois une nuance dans le cas dune frequence porteuse denviron 1.5Hz et dun
modulant de frequence 0.1 `a 0.2Hz. Cependant, une frequence cardiaque de 1.5Hz (90bpm)
saccompagnerait dune frequence respiratoire superieure `a 0.3Hz en raison de linteraction
des syst`eme cardiaque et respiratoire. Le mauvais fonctionnement de la methode dans cette
region nest donc pas genant. Precisons quand meme que lerreur observee dans cette region
sexplique par une raie frequentielle associee `a la premi`ere harmonique du signal modulant
qui se rev`ele plus elevee que celle associee `a la frequence fondamentale (0.4Hz pour une
frequence fondamentale de 0.2Hz par exemple).
72
CHAPITRE 3. UTILISATION DE LA DEMODULATION AMFM

(a) (b)

Fig. 3.8 Estimation de la frequence du signal de modulation damplitude. (a) : utilisation


de filtres glissants. (b) : utilisation de filtres fixes. Lerreur dans la zone de maillage horizontal
nexc`ede pas 1%.

Ces differents tests nous permettent de mieux apprehender le comportement de cette tech-
nique destimation des param`etres physiologiques. Plus specifiquement, nous avons montre
quen raison de la nature meme des methodes destimation utilisees, celles-ci fonctionnent au-
del`a des limites fixees par les contraintes theoriques, et plus particuli`erement dans la plage des
frequences cardiaques et respiratoires rencontrees en sommeil, cest-`a-dire moins de 90bpm
pour la frequence cardiaque, et moins de 0.6Hz pour la frequence respiratoire.

3.4
Evaluation sur des signaux r
eels

Apr`es nous etre assures, par lutilisation de signaux synthetiques, que le domaine de vali-
dite effectif des estimateurs proposes couvre la plage des frequences cardiaque et respiratoire
que nous sommes amenes `a rechercher, nous pouvons maintenant etudier leur comportement
lorsquils sont employes sur des signaux reels.

3.4.1 Estimation du rythme cardiaque par utilisation du signal de


fr
equence instantan
ee

La figure 3.9(a) illustre le fonctionnement de lestimateur de la frequence cardiaque defini


au 3.38, lorsque celui-ci est applique aux signaux de variation de pression arterielle issus
de la base de Nantes. Les resultats statistiques donnent une surestimation de la frequence
cardiaque de 3%, avec un ecart-type de 7%. Precisons que ces resultats traduisent bien la
perception visuelle donnee par la courbe. En effet on remarque le suivi fid`ele des variations
du rythme cardiaque, avec une tendance generale `a la surestimation. En sattardant sur le
zoom donne en (b), on sapercoit quil existe un decalage temporel entre les deux signaux.
Celui-ci peut etre du, en partie, `a la methode utilisee pour lestimation du rythme cardiaque
de reference. Notamment, la valeur destimation donnee `a linstant t correspond `a une valeur
estimee sur la periode t : t + 30s. Il est possible qu`a linverse, le syst`eme de reference utilise
les trente derni`eres secondes passees t : t 30s pour estimer la valeur donnee dans la periode
t : t + 30s. Une autre partie de ce decalage est liee `a une synchronisation imparfaite des
enregistrements (cf. paragraphe 5.2.1).

3.4. EVALUATION
SUR DES SIGNAUX REELS 73

(a) (b)

Fig. 3.9 Resultats de lestimation cardiaque operee sur 9 signaux.(a) : vue densemble. (b) :
detail de la premi`ere courbe pour visualiser le decalage temporel.

Nous avons constate quil arrive que loperateur [x(n)] ou [x(n)]


prenne localement
une valeur negative, ce qui rend aberrant le calcul de sa racine carree, et, par suite, la valeur
de frequence instantanee obtenue. Nous avons donc decide de ne pas prendre en compte ces
points dans le calcul de la moyenne du signal de frequence instantanee.

On remarque aussi que le biais est globalement constant, ce qui nous permet denvisager
un calibrage de la methode afin dannihiler celui-ci. Cest ce que nous avons fait. Ainsi, sur un
premier groupe de nuit (la moitie dentre elles, choisies aleatoirement), nous avons estime le
biais b0 de lestimateur. Puis, nous avons systematiquement retranche ce biais aux estimations
portant sur le groupe de test (lautre moitie), utilisant lestimateur fcN B suivant :

fcN B (m) = fc (m) b0 (3.41)


1 X 
b0 = fc (n) fc (n) (3.42)
N n

Les resultats sont concordants et on aboutit, pour cette estimation corrigee, `a un biais nul,
lecart-type nayant bien s
ur pas varie.

3.4.2 Estimation du rythme respiratoire par analyse du signal de fr


equence
instantan
ee

Nous presentons dans ce qui suit les resultats issus dune seule nuit pour des raisons de
lisibilite des courbes. Il faut cependant savoir que les conclusions tirees de cet exemple sont
representatives de celles tirees sur lensemble de la base de donnees. Pour les memes raisons
de lisibilite des graphiques, on ne represente pas les zones non calculees du signal (environ
15% des epoques).

Estimation directe

On observe sur la figure 3.10 les resultats de lestimateur de la frequence respiratoire


donne en 3.39. On constate demblee le mauvais fonctionnement de la methode. En fait,
la raie de frequence maximale du signal de frequence instantanee estime ne correspond
74
CHAPITRE 3. UTILISATION DE LA DEMODULATION AMFM

Fig. 3.10 Estimation de la frequence respiratoire par analyse du signal de frequence ins-
tantanee filtre selon le gabarit [0.2; 0.5]Hz

pas forcement `a la frequence respiratoire. Le spectre est beaucoup plus riche et dautres
composantes frequentielles peuvent localement se reveler plus importantes que la frequence
respiratoire.

En outre, les resultats presentes sur la figure 3.10 ont ete obtenus avec un filtre de respira-
tion de [0.2; 0.5]Hz et non [0.1; 1]Hz comme prevu initialement. En effet, au vu des premiers
resultats de ce gabarit initial, nous avons decide de resserrer la focale dobservation autour
des frequences respiratoires. Cependant, comme on le constate, le balayage est encore trop
large cest `a dire que dans le gabarit conserve, il existe encore des frequences trop energetiques
par rapport a` celle de la respiration. Une solution serait de resserrer encore le gabarit du
filtre mais ce nest pas possible. En effet, les frequences respiratoires atteignent reguli`erement
les valeurs extremes de ce gabarit.

Asservissement du filtre de respiration

En fait, on ne peut resserrer le gabarit que si lon poss`ede des connaissances sur la
localisation de la frequence respiratoire. Si tel est le cas, alors on pourra definir une bande
de frequence suffisamment etroite `a linterieur de laquelle la raie damplitude maximale
correspondra `a la frequence respiratoire. Or, on sait que les syst`emes cardiaque et respiratoire
interagissent. Une augmentation de la frequence respiratoire provoque une augmentation de
la frequence cardiaque. Nous avons donc etudie, sur un ensemble representatif de signaux,
le facteur multiplicatif qui lie la frequence respiratoire et la frequence cardiaque. Nous
avons determine que la frequence respiratoire est en moyenne le quart de la frequence
cardiaque, et ce avec un ecart-type de 1. Nous decidons donc, une fois la frequence cardiaque
(Fc ) determinee `a laide de lestimateur 3.38, de filtrer les frequences inferieures `a Fc /5 et
superieures `a Fc /3. Le resultat est porte sur la figure 3.11(a).

On constate tr`es clairement un saut entre des frequence proches de la reference et


des frequences denviron 0.4Hz. Celles-ci correspondent `a la frequence Fc /3, qui est une
frequences harmonique de Fc . Pour limiter ce phenom`ene, nous avons resserre le filtre avec
un gabarit [Fc /5; Fc /4]. On obtient la figure 3.11(b). On constate que si les frequences es-
timees sont globalement dans les environs de la frequence recherchee (lerreur moyenne est

3.4. EVALUATION
SUR DES SIGNAUX REELS 75

(a) (b)

Fig. 3.11 Estimation de la frequence respiratoire par analyse du signal de frequence ins-
tantanee filtre en frequences asservies par la frequence cardiaque (Fc ).(a) : utilisation dun
filtre passe-bande de gabarit [Fc /5; Fc /3]. (b) : utilisation dun filtre passe-bande de gabarit
[Fc /5; Fc /4].

de 5% pour un ecart-type de 10%), notre estimateur ne suit pas suffisamment les variations
temporelles du signal (voir notamment le debut, la fin, et les echantillons compris entre les
indices 600 et 800). En fait, une etude comparative nous apprendra que la frequence donnee
par cet estimateur est precisement la frequence Fc /4, ce qui sexplique par le fait que la
contribution cardiaque est trop importante en regard de la contribution respiratoire pour
pouvoir estimer convenablement cette derni`ere par une analyse spectrale.

3.4.3 Estimation du rythme respiratoire par analyse du signal damplitude


instantan
ee

Nous nous sommes ensuite interesses `a lestimation de la frequence respiratoire obtenue


`a laide du signal damplitude instantanee, selon lestimateur donne par la relation 3.40. Il
sav`ere que nous sommes arrive aux memes conclusions concernant lestimation obtenue par
cette methode que celles donnees ci-dessus `a propos de lanalyse du signal de frequence ins-
tantanee, si ce nest une qualite leg`erement moindre, notamment en raison dune plus grande
sensibilite aux bruit et artefacts presents dans le signal de variation de pression arterielle.

3.4.4 Conclusions concernant cette m


ethode destimation des param`
etres
cardio-respiratoires

Ainsi donc, si cette methode destimation des param`etres cardio-respiratoires donne de


bons resultats sur des signaux synthetiques, son utilisation sur des signaux reels a revele cer-
taines faiblesses. On retiendra que lestimation du rythme cardiaque obtenue en exploitant
lestimation du signal de frequence instantanee se rev`ele tout `a fait pertinente. Lerreur desti-
mation est suffisamment faible au regard de la precision souhaitee et la complexite de mise en
oeuvre est raisonnable (quatre multiplications, deux soustractions et une division) au regard
des ressources materielles qui seront disponibles au sein du bracelet. Par contre, les methodes
utilisees pour estimer la frequence respiratoire ne se sont pas revelees convaincantes, malgre
les ameliorations apportees.
76
CHAPITRE 3. UTILISATION DE LA DEMODULATION AMFM

3.5 D
etermination de la fr
equence respiratoire ` a partir du si-
gnal de variation de pression art
erielle filtr
e

Les methodes danalyse du signal damplitude ou de frequence instantanee ne donnant


pas de resultats suffisamment bons pour ce qui est de lestimation de la frequence respiratoire,
nous avons recherche cette information directement dans la composante respiratoire additive
du signal de variation de pression arterielle. Linconvenient majeur de ce signal (et qui nest
pas visible sur la figure 3.1) est que la composante respiratoire y est en general tr`es faible par
rapport `a la composante cardiaque. Cest pourquoi nous devons imperativement supprimer
cette derni`ere afin destimer efficacement la composante respiratoire.

Fig. 3.12 Estimation de la frequence respiratoire obtenue par analyse dun signal residuel
issu de lannulation par un filtre adaptatif de la composante cardiaque dans le signal de
variation de pression arterielle.

Nous choisissons de supprimer la composante cardiaque du signal de variation de pression


arterielle par un filtrage adaptatif. Celui-ci, dont le principe est repris sur la figure 3.12 utilise
le signal de variation de pression arterielle pour determiner la frequence cardiaque. Puis il
gen`ere une sinusode `a cette meme frequence, dont lamplitude et la phase sont adaptees
automatiquement de sorte que le signal resultant sapproche au mieux de la composante
cardiaque. On supprime ensuite cette composante du signal de variation de pression arterielle.
Le signal residuel est alors majoritairement compose de la contribution respiratoire, comme
on peut le voir sur la figure 3.13 qui en presente un exemple. Il sagit dorenavant destimer
convenablement la frequence de la contribution respiratoire du signal residuel.

Fig. 3.13 Exemple de signal residuel obtenu apr`es filtrage adaptatif du signal de variation
de pression arterielle.

3.5. DETERMINATION
DE LA FREQUENCE RESPIRATOIRE A ` PARTIR DU

SIGNAL DE VARIATION DE PRESSION ARTERIELLE
FILTRE 77

3.5.1 Estimation non param


etrique de la fr
equence respiratoire : utilisation
dun p
eriodogramme

En premier lieu nous avons choisi destimer la frequence respiratoire en realisant le


periodogramme du signal residuel (calcule sur NF F T points), et en recherchant la raie spec-
trale la plus energetique de celui-ci, la frequence associee donnant la frequence respiratoire.
Dans ce cas, lestimateur sappliquant `a la fenetre m secrit :
2
1 mN
X +N
nk
frF F T (m) = argk=0,1,...,NF F T 1 max x(n) expj2 N (3.43)

N Te
n=mN +1

O`u N represente le nombre de points contenus dans une epoque (N = 30s 256Hz). On
observe sur la figure 3.14(a) les resultats de cette estimation. On constate que le fonction-
nement general de la methode nest pas tr`es bon. Les statistiques confirment cette premi`ere
impression puisque lerreur est en moyenne de 25% avec un ecart type de 42%. Le zoom donne
en 3.14(b) nous explique en grande partie ce resultat : la majorite des erreurs viennent de
sauts `a la frequence Fc /2, Fc representant la frequence cardiaque. Ces sauts sexpliquent
par une plus grande difficulte eprouvee `a certains moments par le filtre adaptatif `a eliminer
suffisamment le contribution cardiaque du signal. Cette contribution reste presente dans le si-
gnal residuel de telle sorte quelle est parfois plus energetique que la contribution respiratoire.
Cette source derreur est renforcee par la variance non negligeable de lestimateur spectral
quest le periodogramme. Une estimation de cette variance est donnee par [69]. Considerant la
densite spectrale de puissance Sxx () dun signal x(n) et son estimation par le periodogramme
calcule sur N points IN (), on a :
(  2 )
2 sin[N ]
var[IN ()] = Sxx () 1 + (3.44)
N sin

Cette relation nous apprend que la variance de lestimation de la puissance de la raie spec-
trale de frequence angulaire est de lordre de grandeur du carre de la puissance reelle de
la raie spectrale estimee. Cest une valeur consequente, et qui peut favoriser localement la
surestimation de la raie spectrale cardiaque, ou la sous-estimation de la raie respiratoire, ou
les deux. Une solution serait de limiter davantage lobservation spectrale de sorte `a ne plus
etre perturbe par la contribution cardiaque `a la frequence Fc /2 mais, pour les memes raisons
que celles exposees au paragraphe 3.4.2, on ne peut le faire. Il nous faut donc recourir `a une
autre technique destimation de frequence, et si possible `a faible co
ut.

3.5.2 Estimation param etrique de la fr


equence respiratoire : mod
elisation
du signal r
esiduel par une sinusode bruit
ee

La contrainte dune methode `a faible co ut nous a guide vers la recherche dune methode
parametrique. Dans ce type de methode, on modelise le signal par un certain nombre de pa-
ram`etres et de lois. La premi`ere modelisation proposee pour le signal residuel est la suivante :

x(n) = A cos(2fr n + ) + b(n) (3.45)

Dans ce cas, le signal residuel x(n) est approxime par une sinusode de frequence fr , ad-
ditionnee `a un bruit blanc b(n). La premi`ere technique que nous avons cherche `a mettre en
uvre pour determiner la frequence de cette sinusode bruitee est la methode de la covariance
modifiee.
78
CHAPITRE 3. UTILISATION DE LA DEMODULATION AMFM

(a) (b)

Fig. 3.14 Resultat de lestimation de la frequence respiratoire obtenue par periodogramme


du signal residuel. Application aux signaux de la base de Nantes. (a) : Vue densemble. (b) :
Detail.

M
ethode de la covariance : estimateur biais
e

Elle sappuie sur la relation de recurrence qui lie un signal sinusodal mesure aux instants n
et n+1. Ainsi pour le signal s(n), de frequence angulaire 0 , et tel que s(n) = A cos(0 n+),
on a :

s(n) = 2 cos(0 )s(n 1) s(n 2) (3.46)

La methode de la covariance modifiee consiste `a maintenir cette relation dans le cas dune
sinusode bruitee. Pour un signal x(n), n = 1, . . . , N o`
u N est le nombre de points de signal
contenus dans une epoque, et compose dune sinusode s(n) et dun bruit blanc b(n) de
moyenne nulle et de variance 2 , on pose :

(n) = 2 cos()x(n 1) x(n 2) , pour n = 3, . . . , N


x (3.47)

On recherche ensuite la valeur de qui minimise la puissance de lerreur commise par cette
approximation. On definit lerreur par :

e(n) = x(n) 2 cos()x(n 1) + x(n 2) (3.48)

On peut montrer que cette valeur est un estimateur de la frequence 0 recherchee [70]. Son
expression est donnee par la relation suivante :
(N )
X
0M C = arg min
e2 (n) (3.49)

n=3
PN !
n=3 x(n 1)(x(n) + x(n 2))
= cos1 (3.50)
2 N 2
P
n=3 x (n 1)

Le biais de cet estimateur est analyse dans [71]. Il est donne par la relation suivante :

x(0) x(1) + x(N 2) x(n) (N 2) cos 0 2
0 ] cos =
E[cos P 2 PN 2 2
(3.51)
N 2 2 (x(i))
i=1 (x(i))
i=1

3.5. DETERMINATION
DE LA FREQUENCE RESPIRATOIRE A ` PARTIR DU

SIGNAL DE VARIATION DE PRESSION ARTERIELLE
FILTRE 79

Lorsque le nombre dobservation crot, le premier terme de la parenth`ese tend vers zero
(le numerateur
P 2 est constant et le denominateur crot). Quant au second terme, il tend vers
cos 0 / Ni=1 (x(i))2
, avec , une constante. En se rappelant que 2 represente la variance
du bruit additionne au signal x(n), il ressort que cet estimateur tend vers la valeur limite :

N cos 0
E[cos 0 ] cos = (3.52)
RSB

o`
u RSB represente le rapport signal `a bruit. En presence de bruit, le biais nest donc
nul que lorsque cos 0 est nul, ce qui nest vrai que pour deux valeurs particuli`eres de 0
` cette exception pr`es, cet estimateur de frequence presente un biais
(lorsque 0 [0; 2]). A
et cest pourquoi nous avons choisi de ne pas lutiliser tel quel.

Lorsquon analyse lerreur quadratique moyenne de lapproximation, E e2 (n) , on trouve :


 

h i
E e2 (n) = E (x(n) 2 cos()x(n 1) + x(n 2))2
 
(3.53)
= 4A2 cos2 (0 (n 1) + ) (cos(0 ) cos())2 + 2(2 + cos(2))q2 (3.54)

Les deux termes de cette expression dependent de ce qui fait que le minimum de lexpression
nest generalement pas atteint en = 0 , valeur pour laquelle le premier terme atteint sa
valeur minimale nulle. Une solution pour que ce soit le cas serait de rendre le second terme
independant du param`etre . Or, lorsquon sattarde sur les calculs menant `a ce terme, on
sapercot que celui-ci provient du facteur multiplicatif (2 cos()) applique `a lechantillon
x(n 1) de la recurrence (3.47). Il est donc possible de rendre ce second terme independant
en realisant une normalisation. Cest la methode proposee dans [70] et que nous exposons
ci-apr`es.

M
ethode de la covariance : estimateur non biais
e

En fait, la recurrence (3.48) peut etre vue comme une operation de filtrage lineaire realisee
sur le signal residuel par un filtre v, dont la sortie (n) donne lerreur dapproximation de la
prediction. Ce filtre est represente sur la figure 3.15. Formellement, lexpression de loperation

Fig. 3.15 Filtre v donnant lerreur dapproximation (3.48).

de filtrage secrit :

(n) = xT v (3.55)
= e(n) (3.56)

O`
u x(n) et v prennent les definitions suivantes :

x(n) = [ x(n) x(n 1) x(n 2) ]T (3.57)


T
v = [ 1 2 cos() 1 ] . (3.58)
80
CHAPITRE 3. UTILISATION DE LA DEMODULATION AMFM

Afin dannihiler linfluence des developpements en induits par le second coefficient sur
lerreur dapproximation, on modifie le filtre de sorte que sa norme soit unitaire :
1
v= p [ 1 2 cos() 1 ]T (3.59)
2(2 + cos(2))

La fonction de co
ut devient :
N
X
JN (v) = 2 (n) (3.60)
n=3

Cette expression peut secrire matriciellement. Pour cela, on definit la matrice X :



x(3) x(2) x(1)
x(4) x(3) x(2)
X= . (3.61)

. ..
.. ..
.
x(N ) x(N 1) x(N 2)

Le produit Xv secrit alors :



x(3) x(2) x(1)
x(4) x(3) x(2) 1
Xv = . 2 cos() (3.62)

.. ..
.. . . 1

x(N ) x(N 1) x(N 2)

x(3) 2 cos()x(2) + x(1)
x(4) 2 cos()x(3) + x(2)
= (3.63)

..
.
x(N ) 2 cos()x(N 1) + x(N 2)
= [(3)(4) . . . (n)]T (3.64)

Et la fonction de co
ut se deduit de ce produit :
N
X
JN (v) = 2 (n)
n=3
= kXvk2 (3.65)

La valeur de qui minimise la fonction de co


ut (3.60) est :
q
BN + BN 2 + 8A2
N
SC = cos1
(3.66)
0

4AN

Avec :
N
X
AN = (x(n) + x(n 2))x(n 1) (3.67)
n=3
N
X
BN = x2 (N ) x2 (N 1) x2 (2) + x2 (1) + 2 x(n)x(n 2) (3.68)
n=3

3.5. DETERMINATION
DE LA FREQUENCE RESPIRATOIRE A ` PARTIR DU

SIGNAL DE VARIATION DE PRESSION ARTERIELLE
FILTRE 81

Dapr`es la relation (3.65), le vecteur v0 qui minimise JN (v) minimise aussi kXvk2 . Or,
en raison du caract`ere monotone croissant de la fonction racine carree sur R+ , le vecteur v0
minimise aussi kXvk. Comme v0 est de norme unitaire, linegalite suivante est valide :

kXv0 k min kv0 k (3.69)

O` u min est la plus petite valeur singuli`ere de la matrice X. v0 est donc le vecteur propre
associe `a cette plus petite valeur singuli`ere. Or, en raison des proprietes des decompositions
en valeurs propres et en valeur singuli`ere, v0 est aussi le vecteur propre associe `a la plus
petite valeur propre de la matrice de correlation associee `a X. Or, en utilisant les proprietes
de lestimateur de Pisarenko [72], la frequence de la sinusode est donnee par les racines du
polynome dont les coefficients sont les elements du vecteur propre v0 . En loccurrence, de
par la construction de v0 , ces zeros sont ej0 et ej0 et donc 0 est un estimateur de la
frequence 0 . Larticle [70] sattache `a demontrer que cet estimateur est non biaise.

Validation de lestimateur sur des signaux synth


etiques

Dans un premier temps nous avons etudie le comportement de cet estimateur lorsquil
est utilise sur un signal synthetique. En loccurrence, nous avons genere une sinusode de
frequence 50Hz, `a laquelle nous avons ajoute un bruit blanc gaussien avec un rapport signal
a bruit (RSB) de 40dB. Le signal, echantillonne `a 256Hz, est calcule sur trente secondes. Le
`
resultat de lestimation delivree par lestimateur donne en (3.66), en chaque point du signal,
est reporte sur la figure 3.16. Sur cette figure sont egalement tracees les moyennes et medianes
des estimations, telles que pour SC (n), lestimation delivree `a linstant n (n = 1, . . . , N ) :

n
SC 1 X SC
moyenne (n) = (n) (3.70)
n
k=1
 
arg SC (k)
SC (n) = n/2

median
SC
et 
median (n) tel que  (3.71)
SC (k)
SC

arg

(n) = n/2
median

On constate sur ce signal que la variance de lestimation diminue en fonction du nombre

Fig. 3.16 Estimation dun signal sinusodal de frequence 50Hz, additionne dun bruit blanc
(RSB = 40dB, F e = 256Hz)

dobservations utilisees pour le calcul de la frequence. On remarque egalement le caract`ere


asymptotiquement non biaise de cet estimateur. Ces observations sont en accord avec les
82
CHAPITRE 3. UTILISATION DE LA DEMODULATION AMFM

resultats theoriques presentes ci-avant.

Concernant la variance, il est montre dans [70] que celle-ci atteint un minimum pour
une frequence normalisee de 0.5, et quelle augmente significativement pour des frequences
normalisees proches de 0 et 1. Or, nous recherchons une frequence avoisinant les 0.25Hz (en
fait comprise entre 0.1 et 0.5Hz) soit, en frequence normalisee, 0.25/256 104 . Nous avons
cherche `a evaluer, en pratique, cette erreur. Pour cela nous avons cree, pour des frequences
couvrant la bande [0; 256]Hz, cent signaux echantillonnes `a 256Hz, dont on estime la
frequence par lestimateur (3.66), au terme de trente secondes dobservation. Les resultats
de lerreur destimation sont donnes sur la figure 3.17(a).On y constate que la variance est
tr`es forte aux environs des frequences que lon recherche, et quil va nous falloir employer
une frequence dechantillonnage differente des 256Hz du signal original. Comme la frequence
maximale de ce signal est de 0.5Hz, nous decidons dutiliser une frequence dechantillonnage
de 1Hz. La figure 3.17(b) illustre linteret du sous-echantillonnage `a 1Hz. On y remarque
que la variance est tr`es faible dans la bande de frequence qui nous interesse ([0.1; 0.5]Hz).

(a) (b)

Fig. 3.17 Erreur destimation dune sinusode bruitee par un bruit blanc gaussien (RSB =
20dB). (a) : Fe = 256Hz. (b) : Fe = 1Hz.

Validation sur les donn


ees exp
erimentales

Nous avons alors applique ce mod`ele incluant un sous-echantillonnage aux signaux issus
de la base de donnee de Nantes. On obtient la courbe de resultat portee en figure 3.18(a). La
moyenne de lerreur est de 14%, et lecart type 36%, ce qui est insuffisant. Nous recherchons
alors les ameliorations possibles pour cette technique destimation.

Dabord, pour diminuer la variance, nous choisissons de realiser une mediane des valeurs
obtenues. En effet, selon le principe theorique, plus on int`egre dechantillons dans le calcul
de la frequence et moins la variance de lestimation sera elevee. Seulement, nous traitons
des signaux qui ne sont pas stationnaires et lestimation au terme de la fenetre danalyse
peut etre perturbee par un bruit local. En consequence, il est preferable, dans le cadre de
nos signaux, dutiliser plusieurs estimations et de les combiner. Notre choix sest porte sur
la mediane dans la mesure o` u cet estimateur est moins sujet aux valeurs aberrantes que la
moyenne. En outre, nous utilisons les estimations obtenues sur la seconde moitie de la fenetre

3.5. DETERMINATION
DE LA FREQUENCE RESPIRATOIRE A ` PARTIR DU

SIGNAL DE VARIATION DE PRESSION ARTERIELLE
FILTRE 83

danalyse, la premi`ere servant `a la convergence des calculs. Formellement, en considerant que


N represente le combre dechantillons que contient une epoque, lestimateur devient :
 
arg r (k) fmedian = N/4
f , k = N/2, . . . N

r

frmedian
tel que et  (3.72)

arg fr (k) fmedian = N/4

, k = N/2, . . . N

r

Ensuite, nous decidons de conserver les valeurs An et Bn obtenues en fin de fenetre pour
param`etres initiaux de la fenetre suivante. Ainsi, la convergence est obtenue plus rapidement
et les estimations obtenues en seconde moitie de fenetre en seront dautant meilleure.

Au final on obtient les resultats portes sur la figure 3.18(b). Lerreur moyenne saccrot
pour atteindre 20%, tandis que lecart type diminue jusqu`a la valeur de 28%. La diminution
de lecart type etait bien levolution recherchee. Laccroissement du biais sexplique par
la convergence non instantanee du syst`eme : de fait, les valeurs successives suivent une
evolution telle que la mediane de leurs valeurs est forcement biaisee. Ce phenom`ene est
dailleurs visible sur la figure 3.16. Au-del`a de la description statistique, la courbe nous
apprend que les performances du syst`eme sont tr`es variables dans le temps. Ainsi, la region
[3000; 4000] est globalement bien suivie, meme si le biais y est important. La decroissance
brutale aux environs de lindice 5000 est egalement bien observee. A linverse, les estimations
donnees dans la region [8000; 10000] sont sans rapport avec les valeurs de reference de cette
zone.

(a) (b)

Fig. 3.18 Estimation de la frequence respiratoire par application de lestimateur de So


et Chan sur le signal residuel sous-echantillonne `a 1Hz (Base de Nantes). (a) : estimation
standard. (b) : conservation des param`etres entre les epoques et utilisation de la mediane.

Nous avons compare ces resultats `a lestimation obtenue lorsque la frequence


dechantillonnage est de 128Hz (frequence originale) et 8Hz. Conformement `a nos attentes,
les resultats sont inferieurs `a ceux que nous venons devoquer puisque le biais atteint 24%.

Limitations du premier mod`


ele propos
e pour le signal r
esiduel

Les resultats delivres par cette methode destimation sont donc insatisfaisants. En
fait, conformement `a ses fondements theoriques, cet estimateur ne fonctionne correctement
84
CHAPITRE 3. UTILISATION DE LA DEMODULATION AMFM

que dans le cas o` u un signal sinusodal pur est plonge dans un bruit blanc. Nous avons
pu verifier que lorsque deux sinusodes sont en presence dans le signal, alors la frequence
estimee ne correspond `a aucune des deux frequences. Pour cela, nous avons construit un
signal y(n) = A0 cos(2fp n + ) + A1 cos(2kfp n + ) + b(n) o` u b(n) est un bruit blanc
centre. Nous avons observe les resultats de lestimation pour differentes valeurs de k (et
pour differentes frequences fp ). Ceux-ci sont donnes sur la figure 3.19. A chaque fois (hormis
bien sur lorsque le facteur k vaut 0 ou 1 ce qui revient `a un mod`ele comprenant une seule
sinusode), lestimation realisee ne correspond ni `a fp , ni `a kfp . Ce resultat est coherent avec
la condition de Pisarenko qui precise que lorsque p sinusodes sont contenues dans un signal,
il est necessaire de disposer de N 2p + 1 echantillons du signal pour les estimer.

Fig. 3.19 Resultat de lestimateur lorsque le signal etudie comporte deux sinusodes

On remarquera toutefois que la dependance de la valeur estimee au facteur k est lineaire,


ce qui sugg`ere la possibilite dutiliser cet estimateur, meme lorsque plus deux sinusodes sont
presentes dans le signal etudie. Nous navons par contre pas encore eu le temps dexplorer
cette voie.

Cet estimateur est donc insuffisant car il est base sur une modelisation trop simpliste du
signal. Celle-ci, (3.45), suppose un seul processus sinusodal alors que notre signal en contient
probablement plusieurs, ne serait-ce que parce que la suppression de la composante cardiaque
nest jamais parfaite. Le paragraphe suivant propose dutiliser un estimateur parametrique
base, cette fois, sur une modelisation multicomposante du signal.

3.5.3 Estimation param etrique de la fr


equence respiratoire : mod
elisation
du signal r
esiduel par une somme de sinusodes bruit ees

Le signal residuel x(n) est cette fois modelise comme une somme de p sinusodes, aux-
quelles sajoute un bruit blanc :
p
!
X
x(n) = Ak cos(2fk n + k ) + b(n) (3.73)
k=1

Estimation directe des z


eros dun filtre FIR

Une solution pour determiner les frequences des differentes composantes du signal x(n)
est de calculer le vecteur propre de longueur N = 2p + 1 associe `a la plus petite valeur

3.5. DETERMINATION
DE LA FREQUENCE RESPIRATOIRE A ` PARTIR DU

SIGNAL DE VARIATION DE PRESSION ARTERIELLE
FILTRE 85

propre de sa matrice dautocorrelation et de determiner les zeros de celui-ci. Comme nous


le verrons plus loin, il est possible de calculer `a faible co
ut ce vecteur propre en utilisant
des techniques basees sur des filtres adaptatifs. Mais, puisque ce sont les zeros du filtre qui
nous interessent reellement, pourquoi ne pas utiliser un algorithme travaillant directement
dans lespace des zeros, plutot que dans celui des coefficients ? Dans cet esprit, nous avons
selectionne la methode proposee par Orfanidis [73].

Ainsi, on cherche `a adapter les i zeros (1 i N ) de la mani`ere decrite par lequation


(3.74) :

zi (n + 1) = zi (n) + zi (n) (3.74)

Ladaptation LMS des coefficients du filtre nous donne la valeur de zi (n) :


p
X zi (n)
zi (n) = am (n) (3.75)
am (n)
m=0

zi (n)
Avec les quantites am (n) et am (n) definies comme suit (voir [73] pour les details) :

zi (n) zi (n)pm
= (3.76)
am (n) a0 (n)j6=i (zi (n) zj (n)
am (n) = [e(n)y(n m) e(n) e(n)am (n) (3.77)

(a) (b)

Fig. 3.20 Determination adaptative des zeros correspondant `a s(n) = cos(0.25n) +


cos(0.75n) + (n) o` u (n) est un bruit blanc gaussien centre, de rapport signal `a bruit
0dB. (a) : Valeurs instantanees des zeros. (b) : Trajectoire des zeros dans le plan complexe.

Si letude de cette methode sur des signaux synthetiques (dont un exemple est donne sur
la figure 3.20) nous a montre queffectivement, elle permet destimer les zeros recherches, son
application au signal de variations de pression arterielle sav`ere delicate. En effet, il nest pas
possible de determiner, parmi les zeros de la modelisation, lequel converge vers la frequence
souhaitee (celle de lactivite respiratoire dans notre cas). Nous nous sommes alors orientes
vers une autre propriete de la decomposition en vecteur propre.
86
CHAPITRE 3. UTILISATION DE LA DEMODULATION AMFM

Estimation de la fr
equence du vecteur propre maximum

En loccurrence, nous avons exploite les propriete du vecteur propre associe `a la plus
grande valeur propre (Nous nous refererons dorenavant `a ce vecteur en tant que vecteur propre
maximum). Par construction, il contient linformation majeure contenue dans le signal.

Le vecteur propre maximum est la meilleure approximation du signal - Pour


le verifier, cherchons une transformation unitaire qui transforme le vecteur signal X, de
dimension N en un vecteur Y = T X qui compresse au mieux linformation dans ses M
(M N ) premiers elements. Choisissons comme definition de au mieux le crit`ere dErreur
Quadratique Moyenne (EQM). Alors un tel vecteur minimise lEQM dapproximation du
vecteur Y par sa version tronquee Y . Celle-ci sexprime par :
 2 
EQM

= E Y Y

(3.78)
    2
= E y1 . . . yM . . . yN y1 . . . yM ... 0 (3.79)
  2
= E 0 . . . 0 . . . yN (3.80)
N
X
= E[yi2 ] (3.81)
i=M +1

Soient les vecteurs lignes de la matrice T definis par VTti tels que T = [VTt1 , . . . , VTtN ]t (Z t est
le transpose de Z). Alors :

N
X
EQM = VTti E[XX t ]VTi i = M + 1, . . . , N (3.82)
i=M +1

On recherche les vecteurs VTi tels que cette erreur soit minimale, sous la contrainte de norme
unitaire de ceux-ci. En utilisant les multiplicateurs de Lagrange il vient que ces vecteurs
doivent satisfaire le syst`eme suivant :

E[XX t ]VTi = i VTi i = M + 1, . . . , N (3.83)

Ce qui nest le cas que si les VTi sont les vecteurs propres de la matrice dautocorrelation
associee `a X,E[XX t ], et les i leurs valeurs propres associees. Ainsi donc la transforma-
tion recherchee est la transformation de Karhunen-Lo`eve. Dans ce cas, on a VTti VTj = 1 si
i = j, 0 sinon. En utilisant ce resultat dans lexpression (3.82), on determine LEQM de
lapproximation au rang M du vecteur Y :

N
X
EQM = i (3.84)
i=M +1

Si la matrice de transformation est donnee par la decomposition de Karhunen-Lo`eP ve alors X


peut sexprimer comme une combinaison lineaire de ces vecteurs propres, X = N i=1 ci VTi .
t
Les ci poss`edent la propriete suivante : E[ci cj ] = i si i = j, 0 sinon. Determinons `a present
lerreur e(n) introduite par lapproximation de X par la version tronquee de sa transformee

3.5. DETERMINATION
DE LA FREQUENCE RESPIRATOIRE A ` PARTIR DU

SIGNAL DE VARIATION DE PRESSION ARTERIELLE
FILTRE 87

Y :

e(n) = X(n) Y (n) (3.85)


N
X M
X
= ci VTi ci VTi (3.86)
i=1 i=1
XN
= ci VTi (3.87)
i=M +1

Lerreur quadratique moyenne resultante est :


N
X
2
Eke(n)k = E[ci VTti VTi ci ] (3.88)
i=M +1
N
X
= i (3.89)
i=M +1

Or, nous avons vu que par construction, les valeurs i sont telles que N
P
i=M +1 i est minimale.
En consequence, la decomposition de Karhunen-Lo`eve est telle que la sommation partielle de
X, nommee X est la plus proche possible (au sens de lerreur quadratique moyenne) de X. A `
lextreme, lapproximation de X par son vecteur propre associe `a la plus grande valeur propre
(troncature de Y `a M = 1) est la meilleure approximation possible de X. Cest pour cette
raison que lon peut dire que ce vecteur propre contient linformation majeure du signal. Le
probl`eme consiste alors `a estimer efficacement ce vecteur, sachant quune decomposition de
Karhunen-Lo`eve est dun co ut memoriel et calculatoire prohibitif.

Fig. 3.21 Estimation du vecteur propre maximum

Estimation du vecteur propre maximum - Examinons le syst`eme de la figure 3.21.


Dans ce syst`eme, un signal U (n) = [u(n), u(n 1), . . . , u(n L + 1)]T est introduit dans un
filtre dordre L nomme H(n) = [h0 (n), h1 (n), . . . , hL1 (n)], de norme unitaire (cest `a dire
que H T H = 1). Le signal de sortie est determine par la relation y(n) = H T (n)U (n).

Examinons maintenant la variance du signal de sortie du filtre :

E[y 2 (n)] = E H T U (n)U T (n)H


 

= H T E U (n)U T (n) H
 

= H T RH
H T RH
= , puisque kHk = 1 n (3.90)
HT H
Le terme de droite dans lexpression (3.90) est appelee Quotient de Rayleigh. Ce quotient
poss`ede la propriete suivante, dans le cas o`
u la matrice R, de valeurs propres max ,...,min ,
88
CHAPITRE 3. UTILISATION DE LA DEMODULATION AMFM

est symetrique (ce qui est le cas dune matrice dautocorrelation) :

H T RH
max min , H 6= 0 (3.91)
HT H

Ainsi, si le vecteur H = Hmax est tel quil maximise la quantite E y 2 (n) , alors on a :
 

E[y 2 (n)] = max (3.92)


T
= Hmax (n)RHmax (3.93)

Et en utilisant les multiplieurs de Lagrange on peut demontrer les relations suivantes :


T
max = Hmax R Hmax (3.94)
R Hmax = max Hmax (3.95)

On deduit alors des equations (3.94) et (3.95) que lorsque E y 2 (n) est maximal, Hmax est
 

le vecteur propre associe `a max cest `


a dire le vecteur propre maximum, celui qui approxime
au mieux, dapr`es les resultats du paragraphe 3.5.3, le signal.

Mise en oeuvre adaptative - Il nous faut `a present determiner les coefficients du filtre
H. Leur determination directe est bien s ur impossible car elle necessiterait le calcul, en chaque
instant, de la matrice dautocorrelation R(n). Nous nous orientons donc sur une technique
adaptative doptimisation, et plus precisement utilisant la methode du gradient stochastique.
Celle-ci permet dajuster les coefficients du filtre de sorte `a garantir la maximisation de
E[y 2 (n)], tout en garantissant le respect la contrainte de norme unitaire. Dans cet algorithme,
pour chaque nouveau nouvel echantillon u(n), H(n) est adapte de la facon suivante :

y 2 (n)
G(n) = H(n) +
H(n)
= H(n) + y(n) [U (n) y(n)H(n)] (3.96)
G(n)
H(n + 1) = (contrainte) (3.97)
kG(n)k

Pourvu que et lordre du filtre soient correctement choisis, la convergence est obtenue
et H(n) est une estimation de la composante majeure de U (n). Cette technique, appliquee au
signal residuel de la figure 3.22(a) (presente aussi en figure 3.13) fournit lestimation donnee
en figure 3.22(b).

Mesure de la fr equence du vecteur propre - La frequence de ce vecteur propre reste


`a determiner. A ce stade, le signal etudie (le vecteur propre) est normalement suffisamment
peu bruite pour pouvoir employer une technique simple destimation frequentielle. Nous avons
choisi dutiliser la technique du passage par zero. Celle-ci consiste `a mesurer lecart temporel
separant deux passages par zero du signal. Sa justification theorique est simple dans le cas
dun signal sinusodal s(n) = A cos((n)). En effet, dans ce cas, la frequence f du signal s(n)
est donnee par la derivee de la phase (n), tel que :

1 d
f= (3.98)
2 dn

3.5. DETERMINATION
DE LA FREQUENCE RESPIRATOIRE A ` PARTIR DU

SIGNAL DE VARIATION DE PRESSION ARTERIELLE
FILTRE 89

(a) (b)

Fig. 3.22 (a) Signal issu du filtre rejecteur de la composante cardiaque. (b) Estimation du
vecteur propre maximum de ce signal.

On peut notamment utiliser comme derivee discr`ete la forward finite difference dont lex-
pression mathematique est d/dn = ((n + 1) (n))/Te . Dans ce cas, lexpression de la
frequence de la frequence f (n), de la sinusode devient :
1
f(n) = [(n + 1) (n)] (3.99)
2Te

On peut montrer que la technique du passage par zero se ram`ene `a une moyenne desti-
mations ponctuelles de la derivee de la phase du signal. En effet, le passage par zero consiste
`a compter le nombre de points qui separent deux passages par zero du signal, soit lequivalent
dune demi-periode. Si on appelle k ce nombre, alors la frequence est donnee par :
1
f(n) = (3.100)
2kTe

La moyenne de k estimations de la frequence instantanee peut alors sexprimer par la


relation (3.101) :
1
fk (n) = [(n + 1) (n) + (n + 2) (n + 1) + . . . (3.101)
2kTe
+(n + k) (n + k 1)]
1
= [(n + k) (n)] (3.102)
2kTe

Comme une demi-periode separe les points n + k et n, on a (n + k) (n) = et


donc lexpression (3.102) se ram`ene `a lexpression (3.100). Notons que plus la frequence
dechantillonnage sera elevee, plus la difference entre 1/kTe et 1/(k + 1)Te sera faible et donc
plus lestimation de la frequence sera precise.

R
esultats exp
erimentaux

Le syst`eme finalement obtenu est donne sur la figure 3.23. Dans celui-ci, le signal
de variation de pression arterielle, filtre, est utilise pour determiner la frequence car-
diaque en utilisant une demodulation AMFM. Cette frequence est alors employee pour
generer un signal sinusodal utilise par un filtre adaptatif afin de supprimer la compo-
sante cardiaque du signal de variation de pression arterielle. Enfin, le signal residuel est
90
CHAPITRE 3. UTILISATION DE LA DEMODULATION AMFM

debruite par une somme partielle (en fait limitee `a lordre un) de ses vecteurs propres. En
dernier lieu on estime la frequence de ce vecteur propre par une technique de passage par zero.

Fig. 3.23 Chane de traitement destimation de la frequence respiratoire par analyse de la


composante additive du signal de variation de pression arterielle

On travaille par epoque de trente secondes. Dans le cas de la base de test de Nantes, les
valeurs de reference des frequences cardiaque et respiratoire sont donnees directement par
lappareillage medical. Dans le cas de la base de test de Paris, la frequence respiratoire de
reference est donnee par la raie la plus energetique du periodogramme du signal issu selon les
cas dune sonde thermique posee au niveau du nez, dun capteur de respiration thoracique
ou dun capteur de respiration abdominale. Nous navons pas realise de mesure de frequence
cardiaque de reference sur cette base de test. Comme precedemment, il faut savoir que nous
navons pu realiser destimation sur environ 10% des epoques, pour cause dartefacts sur le
signal. Ces artefacts sont dus `a des bouges, des mauvaises positions du bracelet ou encore `a
une valeur incoherente de la frequence de reference, ce qui arrive parfois lors dun bouge. En
pratique, les epoques presentant plus dune seconde de signal sature sont supprimees, ainsi
que celle dont la valeur de la frequence cardiaque de reference depasse 150bpm.

Frequence d echantillonnage - La frequence dechantillonnage originale des signaux


etant de 128Hz pour la base de Nantes et de 256Hz pour la base de Paris, nous les avons
demblee sous-echantillonnes `a 32Hz au niveau de letape 3 de la figure 3.23 afin de limiter les
volumes de calcul et de taille memoire employee, et ce, dans le but de faciliter limplantation
de lalgorithme sur une cible embarquee. Cette frequence dechantillonnage nest pas choisie
au hasard. En effet, elle offre `a la technique du passage par zero une resolution de (1/32)s =
0.03Hz, qui est la resolution minimale souhaitee sur la frequence respiratoire.

D ecomposition en vecteurs propres - Les param`etres du filtre utilise pour realiser


lestimation du vecteur propre maximum sont commandes par la frequence estimee. En effet,

3.5. DETERMINATION
DE LA FREQUENCE RESPIRATOIRE A ` PARTIR DU

SIGNAL DE VARIATION DE PRESSION ARTERIELLE
FILTRE 91

il nous faut pouvoir observer deux passages par zero soit au moins une demi-periode de
la frequence la plus basse `a estimer ce qui represente environ 0.5 1/0.05 = 10 secondes.
Lordre du filtre depend alors de la frequence dechantillonnage. En loccurrence, celle-ci est
de 32Hz, etant donne que nous realisons un sous-echantillonnage par quatre (voir ci-dessus).
Ainsi, la taille du filtre doit etre au moins superieure `a 320 points.

Il est `a noter que les param`etres du filtre obtenus `a la derni`ere iteration dune epoque
sont conserves pour servir de base `a la premi`ere iteration de lepoque suivante, dans le cas,
bien s ur, o`
u celle-ci est contigue `a la premi`ere. Cela permet de ne pas perdre ladaptation
realisee lors dune epoque lorsquon passe `a la suivante.

Estimation de la fr equence respiratoire - En toute logique, apr`es une phase de


convergence initiale, le principe consiste `a comptabiliser les points de passage par zero
du vecteur H(n). En pratique, bien evidemment, ladaptation du filtre evolue en fonction
des caracteristiques du signal et est donc, suivant les instants dobservation, plus ou moins
bonne. Cest pourquoi on ne peut se contenter destimer la frequence principale du vecteur
propre obtenu `a lissue de lepoque. Comme mentionne au paragraphe 3.5.2, nous avons
choisi de realiser, par epoque, plusieurs estimations de frequence. Puis, nous en prenons la
valeur mediane et cest cette valeur qui donnera lestimation de la frequence respiratoire.
Les resultats presentes ci-apr`es correspondent `a la situation o`
u une estimation est produite
`a chaque adaptation du filtre. Bien evidemment, la periode de rafraichissement de lestima-
tion peut etre considerablement reduite en fonction des contraintres liees `a limplantation
embarquee.

R
esultats (base de Nantes)

Les resultats de cette chane de traitement sont donnes sur la figure 3.24. Lerreur moyenne
commise sur lestimation de la frequence cardiaque est de 7%, avec un ecart type de 4%,
ainsi que nous lavions vu au paragraphe 3.4.1. Concernant la frequence respiratoire, lerreur
moyenne est de 3%, et lecart type de 16%. On constate sur la figure 3.24(a) et plus encore
sur le detail donne en 3.24(b) que lestimation suit fid`element la valeur de la frequence de
reference.

(a) (b)

Fig. 3.24 Resultats de la chane de traitement de la figure 3.23 dans lestimation de la


frequence respiratoire. Base de donnees de Nantes. (a) : Vue densemble. (b) : Detail
92
CHAPITRE 3. UTILISATION DE LA DEMODULATION AMFM

Confirmation du fonctionnement sur la base de Paris

On teste ensuite ce syst`eme sur la base de Paris. Celui-ci fournit la courbe donnee en figure
3.25. On retrouve les memes conclusions `a savoir que le suivi des variations apparat fid`ele,
confirme par de bons resultats statistiques (la moyenne des erreurs portant sur lestimation
de la frequence respiratoire est de 3% et lecart-type de 20%). On note cependant une zone
derreur, localisee entre les abscisses 800 et 900. Celle-ci sexplique par le fait que le filtre
de respiration limite `a 0.5Hz la frequence du signal residuel. Or la frequence de reference
depasse les 0.5Hz dans cette zone. Le syst`eme ne peut donc suivre ces valeurs. Notons enfin
que lecart-type sexplique surtout par quelques valeurs aberrantes, comme le montre le detail
donne en figure 3.25(b).

(a) (b)

Fig. 3.25 Resultats de la chane de traitement de la figure 3.23 dans lestimation de la


frequence respiratoire. Base de donnees de Paris. (a) : Vue densemble. (b) : Detail

Repr
esentation en nuage de points

Afin de caracteriser au mieux le fonctionnement de cette methode nous avons decide


dutiliser une representation en nuage de points. Dans celle-ci, on represente chaque point
destimation dans un espace `a deux dimensions. Labscisse est donnee par la valeur de la
frequence respiratoire de reference de cette epoque, et lordonnee du point par la valeur
estimee. Cette representation est donnee en figure 3.26(a).
Les valeurs estimees devraient, idealement, etre identiques aux valeurs de reference et
donc les points bleus devraient etre confondus dans la droite y = x representee en vert.
La dispersion des estimations autour de cette droite nous informe sur la performance de la
methode. Plus lellipse les regroupant est large et moins bonne est cette methode. Dans notre
cas, on distingue plusieurs zones.
Dabord un ensemble de points eparpilles verticalement au niveau de labscisse 0.2Hz.
Ce nuage correspond aux points que lon retrouve sur la figure 3.25(a) entre les valeurs
dabscisse 5000 et 6000 et dont nous avons dej`a parle ci-dessus.
ensuite, une ellipse de bon fonctionnement, comprenant les estimations dont la
reference est comprise entre 0.2 et 0.4Hz.
Puis, un groupe de points centre autour de [0.5, 0.25]Hz. Celui-ci resulte de la mauvaise
estimation des points dabscisse 800 `a 900 de la figure 3.25(a).
Au-del`a de ces points, on retrouve un bon fonctionnement du syst`eme. Enfin, quelques

3.5. DETERMINATION
DE LA FREQUENCE RESPIRATOIRE A ` PARTIR DU

SIGNAL DE VARIATION DE PRESSION ARTERIELLE
FILTRE 93

(a) (b)

Fig. 3.26 (a) Representation en nuage de points des estimations de la frequence respiratoire.
(b) Representation en densite de ces points.

points se dispersent au dessus de lellipse.

R
egression lin
eaire

Si la representation en nuage de points permet de bien visualiser la dispersion generale


des valeurs, elle ne permet pas danalyser finement le comportement moyen de lestimation.
Cest pourquoi nous avons realise un calcul des medianes verticales E(f ). Ce calcul nest
possible que parce que les valeurs de lestimation de reference sont discr`etes. Nous navons
donc realise ce calcul quavec la base de Paris, les valeurs de reference de Nantes etant, elles,
continues.

Les valeurs de reference de la base de donnees de Paris sont obtenues par Transformee de
Fourier Rapide (FFT) realisee de sorte `a ce que le nombre de points soit une puissance de
deux et tel que la resolution soit inferieure `a 0.01Hz. En loccurrence, travaillant a` 256Hz,
la resolution est denviron 0.0078Hz. Soit une frequence de reference fr0 (par exemple fr0 =
30 32768/256 = 0.2344Hz). Soient les L0f points qui poss`edent pour reference cette valeur
fr0 . Considerons alors les differentes estimations de cette frequence respiratoire et notes fr0 .
Alors on calcule la mediane M (f 0 ) de ces points :
 
arg
f 0 M (f 0 ) = L0 /2

r f
M (f 0 ) tel que et  
arg f0 M (f 0 ) = L0 /2


r f

On obtient alors les points portes en rouge sur la figure 3.27. Lemploi de la mediane se
justifie par le fait que les erreurs sont de type aleatoire cest-`a-dire que spontanement, une
estimation peut etre tr`es mauvaise, alors que les precedentes et les suivantes sont correctes.
Cela est en general du `a un artefact sur le signal de variation de pression arterielle. Or, il
suffit dune erreur de ce type pour que la valeur moyenne soit alteree. En consequence, la
moyenne, avec ce type de bruit, ne permet pas de modeliser efficacement le comportement
general de la methode. A linverse, la valeur mediane nest pas sensible `a ce bruit et cest
94
CHAPITRE 3. UTILISATION DE LA DEMODULATION AMFM

pourquoi nous lavons preferee `a la moyenne. On realise alors une regression lineaire au sens
des moindres carres de ces points, ce qui donne la figure 3.27.

Fig. 3.27 Regression lineaire des medianes verticales

)
On sapercoit, dapr`es cette regression, que lestimation est donnee par la relation E(f
0.9 f + 0.03. Ainsi, le biais systematique est quasiment nul. Par contre, il existe un biais
dependant de la frequence `a estimer. Pour les frequences inferieures `a 0.4Hz, on surestime la
frequence respiratoire et pour les valeurs superieures, on la sous-estime. Notons que le biais
maximal de cette regression est de 8%, ce qui reste acceptable.

Exploitation de lanalyse : correction du biais

On peut envisager de calibrer la methode destimation en utilisant les informations issues


de la regression lineaire des medianes. Pour cela, il suffit dappliquer la fonction inverse de
celle qui lie les donnees de reference aux donnees observees. Nous navons cependant pas
realise cette operation qui devrait theoriquement conduire `a une diminution du biais.

3.6 Conclusions sur lutilisation de la d


emodulation AMFM
pour lestimation des rythmes cardiaque et respiratoire

Nous avons explore dans ce chapitre differentes techniques destimation du rythme


cardiaque et respiratoire basees sur la modelisation du signal de variation de pression
arterielle comme une signal module `a la fois en amplitude et en frequence.

La moyenne du signal de frequence instantanee sest averee un bon estimateur de la


frequence cardiaque puisquil conduit, sur notre base de test, `a une erreur moyenne de 3%
et un ecart-type de 7%.

La mesure de la frequence respiratoire sest averee plus difficile, ce qui sexplique bien
par la contribution plus faible de la respiration au signal de variation de pression arterielle.
Neanmoins nous avons reussi `a obtenir un estimateur correct de la frequence respiratoire
en utilisant la mesure de la frequence du vecteur propre maximal issu de la decomposition
du signal residuel. Cet estimateur donne, sur notre base de test, une erreur de 3% et un

3.6. CONCLUSIONS SUR LUTILISATION DE LA DEMODULATION AMFM POUR
LESTIMATION DES RYTHMES CARDIAQUE ET RESPIRATOIRE 95

ecart-type de 20%.

En outre, ces deux techniques offrent des perspectives de complexite calculatoire et


memorielle compatibles avec une implantation sur une cible embarquee. Precisons notam-
ment que la quasi-totalite des calculs sont realises en continu, ce qui permet une repartition
optimale de la charge. Cest donc naturellement ces techniques que nous avons utilisees par
la suite, notamment pour le calcul des param`etres cardiaque et respiratoire employes pour
realiser la classification.

Differents axes damelioration restent `a etudier. Notamment, la contrainte de norme


unitaire exposee au paragraphe 3.5.3 impose le calcul de la norme du vecteur `a chaque
adaptation, suivi dune division de chacun des param`etres par cette norme. Cette operation
est relativement co uteuse. Or, Regalia [64] propose une methode de decomposition de
Karhunen-Lo`eve nimposant pas cette division. Celle-ci est remplacee par lemploi de
rotations et de delais appliques au signal original.

Il serait egalement interessant de realiser un dispositif de verification de la coherence des


donnees voire de correction de celles-ci. On peut imaginer un dispositif du meme type que
celui utilise pour le rescorage de la classification, expose au paragraphe 4.6, et qui verifie que
lestimation donnee `a lepoque n ne secarte pas de facon invraisemblable des estimations
realisees aux epoques n 1 et n + 1. Le cas echeant, cette valeur est corrigee.

Enfin, lestimation de la frequence du vecteur propre, telle quelle est pratiquee, rec-
quiert une demi-seconde de signal ce qui represente un nombre relativement important
dechantillons. Nous pourrions utiliser une methode plus economique, comme celle exposee
au paragraphe 3.5.2 pour estimer sa frequence. Si elle ne pouvait sappliquer au signal
residuel, il est probable que le vecteur propre soit suffisamment peu bruite pour que cette
fois nous puissions lemployer.
Chapitre 4

Classification

Nous presentons dans ce chapitre la mise en place ainsi que les resultats de la classification
automatique en stade de sommeil des signaux delivres par le bracelet. Apr`es avoir bri`evement
presente les donnees qui sont utilisees, nous etudions deux techniques de classification, la clas-
sification gaussienne et les reseaux de neurones. Nous avons selectionne la premi`ere methode
pour sa simplicite de mise en uvre. Ce sont les performances de la seconde qui nous ont
amene `a son utilisation. Nous verrons ensuite comment les resultats issus de ces traitements
peuvent etre ameliores par un rescorage. Enfin, nous exposerons la technique sur laquelle
nous travaillons actuellement, qui utilise un arbre de decision.

4.1 Contexte de lexp


erimentation

4.1.1 La collaboration avec les centres de sommeil

Notre base de donnees est constituee des signaux issus du bracelet, enregistres sur
des patients volontaires, et des signaux que nous qualifions de reference, enregistres
simultanement par les materiels medicaux en place dans les centres de sommeil avec
lesquels nous collaborons. Ceux-ci sont au nombre de deux. Il sagit, pour le premier, du
centre du sommeil de lhopital Laennec `a Nantes, dirige par Mme B. NOGUES, et, pour
le second, du centre du sommeil de lhotel-Dieu de Paris, dirige par Mr D. LEGER. La
participation `a notre etude est proposee par le medecin responsable aux patients devant
subir un enregistrement polysomnographique. Il ne sagit donc uniquement que de patients
souffrant dune pathologie, ou, du moins, o` ` Nantes, le
u celle-ci est fortement presumee. A
medecin pose preferentiellement le bracelet sur des personnes quil suppose non sujettes aux
apnees du sommeil. Mais cette preference ne peut etre toujours satisfaite dans la mesure
o`
u ce type de patient represente 50 `
a 80% des personnes examinees par les centres de sommeil.

Le fait que les enregistrements soient realisees sur des personnes non saines est un
probl`eme majeur pour la mise au point dun syst`eme de reconnaissance des stades de
sommeil. Premi`erement, le deroulement de la nuit sera tr`es specifique au patient. Les
personnes saines respectent un certain enchanement de stades, decrit precedemment au
paragraphe 1.1.1. Les patients insomniaques ou apneiques ne le respectent pas. Un apneique
est, par exemple, susceptible de se reveiller tr`es reguli`erement, lorsque survient une apnee
du sommeil. Celle-ci se traduit par une interruption (de duree superieure `a dix secondes)
du flux dair dans les poumons soit par interruption de leffort respiratoire (cest lapnee
98 CHAPITRE 4. CLASSIFICATION

centrale), soit par blocage au niveau des voies aeriennes superieures (on parle alors dapnee
obstructive). Lors de lapnee, on observe generalement un trouble du rythme cardiaque
[1]. Les patients apneiques presentent donc, en sus du non-respect du cycle de sommeil,
des troubles des variables cardio-respiratoires, qui rendent les signaux observes potentiel-
lement moins caracteristiques des stades de sommeil que ceux observes chez des patients sains.

Le prototype utilise `a Nantes est un bracelet autonome permettant denregistrer les


signaux issus des capteurs places au sein du bracelet sur une memoire SmartMedia amovible.
A Paris, nous utilisons un bracelet qui se connecte directement sur lappareillage medical
local. Ces deux bracelets utilisent la meme base multicapteur. Toutefois, la numerisation
se fait sur 8 bits `a 128Hz pour le bracelet de Nantes, et sur 16 bits `a 256Hz `a Paris. Par
ailleurs, de par le montage utilise, le bracelet de Nantes est plus sujet `a lapparition de
saturations du signal de variation de pression arterielle en cas de bouge.

Nous invitons le lecteur `a se reporter au chapitre 5 pour une explication plus detaillee du
fonctionnement des bracelets et des protocoles denregistrement des signaux.

4.1.2 Description g
en
erale de la chane de traitement

Detaillons `a present la mani`ere dont sont traitees les donnees. La figure 4.1 reprend
lensemble de la chane de traitement mise en place. Les signaux numerises sont decoupes
en epoques dune duree de trente secondes. Lorsque lepoque est int`egre (pas de saturations
par exemple), la portion de signal correspondante est utilisee pour calculer des param`etres
discriminants. Puis, le cas echeant, ces param`etres sont combines par des Fonctions Lineraires
Discriminantes (FLD) en vue de reduire la dimension du vecteur `a classer. Le vecteur de
param`etre est ensuite classe cest-`a-dire attribue au stade (ou groupe de stade) de sommeil
dont il est le plus proche au sens dun crit`ere mesurant le co
ut le separant dun vecteur moyen,
caracteristique de chaque classe, et defini lors de la phase dapprentissage.

Fig. 4.1 Chane de classification



4.2. SELECTION `
DES PARAMETRES PAR LA CLASSIFICATION
UTILISES 99

Nous avons choisi de considerer des epoques dune duree de trente secondes car il sagit
de la duree utilisee par les logiciels medicaux des centres de sommeil avec lesquels nous
collaborons. Il sagit en fait dune des deux normes existant dans le domaine de letude du
sommeil. Lautre definissant une duree depoques de vingt secondes. Nous avons egalement
explore linteret de lemploi depoques plus courtes, eventuellement recombinees en epoques
de trente secondes, dans le but de diminuer linfluence dune erreur locale. Cependant, les
premiers resultats observes ne nous ont pas encourages `a poursuivre dans cette voie.

4.1.3 Bases de donn


ees retenues

Pour linstant, la base de donnees utilisee pour lexploration de la classification auto-


matique des nuits contient uniquement des signaux provenant denregistrements realises
`a Paris, moins sujets aux saturations du signal de variation de pression arterielle. Nous
travaillons actuellement `a lintegration des nuits de Nantes. Les patients faisant lobjet
dun enregistrement sont, dans les faits, choisis aleatoirement, sans distinction dage ni de
pathologie supposee. Sur les quarante-deux nuits enregistrees `a Paris jusquau 18 fevrier
2005, quatre comportent des erreurs denregistrement (gravure defaillante, un des fichiers
est manquant . . . ). Restent donc trente-huit fichiers. Nous avons fait le choix decarter de la
selection les fichiers presentant trop dapnees (pour lesquels levolution cardiorespiratoire est
alteree), de meme que ceux dont les hypnogrammes sont trop fractionnes. Nous supposons
en effet que les signaux, lors des periodes de transition, presentent des caracteristiques
communes aux deux stades entre lesquels ils evoluent. Les epoques correspondantes risquent
donc de ne pas etre representatives dun stade en particulier et nous preferons les ecarter
dans un premier temps.

Au final, les signaux sont separes aleatoirement en deux bases de caracteristiques proches :
la base dapprentissage et la base de test. La premi`ere compte seize nuits, la seconde cinq.
Dans les differents tests realises, lapprentissage est opere sur 70% de la base dapprentissage,
les 30% restants etant notamment utilises pour mesurer le degre dapprentissage. La base de
test nest utilisee que pour les differents tests et ne sert `a aucune etape de lapprentissage. La
repartition des epoques constituant les bases dapprentissage et de test est donnee ci-dessous :

Base dapprentissage Base de test


stade 0 : 15% 12%
stade 1 : 4% 3%
stade 2 : 39% 34%
stade 3 : 8% 6%
stade 4 : 16% 20%
stade 5 : 19% 25%

4.2 S
election des param`
etres utilis
es par la classification

La classification, quelle que soit la methode utilisee, se base sur letude dattributs, dont on
suppose les valeurs caracteristiques des classes qui les ont engendres. Nous avons en premier
lieu recherche ces attributs.
100 CHAPITRE 4. CLASSIFICATION

4.2.1 Param`
etres initiaux

Dans cette entreprise, la premi`ere etape consiste `a determiner un ensemble de param`etres


physiologiquement pertinents. Nous en avons retenu cinquante-cinq (donnes en annexe A),
caracterisant chacun des proprietes specifiques du signal de variation de pression arterielle.

En premier lieu, nous realisons une detection des instants de battements cardiaques par
la technique presentee au paragraphe 2.4.4. Les intervalles successifs entre deux battements
cardiaques intervenant respectivement aux instants tk et tk+1 , donnent une estimation de la
frequence cardiaque instantanee :
1
fc (k : k + 1) = (4.1)
tk+1 tk
Lensemble des estimations instantanees du rythme cardiaque forme un signal (echantillonne
non reguli`erement) que nous caracterisons par sa moyenne (param`etre 1), sa variance
(param`etre 2), sa valeur mediane(1 / param`etre 3), ainsi que ses valeurs extremales.

Lestimation de la frequence respiratoire delivree par lestimateur decrit en 3.23 fait


egalement partie des param`etres retenus (param`etres 12 et 13).

Par la suite, le signal est presente `a un banc de filtres, de sorte `a isoler quatre bandes
spectrales. La premi`ere est centree autour de la frequence respiratoire et la seconde autour
de la frequence cardiaque. La troisi`eme est definie pour correspondre aux contributions
haute frequence des signaux phyisologiques. Enfin, la derni`ere bande comprend le reste des
frequences. Nous supposons quelle est essentiellement constituee de bruit. Lenergie totale
de chacune de ces bandes est calculee (param`etres 14 `a 17) et sert `a determiner la repartition
relative de lenergie du signal de variation de pression arterielle entre ces differentes bandes
(param`etres 18 `a 23).

Ce meme signal peut aussi etre caracterise par les coefficients de sa modelisation au-
toregressive, etablissant une estimation s(n) de sa valeur actuelle s(n), `a partir de ses J
valeurs precedentes :
J1
X
s(n) = aj s(n j) , n = 1, . . . , N (4.2)
j=0

Les aj sont les coefficients caracteristiques du mod`ele. Pour des raisons de convenience
mathematique (en vue de leur utilisation sur un processeur embarque), nous nutilisons pas
directement les coefficients aj , mais des coefficients derives de ceux-ci, les coefficients de
correlation partielle, ou PARCOR (pour PARtial CORrelation), notes cj . Ils sont donnes par
la recurence :
j1
" #
1 X j1
cj = (j) ai (j i) j = 1, . . . , P (4.3)
Ej1
i=1
N 1
1 X
avec (m) = s(n)s(n m) (4.4)
N
n=0
et E(j) = (1 c2j )Ej1 , E(0) = (0) (4.5)

4.2. SELECTION `
DES PARAMETRES PAR LA CLASSIFICATION
UTILISES 101

O` u les coefficients aji correspondent au predicteur (4.2) dordre j. Ces coefficients forment les
param`etres 24 `a 36. La valeur de P est fixee `a 20, ce qui signifie que le calcul des coefficients
PARCOR etablira le lien entre chaque point du signal et les vingt points le precedant. Le
signal etant echantillonne `a 256Hz (ou 128Hz pour ceux issus du laboratoire de Nantes),
cela implique que lestimation de lechantillon courant se fait `a partir des 8ms precedentes.
Il sagit donc dune prediction `a court terme. Cependant, notre signal presente egalement
une periodicite forte `a la frequence moyenne de 1Hz, liee aux battements cardiaques. Il
est donc interessant de determiner les param`etres caracterisant le syst`eme modelisant cette
periodicite. Pour cela, nous avons conserve la valeur de P mais nous avons sous-echantillonne
le signal, `a la frequence de 16Hz. Ainsi, le mod`ele est cette fois en mesure dintegrer la
periodicite cardiaque. Les coefficients PARCOR associes `a cette modelisation long-terme
correspondent aux param`etres 37 `a 49.

Enfin, les derniers param`etres (50 `a 55), caracterisent la modulation respiratoire du


signal de variation de pression arterielle. La contribution respiratoire est estimee selon le
syst`eme decrit en figure 3.12.

Appelons X cet ensemble compose des variables principales (X = {x1 , . . . , x55 }). Nous
avons egalement retenu les variables inverses de ces 55 param`etres cest-`a-dire que pour
chacun des param`etres xi appartenant `a lensemble X, nous avons calcule le param`etre 1/xi .
Portant sur les memes caracteristiques que les variables principales, les variables inverses
poss`edent des proprietes statistiques, notamment en terme de biais et de variance, qui sont
differentes de celles des variables principales, pouvant conduire `a une meilleure detection de
linformation. Ce second ensemble est appele 1/X.

Dans un second temps, nous nous sommes interesses `a levolution temporelle `a court terme
de ces param`etres. Plus precisement, nous avons cherche `a evaluer la variation de la valeur
de ces param`etres entre une epoque et la suivante. Nous avons ainsi calcule les ensembles de
param`etres X(n, n 1), X%(n, n 1) et X%(n, n 1) definis comme suit :

X(n, n 1) {X, 1/X}n {X, 1/X}n1 (4.6)


{X, 1/X}n
X%(n, n 1) (4.7)
{X, 1/X}n1
{X, 1/X}n {X, 1/X}n1
X%(n, n 1) (4.8)
{X, 1/X}n

Nous avons caracterise de la meme facon levolution `a moyen terme de ces param`etres en
calculant X(n, n 3), X%(n, n 3) et X%(n, n 3). Ce dernier groupe permet dobserver
les variations sur une duree de lordre de la minute et demie.

4.2.2 S
election des param`
etres pertinents

Pour selectionner les param`etres les plus pertinents, nous avons choisi de leur appliquer
un test statistique, le lambda de Wilks. Cette valeur est obtenue par la somme des variances
intraclasse de ce param`etre sur la somme totale des variances de celui-ci [74]. Le lambda de
Wilks fournit une valeur comprise entre 0 et 1 et qui est dautant plus petite que la variable
est pertinente pour qualifier les signaux observes.
102 CHAPITRE 4. CLASSIFICATION

Afin de separer les erreurs destimation des param`etres (qui peuvent etre corrigees par
ailleurs) de la mesure de leur pertinence, nous avons choisi de realiser ce test statistique sur
un ensemble le plus caracteristique possible de chacun des stades. Pour cela, nous navons
retenu que les epoques :
Int`egres, cest `a dire qui ne suivent pas ou ne prec`edent pas une zone de bouge ;
Typiques, cest `a dire que lepoque suivante et lepoque precedente appartiennent au
meme stade que lepoque courante.
Au final les epoques satisfaisant ces deux conditions ne representent que 20% des epoques
de lensemble de la base.

` lissue de cette etape, nous conservons les param`etres dont le lambda de Wilks atteint
A
une valeur inferieure `a 0.98. Ces param`etres sont indiques en gras dans la liste donnee en
annexe B. Il faut savoir que cette valeur de seuil est plutot haute. Il est plus courant de
considerer comme non pertinents des param`etres dont le lambda de Wilks est superieur `a
0.9. Cependant, nous savions que, de par les informations disponibles dans la litterature au
sujet de la detection des stades de sommeil `a partir de donnees cardiorespiratoires, aucun
dentre eux ne serait tr`es pertinent `a lui seul et cest pourquoi nous pensons que le pouvoir
de decision ne peut se faire quavec le concours dun maximum dinformations elementaires.

Parmi les param`etres saverant pertinents on retrouve le rapport entre frequence respira-
toire et frequence cardiaque (param`etre 13). On retrouve ensuite (et surtout) les param`etres
exprimant la decomposition energetique du signal de variation de pression arterielle sur
differentes bandes spectrales (param`etres 13 `a 21). Les coefficients PARCOR sav`erent
interessants egalement, surtout ceux lies `a la modelisation `a 256Hz du signal (param`etres
24 `a 36). On note egalement que lestimation du signal respiratoire, obtenue par filtrage du
signal de variation de pression arterielle est pertinente (param`etres 52, 107, 105 et 110).

On retrouve essentiellement les meme param`etres lorsquon sinteresse au groupe des


param`etres inverses. On notera toutefois que linverse de la frequence respiratoire apparat
(alors que la frequence respiratoire nest pas pertinente), de meme que linverse de lamplitude
du signal respiratoire dans le signal de variation de pression arterielle. Ceci sexplique par le
fait que les variables 1/xi nont pas les memes proprietes statistiques en terme notamment
de biais et de variance que les variables xi .

Cas du suivi de patient

Lune des applications envisagees concerne le suivi du sommeil du patient sur plusieurs
nuits. Il est possible, dans ce cadre, de realiser un enregistrement de sommeil par les
techniques medicales habituelles, et dutiliser les informations collectees durant cette nuit
pour permettre au bracelet de realiser une classification automatique efficace des nuits
suivantes. Or, dans ce cas, certains param`etres specifiques au patient peuvent saverer
interessants alors quils ne le sont pas `a lechelle dune population.

Pour le verifier, nous avons pris separement chacune des nuits de la base dapprentissage,
et nous avons calcule le lambda de wilks de chacun des param`etres. Puis, nous avons moyenne
les resultats obtenus par chacun des param`etres sur les differentes nuits afin de faire ressortir
les plus pertinents dentre eux `a lechelle dune nuit, sans etre specifiques au patient. Formel-

4.2. SELECTION `
DES PARAMETRES PAR LA CLASSIFICATION
UTILISES 103

lement, si lon nomme W k = [w1,k , w2,k , . . . , w440,k ] le vecteur indiquant la valeur, calculee
sur la nuit k (k = 1, . . . , K), des lambda de wilks des quatre-cent-quarante param`etres decrits
plus hauts, alors on etudie le vecteur W = [w1 , w2 , . . . , 440 ], dont chacun des elements wi
est calcule selon :
K
1 X
wi = wi,k (4.9)
K
k=1

Ce vecteur est donnee dans lannexe C. Nous avons porte en gras les trente-cinq
param`etres les plus pertinents, afin de pouvoir comparer ces donnees au cas precedent, dont,
dapr`es le crit`ere applique, trente-cinq param`etres etaient qualifies de pertinents.

La premi`ere chose que lon remarque est que les param`etres utilises sav`erent en moyenne
beaucoup plus pertinents que lors de lutilisation de la base globale, puisque les valeurs
atteignent notamment 0.82. Ensuite, les groupes S(1), D(1), DC(1) et S(3), D(3), DC(3) ne
sav`erent pas plus pertinents que dans le cas de la population totale. On peut supposer que
limprecision liee `a lestimation des param`etres est superieure `a la variation de ceux-ci entre
une epoque et ses suivantes, de sorte que la mesure de cette variation ne soit pas pertinente.

Quant aux param`etres pertinents, on note une difference fondamentale : cette fois, la
frequence respiratoire ressort tr`es clairement puisque les deux param`etres les plus importants
sont cette variable et son inverse (param`etres 3 et 58). La frequence cardiaque est pertinente
egalement par le biais des param`etres inverses (param`etres 56 `a 62). On retrouve aussi les-
timation du signal respiratoire dans le signal de variation de pression arterielle (param`etres
50, 51 et 105, 106).

Par contre, ce sont les coefficients PARCOR lies `a la modelisation `a 16Hz, et non ` a
256Hz comme auparavant, qui sav`erent les plus pertinents pour ce probl`eme. Il est possible
que les formes dondes de pression arterielle des individus constituant la base presentent des
dissemblances telles que celles-ci ne permettent pas lapprentissage de la correlation `a long
terme `a lechelle de la population, alors que ce param`etre est pertinent lorsquon sinteresse
au signal issu dun patient. On note egalement que la decomposition frequentielle, pourtant
tr`es importante `a lechelle de la population, ne lest plus `a lechelle dune nuit.

En dehors de nous indiquer les param`etres `a utiliser dans le cas dun suivi de patient, cette
analyse nous apprend que, vraisemblablement, il existe certains param`etres, non determines
pour linstant, qui pourraient saverer interessants pour lanalyse du sommeil. Par exemple, le
fait que la frequence respiratoire soit pertinente `a lechelle des individus pris separement mais
pas `a lechelle de la population suppose que lactivite respiratoire est effectivement correlee
au sommeil. Cependant, la frequence respiratoire en elle-meme est dependante du patient sur
lequel elle est mesuree et cest pourquoi elle nest pas utilisable pour caracteriser la population.
Il reste quil existe un lien entre la frequence respiratoire et le sommeil chez tous les individus
de la population, mais le param`etre permettant de le qualifier reste `a determiner.

4.2.3
Elimination des param`
etres redondants

Il est toujours preferable de reduire le nombre de param`etres utilises pour la classi-


fication. Dabord parce que plus le vecteur `a classer est de dimension reduite et plus le
104 CHAPITRE 4. CLASSIFICATION

co
ut calculatoire de la classification sera faible. Ensuite, parce quavec un meme nombre
dobservations, la modelisation des classes de reference sera dautant moins erronee que le
nombre de param`etres `a estimer sera faible. Nous discuterons dailleurs plus loin de ce point.
Cest pour cette raison que nous avons cherche `a eliminer, parmi la selection retenue, les
param`etres redondants. Pour cela nous avons pratique un test de correlation.

Nous avons considere comme correles les param`etres dont le coefficient de correlation
(dans la base de test ou dapprentissage) atteint ou depasse la valeur 0.5. Nous avons
elimine de la liste des param`etres pertinents les param`etres correles. Pour cela, nous avons
retenu, lorsque deux param`etres sont correles, celui dont le lambda de Wilks est le plus faible.

Nous disposons au final de 25 param`etres pertinents non correles, signales par une etoile
dans la liste donnee en annexe B. Nous avons fait le choix de ne pas etre trop sev`eres dans la
selection et de conserver un nombre relativement eleve de param`etres au regard des methodes
de selection dans la mesure o` u certains param`etres pris en couple peuvent saverer plus
informatifs que pris separement [75].

4.3 Description g
en
erale de la classification

Une fois les param`etres determines, il nous faut choisir une methode de classification.
Nous presentons dans ce paragraphe un apercu des methodes classiquement utilisees, parmi
lesquelles seffectuera notre choix.

Les techniques de classification peuvent se regrouper en deux grandes familles :

La classification non supervisee, qui consiste `a regrouper des elements ayant un


comportement similaire (au sens dun crit`ere `a definir) dans des classes inconnues au
prealable. Il ny a donc pas lieu de disposer ici dun ensemble dapprentissage. La r`egle
de classification consiste alors `a decouper lespace en plusieurs sous-espaces selon le
crit`ere de similarite reliant les elements.

La classification supervisee, qui consiste `a classer des elements dun ensemble `a partir
de la connaissance a priori dun ensemble dapprentissage (lensemble dapprentissage
etant defini comme un ensemble dobservations dont on connat pour chacune la
classe `a laquelle elle appartient). La r`egle de classification consiste dabord `a decouper
lespace de representation des elements `a classer et `a attribuer `a chacune des zones de
ce decoupage une des classes definies a priori (cest la phase dapprentissage), puis `a
classer les elements en fonction de leur position dans lespace ainsi structure (cest la
phase de classement).

Dans notre cas, le probl`eme `a resoudre consiste `a realiser une classification automatique
dont les classes de sortie souhaitees sont identifiees puisquil sagit des stades (ou des groupes
de stades) de sommeil, tels que definis par les r`egles de Rechtshaffen et Kales. Notre objectif
nous place donc dans le cadre de la classification supervisee et cest pourquoi nous ne
developperons que ce type de classification.

Il existe, pour realiser une classification supervisee, plusieurs familles dalgorithmes. La


ERALE
4.3. DESCRIPTION GEN DE LA CLASSIFICATION 105

figure 4.2 presente bri`evement les plus classiques dentre elles, que nous decrivons ci-apr`es.

Fig. 4.2 Representation des techniques de classification

4.3.1 Les r
eseaux de neurones

Cette technique fait partie de celles que nous avons utilisees et nous la developperons
donc ulterieurement (paragraphe 4.5).

4.3.2 Les surfaces s


eparatrices lin
eaires

Une surface separatrice lineaire est un hyperplan. Cest `a laide de cette forme geometrique
simple quest realise lapprentissage dun concept. Dans le cas dun vecteur de dimension
trois par exemple, on va supposer que deux classes sont separees par une certaine surface,
definie par une equation dont les param`etres doivent etre estimes. Il est en general impossible
106 CHAPITRE 4. CLASSIFICATION

de trouver un hyperplan qui separe parfaitement les points dapprentissage et on se contente


donc de chercher un hyperplan discriminant qui en est une approximation, au sens dun
certain crit`ere `a fixer. Le probl`eme de lapprentissage de surfaces lineaires se resume donc
`a la recherche des param`etres de lequation de la surface separant le mieux possible les
points dapprentissage des deux classes dans lespace Rd , pourvues de la meilleure faculte de
generalisation possible.

Le probl`eme devient complexe dans le cas o` u le nombre de classes est superieur `a deux
car alors, de par la nature de la surface (lineaire), il apparat des zones dambigute. Une
premi`ere methode est dapprendre, pour chaque classe, un hyperplan qui la discrimine de
toutes les autres. Cela conduit `a de nombreuses zones de classification ambigues : au-del`a de
2
trois classes, pour n hyperplans construits, lespace Rd est partage en n +n+2
2 zones convexes.

La figure 4.3 represente le cas de trois classes (C1, C2, C3) o`


u se croisent trois hyperplans.
Il apparat donc sept zones convexes. Les zones blanches sont les zones representatives des
classes alors que les zones colorees sont les zones ambigues entre les classes. Le triangle central
est une zone ambigue entre les trois classes.

Fig. 4.3 Separation lineaire `a trois classes

Une solution remediant `a ce probl`eme consiste `a rechercher une surface discriminante


entre chaque couple de classes. Il ne subsiste alors quune seule zone dambigute. Mais cette
technique necessite le calcul de C(C1)
2 jeux de param`etres au lieu de C, dans le cas de C
classes.

Au-del`a de la gestion des ambigutes, le principal frein `a lutilisation dune telle technique
dans notre probl`eme est que rien ne laisse supposer que les surfaces discriminant nos classes
soient lineaires. Or, calculer des surfaces discriminantes non lineaires oblige `a augmenter le
nombre de param`etres `a apprendre, et en augmentant trop le degre de la surface, le risque
daboutir `a un apprentissage par cur devient consequent. Pour ces raisons, la recherche
de surfaces discriminantes se limite en pratique `a celle dhyperplans. Notons enfin que les
reseaux de neurones `a couches cachees calculent implicitement des hyperplans par morceaux
[75] et nous avons donc privilegie cette derni`ere methode, plus simple `a mettre en oeuvre.
ERALE
4.3. DESCRIPTION GEN DE LA CLASSIFICATION 107

4.3.3 Les m
ethodes bay
esiennes

Lapprentissage bay
esien

Il est possible dassocier `a chaque classe ci C = {c0 , c1 , . . . , CL1 } une densite de


probabilite p(x|ci ), regissant la generation dun vecteur x de dimension d (x represente le
vecteur regroupant les param`etres physiologiques et d le nombre de ces param`etres) lorsquon
est en presence de cette classe ci . Lors de la phase de classification, nous calculons le vecteur xk
correspondant `a lepoque k et on cherche `a lattribuer `a une classe ci . La r`egle de decision du
maximum a posteriori (MAP) ou r`egle bayesienne consiste `a classer ce vecteur de param`etre
dans la classe qui est la plus probable au vu de ce vecteur xk . Pour cela, il est necessaire de
proceder au calcul, pour chaque classe ci , de la probabilite detre en presence dun echantillon
issu de cette classe sachant que lon observe xk , puis de determiner la classe qui maximise
cette probabilite. On peut formuler ceci en terme de probabilites par la relation suivante [75] :
c = argci max P (ci |x) (4.10)

Afin de determiner cette probabilite, il est necessaire de faire intervenir la r`egle de Bayes.
Celle-ci nous apprend que P (ci |x) = p(x|cp(x) i )P (ci )
, o`
u p(x) represente la densite de probabilite
dobservation du vecteur x, P (ci ) represente la probabilite dapparition a priori de la classe
ci et p(x|ci) la densite de probabilite de la classe ci au point x. Cette propriete nous permet
de reecrire la r`egle de classification de la facon suivante :
 
p(x|ci )P (ci )
c = argci max (4.11)
p(x)
Le terme p(x) ne dependant pas de la classe, il intervient identiquement pour chacune
delle et il nest donc pas necessaire de proceder `a son calcul. La r`egle se simplifie par :
c = argci max p(x|ci )P (ci ) (4.12)

P (ci ) represente la probabilite a priori dapparition de la classe ci . Pour estimer les


valeurs P (ci ), on peut, en labsence dinformation particuli`ere, supposer lequiprobabilite
des L classes et utiliser lestimation P (ci ) = 1/L i. Il est egalement possible de supposer
lensemble dapprentissage representatif et destimer ces probabilites par les frequences
dapparition de chacune des classes ci dans cet ensemble. Lestimation donne P (ci ) = mi /M ,
o`u mi represente le nombre de points de lensemble dapprentissage affectes `a la classe
ci et M le nombre total delements de cet ensemble. Dans notre cas, il convient, pour
le test des algorithmes, destimer sur lensemble dapprentissage les probabilites a priori
puisque la population cible est particuli`ere et donc ne repond pas aux statistiques generales
(cf.paragraphe 4.1.1).

Enfin, p(x|ci ) represente la densite de probabilite demission du vecteur x, sachant quil


sagit dun element issu de la classe ci . Celle-ci peut se determiner en utilisant lensemble dap-
prentissage. On distingue pour cela les methodes parametriques, pour lesquelles on suppose
que les p(x|ci ) poss`edent une certaine forme analytique, des methodes non parametriques, o` u
aucune hypoth`ese nest emise sur la nature de la distribution des param`etres.

Les m
ethodes bay
esiennes param
etriques

Lune des representations les plus communes consiste `a supposer les distributions gaus-
siennes. Ainsi, le probl`eme se ram`ene `a estimer le vecteur moyen et la matrice de covariance
108 CHAPITRE 4. CLASSIFICATION

de chaque distribution. La probabilite dappartenance dun point x `a une classe se calcule


alors directement `a partir des coordonnees de x. Nous reviendrons sur les details de cette
technique au paragraphe 4.4.

Les m
ethodes bay
esiennes non param
etriques

Lestimation non parametrique dune densite de probabilite est une estimation locale,
cest-`a-dire que lon estime les densites conditionnelles en observant les elements de lensemble
dapprentissage qui sont autour de ce point. Il sagit donc destimer la densite de probabilite
p(x|ci ) en un point x quelconque de lespace de representation des elements `a classer, `a
partir de la seule connaissance des mi elements de la classe ci contenus dans lensemble
dapprentissage A. Pour realiser cette estimation, on commence par delimiter une region
P (de volume V ) autour du point x considere. Puis on denombre le nombre ki delements
de lensemble A contenus dans ce volume V . Enfin, on estime la densite p(x|ci ) grace `a
lestimateur :
ki /mi
pb(x|ci ) = (4.13)
V
O`u ki est le nombre de points de A contenus dans le volume V entourant x, et mi represente
le nombre de points de A issus de tirages independants selon la densite p(x|ci ) presents dans V .

Il existe deux grandes methodes utilisant ce principe destimation non parametrique :


la methode de Parzen, pour laquelle le volume Vi est fixe et on compte le nombre ki
delements de A contenus dans ce volume ;
la methode des k-plus proches voisins, pour laquelle le nombre ki est fixe et on
determine le volume Vi qui contient exactement ce nombre delements de A.

Ces methodes imposent une connaissance des densites de probabilite qui soient ponctuelles
dans le sens o`u, pour chaque point de lespace de representation des elements `a classer nous
sommes obliges de connatre la valeur de cette densite. Le syst`eme doit alors avoir en memoire,
au moment de la phase de classification, lensemble dapprentissage. Or, ce co ut memoire est
prohibitif au regard du syst`eme que nous souhaitons mettre au point, qui est embarque. Cest
pourquoi nous navons pas employe ce type de technique.

Les m
ethodes semi-param
etriques : le mod`
ele de Markov cach
e

Il existe aussi des methodes dites semi-parametriques, appelees ainsi du fait quelles
nimposent pas a priori de forme analytique pour les distributions de probabilites. Cependant
elles supposent que ces distributions suivent des lois. Les mod`eles de Markov se situent dans
cette branche de la decision bayesienne.

Un mod`ele de Markov est un automate `a M etats caracterise par une probabilite


a(m, m0 ) de passer dun etat m `a un etat m0 . Un exemple `a deux etats est donne sur la figure
4.4. Intuitivement la nuit se modelise assez bien par un mod`ele de Markov, chaque etat
representant un stade (ou un groupe de stades) de sommeil. Un mod`ele de Markov cache
reprend ce mod`ele, en ajoutant le fait quun symbole est emis avec une certaine probabilite
dans chacun des stades, la distribution de ces probabilites etant variable dun stade `a un
autre. Le mod`ele est dit cache dans la mesure o` u on nacc`ede pas directement `a la suite des
4.4. CLASSIFICATION GAUSSIENNE 109

Fig. 4.4 Le mod`ele de Markov observable `a deux etats et ses probabilites de transition

Eveil Stade 1 Stade 2 Stade 3 Stade 4 SP


Eveil 99.5349 0.2714 0.1156 0.0426 0.0376 0.1776
Stade 1 0.2584 98.9440 0.0400 0.0019 0.0000 0.1562
Stade 2 0.1785 0.4218 99.7683 0.1432 0.0102 0.0021
Stade 3 0.0012 0.0000 0.0681 99.7330 0.0956 0.0000
Stade 4 0.0012 0.0000 0.0000 0.0793 99.8531 0.0021
SP 0.0258 0.3628 0.0081 0.0000 0.0034 99.6599

Tab. 4.1 Probabilites de transition entre les stades (en %)

etats mais seulement `a la suite des symboles. Cest le cas de notre application : les etats
sont les stades de sommeil, les symboles sont les vecteurs de param`etres, et on cherche les
premiers `a partir de la connaissance des seconds.

Il existe des algorithmes permettant de determiner les param`etres de ce mod`ele puis


de retrouver la succession des etats (des stades) `a partir de la succession des symboles.
Cependant, dans notre cas, les probabilites de transitions sont telles qu`a partir du moment
o`
u le processus est entre dans un etat, il lui est quasiment impossible den sortir et donc
de transiter (voir le tableau 4.1 qui donne les probabilites de transition calculees sur nos
donnees). Or, de par la nature des signaux utilises, on imagine assez bien que lestimation
des param`etres sera affectee par des erreurs (biais et variance des estimateurs, bruits...). En
raison des probabilites de transition, cette erreur est susceptible davoir des consequences ` a
long terme. Cest pourquoi, nous avons opte pour des techniques de classification epoque par
epoque cest-`a-dire nincluant pas les epoques precedentes et suivantes pour la determination
de lepoque courante. Par contre, une methode de rescorage utilisant les mod`eles de Markov
caches sera presente au paragraphe 4.6.2.

4.4 Classification gaussienne

Apr`es avoir decrit les differentes techniques existantes, et elimine celles qui ne sont pas
applicables `a notre probl`eme, nous pouvons nous concentrer sur les methodes susceptibles de
repondre `a notre probl`eme, en particulier la classification gaussienne.
110 CHAPITRE 4. CLASSIFICATION

4.4.1 Principe th
eorique

Comme nous lavons dit, une des methodes pour estimer convenablement les densites de
probabilite des param`etres est de leur imposer pour mod`ele des fonctions parametrees. Cha-
cune des densites sexprime en fonction dun certain nombre de param`etres, que lon notera
sous la forme vectorielle. Il sagit donc destimer le vecteur de param`etres, puis dappliquer
la r`egle de decision bayesienne (4.12) en remplacant les probabilites par leur estimees. Nous
avons dej`a appris `a estimer P (ci ) par P (ci ) = mi /M , reste `a estimer p(x|ci ).

Lestimation des param`


etres dune distribution gaussienne

Dans le cas monogaussien, on suppose que la distribution de probabilite de chaque classe


est une loi normale, enti`erement definie par lensemble des param`etres = (, Q)T compose
de son vecteur moyenne et de sa matrice de covariance.
Rappelons que la moyenne dune densite de probabilite dans Rd est un vecteur de
dimension d et sa covariance une matrice Q de dimension d d definis par :

= E[x] et Q = E[(x )(x )T ] (4.14)

Une distribution de probabilite gaussienne a pour caracteristique de pouvoir enti`erement


etre definie par son vecteur moyenne et sa matrice de covariance. En supposant donc la classe
ci gaussienne, sa densite de probabilite secrit, dans un espace multidimensionnel :

|Q|1/2
 
1 T 1
p(x|ci ) = exp (x i ) Qi (x i ) (4.15)
2 d/2 2
Compte tenu des mi points dapprentissage {x1 , . . . , xj , . . . , xmi } relatifs `a la classe ci , il est
demontre que les estimateurs optimaux de sa moyenne i et de sa matrice de covariance Qi
au sens du maximum de vraisemblance se calculent simplement par :
mi
1 X

i = xj (4.16)
mi
j=1
mi
i = 1 X
Q (xj i )T
i )(xj (4.17)
mi
j=1
(4.18)

Mise en application

La r`egle de decision bayesienne consiste donc `a attribuer `a lepoque testee la classe


ayant la probabilite P (ci |x) la plus elevee, avec i [1; L]. On utilise pour cela la relation 4.12.

On calcule la probabilite donnee par cette relation pour i variant de 1 au nombre


de classes. Puis nous attribuons au vecteur (`a lepoque) la classe ayant la probabilite
maximale. Nous avons donc utilise les i comme sil sagissaient de la valeur de probabilite
a posteriori. Or, par construction, ces valeurs ne sont pas des probabilites. Par contre elles
sont proportionnelles aux probabilites desirees et respectent le meme ordre. Cest pourquoi
nous pouvons utiliser ces valeurs pour determiner la classe maximisant la probabilite que
x soit un de ses elements. Par contre il ne faut pas perdre de vue que ce ne sont pas des
4.4. CLASSIFICATION GAUSSIENNE 111

probabilites, et donc quon ne connat donc pas leur dynamique.

Les premiers essais que nous avons menes avec cette technique de classification condui-
saient `a attribuer le meme stade de sommeil (la meme classe) `a toutes les epoques. En raison
des valeurs numeriques utilisees dans la base de donnees, la relation 4.15 pose des probl`emes
de calcul, lies `a la quantification des variables. Une solution pour sen affranchir consiste `
a
calculer non plus p(ci |x) mais log(p(ci |x)), ce qui ne change rien au resultat final dans la
mesure o` u la fonction log est croissante et que nous traitons de donnees strictement positives.
La relation 4.15 devient :
d 1
log(p(ci |x)) = log P (ci ) 1/2 log(|Qi |) + log(2) (x i )T Q1
i (x i ) (4.19)
2 2

4.4.2 Analyse du caract`


ere gaussien des param`
etres

La classification gaussienne repose sur une modelisation gaussienne des distributions


de param`etres. Elle ne peut donc, en toute rigueur, etre appliquee qu`a des probl`emes
satisfaisant cette modelisation. Nous nous sommes donc interroges sur la vraisemblance de
lhypoth`ese gaussienne dans notre application.

Dapr`es [76], on sait que X est un vecteur gaussien ` a p dimensions si toute combinaison
lineaire de ses composantes suit une loi de Laplace-Gauss ` a une dimension. Donc si un vecteur
est gaussien alors ses coordonnees sont des variables aleatoires gaussiennes. Pour determiner
si un vecteur est gaussien, il suffit donc de verifier le caract`ere gaussien de chaque param`etre
du vecteur. Sils ne sont pas gaussiens, alors le vecteur ne lest pas non plus. Nous avons
envisage plusieurs tests permettant deffectuer cette operation. On citera notamment :
Le test de Shapiro et Wilks mais ce test ne convient que pour des bases contenant au
plus cinquante points.
Le test de Kolmogorov-Smirnov, mais ce test necessite de connatre par avance les
param`etres de la distribution, ce qui nest pas notre cas.
Le test du chi2 est applicable `a notre probl`eme et nous lavons donc employe.
Le test de Lilliefors, que nous avons egalement utilise.

Le test du Chi2

Ce test nest applicable qu`a des lois discr`etes mais nous pouvons discretiser nos distri-
butions en les decoupant en intervalles. Une fois cette repartition effectuee, on calcule la
probabilite que lobservation ait ete generee par la loi gaussienne theorique estimee. Puis on
calcule la distance entre la loi observee et la loi theorique de la distribution (estimee `a partir
des donnees). Cette variable aleatoire suit une loi du chi2. On la compare `a une valeur tabulee.
Si la distance est superieure `a cette valeur, alors le param`etre teste nest pas gaussien.

Le test de Lilliefors

Ce test permet de tester ladequation `a une loi normale dont les param`etres sont estimes
sur les donnees `a tester. Son principe est de verifier si la distribution f inconnue dune
population nest pas trop eloignee de la famille des lois gaussiennes. On teste les hypoth`eses :
H0 : f est une loi normale de moyenne et de variance quelconque ;
112 CHAPITRE 4. CLASSIFICATION

H1 : f nest pas une loi normale de moyenne et de variance quelconque.


Lechantillon teste doit etre un echantillon de variables aleatoires continues et
independantes, de meme fonction de repartition inconnue F (x). On definit la variable z, et
on calcule la distance entre la fonction de repartition de Z avec celle de la loi theorique. On
rejette lhypoth`ese H0 au profit de lhypoth`ese H1 si la distance est superieure `a une valeur
tabulee. Le test est effectue avec un risque de premi`ere esp`ece de 5% (probabilite de rejeter
lhypoth`ese H0 alors quelle est vraie).

Ces deux tests ont conduits `a une reponse negative quant au caract`ere gaussien des
param`etres. Ce nest pas le cas de tous, bien au contraire, mais un certain nombre dentre eux
presentent des similitudes avec une distribution gaussienne, sans pour autant etre gaussiens.
Ainsi, ils sont centres, avec une dispersion globalement monotone decroissante et symetrique
autour de la moyenne, `a lexemple du param`etre 1, dont la distribution est donnee sur la figure
4.5. Pour cette raison, mais surtout pour la simplicite de mise en uvre de cette methode,
nous avons quand meme decide devaluer la performance dune classification gaussienne.

Fig. 4.5 Distribution des valeurs du param`etre 1 (periode cardiaque moyenne de lepoque.

4.4.3 Premiers r
esultats de la classification par mod
elisation gaussienne

Pour la presentation des resultats nous distinguerons lecriture stade 0, qui represente
lensemble des epoques de stade 0 de sommeil (deveil donc), de lecriture stade 0 , qui
represente la classe intitulee stade 0. Precisons que le syst`eme, dans un premier temps, realise
une classification en six classes (stade 0 `a stade 5 ), censees correspondre respectivement aux
six stades de sommeil.

Classification gaussienne appliqu


ee aux six stades du sommeil

Dans un premier temps nous realisons lapprentissage sur 70% des epoques constituant la
base dapprentissage. Puis, le mod`ele de classification est teste sur les epoques restantes, qui
representent donc 30% de cette base. On effectue une mesure de rappel cest-`a-dire que lon
denombre, pour chacun des stades, le nombre depoques classees identiquement `a la reference.
Ainsi, le chiffre indique ci-dessous correspondant au stade 0 represente la proportion depoques
de stade 0 (deveil) effectivement classees par le mod`ele en tant que stade 0. Cette mesure
permet devaluer la performance pure du syst`eme, mais est `a considerer en ne perdant pas
4.4. CLASSIFICATION GAUSSIENNE 113

de vue la proportion de chacun des stades dans la base testee. On obtient les resultats portes
ci-dessous :

stade 0 : 63% stade 1 : 12% stade 2 : 29% stade 3 : 27% stade 4 : 82% stade 5 : 48%

Il ressort que le stade 4 est bien classe, et les stades 0 et 5 le sont moyennement. Le stade
2 lest insuffisamment. Il en va de meme pour les stades 1 et 3 mais cela est moins grave
dans la mesure o` u ces deux stades cumules representent environ 10% de la nuit.

Si on sinteresse `a la matrice de confusion, qui detaille la classification de chaque stade,


on se rend compte que le stade 1 est majoritairement classe en stades 0 et 2, ce qui est en
accord avec sa definition physiologique. Rappelons que cest un stade de transition entre
leveil et le stade 2, ce dernier correspondant veritablement au premier stade de sommeil.
Il en va de meme pour le stade 3, majoritairement classe en stade 4. En ce qui concerne le
stade 0, lerreur vient essentiellement de ce que certaines epoques sont classees en stade 4.
La meme raison explique la majorite de lerreur correspondant aux stades 2 et 5. Enfin,
16% des stades 5 sont classes en stade 0. One ne peut donc pas dire que la classification soit
tr`es bonne, bien quil sagisse de donnees proches des donnees dapprentissage puisquissues
des memes patients. Cependant, les principaux stades (0, 4 et 5) sont majoritairement bien
classes.

Si lon realise une moyenne ponderee des resultats par stades, en utilisant pour
ponderation la proportion de chaque stade dans la base consideree, on obtient une mesure
de classification moyenne de 46%.

Dans un second temps, la capacite de generalisation du mod`ele est testee en realisant la


classification des epoques de la base de test. On obtient les resultats suivants :

stade 0 : 59% stade 1 : 6% stade 2 : 35% stade 3 : 4% stade 4 : 14% stade 5 : 3%

Globalement, on peut dire que le mod`ele ne poss`ede pas de bonne capacite de


generalisation. Hormis les stades 0 et 2, les autres stades ne sont jamais detectes. Lana-
lyse de la matrice de confusion montre que ces autres stades sont aussi classes en 0 et 2.
Ainsi, 40% des epoques de stade 4 et 26% de celles du stade 5 sont classes en stade 0, tandis
que sont classes en stade 2 25% des premi`eres et 42% des secondes. En conclusion, le mod`ele
a une tendance `a classer en stades 0 et 2 lensemble des epoques. La mesure de classification
moyenne telle que definie precedemment donne 22%.

Regroupement des stades de sommeil physiologiquement proches

Dans un second temps, nous groupons les stades 1 et 2 pour creer une classe sommeil
lent leger que lon notera classe 1, et les stades 3 et 4 pour creer une classe sommeil lent
profond, que lon notera classe 2. La raison en est que physiologiquement, ces etats sont
proches. En consequence, il est possible que la discrimination soit difficile `a realiser dun
point de vue physiologique, ces deux etats sinterpenetrant. On peut esperer obtenir une
localisation globale de ces deux etats meilleure que la localisation de chacun de ces stades
114 CHAPITRE 4. CLASSIFICATION

pris separement. On obtient pour les 30% depoques de la base dapprentissage nayant pas
participe `a lapprentissage une mesure de rappel moyenne de 46%, detaille selon les resultats
suivants :

Classe 0 : 84% Classe 1 : 20% Classe 2 : 64% Classe 3 : 50%

Concernant la base de test on obtient une mesure moyenne de 23%. La majorite des
epoques sont classees en classe 0, quel que soit leur stade de reference. Le reste est essentiel-
lement classe en classe 1. Ceci explique les resultats par classes donnes ci-dessous :

Classe 0 : 66% Classe 1 : 30% Classe 2 : 8% Classe 3 : 9%

Conclusions sur ces premiers r


esultats

Ces resultats sav`erent donc decevants. Mais le manque de faculte de generalisation que
lon observe peut etre d u `a un manque de donnees.

En effet, en raison des donnees constituant la base dapprentissage, les concepts appris
sont peut-etre insuffisamment representatifs des classes. En effet, pour maximiser le nombre
de donnees, nous avons utilise les epoques voisines dune transition entre deux stades. Or,
meme dans le cas de la polysomnographie classique, les stades voisins dune transition entre
un stade S et un stade S 0 peuvent presenter `a la fois des caracteristiques du stade S et des
caracteristiques du stade S 0 . Or, il nexiste a priori aucune raison pour quil nen soit pas de
meme avec les param`etres que nous utilisons. Idealement, il aurait donc fallu exclure de la
base dapprentissage toutes les epoques contigues `a une transition, ce que nous navons pu
nous permettre par manque de donnees.

Une seconde explication possible correspond au fait que, pour un nombre de donnees
dapprentissage etabli, le nombre de param`etres utilises influence la qualite de la classifica-
tion. Il faut savoir en effet que la classification par Maximum A Posteriori applique `a un
mod`ele Gaussien necessite lestimation de C(d2 + 3d)/2 variables, avec C, le nombre de
classes et d, la dimension de lespace dobservation [75]. Cela represente, en considerant 6
classes et une trentaine de param`etres, 3000 variables, ce qui est de lordre de grandeur
du nombre dobservations disponibles pour lapprentissage. Cest peu, trop peu, dautant
que les classes, nous avons pu le constater, ne se distinguent pas particuli`erement comme
cest parfois le cas dans certains probl`emes de classification. Lestimation des param`etres du
mod`ele gaussien, en particulier des matrices de covariance, risque donc de se faire avec une
erreur non negligeable. Il nous faudrait donc reduire le nombre de param`etres pour satisfaire
cette contrainte. Mais dun autre cote, on sait que les param`etres sont relativement peu
informatifs et quil est donc necessaire den disposer dun grand nombre pour maximiser
linformation apportee au classifieur. On se retrouve donc face `a un compromis difficile `a
resoudre.

La solution la plus evidente `a ce probl`eme est detoffer la base dapprentissage de sorte


quelle contienne suffisamment de donnees pour etre au-del`a de cette taille critique. Cest
4.4. CLASSIFICATION GAUSSIENNE 115

ce que nous realisons actuellement en incluant les donnees de la base de Nantes. Mais
cette operation est complexe et nous avons d
u chercher dautres solutions pour repondre
rapidement au probl`eme.

En loccurrence, une autre solution consiste `a limiter le nombre de variables `a evaluer. On


peut par exemple imposer des matrices de covariance diagonales, ce qui revient `a supposer
les param`etres decorreles. Mais en le faisant alors que ce nest pas une hypoth`ese averee,
on introduit un biais prejudiciable `a la qualite des resultats. Or on sait que beaucoup des
param`etres utilises sont physiologiquement ou mathematiquement lies entre eux. Cest par
exemple le cas du rythme cardiaque et respiratoire. Au final la modelisation sous-jacente,
meme si elle pourrait etre mieux apprise, ne serait pas suffisamment representative des
donnees et ne permettrait pas desperer une amelioration des resultats.

Il existe enfin une derni`ere solution qui combine lavantage dune reduction du nombre
de param`etres sans linconvenient de perte dinformation. Cette solution consiste `a combiner
les param`etres entre eux par une operation mathematique, de sorte `a concentrer tout leur
apport informatif dans un nombre restreint de param`etres.

4.4.4 Combinaison des param`


etres par fonctions lin
eaires discriminantes

Il existe differentes methodes de combinaison. Elles peuvent etre lineaires comme lAna-
lyse en Composantes Principales (ou ACP) ou non lineaires comme lAnalyse en Compo-
santes Independantes. Nous avons prefere utiliser des methodes lineaires dans un premier
temps. Parmi celles-ci, lACP ne peut convenir dans la mesure o` u elle determine des centres
de gravite, de facon independante des classes. Nous avons utilise lAnalyse Factorielle Discri-
minante (ou AFD) qui, elle, int`egre les classes etablies puisquelle combine les param`etres de
sortie de mani`ere `a dissocier le plus possible les classes, tout en les compactant au maximum.
La reduction de dimension du vecteur `a classer est importante puisque la dimension de sortie
de celui-ci est au maximum egale au nombre de classes (les stades de sommeil ou les groupes
de stade de sommeil dans notre cas) diminue de un soit 5 ou 3 selon la classification souhaitee.

Description de lAFD

En analyse discriminante, les donnees `a etudier constituent un ensemble de n individus o` u


chaque individu est represente `a laide de p variables quantitatives (ou explicatives) et dune
variable qualitative (en loccurrence le stade de sommeil pour nous). Cette derni`ere definie
un crit`ere de regroupement qui decrit les k classes auxquelles appartiennent les individus
presents. Le but de lanalyse discriminante est de mettre en evidence une dependance entre
les p variables quantitatives et la variable qualitative, cette dependance etant mesuree sur
lensemble des individus.

La mise en uvre de lAFD

Elle construit `a partir des variables explicatives initiales un nombre reduit de nouvelles
variables qui discriminent le mieux possible les k classes. Les nouvelles variables sont des
combinaisons lineaires de lensemble des variables explicatives initiales.
116 CHAPITRE 4. CLASSIFICATION

Pour chacune des combinaisons lineaires, les coefficients obtenus constituent un axe
factoriel du sous-espace dans lequel seront projetes les individus. Les coefficients associes
`a la combinaison lineaire ayant le pouvoir discriminant le plus fort engendrent le premier
axe (la premi`ere composante discriminante) du sous-espace. Les coefficients associes `a la
combinaison lineaire ayant le second plus fort pouvoir discriminant et non correlee au
premier axe engendrent le second axe (la seconde composante discriminante) du sous-espace,
et ainsi de suite jusquau dernier axe discriminant. En considerant quil y ait un nombre
plus important de variables explicatives que de classes, le nombre maximum de composantes
discriminantes est egal au nombre de classes diminue de une unite.

La recherche de ce sous-espace doit etre telle que les barycentres des classes soient eloignes
les uns des autres et que les individus dune meme classe soient proches. Cest `a dire en terme
de probabilite, que la variance intraclasse (entre les individus dune meme classe) soit faible
et que la variance interclasse (entre les classes) soit forte.

Calcul des composantes discriminantes

Soit x une variable aleatoire (un param`etre) observee sur n echantillons repartis en L
classes c1 , c2 , . . . , cL (six ou quatre dans notre cas), deffectifs n1 , n2 , . . . , nL . Le nombre total
dobservations est egal `a n : n = n1 + n2 + . . . + nL .

On note m et s2 la moyenne et la variance de la variable x dans la totalite de la population


et m1 , m2 , . . . , mL et s21 , s22 , . . . , s2L dans chaque groupe. On a alors les relations ci-dessous :

L
1X
m = nl ml (4.20)
n
l=1
L L
1 X 1X
s2 = nl (ml m)2 + nl s2l (4.21)
n n
l=1 l=1
V = W +B (4.22)

La relation (4.21) exprime la variance totale (s2 ) comme la somme de la variance


interclasse (premier terme, note W : variance des moyennes ponderees) et de la moyenne des
variances intraclasses (second terme, note B).

Lorsque les groupes sont tr`es differents les uns des autres, la variance interclasse est elevee
relativement `a la variance totale, et les variances intraclasses sont faibles, ce qui signifie quau
sein dun groupe donne, les unites statistiques sont proches de la moyenne de ce groupe. Inver-
sement, si les groupes sont melanges, cela signifie que les moyennes sont relativement proches
les unes des autres, et que les observations dun meme groupe sont fortement dispersees. On
mesure cette discrimination par le rapport de correlation, qui est le rapport de la variance
interclasse `a la variance totale. Ce rapport est toujours compris entre 0 et 1 :
plus il est proche de 1 , plus la variance interclasse est elevee, plus les variances intra-
classes sont faibles (par rapport `a la variance totale) et plus forte est la discrimination ;
plus il est proche de 0 , plus la variance interclasse est faible, plus les variances intra-
classes sont elevees, et moins la discrimination est faible.
4.4. CLASSIFICATION GAUSSIENNE 117

Cette propriete est vraie quelle que soit la variable quantitative x consideree. Lorsque lon
dispose de plusieurs variables x1 , x2 , . . . , xp que lon suppose centrees, on peut donc considerer
lensemble des variables Y de la forme :

Y = u1 x1 + u2 x2 + . . . + up xp

les coefficients u1 , u2 , . . . , up etant des nombres reels quelconques.

Lanalyse factorielle discriminante consiste `a chercher ces coefficients de facon `a ce que


le rapport de correlation de Y soit le plus eleve possible. On cherche ensuite une autre suite
de coefficients maximisant le rapport de correlation, de facon que la seconde composante
discriminante soit non correlee `a la precedente et ainsi de suite.

La variance de la nouvelle distribution de param`etres est Y 0 V Y = Y 0 W Y + Y 0 BY . Dans


la pratique on fixe Y 0 BY , la variance intraclasse, `a 1, et on maximise la variance interclasse.
Il sagit donc dun probl`eme doptimisation : la variable la plus discriminante sera solution
du probl`eme : maximiser la variance interclasse sous la contrainte que la variance intraclasse
soit egale `
a lunite.

La solution est le vecteur propre associe `a la plus grande valeur propre de V 1 B [76].
La valeur propre mesure le pouvoir discriminant de la variable discriminante calculee. Les
valeurs moyennes de cette variable Y calculees dans chaque groupe sont les plus dispersees
possible au sens de la variance interclasse et inversement, les valeurs de Y prises par les
unites statistiques de chaque groupe sont concentrees autour de la moyenne de ce groupe
(variance intraclasse). La discrimination est maximale. On determine ainsi la premi`ere
composante discriminante, dont le rapport de correlation est appele pouvoir discriminant.

En prenant les valeurs propres par ordre decroissant, les vecteurs propres corres-
pondants representent les nouvelles variables discriminantes et sont appeles les fonctions
discriminantes, dont le pouvoir de discrimination des classes est donne par leur valeur propre.

Si le nombre de fonctions discriminantes est egal au nombre de groupes diminue de 1, on


ne consid`ere, en general, que les deux ou trois premi`eres dentre elles. Toutefois, dans notre
application, nous avons choisi dutiliser toujours lensemble des fonctions dans la mesure
o`
u le nombre de param`etres ainsi obtenus reste suffisamment reduit. Nous avons pu verifier
que la conservation totale des fonctions lineaires discriminantes ne degrade pas les resultats
dune conservation partielle de celles-ci.

R
esultats des Fonctions Lin
eaires Discriminantes

Dans un premier temps nous verifions que les param`etres sont gaussiens. Ils sav`ere
que, comme precedemment, ils ne le sont pas mais presentent des similitudes avec les ca-
racteristiques dune loi gaussienne, `a limage de la distribution du param`etre issu de lemploi
de la deuxi`eme fonction lineaire, dont lhistogramme est represente sur la figure 4.6. Par
contre cette fois lensemble des cinq param`etres (ou trois) presente des histogrammes simi-
laires `a la figure 4.6, ce qui netait pas le cas des param`etres pris tels quels.
118 CHAPITRE 4. CLASSIFICATION

Fig. 4.6 Distribution du param`etre issu de lemploi de la deuxi`eme fonction lineaire

Nous nous attendons ici `a obtenir des resultats meilleurs que dans le cas gaussien o`u les
param`etres ne sont pas combines dans la mesure o` u lestimation des matrice de covariance est
amelioree par un nombre de donnees dapprentissage tr`es superieur au nombre de variables
`a estimer. De plus, lAFD cree des conditions favorables de separation des classes, ce qui est
susceptible dameliorer les resultats.

En fait, les tests montrent quil nen est rien, la mesure de rappel moyenne appliquee aux
30% de la base dapprentissage setablissant `a 45%. Le detail des resultats est donne ci-apr`es :

stade 0 : 20% stade 1 : 6% stade 2 : 67% stade 3 : 4% stade 4 : 56% stade 5 : 34%

Lapplication de la classification gaussienne `a la base de test donne une mesure moyenne


de 28%, detaillee selon le tableau ci-dessous. La mesure moyenne est donc meilleure que
lorsquil nest pas fait appel aux FLD. Cependant, lanalyse de la matrice de confusion rev`ele
que quel que soit le stade, 70% de celui-ci est classe en stade 2 (le plus important en volume),
ce qui explique ce score moyen. Les FLD, dans cette configuration, ne sav`erent donc pas tr`es
efficaces.
stade 0 : 22% stade 1 : 2% stade 2 : 71% stade 3 : 0% stade 4 : 6% stade 5 : 1%

Lapplication de lanalyse factorielle discriminante aux stades groupes (classes) donne un


taux daccord moyen de 48% pour les nuits ayant participe `a lapprentissage, detaille comme
suit :
Classe 0 : 18% Classe 1 : 67% Classe 2 : 57% Classe 3 : 26%

Les mauvais resultats observes pour la detection des classes 0 et 3 proviennent de ce que
plus de 50% des epoques de ces stades sont classes en classe 1 . Cest encore plus flagrant
avec les donnees de la base de test puisque cette donnee atteint la valeur de 80%. Le detail
des mesures de rappel par stade est donne ci-dessous :

Classe 0 : 26% Classe 1 : 70% Classe 2 : 12% Classe 3 : 1%


4.4. CLASSIFICATION GAUSSIENNE 119

4.4.5 Suivi de patient

Dapr`es les resultats ci-dessus, le nombre de param`etres ne semble pas expliquer `a lui
seul les mauvais resultats de la classification gaussienne. Il est probable que les param`etres
`a notre disposition ne contiennent pas suffisamment dinformation pour nous permettre
de realiser une classification automatique des signaux dindividus relativement differents.
Pour tester cette hypoth`ese, nous avons evalue les performances de ce classifieur sur un
seul patient `a la fois. Le classifieur realise un apprentissage sur 70% des epoques de la nuit
correspondante et nous testons ses performances sur les 30% restants. Les donnees testees
ne participent donc pas `a lapprentissage mais sont issues de la meme nuit de sommeil.
Ces resultats nous interessent dans loptique dun suivi de patient, o` u lon cherche `a suivre
levolution de la personne sur plusieurs jours. Dans ce cadre, il est envisageable que la
personne passe une nuit en laboratoire de sommeil et que ces resultats soient utilises pour
ladaptation du syst`eme automatique au patient.

Nous selectionnons les param`etres les plus pertinents dans le cas dune nuit de sommeil.
Par contre, etant donne que nous disposons dun nombre moins important de donnees que
precedemment, nous reduisons le nombre de param`etres utilises. Sachant que nous disposons
de 70% des epoques utilisables dune nuit, quune nuit comprend environ 1000 epoques (8
heures), et que 15% des epoques sont bruitees, nous disposons denviron 600 epoques pour
lapprentissage. Nous avons vu que le nombre de variable `a estimer est C(d2 + 3d)/2 et quil
faut posseder un plus grand nombre de donnees que de variables `a estimer. En prenant un
facteur deux, on aboutit `a un nombre maximum de param`etres de 10. Parmi les param`etres
adaptes `a la classification dune nuit (et etudies au paragraphe 4.2.2) nous retenons les
param`etres 3, 56, 58, 73, 78, 38, 47, 48 et 51.

Finalement, le syst`eme aboutit aux resultats presentes en annexes D.5 et D.6. Ces resultats
sont issus dune moyenne realisee sur plusieurs nuits, chacune etant testee separement. Il
est `a noter que les tendances etaient similaires pour les differentes nuits utilisees pour cette
moyenne (pas de discordance forte entre les nuits). Les valeurs de la matrice de confusion sont
calculees par une moyenne ponderee par le nombre depoques de chaque stade que contiennent
les differentes nuits. Par exemple, le taux T(4;5) representant le taux moyen delements de stade
4 classes en Stade 5 est donne par :
1 X
T(4;5) = P k
nk4 tk(4;5) (4.23)
k n4 k

O` u nk4 represente le nombre delements de stades 4 compris dans les 30% testes de la nuit k,
et tk(4;5) indique le ratio des nk4 elements de stade 4 de la nuit k classes en Stade 5. De cette
facon, la matrice de confusion resultante represente le comportement global du syst`eme sur
un panel representatif de nuits. En se concentrant sur les mesures de rappel on obtient les
resultats suivants :

stade 0 : 49% stade 1 : 39% stade 2 : 66% stade 3 : 38% stade 4 : 77% stade 5 : 66%

On remarque que les resultats sont cette fois tr`es interessants. Ainsi, hormis le stade
deveil (et les stades 1 et 3 mais cela est moins important), les stades sont bien classes dans
deux tiers des cas, ce qui, compte tenu des patients scores, est proche dun score obtenu avec
120 CHAPITRE 4. CLASSIFICATION

un appareillage medical. Le stade 1 est majoritairement confondu avec les stades 0 et 2, ce


qui est physiologiquement explicable, de meme que le stade 3, essentiellement confondu avec
les stades 2 et 4. Enfin, on notera un leger caract`ere attracteur du stade 2 puisquil est `a
lorigine du mediocre score du stade 0 et attire 20% des epoques de sommeil paradoxal.

Les memes tendances sobservent lorsquon regroupe les stades physiologiquement


proches. Ainsi le stade de sommeil lent leger attire les epoques de sommeil paradoxal. Les
statistiques sont leg`erement moins bonnes dans la mesure o`u les erreurs liees aux stades 1 et
3 sont inclues dans les regroupements.

Classe 0 : 52% Classe 1 : 66% Classe 2 : 76% Classe 3 : 57%

Au vu de ces bons resultats, nous avons considere que les donnees etaient suffisamment
coherentes pour pouvoir chercher `a ameliorer la detection en augmentant le nombre de pa-
ram`etres utilises. Rappelons que laugmentation de la dimension de lespace de classification
ne peut, en theorie, quaugmenter la capacite du syst`eme `a discriminer correctement les
classes. Cette propriete trouve sa limite en pratique pour les raisons evoquees plus haut et
cest pourquoi nous devons, dans ce cas, avoir recours aux fonctions lineaires discriminantes.
La classification se basera donc sur les vingt-cinq param`etres generaux que nous avons vu
plus haut, combines par les FLD. On obtient les mesures de rappel suivantes :

stade 0 : 69% stade 1 : 17% stade 2 : 67% stade 3 : 41% stade 4 : 76% stade 5 : 74%

Les resultats sav`erent donc ameliores par cette technique, `a lexception des epoques de stade
1, mais qui representent tr`es peu de donnees (dailleurs letude des matrices de confusion
nous indique que les elements de stade 1 sont essentiellement classes en stade 0 et stade 2 ).

4.4.6 Conclusions sur la classification gaussienne

Les resultats obtenus par la classification par maximum de vraisemblance et modelisation


gaussienne donne des resultats similaires dun point de vue statistique selon que lon travaille
avec six stades de sommeil ou quatre classes, ou encore selon que les param`etres sont
combines par des fonctions lineaires discriminantes ou non.

Ces resultats sont decevants. Ainsi, les tests sur les nuits ne participant pas `a lappren-
tissage montrent dans tous les cas une tendance `a attribuer les epoques `a un seul stade, quel
que soit le stade de reference de cette epoque. Sagissant de la classification en six stades,
lutilisation des FLD provoque une classification de la majorite des epoques en stade 2, quel
que soit le stade classe. Cest egalement le cas lorsquon nutilise pas les FLD (classification
en stade 0 ).

Toutefois, lorsquon sinteresse `a la classification des epoques issues des nuits ayant
participe `a lapprentissage (mais nayant pas elles-memes participe `a lapprentissage),
lutilisation des FLD sav`ere moins performante que sa non-utilisation. Ainsi, les FLD
provoquent une classification majoritaire des elements en stade 2, alors que la repartition
devient coherente dans le cas o`u on ne les emploie pas. Bien s ur, les stades 1 sont classes en
stade 0 et les stades 3 en stade 4 mais cela reste physiologiquement coherent.
4.4. CLASSIFICATION GAUSSIENNE 121

Les memes conclusions setablissent lorsquon travaille avec quatre classes de sortie. Il
nexiste pas non plus de distinction claire dans les resultats qui conduirait `a preferer une
classification en quatre classes plutot quen six.

En fait, nous nobtenons des resultats vraiment satisfaisants que dans le cas du suivi de
patient. Lorsquil est possible dadapter le syst`eme au sujet, les scores obtenus sont proches
des references medicales. Il reste cependant `a confirmer ce resultat sur des donnees isssues
de plusieurs nuits dun meme patient. Ce resultat valide aussi lemploi dune technique de
classification gaussienne, meme si les donnees en presence ne sont pas rigoureusement de
nature gaussienne.

Les mauvais scores obtenus dans le cas general sexpliquent certainement par plusieurs
sources derreurs. Une premi`ere source derreur est liee au choix des param`etres, non suffi-
samment pertinents dans le cas de la population representee dans les bases. A cela sajoute la
rigidite de la classification gaussienne, moins malleable pour etablir des fronti`eres de decision
que les reseaux de neurones par exemple. Ces contraintes sav`ereraient probablement moins
genantes si la composition des bases dapprentissage et de test etait plus homog`ene. On peut
raisonnablement supposer que les resultats seraient meilleurs si les donnees etaient toutes
issues de patients sains.

Concernant les mauvais resultats observes lors de lutilisation des FLD, une hypoth`ese
peut egalement etre avancee. Cette technique a pour but de regrouper les donnees autour
dun centre. Or, il est possible, et meme probable dapr`es certains resultats preliminaires,
que les stades soient multicentriques cest-`a-dire que pour un meme param`etre et un meme
stade, les donnees sagr`egent en deux groupes. Un exemple est donne sur la figure 4.7
dans laquelle on observe, pour des epoques prises dans la base dapprentissage la frequence
respiratoire en fonction de la frequence cardiaque pour deux stades de sommeil, le stade 0 et
le stade 5. On voit tr`es nettement sur cette figure que les donnees concernant le stade 0 se
repartissent autour de deux noyaux, `a linverse du stade 5 qui nen comporte quun. On trouve
l`a une hypoth`ese serieuse pour expliquer que lutilisation des FLD nameliore pas les resultats.

Fig. 4.7 Valeur de la frequence respiratoire en fonction de la valeur de la frequence car-



diaque. Epoques issues de la base dapprentissage

Laspect multicentrique que nous observons sur certaines donnees, et le fait que la
122 CHAPITRE 4. CLASSIFICATION

modelisation gaussienne ne donne pas de bons resultats nous a conduit `a etudier une
modelisation plus pertinente, basee sur les mixtures de gaussiennes. Dans cette modelisation,
on ne represente plus la distribution des param`etres par une distribution gaussienne dont on
cherche `a determiner moyenne et covariance mais par une somme de distributions gaussiennes.
Il faut alors etablir les moyennes et covariances de chaque gaussienne du mod`ele, ainsi que
les facteurs de melange, ce qui implique lemploi dalgorithmes differents de ceux que nous
avons vus ici, du type Expectation-Maximisation (EM). Cette methode offre lavantage du
determinisme de la solution bayesienne sans presenter linconvenient de lhypoth`ese gaus-
sienne simple, trop peu realiste dans beaucoup de cas. Elle semble adaptee `a notre probl`eme
et nous recommandons son evaluation.

4.5 Classification connexioniste

Les reseaux de neurones font partie des techniques de classification tr`es employees aujour-
dhui. Ils sont fiables, relativement simples `a mettre en uvre et ont fait leurs preuves dans de
nombreux domaines. Ils sav`erent tr`es efficaces dans la gestion de fronti`eres de decision com-
plexes. Mais surtout, ils sont tr`es economiques en terme de complexite calculatoire, du moins
pour ce qui est de letape de classification (lapprentissage lest moins mais nous ne sommes
pas contraints sur cette etape). Pour ces raisons nous avons choisi dessayer de resoudre notre
probl`eme de classification par ce moyen.

4.5.1 Description g
en
erale dun r
eseau de neurones

Quest-ce quun r
eseau de neurones

Ce que lon designe habituellement par reseau de neurones est en fait un reseau de neu-
rones artificiels base sur un mod`ele simplifie de reseaux de neurones biologiques. Les reseaux
de neurones ou reseaux connexionnistes sont fondes sur une analogie avec la transmission de
linformation dans les syst`emes cerebraux. Un reseau de neurones est constitue dun grand
ensemble dunites (ou neurones), ayant chacune une petite memoire locale. Ces unites sont
reliees par des canaux de communication : les connexions, qui transportent des donnees
numeriques. Les reseaux de neurones ont une certaine capacite dapprentissage, quils ac-
qui`erent `a partir dexemples, afin detre capables de generaliser par la suite les r`egles apprises
lors de la phase dapprentissage.

Mod
elisation dun neurone

Fig. 4.8 Modelisation dun neurone


4.5. CLASSIFICATION CONNEXIONISTE 123

La definition usuelle du neurone, correspondant `a la figure 4.8 est un processeur tr`es simple
qui calcule une somme ponderee et qui applique `a cette somme une fonction de transfert non
lineaire. Lequation de fonctionnement de chaque neurone j est :
nj
X
j = w0j + wij ei (4.24)
i=1

w0j est le biais. Il sagit dun neurone dans lequel narrive aucune connexion. Un neurone
de ce type est ajoute sur la couche dentree dun reseau ainsi qu`a chaque couche cachee
(nous verrons plus loin la definition dune couche cachee). Il est toujours actif `a 1 et sa
connexion vers les neurones j de la couche superieure est notee w0j .

Un neurone est caracterise par une fonction dactivation (ou fonction de transfert) f qui
permet de calculer pour chaque neurone une valeur de sortie Oj (ou yj ) en fonction de son
etat dactivation j :
Oj = f (j) (4.25)

Il existe plusieurs sortes de fonctions dactivation. Les fonctions de type sigmode comme
1
par exemple f (x) = 1+exp(x) qui est tracee sur la figure 4.9 sont souvent utilisees.

Fig. 4.9 Fonction dactivation de type sigmode

Mod
elisation dun r
eseau de neurones

Les neurones ne sont jamais utilises seuls mais en reseau. Un reseau est caracterise par son
architecture, cest-`a-dire la structure selon laquelle les neurones qui le composent sont relies
les uns aux autres. Certains reseaux ont une connectivite compl`ete (chaque neurone est relie
`a tous les autres) ; dautres, comme celui que lon a utilise, ont une architecture en couches
superposees. Dans ce cas les unites dune couche sont reliees `a toutes celles de la couche
superieure, mais `a aucune autre. Ces reseaux portent le nom de perceptron multicouche. Une
schema de perceptron multicouche est donnee sur la figure 4.10. On remarquera que les biais
ne sont pas representes.
A` chaque connexion entre deux unites i et j, on associe un poids correspondant `a la force
de la connexion et note wij . Un reseau multicouche est compose dune couche dentree, de
plusieurs sous-couches (ou couches cachees) et dune couche de sortie.
124 CHAPITRE 4. CLASSIFICATION

Fig. 4.10 Architecture dun reseau de type perceptron multicouche

Le fonctionnement dun reseau connexionniste, pour des poids de connexions donnes, se


resume `a definir une r`egle de propagation, qui decrit comment calculer letat dactivation
dune unite j en fonction de ses unites dentree. Cette r`egle est donnee par les formules
(4.24) et (4.25) du paragraphe precedent.

En resume, la couche dentree est activee par larrivee dune donnee, en recevant une
composante dun vecteur de donnees x sur chacune de ses unites. La couche dentree ne
fait pas subir de transformation `a ses unites. La premi`ere couche cachee effectue le calcul
(equations (4.24) et (4.25)) pour chacune de ses unites, puis cest au tour de la seconde, etc.
Finalement, lunite de la couche de sortie ayant la valeur la plus forte indique la sortie qui
correspond le plus vraisembablement, selon les r`egles apprises par le reseau, `a la classe du
vecteur dentree.

Lapprentissage dun reseau de neurone se fait par presentation successive dexemples et


de contre-exemples. On presente une donnee `a classer au reseau. Si celui-ci la classe mal, on
mesure lecart entre la sortie delivree et la sortie souhaitee. Celle-ci est ensuite utilisee pour
determiner les corrections `a apporter aux differents poids du reseau, de sorte que la classifi-
cation de la meme donnee conduirait `a une erreur plus faible. Cest le principe doptimisation
par minimisation du gradient. Nous renvoyons le lecteur `a lannexe E pour plus de details
sur lapprentissage dun reseau de neurones.

4.5.2 Mise en oeuvre dun r


eseau de neurones

Configuration du r
eseau de neurones

Un param`etre important dans la performance dun reseau de neurones est sa confi-


guration. Dans le cas dun perceptron multicouches, le nombre de couches etablit des
caracteristiques propres au reseau :

le perceptron `a une couche (pas de couche cachee) ne fonctionne que pour des formes
separables par un hyperplan. Dans le cas dun espace dentree `a deux dimensions par
4.5. CLASSIFICATION CONNEXIONISTE 125

exemple, la fronti`ere de decision est une droite.

Le perceptron `a deux couches (une couche cachee) est capable dapprendre des formes
de type convexe.

Le perceptron `a trois couches (deux couches cachees) est capable de generer des regions
de decision arbitraires, lesquelles peuvent etre non-convexes et disjointes [77].

Nous avons retenu un reseau `a deux couches cachees car nous ne connaissons pas `a lavance
la disposition des regions de decision mais nous pouvons supposer quelles sont suffisamment
complexes pour ne pas respecter les contraintes imposees par les deux premiers types de
reseaux. Puis, en nous appuyant sur la litterature (cf.paragraphe 1.3.2) mais aussi sur des
essais preliminaires qui nous ont permis de mieux apprehender le comportement des reseaux,
nous avons defini que la premi`ere couche cachee comprendrait 16 neurones, et la seconde 6. La
couche dentree comprend autant de neurones que le vecteur depoque contient de param`etres
(soit une trentaine lorsque les fonctions discriminantes ne sont pas utilisees, cinq lorsquelles
les sont), et la couche de sortie comprend 6 neurones (respectivement 4), un pour chaque
stade (respectivement groupe) de sommeil.

Crit`
ere darr
et

Lapprentissage dun reseau de neurones peut se voir comme un probl`eme doptimisa-


tion. Il est alors necessaire de fixer un crit`ere darret `a la presentation des observations
dapprentissage. Bien s ur, si lon sarrete trop tot, on nexploite pas de facon optimale
linformation contenue dans la base dapprentissage. Mais si lon sarrete trop tard, on
prend le risque realiser un surapprentissage ou apprentissage par cur. Dans ce cas, les
donnees de la base dapprentissage sont parfaitement apprises mais le reseau na plus de
faculte de generalisation. Cest pourquoi on proc`ede generalement `a un decoupage de la base
dapprentissage en deux parties : une base dapprentissage veritable et une base de test. Et
les etapes dapprentissage sur la base dapprentissage et les mesures de performances sur
la base de test son alternees jusqu`a atteindre des resultats acceptables sur la base de test.
Cette methode permet darreter lapprentissage avant que napparaisse le surapprentissage.

Cest ainsi que nous avons defini larret de lapprentissage. On utilise pour cela les 30%
de la base dapprentissage ne participant pas `a lapprentissage du reseau (cf paragraphe
4.1.3). Lors de lapprentissage, on presente reguli`erement cette base de test au reseau.
Lorsque lerreur de classification de cette base ne sameliore plus et tend `a decrotre, on
arrete lapprentissage. Nous navons toutefois commence la mesure de performance du reseau
qu`a partir du soixanti`eme passage de la base dapprentissage, afin de sassurer que lon est
bien entre dans le processus dapprentissage et que les variations observees ne resultent pas
des caracteristiques initiales du reseau.

Traitement des donn


ees dentr
ee

Les entrees du reseau peuvent etre de type tr`es different. Or, selon leur valeur, elles
nauront pas la meme influence dans lapprentissage des poids du reseau au vu de lexpression
de la r`egle dadaptation (E.4). Pour cela, nous avons choisi de normaliser toutes les valeurs
dentree, de sorte `a ce quelle soient comprises dans lintervalle [1; +1]. Ainsi, pour chaque
126 CHAPITRE 4. CLASSIFICATION

element xi du vecteur `a classer on applique la transformation yi = xi i


i
de sorte que la
distribution des valeurs de chaque xi soit comprise dans lintervalle [1; +1]. Cest ensuite le
vecteur Y = [y1 , y2 , . . . , yN ] qui est applique `a lentree du reseau de neurone. Les valeurs de
normalisation i et i sont determines durant la phase dinitialisation `a partir de lobservation
des donnees dapprentissage.

Pr
esentation des donn
ees dapprentissage

Il est important de presenter successivement au reseau de neurones des exemples et


des contre-exemples de chaque classe. En effet, lapprentissage se fait par essais successifs,
chaque classification venant modifier leg`erement les poids du reseau et donc les fronti`eres de
decision. Si, durant la phase dapprentissage, tous les elements dune classe sont presentes
successivement `a lentree du reseau, alors les fronti`eres de decision de cette classe seront
etendues et empi`eteront sur les classes suivantes jusqu`a occuper tout lespace de decision.
En presentant des exemples et contre-exemples, on evite une telle denaturation des fronti`eres
de decision.

Nous avons donc presente les donnees au reseau de mani`ere aleatoire. Ainsi, avant chaque
nouvel apprentissage de la base dapprentissage, nous avons opere un rangement aleatoire de
celle-ci. Ce rangement aleatoire des donnees ameliore considerablement la vitesse de conver-
gence des poids vers leurs valeurs stables [78].

Initialisation des poids du r


eseau

La premi`ere etape lors dun apprentissage par retropropagation est dinitialiser les pa-
ram`etres libres du reseau `a savoir les poids des connexions. Quand on ne poss`ede pas din-
formations au prealable pour initialiser le reseau, la mani`ere usuelle est dinitialiser les poids
avec des nombres choisis de facon aleatoire, uniformement distribues dans un intervalle etroit
de valeurs [78]. Nous avons donc choisi dinitialiser les poids par des valeurs aleatoires prises
dans lintervalle [1; 1], qui correspond `a la plage des valeurs dentrees.

Fonction de sortie

Concernant le choix de la fonction dactivation des neurones situes sur la couche de sortie,
il est communement admis quun perceptron entrane avec lalgorithme de retropropagation
peut, en general, apprendre plus rapidement (en terme de nombre diterations de la boucle
dapprentissage) quand celle-ci est impaire plutot quasymetrique [78]. Une fonction dac-
tivation f (x) est de symetrie impaire si f (x) = f (x), cest-`a-dire que la fonction est
symetrique par rapport `a lorigine. Un exemple connu de fonction dactivation asymetrique
et non lineaire est la tangente hyperbolique. Nous avons valide ce fait sur une base de donnee
comprenant cinq cents points dapprentissage et trois mille points de tests. Ces deux bases
sont donnees sur la figure 4.11.
Pour cela nous avons trace la courbe de lerreur quadratique lors de lapprentissage de
la meme base, lorsque le reseau est muni de fonctions sigmodes dune part, ou de fonctions
tangente hyperbolique dautre part. Les resultats sont portes sur la figure 4.12. On y constate
effectivement que lapprentissage utilisant des fonctions tangente hyperbolique est plus rapide
puisque le regime asymptotique est atteint en un nombre plus restreint diterations. Les
4.5. CLASSIFICATION CONNEXIONISTE 127

(a) (b)

Fig. 4.11 Donnees utilisees pour la mise au point du reseau de neurones. (a) Base dap-
prentissage. (b) Base de test.

courbes representees ici ont ete confirmees avec dautres initialisations du reseau. Nous avons
opte pour lemploi de cette fonction par la suite.

(a) (b)

Fig. 4.12 Comparaison des apprentissage selon la fonction dactivation utilisee. Apprentis-
sage de cinq cents fois la base dapprentissage. (a) Fonction sigmode. (b) Fonction tangente
hyperbolique.

Egalisation du nombre de donn


ees de chaque classe

Un reseau de neurones apprend par presentation successive dexemples et de contre-


exemples. Ainsi, lorsquun element est mal classe, la fronti`ere de decision qui le distingue
de la classe voisine `a laquelle il a ete, par erreur, attribue, est deplacee vers celle-ci de sorte
`a integrer cet element. Lorsquune classe poss`ede peu delements (dexemples) par rapport
`a une autre (les contre-exemples), la fronti`ere de decision sera plus souvent adaptee `a la se-
conde et la premi`ere sera donc moins bien definie. Il est par consequent indispensable, pour
un bon apprentissage de celui-ci, que le nombre dexemples de chaque classe soit similaire.
Nous avons dailleurs constate experimentalement que les classes presentant peu delements
etaient moins bien apprises que lorsque le nombre delements par classe est similaire. Pour
cette raison, nous avons choisi de construire la base delements servant `a lapprentissage du
128 CHAPITRE 4. CLASSIFICATION

reseau en recopiant les elements des classes les moins representees de sorte `a ce que chaque
classe poss`ede le meme nombre delements.

4.5.3 R
esultats de la classification connexioniste

Classification en six stades de sommeil

Nous nous interessons dans un premier temps au resultat de la classification operee sur
les 30% de la base dapprentissage utilises pour determiner larret de la procedure dappren-
tissage. Nous commencons par etudier la classification en six classes, sans utilisation des
fonctions lineaires discriminantes. La matrice de confusion globale est donnee en annexe F.
Les mesures de rappel, pour chacune des six classes de sortie, sont reprises ci-dessous :

Stade 0 : 54% Stade 1 : 44% Stade 2 : 0% Stade 3 : 14% Stade 4 : 67% Stade 5 : 44%

Nous pouvons remarquer que le stade 2 nest jamais reconnu, alors quil sagit du stade le
plus volumineux de la base. En fait ce stade est essentiellement reparti entre les stades 0 et
2. Hormis ce fait, les autres stades sont majoritairement bien classes. Lapprentissage semble
donc coherent et nous pouvons passer `a levaluation du syst`eme proprement dit en etudiant
les resultats de la classification operee sur les elements de la base de test et donnes en annexe
F.2.

Stade 0 : 33% Stade 1 : 17% Stade 2 : 0% Stade 3 : 18% Stade 4 : 9% Stade 5 : 21%

L`a encore, aucun element nest attribue au stade 2. En etudiant attentivement la matrice
de confusion on sapercoit que la majorite des epoques sont classees en stade 0, quel que soit
le stade reel de lepoque. Pour cette raison, la detection des autres principaux stades (4 et 5)
est mauvaise (9% pour le premier et 21% pour le second). Le stade 0 est egalement mal classe
puisque ses epoques sont reparties entre le stade 1 et le stade 2. Le taux daccord moyen est
de 13%, ce qui traduit bien la mauvaise performance de cette classification.

Classification en groupes de stades

Le regroupement des stades ameliore significativement les resultats statistiques (cf.annexe


F.4), portant le taux daccord moyen `a 29%. Ce fait est essentiellement d u au score eleve de
la classe 1. Lanalyse de la matrice de confusion rev`ele quenviron 50% des epoques, quel que
soit le stade dont elles sont issues, est classe en classe 1, ce qui explique le score de cette
classe. Le reste des epoques est reparti sur les autres groupes sans grande pertinence.

Classe 0 : 8% Classe 1 : 50% Classe 2 : 12% Classe 3 : 24%

4.5.4 Utilisation des fonctions lin


eaires discriminantes

Lapplication des fonctions lineaires discriminantes semble ameliorer leg`erement les


resultats mais ceux-ci restent insuffisants. Le taux daccord moyen est porte `a 19%. Contrai-
4.5. CLASSIFICATION CONNEXIONISTE 129

rement au cas o`u elles ne sont pas utilisees, des elements sont classes en stade 2, mais insuffi-
samment. Ainsi, 16% des elements de stade 2 sont bien classes en stade 2 mais dans le meme
temps 17% des epoques de stade 2 sont classees en stade 0 et 25% en stade 4. Pour le reste, ` a
part le stade 0 (et de justesse le stade 3 ), aucun stade ne voit ses elements majoritairement
bien classes.

Stade 0 : 36% Stade 1 : 9% Stade 2 : 16% Stade 3 : 26% Stade 4 : 23% Stade 5 : 11

Linteret des AFD nest pas plus evident lorsquon travaille avec quatre classes de sortie
puisque seuls les groupes 2 et 3 se voient majoritairement bien classes, avec seulement 35%
des elements dans le cas du groupe 3. Les stades correspondants aux groupes 0 et 1 sont
classes en groupe 3. Cette configuration obtient cependant le meilleur taux daccord moyen,
celui-ci etant de 32%.
Classe 0 : 20% Classe 1 : 19% Classe 2 : 52% Classe 3 : 35%

4.5.5 Changement de configuration du r


eseau

Bien que la configuration du reseau employe ait ete definie suite `a des essais preliminaire
representatifs, nous avons cherche `
a verifier quelle etait adequate. Pour les raisons evoquees
precedemment, nous ne pouvons nous permettre daugmenter le nombre de connexions. Nous
avons donc teste un reseau comprenant respectivement 6 et 5 neurones sur les premi`ere et
seconde couche cachee. Les resultats complets de ce reseau sont donnes en annexe G. Les
mesures de rappels de letude menee sur la base de test sont donnees ci-dessous :

Classe 0 : 52% Classe 1 : 52% Classe 2 : 12% Classe 3 : 1%

Il ressort que les resultats ne sont pas profondement modifies par rapport au reseau
precedemment utilise. Lapprentissage sav`ere relativement bon puisque toutes les classes
sont majoritairement bien classees. En revanche, les donnees issues de la base de test sont
essentiellement reparties entre les groupes 0 et 1. Le taux daccord moyen setablit `a 28%.

Nous avons egalement evalue une classification en six classes, avec le meme reseau.
Les resultats sont l`a-aussi tr`es mauvais, la majorite des elements etant classes en Stade 1.
Bien que la litterature ne mentionne pas cette contrainte, nous avons souhaite verifier que
ce probl`eme ne venait pas du fait que la derni`ere sous-couche du reseau comprend moins
de neurones que la couche de sortie. Pour cela, nous avons reitere le test avec un reseau
E/8/7/6. Cette fois, le stade 0 est visible, mais ni la matrice dapprentissage ni celle de test
ne laisse supposer un quelconque apprentissage des concepts.

Ces resultats tendent `a confirmer les resultats preliminaires ayant abouti `a la definition
de cette configuration de reseau. Pour etre complets, il aurait fallu evaluer limpact de lin-
troduction dans le reseau de quelques neurones supplementaires. Nous navons cependant pas
pu realiser ce test dans la mesure o`u il nous aurait fallu disposer de plus de donnees, selon
les recommandations indiquees notamment dans [78].
130 CHAPITRE 4. CLASSIFICATION

4.5.6 Suivi de patient

Tout comme avec le mod`ele gaussien, nous avons evalue le reseau de neurones dans le
cadre du suivi de patient. Ainsi, comme nous lavons fait precedemment, nous selectionnons
aleatoirement 70% des epoques, et nous nous en servons pour pratiquer lapprentissage du
reseau. Puis, nous testons les 30% restants. Nous repetons cette operation pour chacune
des nuits contenues dans les bases de test et dapprentissage et nous realisons une moyenne
ponderee des matrices de confusion, la ponderation etant realisee par le nombre depoque de
chaque stade que contiennent les differentes nuits. Le calcul de la moyenne est donne par
lexpression 4.23. On extrait de cette matrice, donnee en annexe F.9, les mesures de rappel
par stade donnees ci-apr`es :

Stade 0 : 70% Stade 1 : 33% Stade 2 : 59% Stade 3 : 47% Stade 4 : 72% Stade 5 : 74%

Notons pour etre complets que, bien que travaillant sur une seule nuit `a chaque
fois, nous avons utilise le jeu de param`etre global (et non pas specifique au suivi de
patient) car les reseaux de neurones realisent eux-memes une combinaison des param`etres
et nous les avons estimes suffisamment puissants pour faire ressortir les param`etres pertinents.

Les mesures de rappel laissent apparatre de tr`es bons resultats, leg`erement superieurs
au cas gaussien. Hormis le stade 2, leg`erement moins performant, les grand stades (0, 4 et
5 sont bien classes dans 70% des cas. Le stade 1 laissent apparatre des resultats inferieurs.
Cependant, les epoques issues de ce stade sont essentiellement confondues avec le stade 2,
ce qui est physiologiquement coherent. De meme, les epoques de stade 3 sont classees en
stade 2 ou en stade 4. Reste le stade 2, dont 40% des elements sont repartis de facon presque
homog`ene sur les autres stades, avec une leg`ere predominance du sommeil paradoxal. On
peut emettre lhypoth`ese que, le stade 2 representant beaucoup depoques au sein de la base
de donnee, ses elements sont etendus sur une vaste surface et les fronti`eres de decision sont
plus delicates `a etablir que pour les autres stades.

4.5.7 D
etection actim
etrique

Nous avons souhaite egalement evaluer la capacite du syst`eme `a realiser une discrimi-
nation veille / sommeil. Pour cela, nous avons regroupe en une seule classe tous les stades
de sommeil. Notons quil est tr`es peu probable que le regroupement des classes, meme
quasi-gaussiennes, conduise `a une nouvelle classe gaussienne, dans la mesure ou il faudrait
pour cela quelles poss`edent toutes le meme vecteur moyen. Cest pour cette raison que nous
ne realisons ce test quavec les reseaux de neurones et non avec la technique de classification
precedente. Cest egalement pour cette raison que nous ne testerons pas lutilisation des
fonctions lineaires discriminantes.

Lorsque lapprentissage est stoppe, 74% des epoques deveil sont bien detectees comme
telles, et 82% des epoques de sommeil sont classees en sommeil, ce qui laisse entrevoir que
le concept est appris. On evalue alors le syst`eme sur la base de test. Dans ce cas, 57%
des epoques deveil sont bien classees, le complement etant bien s ur classe en sommeil.
Concernant le sommeil, 75% des epoques sont bien classees. Ces scores, `a premi`ere vue
interessants, sont en fait insuffisants. Ainsi, le fait que pr`es dune epoque deveil sur deux
4.5. CLASSIFICATION CONNEXIONISTE 131

soit mal classee implique que la detection de leveil est mauvaise, meme si le scorage
global atteint en moyenne 72% en raison de la plus forte representation des stades de
sommeil par rapport `a leveil (respectivement 648 et 4219 epoques). Comme nous traitons
un probl`eme a` deux classes, cest le syst`eme dans son ensemble qui ne repond pas au probl`eme.

Cependant, ce probl`eme rassemble au sein dun meme stade des epoques provenant `a la fois
de sommeil paradoxal (qui presente certaines similitudes avec leveil) et de sommeil orthodoxe,
ce stade etant `a distinguer de leveil. Nous avons envisage que cette ambiguite puisse etre une
source derreur au sein du reseau et cest pourquoi nous avons teste un decoupage en trois
classes : Veille / Sommeil orthodoxe (stades 1, 2, 3 et 4) / Sommeil paradoxal. Les resultats,
donnes en annexe H, sont sans appel : le syst`eme nest pas pertinent. En fait il classe la
majorite des epoques dans la classe de sommeil orthodoxe.

4.5.8 Conclusions sur le scorage par r


eseau de neurone

Le reseau de neurone ne sav`ere donc pas en mesure de realiser une classification efficace
de la nuit. On observe souvent que la majorite des elements de tous les stades sont affectes `
a
une ou deux classes, comme cest le cas avec la classification gaussienne. On notera toutefois
que ce stade attracteur est moins hegemonique que lors de la classification gaussienne. Dans
cette derni`ere il reste peu de donnees non attirees par ce stade (environ 30%). Cette fois, il
reste en moyenne 60% des donnees, qui sont reparties de facon relativement homog`ene entre
les autres stades.

Notons que les resultats les plus homog`enes sont obtenus lorsque les stades de sommeil
sont regroupes en quatre classes, et que les param`etres sont combines par les fonctions
lineaires discriminantes. Dans ce cas on obtient une classification moyenne de 32%.

Une hypoth`ese pour expliquer ce mauvais fonctionnement est que lapprentissage serait
insuffisant. Mais letude des matrices de confusion obtenues en classant les 30% de la
base dapprentissage nayant pas participe `a lapprentissage nous apprend que celui-ci est
globalement bon. Ainsi, hormis quelques erreurs (certaines notables comme labsence de
detection de stade 2 dans le cas six stades/AFD) les elements sont majoritairement bien
classes. Le surapprentissage, de par le crit`ere darret utilise, est normalement evite. Une
derni`ere hypoth`ese, plus probable, est que les donnees soient trop dispersees pour que le
reseau parvienne `a etablir des fronti`eres de decision pertinentes. Il serait interessant devaluer
si les performances sameliore avec une selection plus rigoureuse des donnees utilisees pour
lapprentissage.

Notons que nous navons utilise jusquici que le perceptron multicouche. Dans ce type
de reseau, tous les neurones dune couche sont connectes `a lensemble des neurones de la
couche suivante, mais seulement `a ceux-ci. Bien dautres configuration de reseaux existent.
Par exemple, les connexions entre une couche et la suivante peuvent etre partielles au lieu
detre totales dans notre cas. Nous navons pas explore ce type de reseau.

De meme, il ny a pas de rebouclage entre les differentes couches. Dautres reseaux utilisent
ce rebouclage ([78] et plus specifiquement concernant lanalyse du sommeil [40]) cest `a dire
que les sorties de certaines couches servent de donnees dentrees `a des couches anterieures.
132 CHAPITRE 4. CLASSIFICATION

Ces structures particuli`eres de reseaux sont qualifies de structures recurrente. Ces reseaux
sont donc en mesure dutiliser une decision anterieure pour formuler la decision courante. Cela
se justifierait pleinement dans notre application puisquon sait que les transitions entre les
differents stades de sommeil obeissent `a des lois statistiques et donc que certaines transitions
sont tr`es probables et dautres impossibles. Lemploi dun tel reseau permettrait donc de tenir
compte de ces r`egles physiologiques. Un autre moyen den tenir compte est dappliquer un
algorithme qui retraite lhypnogramme propose par la classification. Cest lobjet du chapitre
suivant.

4.6 Rescorage
Les techniques de classification decrites precedemment realisent en fait une operation lo-
cale cest `a dire quelles classent un vecteur independamment du vecteur classe precedemment.
Aucune information temporelle nest utilisee. Pourtant, celle-ci est pertinente. En effet, on
sait que la succession des stades au cours de la nuit obeissent `a des r`egles physiologiques.
Il est par exemple peu probable quune epoque de stade 4 soit noyee dans une succession
depoques de stade 2. Il peut alors etre interessant dutiliser ces informations globales cest-
`a-dire prenant en compte une partie voire lensemble des epoques classees pour corriger les
erreurs de classification. La figure 4.13 illustre ce principe de rescorage.

Fig. 4.13 Principe du rescorage par utilisation dinformations globales : une epoque de
stade 4 entouree depoques de stade 2 est rescoree en stade 2.

La premi`ere methode que nous avons employee utilise des r`egles, definies par les connais-
sances de reference sur le deroulement des stades de sommeil. Ces r`egles nutilisent que les
epoques voisines de la zone etudiee pour realiser un rescorage et il sagit donc dun rescorage
local. Dans un deuxi`eme temps, nous avons utilise un mod`ele plus puissant puisquil sagit
dune modelisation par mod`ele de markov cache de la nuit.

4.6.1 Le rescorage par r`


egles

Pour evaluer limpact des r`egles que nous definissons, nous observons le taux daccord
global des nuits constituant la base de test. Rappelons que, en considerant que le stade de
k (n) et le stade issu de la classification S k (n),
reference de lepoque n de la nuit k secrit Sref cla
le taux daccord de la nuit k est donne par :
k (n) = S k (n))
arg(Sref cla
k = k (n))
(4.26)
arg(Sref

Le taux daccord global (ou cumule) est donne par T = k tk . Chacune des nuits est scoree
P
puis rescoree par les r`egles qui sappliquent successivement. Le premier rescorage fait inter-
4.6. RESCORAGE 133

venir une r`egle R1, le second, R1+R2. Le taux daccord global, cumule sur lensemble des
nuits de la base de test atteint, sans rescorage, 63%.

R`
egle 1 Une epoque entouree depoques dun stade different est rescoree en ce stade.

La premi`ere r`egle mise en place supprime les stades isoles cest-`a-dire que les epoques dun
stade donne (par exemple une epoque de stade 4 ) entourees par un autre stade (par exemple
par une epoque de stade 2 `a gauche, et une autre epoque de stade 2 `a droite). De telles
epoques sont rescorees par le stade entourant (le stade 2 dans ce cas). Schematiquement, la
succession 2 2 4 2 2 devient 2 2 2 2 2. Lemploi de cette r`egle porte `a 64% le taux daccord
cumule.

R` egle 2 Les zones en erreur sont rescorees par les stades des epoques immediatement voi-
sines.
Nous avons observe quil apparat des zones derreur, cest-`a-dire reconnues comme des zones
de bouges par les syst`emes de controle dintegrite du signal, lors dune transition entre deux
stades de sommeil. Une valeur de stade negative est attribuee `a ces zones par lalgorithme
de classification. Une sequence typiquement observee dans ce cas est 3 3 3 -2 -2 4 4 4. Nous
decidons alors de rescorer le o`
u les epoques en erreur par les stades presents `a gauche et ` a
droite de cette zone (`a gauche sil ny a quune epoque, `a gauche pour la premi`ere et `a droite
pour la deuxi`eme sil y en a deux. Pour ne pas risquer de sortir de ce cadre, nous limitons
les zones de transitions `a deux stades en erreur maximum. Le taux daccord est alors porte
`a 79%.

Utilisation de la confiance

Nous avons egalement souhaite pouvoir utiliser une information evaluant la pertinence
de la classification realisee. Si on consid`ere le cas dune classification par surface separatrice,
on imagine assez bien que plus le vecteur `a classer se rapproche de la fronti`ere de separation
et plus il est probable que lon commette une erreur de classification. Une indication sur la
confiance que lon peut avoir en la classification realisee peut etre, dans ce cas, la mesure de
la distance qui le separe de la fronti`ere la plus proche.

Cest cette notion de confiance dans la classification que nous avons cherche `a exploiter.
Nous souhaitons pouvoir tenir compte de certaines epoques dans lesquelles on poss`ede une
grande confiance dans la classe attribuee pour eventuellement corriger dautres epoques, en
contradiction avec les premi`eres, et beneficiant dune confiance moindre. Il nous faut donc
disposer dune mesure de confiance pour les deux techniques de classification utilisees ` a
savoir la classification gaussienne et la classification connexioniste.

Application ` a la classification gaussienne Dans le premier cas, on dispose des


probabilites dappartenance du vecteur `a chacune des classes. Ce vecteur est attribue
`a la classe dont la probabilite dappartenance est la plus forte. Plusieurs mesures de
confiance peuvent alors etre envisagees selon les hypoth`eses retenues. On notera Pmax la
probabilite dappartenance du vecteur vi `a la classe Cmax qui maximise cette probabilite
134 CHAPITRE 4. CLASSIFICATION

(Pmax = P (Cmax |x) t.q. {Cmax = argmax (i)P (Ci |x)}.

Plus cette probabilite est forte et plus la confiance peut etre grande. La mesure de
confiance est alors directement donnee par la probabilite dappartenance. Si la mesure de
confiance du vecteur i, correspondant `
a lepoque i est notee c(vi ) alors on a c(vi ) = Pmax .

Plus lecart entre la probabilite maximale et sa suivante est fort et plus la classe se
discrimine en regard des autres. Lecart entre les deux probabilites peut alors traduire
une confiance dans la mesure. Pour pouvoir effectuer des comparaisons, lestimateur doit
normaliser cet ecart. Si on designe par Psuite la plus grande des probabilites apr`es Pmax , on
obtient c(vi ) = (Pmax Psuite )/(Pmax ).

Pour evaluer la pertinence des estimateurs presentes, nous avons cherche `a comparer la
valeur de confiance obtenue par ces estimateurs sur les epoques bien classees, `a celle obtenue
en utilisant les epoques mal classees. Si la mesure de confiance est pertinente, nous devrions
observer une distribution de ces valeurs globalement plus elevee dans le premier cas que
dans le second.

Nous avons donc compare les histogrammes des valeurs obtenues dans ces deux cas. Nous
avons utilise pour cela une classification gaussienne en six classes, sans regroupement des
param`etres par les fonctions lineaires discriminantes. Comme precedemment, lapprentissage
du mod`ele sest faite sur 70% des elements de la base dapprentissage, et les mesures de
confiance observees sont issues de la base de test.

En ce qui concerne le premier estimateur (probabilite dappartenance), nous navons pas


observe de resultat probant. Pour ce qui est du deuxi`eme estimateur, on observe sur la figure
4.14 quil existe plus de valeurs comprises entre 20 et 50 dans les estimations de confiance
menees sur les epoque bien classees, que lorsque celles-ci sont menees sur les epoques mal
classees. Toutefois, cette distinction nest pas tr`es marquee. Nous avons cependant decide
dutiliser cet estimateur de la confiance de classification pour etablir des r`egles de rescorage.

Fig. 4.14 Histogramme des distributions des valeurs de confiance de la classification gaus-
sienne : `a gauche, le cas des epoques bien classees. A droite le cas des epoques mal classees.
4.6. RESCORAGE 135

Application ` a la classification connexioniste Comme nous lavons vu precedemment,


le reseau de neurone est entrane pour emettre un 1 sur la sortie valide et un 0 sur les autres
sorties. Lorsque le reseau de neurone classe un stade, il doit donc fournir un 1 sur la sortie
correspondante. Lecart `a 1 de cette valeur peut traduire une mesure de confiance. Plus la
valeur fournie est proche de 1 et plus la mesure est consideree comme fiable. En pratique
nous utilisons plutot lestimateur qui `a x, valeur delivree sur la sortie active, associe la
valeur c(x) = log(x/(1 x)) afin daugmenter la dynamique de sortie de cet estimateur. Cet
estimateur tend vers + lorsque la confiance est forte et vers lorsque celle-ci est faible.

En realite, le reseau de neurone nactive pas ses sorties `a 1 ou 0 mais `a des valeurs
comprises entre ces deux derni`eres. On definit la sortie active comme etant celle dont la
valeur dactivation est la plus forte. Ainsi, `a defaut de fournir des 1 et des 0, le reseau doit
normalement fournir une sortie la plus elevee possible et les autres sorties les plus faibles
possibles. Une autre mesure de confiance decoule de ce fait : la mesure de lecart existant
entre la valeur de la sortie active (x), et la valeur dactivation immediatement inferieure (x0 )
telle que c(x) = x x0 . Cet estimateur est conceptuellement proche du deuxi`eme estimateur
presente pour la classification gaussienne.

Nous avons evalue la pertinence de ces deux estimateurs de la meme mani`ere que le
cas des estimateur associes au mod`ele gaussien. Nous avons conclu quaucun de ces deux
estimateurs de confiance nest pertinent (cf.figure 4.15). La meme conclusion est obtenue
lorsque la classification employee traite quatre classes de sortie au lieu de six (regroupement
des stades), ou que lon combine les param`etres par des fonctions lineaires discriminantes.

Fig. 4.15 Histogramme des distributions des valeurs de confiance de la classification par
reseau de neurones : `a gauche, le cas des epoques bien classees. A droite le cas des epoques
mal classees.

R`egle 3 Les zones non classees sont rescorees par les stades voisins, si ceux-ci beneficient
dune bonne confiance.
Nous lavons vu, il existe de nombreuses zones en erreur, notamment parce que nous ne
disposons pas, sur les prototypes employes, de controle automatique de gain. De fait, un
premier rescorage des zones en erreur est realise lorsque la duree de celles-ci nexc`ede pas
deux epoques. Les zones inaptes `a la classification sont attribuees aux stades des epoques
voisines, presentes `a gauche et `a droite de la zone en erreur. Nous avons decide dutiliser
la mesure de confiance pour pouvoir couvrir des zones plus etendues. Ainsi, si les voisins de
136 CHAPITRE 4. CLASSIFICATION

gauche et de droite dune zone en erreur, quelle que soit sa longueur, sont dignes de confiance,
alors on remplace les stades des epoques constituant la zone en erreur par la classe des stades
voisins. Par exemple, la succession depoque 2 2 E E E E 4 4 devient 2 2 2 2 4 4 4 4.
Nous avons utilise les observations de la distribution des valeurs de confiance de la base de
test pour fixer les seuils indiquant une confiance suffisante ou pas. Limpact de cette r`egle na
pu etre etudie que dans le cas gaussien car nous ne possedons pas destimateur de confiance
pour le cas connexioniste. Il en est ressorti que le taux daccord global nest pas ameliore par
cette r`egle. Ceci sexplique probablement par la faible discrimination operee par la mesure de
confiance disponible entre les zones de classification correctes et les zones ne letant pas.

R`egle 4 Les epoques non encore scorees ou rescorees sont rescorees par les stades voisins.
En dernier lieu, lorsque les r`egles precedentes de rescorage ont ete appliquees, nous rescorons
les zones en erreur restantes par les stades voisins de celle-ci. Ainsi 3 3 E ... E 4 4 devient 3
3 3 ... 4 4 4. Le taux daccord global cumule est porte `a 111% ce qui represente en moyenne
une augmentation des taux daccords de 10% pour chaque nuit.

Conclusions sur le rescorage par r`


egle

Toutes ces r`egles permettent daugmenter les taux daccord bruts des nuits de la base
de test de 10% en moyenne. Nous navons detaille ici que les chiffres correspondant au cas
gaussien mais les memes resultats sont obtenus par la classification par reseau connexioniste.
Ainsi, le taux daccord cumule initial est dans ce cas de 59% (63% en gaussien), et passe
`a 120% (111% en gaussien) apr`es application de lensemble des r`egles. De la meme facon,
lapplication du rescorage `a la classification en quatre classes (eveil / sommeil lent leger /
sommeil lent profond / sommeil paradoxal) permet de passer dun taux daccord global de
64% `a 119%. Ces r`egles sav`erent donc interessantes du point de vue de la performance de
classification.

4.6.2 Mod
elisation Markovienne de la nuit

Le rescorage par mod`ele de Markov cache (ou HMM) nous a semble interessant `a
developper dans la mesure o`
u celui-ci presente lavantage, par rapport au rescorage par r`egle,
de tenir compte du sequencement des stades sur lensemble de la nuit pour emettre chacune
de ses decisions.

Principe

Les HMM sont une generalisation des mod`eles de Markov observables. Ce sont des
automates `a M etats cest `a dire que le syst`eme evolue entre ces M etats (passe dun etat `a
un autre). D`es que lautomate passe dans un etat, il emet un symbole pouvant prendre N
valeurs differentes. Ce symbole est observable et cest pourquoi la suite des symboles emis
est appelee suite observable. Le mod`ele est dit cache dans la mesure o` u la suite des etats par
lequel il est passe nest pas accessible. Seule est donnee la suite des observations. Le symbole
emis est conditionne par une probabilite demission, qui est propre `a chaque etat. Le passage
dun etat `a un autre est egalement conditionne par une probabilite de transition.
4.6. RESCORAGE 137

Dans notre application, nous definissons les symboles emis comme etant la succession
des stades de sommeil proposee par la classification. Les etats representent les stades de
sommeil. A ` ce stade, on suppose que le stade de sommeil dans lequel est reellement la
personne nous est inaccessible, seule est disponible la suite des stades de sommeil proposee
par la classification. Cette modelisation permet dadmettre que certains stades (par exemple
des stades 3) ne soient pas classes comme tels par la procedure initiale de classification (et
soient ainsi classes en stade 4 ), notamment parce que sa representation physiologique est
proche dun autre stade (les stades 3 et 4 sont physiologiquement proches).

Le HMM que lon se propose dutiliser poss`ede donc six etats caches (les cinq stades de
sommeil et leveil), et sept symboles observables (les six stades de vigilance donnes par la
classification et un symbole attribue aux epoques dont lintegrite des signaux na pas permis
la classification). La figure 4.16 illustre partiellement cette modelisation. On y retrouve
les six stades de vigilance. Dans chacun de ces etats, la classification peut avoir fourni un
des six stades de sommeil, ou letat derreur (zone non utilisable pour la classification).
La probabilite demission de chacun des symboles est propre `a chaque etat, et un exemple
est donne pour le stade 0. De meme, les transitions entre chacun des etats obeissent `a des
probabilites notees p(i, j), sachant que p(0, 1) indique la probabilite que le mod`ele passe
de leveil au premier stade de sommeil. Dans un souci de lisibilite de la figure, seules les
transitions et le tableau correspondant `a letat 0 ont ete representees. La structure est la
meme pour les autres etats du HMM.

Fig. 4.16 Representation du HMM utilise pour le rescorage

Le probl`eme que nous avons `a resoudre consiste, `a partir dune sequence dobservation
et dun HMM donne, de determiner la suite detats du HMM qui maximise la probabilite
dobserver cette sequence. On consid`ere que la succession detat la plus proche de la realite
est la sequence la plus probable dun point de vue mathematique, parmi toutes celles qui
ont engendre la sequence de symboles. Il nous faut alors retrouver le chemin le plus probable
parmi tous ceux ayant pu engendrer la sequence observee. On utilise pour cela lalgorithme de
Viterbi. Celui-ci calcule `a chaque nouvelle observation la probabilite de chacun des chemins
conduisant `a la sequence partielle observee. En realite, le nombre de ces chemins crot tr`es
vite ce qui rend le calcul reel impossible. Cest pourquoi lalgorithme de Viterbi consid`ere
que le chemin global le plus probable passe par les chemins partiels les plus probables. En
138 CHAPITRE 4. CLASSIFICATION

dautres termes, si, deux chemins m`enent `a un meme etat intermediaire et que lun des deux
est le chemin qui sav`erera le plus probable `a la fin de la sequence, alors ce sera forcement
celui des deux dont la probabilite `a cette etape est la plus forte. Par consequent il est inutile
de poursuivre le developpement de ces deux chemins. On ne garde donc en permanence la
memoire que de six chemins, un pour mener `a chacun des six etats du mod`ele, ce qui diminue
considerablement les calculs. Lorsque toutes les observations ont ete presentees on retient le
chemin qui presente la plus forte probabilite.

Utilisation

Le mod`ele de Markov etant donne, il nous faut `a present determiner les param`etres qui le
definissent, `a savoir la matrice definissant les probabilites de transition entre etats (appelee
matrice A), celle definissant les probabilites demission de chaque symbole (appelee matrice
B), ainsi que le vecteur definissant la probabilite, pour chacun des stades, que le syst`eme
demarre dans celui-ci.

Concernant ce dernier, on sait que le stade initial de vigilance, pour tous les enregistre-
ments, est leveil. En effet de par la procedure utilisee, le patient est eveille au demarrage de
lenregistrement. La probabilite de demarrer dans le stade 0 est donc de 1, celle de demarrer
dans tous les autres stades est nulle.

La matrice B recense, pour chaque stade, la probabilite demettre un stade qui peut etre
identique `a letat, ou different. On utilise la base dapprentissage pour la determiner. Celle-ci
est classee par la methode retenue (gaussien ou connexioniste). Puis, la comparaison entre le
stade tel que classe et le stade de reference donne la probabilite que la classification indique
tel ou tel stade lorsquil est dans tel ou tel stade. La compilation de ces resultats fournit la
matrice B.

Enfin, on determine la matrice A en comptabilisant chacune des transitions entre stades


pour toutes les epoques de la base dapprentissage.

R
esultat

Nous avons donc procede de la sorte pour aboutir `a la modelisation Markovienne de la


nuit. Nous avons ensuite evalue lapport du rescorage par HMM sur le taux daccord global
mesure sur chacune des nuits de la base de test. Il ressort que le taux daccord global par
nuit est augmente de 16% en moyenne.

4.6.3 Comparaison des deux m


ethodes de rescorage

Le mod`ele de Markov cache est appris en utilisant les resultats de la classification menee
sur la base dapprentissage, et on observe les resultats du rescorage utilisant cette technique
sur toutes les nuits de la base de test. Les valeurs indiquees correspondent aux taux daccords
exprimes sur les epoques correctes cest `a dire que lon ne prend pas en compte les epoques
en erreur (non classees) pour etablir ce taux.
Statistiquement, ces premiers resultats font etat dun avantage pour les hypnogrammes
4.6. RESCORAGE 139

Nuit T1 T2 T3 T4 T5 Moyenne
Taux daccord en sortie de la classification (%) 15 30 12 40 16 23
Taux daccord apr`es le rescorage par r`egles (%) 13 31 12 43 16 23
Taux daccord apr`es le rescorage par HMM (%) 27 32 17 27 29 26

Tab. 4.2 Taux daccord des epoques int`egres des nuits constituant la base de test, avant et
apr`es rescorage par r`egles ou mod`ele de Markov caches. Les meilleurs resultats pour chaque
nuit sont mis en gras.

etablis en utilisant les mod`eles de Markov caches. Ainsi, dans quatre nuits sur cinq, les
resultats sont ameliores alors que ce nest le cas que dans deux cas sur cinq par le rescorage
par r`egle. Lamelioration des taux daccord varie de 2 `a 13%. Cela ne se retrouve pas sur la
moyenne car une nuit (T4) voit son taux daccord considerablement reduit par le rescorage
HMM.

Si on sinteresse maintenant aux taux daccords globaux cest `a dire qui int`egrent les
epoques non classees, on obtient les resultats suivants : Ainsi donc ces resultats sont tout

Nuit T1 T2 T3 T4 T5 Moyenne
Taux daccord en sortie de la classification (%) 9 25 6 14 9 13
Taux daccord apr`es le rescorage par r`egles (%) 13 31 20 32 15 22
Taux daccord apr`es le rescorage par HMM (%) 26 34 27 27 30 29

Tab. 4.3 Taux daccord globaux des nuits constituant la base de test, avant et apr`es
rescorage par r`egles ou mod`ele de Markov caches. Les meilleurs resultats pour chaque nuit
sont mis en gras.

a` fait conformes aux precedents, et linteret statistique du rescorage par les HMM apparat
clairement.

Analyse qualitative Cependant, lorsquon observe les hypnogrammes produits par le re-
scorage utilisant les mod`eles de Markov caches, il apparat que la plupart des sauts de stades
sont elimines par le mod`ele pour ne conserver que de longue plage dun meme stade, lequel
est le plus souvent le stade 2 ou leveil. Un exemple est donne sur la figure 4.17. Ainsi, si ce
type de rescorage sav`ere statistiquement plus interessant que le rescorage par r`egles, il ne
permet pas mieux que celui-ci (et peut-etre moins) de retranscrire levolution des stades du
sommeil au cours de la nuit.

Complexit e de mise en oeuvre Le rescorage Markovien est plus complexe `a mettre


en oeuvre que le rescorage par r`egle. En effet, en dehors de la phase dapprentissage, il faut
pratiquer un algorithme de Viterbi sur les donnees ce qui necessite `a la fois la memorisation de
lensemble des stades de sommeil attribues `a chaque epoque au cours de la nuits (soit environ
1000 donnees codables sur un octet) alors que le rescorage par r`egle, de par sa nature plus
locale, permet de limiter les epoques `a stocker. Pour avoir un ordre de grandeur, il faut savoir
que le microcontroleur embarque dans le bracelet realisant les enregistrements SmartMedia
poss`ede une capacite de memoire RAM de 1kOctet. Lalgorithme de Viterbi necessite ensuite
140 CHAPITRE 4. CLASSIFICATION

Fig. 4.17 Comparaison qualitative sur une nuit des rescorage par r`egle et rescorage mar-
kovien.

T S 2 calculs (T etant le nombre dobservations dans la sequence soit environ 1000 et S


etant le nombre detats du mod`ele soit 6 dans notre cas) alors que le rescorage par r`egle a
un co ut nul de ce point de vue (en fait il necessite des tests et des reaffectations memoires).
Neanmoins, lalgorithme de Viterbi na pas `a etre applique en temps reel sur les donnees et
ce cout calculatoire est donc compatible avec une utilisation embarquee dans la mesure o` u
lalgorithme peut etre applique `a un moment o` u lon peut lui attribuer toute la ressource
calculatoire. Le rescorage par r`egle, quant `a lui, doit etre effectue en temps leg`erement differe
pour profiter pleinement de son faible co ut memoire. Ainsi, d`es que les voisins observes
sont disponibles, le rescorage est effectue et la memoire liberee. Il devient dans ce cas tr`es
interessant par rapport `a lalgorithme de Viterbi.

4.6.4 Conclusions sur le rescorage

Le rescorage est donc clairement interessant puisquil permet daccrotre en moyenne de


10% les resultats. Le rescorage par HMM sav`ere, dans nos tests, plus interessant statistique-
ment, resultat discutable si lon sen ref`ere `a lanalyse qualitative des hypnogrammes rescores.

Globalement, nous avons constate que plus le scorage initial des nuits est bon et plus le
rescorage est performant.

Cependant, un mod`ele de Markov cache est avant tout une modelisation du deroulement
de la nuit. Il ne pourra realiser un apprentissage pertinent qu`a la condition o`
u, dune part, les
nuits de la base dapprentissage sont coherentes entre elles et o`u, dautre part, les nuits de test
sont coherentes avec celles de la base dapprentissage. Cette r`egle est dailleurs valable pour
la classification en general. Or, les enregistrements dont nous disposons presentent justement
un trouble dans la succession des stades de sommeil, dorigine pathologique. Ceux-ci sont

4.7. UTILISATION DUN ARBRE DE DECISION 141

souvent tr`es fractionnes et presentent des dissemblances fortes entre les personnes. La base
denregistrements nest donc pas adaptee `a la validation dun rescorage utilisant les chanes
de Markov cachees car celle-ci ne peut que conduire `a des resultats mediocres. Nous ne
pourrons evaluer le veritable profit apporte par cette methode de rescorage quen lutilisant
sur des enregistrements ne presentant pas de trouble dans la succession des stades de sommeil.

Dautant quun autre facteur est de nature `a limiter la capacite du mod`ele `a corriger des
erreurs : il sagit des zones non utilisables par la classification car saturees. Plus celles-ci sont
nombreuses et surtout longues et plus la modelisation markovienne de la nuit sera entachee
derreur et imprecise, rendant le rescorage moins performant. Dans le meme temps, plus ces
zones sont nombreuses et plus le resultat final repose sur le rescorage. Ces zones derreur
representent donc une double source de degradation des resultats. Dans notre application,
et avec le prototype actuel, le nombre depoques classees peut atteindre des valeurs aussi
faibles que 50% des epoques totales.

Nous retiendrons donc que linteret du rescorage est demontre, bien que toutes les condi-
tions ne soient pas reunies pour quil puisse veritablement ameliorer sur les hypnogrammes
des bases dont nous disposons `a ce jour.

4.7 Utilisation dun arbre de d


ecision
Au vu des resultats non convaincants de la classification, meme rescoree, nous avons
souhaite explorer une autre mani`ere de resoudre le probl`eme. En loccurrence, nous avons
choisi de diviser le probl`eme de classification en sous-probl`emes binaires et de combiner les
resultats issus de ces decisions pour decider de la classe de lelement.

Pour cela, nous avons fait appel `a des detecteurs utilisant des reseaux de neurones.
Ceux-ci sont entranes `a distinguer une classe de lensemble forme par la reunion des autres
classes. Nous avons dailleurs realise cette operation au paragraphe 4.5.7, en distinguant
leveil du sommeil. Nous regroupons les stades 1 et 2 dune part pour former la classe
correspondant au sommeil lent leger, et les stades 3 et 4 dautre part pour former la classe
correspondant au sommeil lent profond. Chaque detecteur fournit donc en sortie une valeur
0 ou 1. Un 0 indique que lelement nappartient pas `a la classe testee par ce detecteur tandis
quun 1 indique que cest le cas. On adjoint en sortie du detecteur un syst`eme de rescorage.
Pour les raisons evoquees au paragraphe 4.6, nous utilisons un rescorage par r`egle dans le
cadre de cette experimentation.

Le syst`eme comprend donc quatre detecteurs delivrant chacun une information sur
lappartenance supposee au stade auquel il appartient. Il reste `a combiner les decisions
elementaires. Pour cela, nous utilisons lalgorithme suivant :
Si aucun d
etecteur nest positif alors on nattribue pas de classe `a lepoque consideree ;
Si un seul d etecteur est positif alors on attribue la classe du detecteur `a lepoque
consideree ;
Si deux d etecteurs sont positifs alors on attribue la classe dun detecteur `a lepoque
consideree ;
Si trois ou quatre d
etecteurs sont positifs alors on nattribue pas de classe `a lepoque
142 CHAPITRE 4. CLASSIFICATION

consideree.
Concernant le cas o` u deux detecteurs sont positifs, le stade est choisi `a laide une
matrice de decision, etablie `a partir de la base dapprentissage. En loccurrence, la base
dapprentissage est classee par les detecteurs et les epoques pour lesquelles deux detecteurs
se sont averes positifs sont isolees. Alors, pour chaque combinaison de detecteur positifs
rencontree on mesure le stade de reference le plus probable et cest ce stade qui sera attribue
lorsque ce couple de detecteur sera positif.

Trois possibilites existent pour completer les zones non attribuees. La premi`ere consiste `a
utiliser un mod`ele de Markov cache. La seconde consiste `a utiliser des r`egles, de meme type
que celles que nous avons exposees pour le rescorage. Enfin, il est aussi possible de completer
les epoques non attribuees par le stade le plus probable localement. Dans ce dernier cas, il est
procede `a une estimation du stade le plus probable pour chaque intervalle de temps de 100
epoques (environ une heure) `a partir des nuits contenues dans la matrice dapprentissage.
Pour finir, un rescorage global de la classification etablie est opere, tout comme pour les
deux methodes de classification vues precedemment.

Nous portons en annexe I les resultats de la detection operee par cette methode, lorsque
le comblement des zones non attribues seffectue par le stade le plus present localement
(paragraphe I.1), lorsque ce travail est laisse au rescorage global par r`egle (paragraphe I.2)
ou au rescorage global utilisant un mod`ele de Markov cache (paragraphe I.3).

Quel que soit le parametrage utilise, cette methode de detection ne repond pas efficace-
ment au probl`eme dans la mesure o` u la majorite des epoques, est toujours classee dans le
premier ou le second groupe.

4.8 Conclusion sur l


etape de classification

Nous avons presente dans cette partie lensemble des techniques que nous avons mises en
oeuvre pour realiser la classification automatique en stade de sommeil.
Il ressort que nous navons pu realiser une methode efficace de classification generale en
stades de sommeil, ni meme en groupes de stades de sommeil. Nous avons pourtant utilise
une technique Bayesienne et une technique connexioniste. Pour pallier au faible volume de
donnees nous avons eu recours `a une technique de combinaison des param`etres mais celle-ci
ne sest pas averee pertinente.

Toutefois, le syst`eme produit des resultats proches des techniques medicales automa-
tique lorsque lapprentissage se deroule sur une seule nuit. Nous pouvons tirer plusieurs
informations de ce resultat. Dabord, la chane de traitement est pertinente. Il est, selon
nous, raisonnable de penser que les resultats seraient significativement ameliores sil etait
fait usage dune base plus coherente, elaboree notamment `a partir denregistrements issus de
patients sains. Ensuite, le fait que certains param`etres se rev`elent pertinents chez plusieurs
patients pris separement, mais que ces memes param`etres ne le soient plus lorsquon traite
de facon globale la population indique que ces param`etres ne sont normalises par rapport
aux patients. Leur valeur nest pas significative mais la realite physique quils decrivent
reste pertinente par rapport au sommeil. Il reste `a determiner le param`etre, independant du

4.8. CONCLUSION SUR LETAPE DE CLASSIFICATION 143

patient, qui traduit ce phenom`ene.

Enfin, nous avons evalue deux techniques de rescorage. Toutes deux, par la prise en
compte de donnees globales, permettent dameliorer significativement les resultats de la
classification. Les chane de Markov cachees sav`erent prometteuses mais leur performance
est conditionnee par la coherence des nuits utilisees pour lapprentissage et le test, hypoth`ese
satisfaite si lon sinteresse au scorage de patients sains, mais pas dans notre cas de patients
pathologiques.

Au final, nous obtenons un taux daccord de 25% en moyenne pour les nuits issues
de la base de test (et nayant donc pas du tout participe `a lapprentissage) classe par un
syst`eme gaussien et utilisant un rescorage par r`egle. Les reseaux de neurones portent ce
score leg`erement au dessus puisquil atteint 28%. Les hypnogrammes issus des classifications
de ces nuits sont donnes en annexe J. Au vu notamment des resultats positifs du suivi de
patient, nous recommandons levaluation de ce syst`eme sur une base de taille consequente,
constituee denregistrements issus de patients sains, afin de pouvoir tirer veritablement
des conclusions definitives. Nous recommandons lemploi dune classification connexioniste,
munie dune etape de rescorage utilisant les mod`eles de Markov caches car ces techniques se
sont averees les plus prometteuses.

Precisons enfin que le reseau de neurone est nettement moins consommateur de calculs
(pour letape de classification sentend) que la classification gaussienne. En loccurrence, si
la dimension du vecteur de param`etres est 30, la classification connexioniste en six classes
necessite environ 2000 operations (multiplication ou addition), tandis que la methode
gaussienne fait appel `a 12000 operations. Quant `a la taille memoire requise pour cet
algorithme (pour la partie donnees bien entendu), elle est dans les deux cas denviron cinq
cents mots. Quant au rescorage par mod`ele de Markov, il pose le probl`eme du stockage des
resultats de classification (un stade par epoque soit environ mille mots). Le rescorage par
r`egle, sinteressant `a des donnees plus localisees necessite nettement moins de memoire. En
outre, le mod`ele de Markov necessite le calcul du chemin le plus probable par un algorithme
de Viterbi, lequel est tr`es couteux. A titre indicatif, une estimation tr`es preliminaire du cout
calculatoire requis pour cet algorithme donne environ 70000 multiplications-accumulations.
Toutefois, rien ninterdit de realiser cet algorithme `a un moment o` u les ressources materielles
peuvent lui etre en grande partie dediees.
Chapitre 5

Developpements mat eriels et


logiciels li
es au cadre CIFRE

5.1 Le bracelet SmartMedia

Le bracelet utilise `a Nantes est un bracelet autonome denregistrement, dont lelectronique


avait ete precedemment developpee au sein de la societe. Cependant, le code de gestion
de celle-ci navait pas ete finalise, et lensemble navait pas reellement ete utilise. Il nous a
donc fallu completer le developpement materiel et logiciel, ainsi que realiser lintegration
mecanique des cartes dans un botier satisfaisant nos contraintes.

Le bracelet autonome dont il est question ici permet la numerisation des signaux sur
une carte SmartMedia, couramment utilisee comme memoire dans les appareils photos
numeriques. La carte SmartMedia a pour dimension 37x45mm. Une vue generale du bra-
celet est presentee `a la figure 5.1.

Fig. 5.1 Le bracelet utilise pour lenregistrement des signaux de Nantes


Electroniquement, ce bracelet est compose de deux cartes. La premi`ere, la carte
electronique inferieure, int`egre lensemble des capteurs ainsi que la chane de traitement ana-
logique. La seconde, la carte electronique superieure, int`egre le microcontroleur de gestion
ainsi que le connecteur de la carte memoire. Une illustration des cartes est donnee en figure
5.2. On distingue sur la carte electronique inferieure le capteur de pression statique (en blanc)
ainsi que le connecteur de liaison avec la carte superieure (en beige). Lensemble des circuits
de conditionnement des signaux est situe sur lautre face de cette carte. On distingue sur la
146
CHAPITRE 5. DEVELOPPEMENTS AU CADRE CIFRE
LIES

carte electronique superieure le connecteur de la carte SmartMedia. Hormis celui-ci, peu de


composants sont visibles sur cette face de la carte superieure.

Fig. 5.2 Vue des deux cartes composant le bracelet utilise pour lenregistrement des signaux
de Nantes

5.1.1 R
ealisation
electronique du bracelet

Initialement, ce bracelet etait concu pour enregistrer les donnees au format FAT (File
Allocation Table). Ce format est celui classiquement utilise par les versions de Windows
anterieures `a NT pour la gestion des fichiers de lordinateur. Linteret de proceder de la sorte
etait de pouvoir acceder aux donnees contenues dans la SmartMedia depuis lexplorateur de
Windows, aussi simplement que nimporte quel autre fichier, et ce, en utilisant un lecteur
de carte du commerce. Ainsi, le medecin pourrait lui-meme recopier les donnees contenues
dans les cartes SmartMedia et les inserer dans le CDROM contenant les donnees de reference.
Cependant, il sest avere que nous navons pu ecrire les donnees au format FAT. Il semblerait
que les specifications de ce format dont nous disposions ne devoilaient pas compl`etement le
fonctionnement de ce mode de gestion de fichier. Nous avons alors du proceder autrement.

Sp
ecifications techniques

Concr`etement, nous avons choisi decrire les donnees `a la volee. Apr`es une premi`ere page
de synchronisation (sur la SmartMedia, une page contient 512 octets), les donnees sont ecrites
par trame de quatre octets selon lordre serrage/pouls/temperature/mouvement. Une page
doctets de valeur 0xF F signale la fin de lenregistrement. La page de synchronisation permet
de supprimer les donnees de bruit presentes sur la ligne de transmission serie.

Le microcontr
oleur

Le microcontroleur utilise est un Xe88LC02, fabrique par la societe Xemics. En dehors


des peripheriques quil int`egre, il a ete choisi pour sa consommation tr`es reduite (environ
300A `a 1 MIPS, 2A en mode faible consommation).
5.1. LE BRACELET SMARTMEDIA 147

La SmartMedia

La SmartMedia est lorgane de stockage de donnees. Elle comprend une memoire de


type flash ainsi quun controleur qui regule les acc`es `a celle-ci. La memoire flash assure
la conservation des donnees meme lorsque la memoire est privee de son alimentation. On
y acc`ede par un bus de donnees 8 bits, et plusieurs signaux permettent de configurer les
operations `a effectuer, de meme quinformer le microcontroleur sur letat de la carte.

Choix de la source
energ
etique

La consommation du montage en regime standard decriture represente un param`etre


critique du bracelet. Celle-ci est cyclique, de periode une seconde. Durant cette seconde,
on observe une premi`ere consommation stable de lordre de 2mA. La majeure partie du
courant consomme provient de lalimentation des circuits analogiques de conditionnement
des signaux (capteurs, filtres et amplificateurs). Ceux-ci sont maintenus actifs pour eviter
les phenom`enes de startup (notamment celui du capteur de pression statique, de lordre
de la seconde). On observe ensuite un pic de courant dune duree denviron 0.5ms cor-
respondant `a lecriture dans la SmartMedia. Dapr`es les documents techniques, elle est
de 20mA mais les verifications experimentales la placent plutot aux environs de 10mA.
Les enregistrements ayant une duree moyenne de 12 heures, la consommation durant les
douze heures denregistrement est de 123600(2999.5103 +100.5103 ) = 86572 mA.s.

Lors des douze heures suivantes (journee), le bracelet nest plus en mode enregistrement.
Le microcontroleur est en mode faible consommation et les peripheriques sont eteints pour
la plupart. Le syst`eme consomme alors 75A soit, sur les douze heures, 3240mA.s. En une
journee type de fonctionnement, le bracelet consomme donc environ 90A.s soit 25mA.h.

Deux types dalimentation sont envisageables : soit une pile, soit une batterie rechar-
geable. Cette derni`ere offre la possibilite de pouvoir laisser le bracelet en permanence sur
site. Cela oblige le personnel `a recharger le syst`eme reguli`erement mais cest une tache
qui ne demande pas un travail considerable. Nous nous sommes donc orientes vers ce type
dalimentation.

Plus particuli`erement, nous nous sommes interesses aux accumulateurs utilises par les
telephones portables ou encore les appareils photo. Ceux-ci, dont la technologie se base sur
des melanges Nickel-Metal hybride (NiMh) ou Lithium-Ion (Li-Ion) offrent des capacites
interessantes, de lordre de la centaine `a plusieurs centaines de milli-amp`eres heures. Quelques
exemples sont donnes sur la figure 5.3.
Toutefois, la hauteur de ce type de batterie est consequente. Ainsi, celle du pack Li-ion
de la figure 5.3(b) est de 5.4mm, ce qui, compte tenu de la hauteur de lensemble carte
electronique inferieure / carte electronique superieure qui est de 16.6mm, porte la hauteur
globale de lensemble `a 22mm, sans compter le support de batterie ni lelement superieur du
botier. Nous avons juge que cela etait dune part trop encombrant et dautre part quun tel
assemblage possedait un centre de gravite trop eleve de nature `a amplifier les mouvements
du boitier, suite `a un mouvement du poignet, ce qui nuirait `a la qualite des signaux.

Nous avons alors decide de nous orienter vers une autre piste : le connecteur utilise
148
CHAPITRE 5. DEVELOPPEMENTS AU CADRE CIFRE
LIES

(a) (b)

Fig. 5.3 Exemples de batteries Ni-Mh (a) et Lithium-ion (b)

pour la liaison des cartes electroniques (en beige sur la figure 5.2) poss`ede une hauteur de
3.5 mm. De plus, la carte electronique inferieure ne comprend sur sa face superieure quun
seul composant, un amplificateur differentiel utilise pour le conditionnement du signal de
serrage du bracelet. Ce circuit peut etre remplace sans modification du montage par le gain
programmable (aussi appele PGA) disponible dans la chane dacquisition du microcontroleur
Xemics. Nous avons donc decide de mettre `a profit cet espace pour y loger la source denergie.

La nature de lespace `a utiliser nous a oriente vers un format de type bouton, du meme
type que les piles de calculatrices. Parmi les technologies disponibles, nous avons choisi le
Mangan`ese-lithium (ML) en format 2032 (20mm de diam`etre et 3.2mm de hauteur). En effet,
les autres technologies noffrent pas de tension suffisante. A titre indicatif, le Ni-Mh en format
2032 est caracterise par une tension maximale de 1.2V . Le Mangan`ese-Lithium, lui, offre
3V , avec une capacite de 65mAh pour une masse de 3g. Le prix unitaire, de quatre euros,
est raisonnable (Commande de une unite de marque Maxell, catalogue Farnell, reference
3031998). Cet accumulateur presente donc en premier lieu toutes les caracteristiques requises.
Nous nous sommes ensuite interesses aux caracteristiques electriques approfondies.

On sait que la tension appliquee aux cartes electroniques doit etre superieure `a 2.4V pour
un fonctionnement correct. En effet, le document de reference constructeur (la datasheet)
du microcontroleur precise quen dessous de cette tension, le convertisseur ne fonctionne
plus. Or, letude des courbes de decharge de la pile dont une partie est representee en
figure 5.4, nous apprend quavec une intensite de decharge de 2mA (ce qui est, en premi`ere
approximation, notre cas durant la nuit), la tension de pile atteint la valeur de 2.4V en
seulement 10 heures environ. Or, les enregistrements peuvent durer classiquement jusque
14 heures, ce qui depasse la capacite de cet accumulateur. Dautant plus que les courbes
donnees sont theoriques en ce sens quelles supposent un parfait respect des cycles de charge
et de decharge, ce qui ne sera vraisemblablement pas le cas. Cet accumulateur ne repond
donc pas `a nos exigences.

Seules les piles (et non plus les accumulateurs) permettent dassurer une tension de
decharge constante dans une duree compatible avec lutilisation que nous souhaitons en
faire. Nous avons donc conserve le format bouton 2032 mais en pile cette fois : la CR2032. Il
faut savoir que, bien que du meme format mecanique, les caracteristiques des piles CR2032
varient sensiblement selon les marques. Nous avons oriente notre choix vers la CR2032 de
marque Varta, qui poss`ede un courant continu de decharge maximum de 3mA, ce qui est
superieur `a notre besoin. Le courant de pointe autorise est de 10mA, ce qui repond l`a-aussi
(mais de facon plus juste cette fois), `a notre besoin. Enfin, nous navons pu verifier la
5.1. LE BRACELET SMARTMEDIA 149

Fig. 5.4 Courbe de decharge de laccumulateur ML2032 Maxell, pour differentes intensites
continues de decharge.

tension de decharge pour une intensite de 2mA comme ci-dessus mais nous lavons fait pour
dautres amperages. Ainsi, pour une impedance de charge de 15k, on atteint la tension
de 2.5V au bout de 860 heures, au lieu de 30 heures dans le cas de laccumulateur. Enfin,
la capacite de cette pile est denviron 200mAh, ce qui offre une autonomie moyenne de 8 nuits.

Par contre, le fait dutiliser une pile impose de prevoir son remplacement. Comme
celle-ci sera logee entre les deux cartes electroniques, il sera necessaire pour y acceder de
desolidariser la carte superieure du botier. En consequence, loperation de changement de la
pile devra etre realisee par la societe et non par lequipe medicale, et ce, pour deux raisons.
Dabord parce quelle demande pour sa realisation un temps superieur `a celui qui nous
est accorde. Ensuite parce que toute intervention sur lelectronique impose une revalida-
tion du syst`eme qui necessite des moyens techniques dont ne dispose pas le personnel soignant.

Le centre realise des enregistrements les lundi, mardi et mercredi. Compte tenu de la
marge de securite, de la consommation en mode sommeil entre les mercredi et les lundi, ainsi
que celle durant lacheminement du bracelet entre Lannion en Nantes, nous avons decide
de qualifier les bracelets pour six nuits. Ainsi, lorsque six enregistrements sont effectues sur
un bracelet, le medecin le renvoie `a Lannion, o` u nous le reconditionnons. Compte tenu de
ces donnees, lautonomie dun bracelet est denviron deux semaines, ce qui est une duree
suffisante pour que cette procedure soit viable.

5.1.2 Le programme de gestion

La contrainte la plus forte qui existe sur lalgorithme de gestion du syst`eme est lauto-
nomie. Le code doit limiter au maximum la consommation energetique globale. Pour cela,
le syst`eme est par defaut en mode low power, ce qui reduit la consommation totale (analo-
gique + numerique) `a 75A. Il ne repasse en mode normal que lorsque la carte SmartMedia
est inseree. Dans ce cas, lensemble des syst`emes analogiques est active. Il en est de meme
pour le circuit de la SmartMedia, en positionnant une valeur haute sur un port de sortie
du microcontroleur, ce qui a pour effet de rendre passant le transistor `a effet de champ qui
commande son alimentation. Le microcontroleur se renseigne alors sur la nature de la carte
inseree (car lalgorithme dadressage depend de la capacite de la carte) et realise linitialisa-
tion de celle-ci. Puis, le programme boucle sur le mode ecriture, tant que lon natteint pas
la capacite maximale de la carte ou bien s ur que la carte nest pas retiree. Lorsque cest le
150
CHAPITRE 5. DEVELOPPEMENTS AU CADRE CIFRE
LIES

cas, le microcontroleur repasse en mode faible consommation.

D
etection de linsertion de la carte SmartMedia

Fig. 5.5 Schema de connexion utilise pour la detection de linsertion de la carte SmartMedia

Le schema de connexion utilise pour la detection de linsertion de la carte SmartMedia


est reporte sur la figure 5.5. Linsertion de la carte provoque mecaniquement un contact
entre les deux pattes SW 1 et SW 2 du connecteur SmartMedia. Par construction, SW 1 est
relie `a Vdd et SW 2 `a la pin 0 du port dentree A du microcontroleur. Ce port peut etre
configure pour declencher une interruption de nature `a reveiller le microcontroleur lorsquun
changement detat intervient sur ses pattes. Dans notre cas, linsertion de la carte est detectee
par un passage dun niveau bas `a un niveau haut de P A0. Lorsque linsertion de la carte est
detectee, une des premi`eres operations realisees consiste `a reprogrammer cette interruption
pour detecter cette fois la sortie de la carte (passage dun niveau haut `a un niveau bas sur
P A0).

Cycle d
ecriture sur la SmartMedia

Les donnees sont stockees dans un tableau de 512 octets. Chaque voie est numerisee
successivement. Pour cela, les registres de la chane dacquisition sont configures de sorte
`a numeriser la voie `a laquelle on sinteresse. De meme, letage de gain programmable est
configure afin dappliquer lamplification necessaire. Puis, la numerisation est lancee et le
microcontroleur passe en mode dattente. La consommation de celui-ci sen trouve diminuee.
Le bloc de conversion analogique-numerique gen`ere une interruption lorsque la numerisation
est realisee. Cest pourquoi cette interruption est autorisee juste avant le lancement de
la conversion. Lorsque linterruption de fin de conversion survient, elle est devalidee et le
programme passe `a la numerisation de la voie suivante.

Le respect de la frequence dechantillonnage est assure par lutilisation dune interruption


cyclique cadencee `a 128Hz. Le microcontroleur est bascule en mode faible consommation
entre deux series de conversion, mais lalimentation des circuits analogiques est maintenue
pour eviter les temps de startup des chanes de capteurs (temps necessaire au syst`eme, `a
5.1. LE BRACELET SMARTMEDIA 151

partir du moment o` u il est alimente, pour quil atteigne un regime de fonctionnement stable
permettant de lutiliser convenablement). Il faut savoir que le startup du capteur de pression
statique est de lordre de la seconde, celui du circuit delivrant le signal composite est compris
entre trente secondes et une minute.

Mode faible consommation

Lalimentation du capteur de pression est coupee, de meme que les circuits analogiques
delivrant les tensions de reference necessaires au convertisseur. Linterruption liee `a la pin 0
du port A est configuree pour detecter un changement de niveau bas vers niveau haut. Enfin,
une instruction bascule le microcontroleur en mode faible consommation.

5.1.3 Probl`
emes rencontr
es et solutions apport
ees

Nous avons rencontre un certain nombre de probl`emes avec cette electronique, que nous
avons en partie resolus.

Chute de tension Sur le signal de variation de pression arterielle, nous observions, en


plus des maximum locaux lies au rythme cardiaque, dautres pics de tension, de forme
proche, et espaces dune seconde soit `a peu pr`es la meme periode que ceux espacant
les battements cardiaques. En fait, `a chaque ecriture sur la SmartMedia, le courant de
pointe, tr`es leg`erement superieur aux previsions, depassait le maximum delivrable par la
pile . En consequence, la tension dalimentation diminuait, provoquant, pour une meme
stimulation du capteur, une variation sur la valeur disponible en entree du conver-
tisseur. Nous pallions ce probl`eme en rajoutant une capacite sur lalimentation du circuit.

Gestion de lalimentation Comme nous pouvons le voir sur le schema 5.5, le circuit de la
SmartMedia nest alimente que lorsque linsertion dune carte est detectee. Cependant,
la commande delivree par le Xemics, bien que theoriquement egale `a Vdd est en general
tr`es leg`erement inferieure, de sorte que le transistor ne devient pas passant. Afin
deliminer ce probl`eme, nous avons choisi de ne plus commander le transistor par le
microcontroleur, mais directement par le switch du connecteur SmartMedia dont nous
avons parle. Ainsi, lorsque la carte est inseree, la grille du transistor, reliee `a SW 2
se voit directement polarisee ` a Vdd . Lorsque la carte nest pas presente, lalimentation
du connecteur est stoppee. Nous avons donc garde les avantages dune alimentation
controlable, meme si la gestion de celle-ci est passee delectronique `a mecanique. Cette
correction nous a oblige, en plus des modifications par coupures de pistes ou straps ` a
pratiquer sur les cartes, `a realiser une adaptation du botier afin dy integrer le fil reliant
la grille du transistor `a SW 2.

Saturations du signal La plupart des nuits de Nantes presentent des saturations sur le
signal de variation de pression arterielle. Et, de par la nature non-lineaire de letage de
gain analogique, mais aussi en raison de la necessite de sadapter `a la variation de ser-
rage observee entre deux porteurs, nous navons pu recourir `a une simple diminution du
gain analogique. A ` la place, nous avons developpe un algorithme de gain automatique,
utilisant letage de gain programmable present sur le microcontroleur. Lorsque le gain
depasse une valeur predeterminee, celui-ci est diminue au niveau de letage program-
mable. Il en va de meme, en sens inverse, lorsque celui-ci est trop faible. Afin de ne pas
152
CHAPITRE 5. DEVELOPPEMENTS AU CADRE CIFRE
LIES

repercuter cette variabilite creee au niveau de lamplitude du signal dans la chane de


traitement, nous avons fait le choix denregistrer simultanement la valeur du gain ap-
pliquee dans le fichier memorise sur la carte SmartMedia, `a lemplacement du signal issu
du capteur de temperature, non utilise jusqu`a present. Ainsi, nous pouvons appliquer
le gain inverse sur le signal avant sa classification. Nous avons valide cette solution sur
site, mais posterieurement `a lacquisition des signaux de nuit.

5.1.4 R
ealisation dune nouvelle version de la carte
electronique sup
erieure

Une fois identifies, `a lusage, les defauts de la premi`ere version de la carte electronique
superieure, et apr`es avoir envisage les corrections que nous pouvions y apporter, nous avons
defini une nouvelle version de cette carte integrant les modifications necessaires.

Ainsi, la patte SW 2 du connecteur SmartMedia est directement connectee `a la grille


du transistor `a effet de champs de commande dalimentation. De plus, le cablage de ce
transistor est revu. En effet, le transistor tel que prevu dans la liste des composants des cartes
electroniques de la version prototype netait plus disponible au moment de lexperimentation.
Nous avions trouve un composant pouvant le remplacer mais celui-ci, bien que du meme
format (SOT-23) netait pas compatible patte-`a-patte (ou pin-compatible) : drain, grille et
source se trouvaient inversees par rapport au composant initialement prevu. Ce composant
etait donc soude `
a lenvers sur la carte. Nous avons profite de la realisation de cette version
pour effectuer la correction.

Afin de pallier au probl`eme des appels de courant lors de lecriture dans la SmartMedia,
un regulateur de tension place entre la pile et lensemble du circuit electronique. Celui-ci
permet de surcrot dassurer une tension constante tout au long du fonctionnement, quel que
soit la tension de pile, tant bien sur que celle-ci reste suffisante. En raison des faibles tension
de travail, nous avons choisi un mod`ele qui permet de disposer dune tension de sortie proche
de la tension dentree (qualifie de low-dropout).

Enfin, nous avons rajoute un amplificateur differentiel pour traiter les signaux delivres
par le capteur de pression statique. Nous avions supprime celui place initialement sur la carte
electronique inferieure afin de pouvoir y loger la pile. Les performances de ce composant
etaient en effet insuffisantes et nous avions choisi de le remplacer par le gain programmable
(PGA) du microcontroleur. Mais cette solution sest avere defaillante `a lutilisation. En effet,
la configuration du PGA etait alors `a modifier `a chaque enregistrement du signal de serrage
car celle-ci etait rendue differente de celle utilisee pour lenregistrement des autres voies. Or,
comme nous enregistrons les quatre voies `a la suite, le PGA ne disposait pas dun temps suffi-
sant pour atteindre un regime stable. De fait, les donnees concernant le serrage etaient exploi-
tables mais bruitees, ce qui nous obligeait `a realiser un traitement supplementaire sur celles-ci.
Cest pour cette raison que nous avons choisi de reintegrer un amplificateur differentiel, que
nous avons configure de sorte `a ne plus avoir `a modifier le PGA pour lenregistrement des
differents canaux.
5.1. LE BRACELET SMARTMEDIA 153

5.1.5 R
ealisation du botier

Tout comme lelectronique, la realisation du botier navait pas ete menee jusque son
terme. Un botier avait ete dessine mais, dune part, il na jamais ete produit et, dautre part,
sa conception nintegrait pas les contraintes liees `a lutilisation que nous souhaitons en faire.
Ce premier botier prevoyait une pile situee au-dessus du connecteur SmartMedia et venait
reposer sur des ergots que comportait la carte electronique superieure. Lencombrement du
syst`eme etait de 50mm par 52mm, la hauteur etant non definie car aucune pile ni support
de pile navait ete etudie.

La surface occupee ayant ete jugee trop importante pour un port confortable du bracelet,
nous avons decide de supprimer les ergots en question, ramenant la surface maximale de
lensemble electronique `a 50mm par 44 mm. La hauteur totale est fixee par le connecteur
SmartMedia, dans la mesure ou la pile est placee entre les deux cartes. Le support de pile
est constitue de deux languettes metalliques usinees par nos propres moyens. Lassemblage
prevu entoure la carte electronique superieure ainsi que la pile, la carte inferieure venant se
fixer sur celui-ci. Une visualisation de lassemblage recherche est donne par la figure 5.9(b).

Premi`
ere r
ealisation

Le capot initialement realise respecte ces contraintes. Il est constitue dun receptacle en
forme de U, nomme entretoise, ferme par une plaque fixee par clips. La carte electronique
inferieure traverse des trous debouchants qui donnent sur un pas de vis present sur la carte
electronique superieure. Lentretoise est donc maintenue en sandwich entre les deux cartes.
Le schema de ce premier botier est donne `a la figure 5.6.

Fig. 5.6 Le botier realise initialement

Comme il sagit dune tr`es petite serie (on envisage de realiser moins de dix unites du
botier), un procede par injection nest pas envisageable. En effet, ce procede demande
la realisation dun moule, lequel est tr`es cher (couramment plusieurs dizaines de milliers
deuros). Lusinage dun bloc de plastique netait pas possible non plus. En effet, la precision
demandee netait pas realisable par les societes contactees. Les reponses obtenues substituait
au plastique laluminium anodise. Celui-ci est leger et electriquement isolant mais nous ne
souhaitions pas employer ce materiau car il est desagreable `a porter (froid). Nous nous
sommes alors dirige vers des techniques de prototypage rapide. Cette technique realise un
quadrillage en deposant un fil de resine, quun laser vient polymeriser selon les plans de
la pi`ece `a realiser, puis proc`ede de meme pour le plan situe au dessus de cette premi`ere
couche. En repetant loperation autant de fois que necessaire, la pi`ece en trois dimensions
154
CHAPITRE 5. DEVELOPPEMENTS AU CADRE CIFRE
LIES

est realisee.

La qualite de fabrication depend de la machine, de la qualite des mati`eres premi`eres mais


aussi de lorientation choisie pour la realisation de la pi`ece. Ces param`etres netaient pas
matrises lors des premi`eres realisations. Mais, pour des raisons de co
ut, nous nous sommes
adresses `a un lycee professionnel et nous ne pouvions exiger de cet etablissement des pi`eces
de qualite professionnelle, ce qui nous oblige `a tenir compte des faiblesses de la qualite de
fabrication.

Ce premier capot realise presente un certain nombre de defauts de fabrication :


1. La fixation de la carte electronique inferieure dans la carte electronique superieure est
inappropriee. En effet, le pas de vis est tr`es peu profond puisquil est de taille inferieure `a
lepaisseur de la carte, qui est de 0.8 mm. Au bout de quelques montages et demontages,
celui-ci sabme et ne remplit plus son role.
2. La forme generale du botier est trop carree. Le bracelet est desagreable `a porter car les
arretes en contact avec le poignet sont trop vives. De surcrot, celui-ci se prend dans les
draps.
3. Nous avions prevu une epaisseur de la face inferieure suffisante dun point de vue rigidite.
Mais le manque de precision dans la realisation fait que celle-ci est insuffisante.
4. Le plaque superieure du capot se desolidarise trop facilement du reste du botier. La
fixation de celui-ci est donc `a revoir.
5. Enfin, il existe un ecart entre la partie superieure du connecteur SmartMedia et le capot
du botier tel que le technicien a insere plusieurs fois la carte au dessus du connecteur.
Il est donc souhaitable de diminuer cet ecart.

Deuxi`
eme r
ealisation

Partant des constatations ci-dessus, nous revoyons la forme generale du bracelet en par-
tant sur une forme de botier plus arrondie, obtenue en cassant les arretes vives. La nouvelle
forme redistribue la hauteur entre les deux parties (capot / entretoise) de sorte que le ra-
tion atteint 40/60 au lieu de 10/90. De fait, les defauts 2, 4 et 5 sont corriges. On modifie
egalement le syst`eme de solidarisation de lensemble. Les cartes electroniques sont desormais
vissees dans la masse du plastique. Pour cela, de nouveaux trous sont perces dans la carte
electronique superieure. Comme ces trous ne sont pas prevus, on perce aussi les plans de
masse et dalimentation, ce qui impose dutiliser des vis en nylon pour ne pas provoquer de
court-circuit. On obtient le botier donne en figure 5.7.
Cependant, de nouveaux defauts apparaissent sur ce botier. Ainsi, la fixation de la carte
superieure est `a revoir. Celle-ci est vissee dans la masse du plastique. Mais au bout de quelques
demontages, le pas de vis salt`ere et le vissage ne se fait plus. La fixation de la carte inferieure,
bien quidentique, ne presente pas ce defaut dans la mesure o` u elle nest pratiquement jamais
devissee. La carte superieure, elle, lest reguli`erement pour, entre autres, programmer le mi-
crocontroleur ou changer la pile. De plus, lepaisseur des montants de lentretoise sav`erent
trop faibles au niveau des gorges du clip de fixation du capot. Tr`es souvent, cette zone casse,
et le capot nest plus aussi fermement maintenu, et le simple frottement avec les draps suffit
`a lenlever au cours de la nuit.
5.1. LE BRACELET SMARTMEDIA 155

Fig. 5.7 Le botier realise apr`es correction des defauts du botier

Troisi`
eme r
ealisation

On modifie alors en trous debouchants les orifices de fixation de la carte electronique


superieure. Le maintien des vis est assure par des ecrous en nylon, que lon int`egre dans un
elargissement des trous debouchants pour des raisons de confort. Rappelons que lobjectif est
que le patient ne prenne pas de position particuli`ere du fait du port du bracelet. Lorsquon
recherche un port confortable, ce nest pas uniquement pour linteret du patient, cest aussi
afin dobtenir une certaine qualite de signaux. Les epaisseurs du capot et de lentretoise sont
egalement modifiees pour conferer plus de solidite au clip fixant ces deux pi`eces. On obtient
les pi`eces de la figure 5.8

(a) (b)

Fig. 5.8 Version 3 du botier : modifications operes sur lentretoise (a) et le capot (b).

Ce bracelet a ete le premier que nous avons pu utiliser reguli`erement. Toutefois, en produi-
sant plusieurs exemplaires de ce mod`ele, nous avons pu constater que, en raison du manque
de precision de la realisation, le plan de support de la carte electronique superieure etait
parfois incline par rapport `a la carte electronique inferieure. Or, le connecteur de liaison uti-
lise est particuli`erement sensible `a cette inclinaison, de sorte que le contact entre les deux
cartes etait intempestivement coupe. Comme la tension negative de la pile est acheminee
`a la carte superieure via ce connecteur, ces coupures produisent une reinitialisation de len-
semble electronique, et donc une perte des donnees enregistrees. Par ailleurs, les modifications
electroniques dont nous avons parle au paragraphe 5.1.3 nous obligeaient `a realiser une gorge
pour le passage du fil de connexion entre la patte SW2 du connecteur SmartMedia, et la grille
du transistor `a effet de champs commandant son alimentation.
156
CHAPITRE 5. DEVELOPPEMENTS AU CADRE CIFRE
LIES

Mod`
ele final

Nous avons donc realise un dernier mod`ele de botier, selon lequel ont ete realises les
derniers botier, sachant que les versions 3 ont continue `a etre utilisees. Ce mod`ele int`egre
une saignee pour le passage du fil de gestion de lalimentation. De plus, des plots de maintien
de la carte superieurs sont rajoutes. Ils sont ajustes en sortie de realisation du botier et
permettent donc de compenser les defauts de realisation de celui-ci. Enfin, nous en avons
profite pour rajouter de la mati`ere uniformement sur le capot, afin de le rendre plus rigide
et donc de limiter encore plus un declipsage intempestif. Lassemblage final est donne sur la
figure 5.9(b)

(a) (b)

Fig. 5.9 Version 4 du botier : modifications de lentretoise (a) et assemblage final (b).

Cette derni`ere version donne satisfaction. Le defaut le plus genant aura ete les resets
intempestifs dans la mesure ou nous ne recevions les donnees que plusieurs jours apr`es leur
enregistrement ce qui fait que lorsque nous nous rendions compte du defaut dun botier, plu-
sieurs enregistrements avaient dej`a ete realises avec celui-ci, augmentant dautant le nombre
denregistrements inexploitables.

5.1.6 R
ealisation du botier de lecture de la SmartMedia

D`es lors que nous abandonnions lecriture dans la SmartMedia selon le format FAT et que
nous utilisions un format prive, il nous fallait developper un botier de relecture specifique.
Nous avons choisi de baser celui-ci sur le MSP430F122, microcontroleur de Texas Instru-
ment, pour sa simplicite de mise en oeuvre, ajoute au fait que nous disposions des outils
de developpement necessaires (chane de compilation et outil jtag de programmation). Le
syst`eme est equipe dun connecteur SmartMedia identique `a celui qui est monte sur les bra-
celets. Les donnees sont transmises au PC via une liaison serie configuree `a 115200 bauds.
Lensemble est integre dans un botier plastique de dimension 120 80 25mm. Lalimenta-
tion est assuree par un circuit exterieur, regulee par un circuit dedie sur la carte. Le schema
de principe du botier de relecture est donne sur la figure 5.10

Fonctionnalit
es logicielles

Ce botier permet de relire les cartes SmartMedia et de transferer leur contenu sur un
PC mais aussi de les formater. Il est en effet indispensable detre certain que les cartes
5.1. LE BRACELET SMARTMEDIA 157

Fig. 5.10 Schema de principe du botier de relecture des cartes SmartMedia

utilisees sur site ne contiennent aucune donnee, notamment pour pouvoir detecter un defaut
du bracelet par labsence de donnee.

Sur le plan logiciel, le programme utilise est tr`es proche de celui implante sur le bracelet.
De par la conception modulaire de celui-ci, nous avons pu le reutiliser en grande partie, ne
modifiant que les fonctions de bas niveau generant les differents signaux de controle.

Interaction avec le PC

Nous avons choisi de conserver les donnees extraites sous la forme dun fichier formate
selon la norme admise par nos programmes de traitement. Le fichier extrait est donc
directement exploitable par ceux-ci. Pour cette raison, cest un programme Matlab qui est
utilise pour la gestion de la procedure. La liaison serie est, elle, geree par un executable que
nous avons ecrit en C, appele par le programme Matlab.

Lorsquune carte est inseree et que le programme de lecture est lance, le PC emet
un caract`ere de commande sur la liaison serie. Celui-ci est renvoye apr`es lecture par le
microcontroleur, afin de confirmer la reception de la commande. Si cette commande est unue
lecture, alors le PC se place en attente de reception des donnees. Le botier, lui, configure la
SmartMedia en lecture, et sinitialise avec les param`etres de celle-ci (taille de carte definissant
le mode dadressage, etc). Puis, les donnees sont lues et transmises au PC au fur et mesure
par le lien serie o`
u elles sont stockees en attente de leur pretraitement. Ce pretraitement a
pour but, entre autres, de separer les quatre canaux enregistres. Il utilise pour cela la page
de synchro, premi`ere page enregistree par le bracelet sur la carte, qui permet de supprimer
du fichier les eventuels octets lies `a un artefact de debut de transmission serie.

Lorsque le PC observe une page de donnee de valeur 0xF F , il transmet au micro-


controleur un ordre de fin de lecture, lequel repasse en mode dattente dun caract`ere de
commande. La procedure decriture sur une carte SmartMedia impose leffacement du cluster
(bloc de 32 pages) suivant, qui se traduit par une affectation de tous les octets `a la valeur
0xF F . En raison de la nature meme des signaux enregistres, il est impossible quune page
de 0xF F corresponde `a lenregistrement de donnees. Cest pourquoi nous utilisons ce crit`ere
pour detecter la fin dun enregistrement. Toutefois, nous avons choisi dattribuer au PC
plutot quau MSP la detection de fin denregistrement afin de nous conserver la possibilite
de changer de crit`ere de fin. Il est en effet plus facile de modifier un programme qui sexecute
sur un PC quun programme sexecutant sur une cible embarquee, auquel cas un demontage
du botier et une reprogrammation du microcontroleur est necessaire.
158
CHAPITRE 5. DEVELOPPEMENTS AU CADRE CIFRE
LIES

La lecture dune nuit necessite une trentaine de minutes. Ce temps est le fait de la liaison
serie utilisee puisque, 115200 bauds representant 11520 octets par seconde (la liaison est
configuree avec un bit de start et un bit de stop), une nuit de douze heures represente une
vingtaine de Megaoctets (12 3600 128 4), ce qui correspond `a un temps de transmission
dune trentaine de minutes (20 106 M o/11.5 103 M o.s1 ).

Le formatage dune carte SmartMedia est bien plus rapide, puisquil ny a cette fois
pas de transmission de donnees. Il est realise de la meme facon, le caract`ere de commande
transmis etant different. Enfin, un temoin lumineux dont nous modifions letat indique
loperation realisee par le botier.

Apr`es la realisation `a la main, dun prototype, et la correction des erreurs observees,


nous avons fait tirer plusieurs de ces circuits par un industriel, et ce sont ces circuits que nous
utilisons aujourdhui.

5.2 Gestion des donn


ees

Les donnees numerisees representent un volume de donnees tr`es considerable (un fichier
de nuit de Paris, une fois pretraite, occupe un volume de lordre de trois cents megaoctets).
Leur traitement est par consequent tr`es lourd, meme sur un poste de travail puissant. Un
soin tout particulier a donc ete apporte au logiciel de traitement de ces donnees.

5.2.1 Pr
etraitement des donn
ees enregistr
ees `
a Nantes

Nous nous sommes adresses `a la societe Medatech afin de connatre les procedure
dexport de fichier. Les donnees sont recuperees en deux fichiers. Le premier correspond `a
lhypnogramme. Il est au format binaire, et chaque octet correspond `a un stade de sommeil.
Chaque valeur est associee `a une epoque de cinq secondes. Lautre fichier, egalement binaire,
correspond aux signaux numerises. Toutefois, une seule valeur par seconde est inscrite dans
celui-ci, meme si les signaux sont physiquement numerises `a une frequence plus elevee.

De par la procedure dexport des donnees, il est frequent que lhypnogramme extrait
ne couvre pas la totalite du fichier de donnees. Nous avons donc d u realiser un programme
permettant de faire concider les donnees issues du fichier des signaux avec lhypnogramme.
Nous nous appuyons pour cela sur des rep`eres chronologiques presents dans les deux fichiers.
Afin de limiter la taille memoire utilisee, ce programme exclue dans le meme temps les
donnees correspondant `a un certain nombre de voies qui nous sont inutiles (notamment les
EEG et EOG).

Dans un second temps, ce fichier est mis en correspondance avec les donnees issues du
bracelet SmartMedia. Une derive temporelle existe entre les deux donnees, et nous avons
choisi de la corriger en inserant des valeurs dans le signal le plus court. Cette solution presente
lavantage de ne pas introduire de rupture dans le signal, en augmentant artificiellement la
difference maximale damplitude existant entre deux points. En inserant une valeur dans le
signal le plus court, le seul risque est de creer une pente inferieure `a la valeur maximale, ce

5.2. GESTION DES DONNEES 159

qui nengendre pas dinformation erronee dans le spectre de celui-ci.

Re-echantilloner les donnees afin quelles soient coherentes aurait signifie utiliser la plus
forte frequence dechantillonnage soit 128Hz, afin de ne pas degrader les signaux, notamment
ceux delivres par le bracelet. Le volume memoire employe etant trop consequent, nous avons
prefere stocker les donnees sous forme heterog`ene, les signaux issus du bracelet etant conserves
`a 128Hz, les signaux issus du materiel medical etant tous passes `a 1Hz. Le programme de
traitement int`egre cette heterogeneite et realise les calages des epoques (pour etre sur que
les signaux du bracelet et de la reference correspondent localement au meme moment), les
associations de fichiers, etc.

5.2.2 Pr
etraitement des donn
ees enregistr
ees `
a Paris

Les fichiers sont convertis au format EDF depuis le logiciel danalyse Deltamed. Le
format EDF (pour Eureopean Data Format) fait office de norme dans les echanges de fichiers
de signaux medicaux. Beaucoup de logiciels permettant la numerisation dEEG, dECG
ou dautres signaux sont equipes dun convertisseur EDF. Cest le cas du logiciel utilise ` a
lHotel-dieu. Ce format comprend un preambule que lon peut scinder en deux parties. Dans
la premi`ere sont regroupes des renseignements sur la version de la norme EDF employee dans
le fichier, des informations sur le patient et les heures de debut et de fin denregistrement.
Dans le seconde on trouve des renseignements sur les voies enregistrees. On y retrouve le
nom de la voie, le type de sonde, lunite de mesure, la plage de valeur admissible par celle-ci
(plage physique et numerique) la frequence dechantillonnage et les filtrages appliques le
cas echeant. Ensuite vient la partie donnees. Dans notre cas, on trouve la premi`ere seconde
de signal issu de la premi`ere sonde, puis la premi`ere seconde de la deuxi`eme sonde, etc.
Puis, lorsque toutes les premi`eres secondes de chaque voie ont ete enregistrees, on trouve la
deuxi`eme seconde de la premi`ere voie, puis la deuxi`eme seconde de la deuxi`eme voie et ainsi
de suite.

Avec le responsable technique de lHotel-Dieu, nous avons defini un montage corres-


pondant `a lenregistrement des voies du bracelet en sus des voies utilisees par lequipe
medicale. Le montage definit la configuration des voies utilisees et cest un param`etre que
doivent renseigner les techniciens denregistrement. Dans celui-ci, on obtient, dans lordre,
les voies : EOG1 / EOG2 / EMG1 / EMG2 / C3 / C4 / O2 / A1 / A2 / AIR / THO
/ ABD / ECG / SAT / ACT1 / ACT2 / ACT3 / ANNOTATION. Les EOGx sont les
electro-oculogrammes, les EMGx sont les electromyogrammes. Les voies Cx, Ox et Ax sont
des voies delectro-encephalogramme. AIR, THO, ABD sont les respirations respectivement
nasales, thoracique et abdominales. Enfin, les voies correspondant au bracelet sont les ACTx.
Notons toutefois que des sondes peuvent ne pas etre cablees ce qui se traduit par un bruit
enregistre au niveau de la voie. Cest reguli`erement le cas pour lECG.

Lhypnogramme est, lui, contenu dans un fichier au format texte, lequel contient egalement
les ev`enements respiratoires. Le programme de pretraitement synchronise ces deux fichiers
en re-echantillonnant lhypnogramme `a 256Hz au lieu de 1/30Hz (un stade par epoque),
puis accole les donnees. On elimine au passage les voies EEG, EOG et EMG dont nous ne
nous servons pas. La nuit est ensuite decoupee et enregistree en fichiers de trente minutes
au format texte. Cela permet deviter de manipuler de trop gros fichiers (nous traitons des
donnees texte, ce qui est beaucoup plus lourd que le binaire). Au final, une nuit comprend en
160
CHAPITRE 5. DEVELOPPEMENTS AU CADRE CIFRE
LIES

general une quinzaine de fichiers.

5.2.3 Traitement des nuits

D
efinition dun nouveau format de fichier

Le logiciel de traitement de donnees devait nous permettre de tester diverses methodes


de classification, et les differents parametrages de celle-ci. Or , il est inutile de recalculer les
valeurs des param`etres pour chaque vecteur epoque lorsquon teste une nouvelle methode de
classification. Cest pourquoi nous avons choisi de ne pas classer directement les fichiers texte
mais une version dans laquelle toutes les donnees utiles sont regroupees. Pour cela nous avons
cree le format EPO. Dans ce format, chaque epoque est caracterise par un vecteur colonne,
lequel comprend `a la fois les param`etres calcules sur les signaux issus du bracelet, et des
donnees issues des informations medicales. Les lignes de ce vecteur sont detaillees ci-dessous :
Stade : Indique le stade de sommeil score pour cette epoque par lequipe
medicale.
EVT (pour evenement) : Code renseignant sur la presence dun
ev`enement respiratoire (apnee) et, le cas echeant, le type de celui-
ci.
n plage : Numero de lepoque dans la nuit. Cette donnee permet notam-
ment de savoir si lepoque que lon est en train de traiter est contig
ue
`a la derni`ere epoque traitee.
R
eserv
e : Champ reserve pour des fonctionnalites futures du logiciel.
Type erreur : Type derreur releve pour cette epoque (-1, pas derreur,
1 : saturation locale du signal de variation de pression arterielle, 3 :
valeur de rythme cardiaque de reference aberrante etc...).
Activit
e : Valeur quantifiant lactivite observee sur le signal dactivite
lors de cette epoque.
Param. 1 . . . Param. N : Les N param`etres calcules `a partir du signal
de variation de pression arterielle.
R
eserv
e : Champ reserve pour des fonctionnalites futures du logiciel.

La figure 5.11 indique les traitements operes sur une nouvelle nuit. Les fichiers pretraites
contenant les signaux numerises sont decoupes en epoques de trente secondes. Differents
param`etres (N en tout) sont calcules sur le signal composite et le signal dactivite. Ces
param`etres sont ensuite encapsules dans un vecteur, qui represente alors lepoque consideree.
Ce vecteur est alors accole au vecteur representant lepoque precedente, et lensemble des
epoque represente la nuit traitee. Cette succession de vecteur est sauvegardee dans un
fichier au format EPO. Ce vecteur peut aussi etre integre `a la base de donnees de stades de
sommeil, notamment si lon veut sen servir pour realiser un apprentissage.

Lorsquune nuit doit etre traitee, le logiciel de gestion sassure quil existe un fichier
EPO. Si cest le cas, il lutilise, sinon, il le calcule selon la procedure que nous venons de
decrire. Lensemble des fonctions traitent les donnees selon ce format afin de pouvoir realiser
facilement des modifications sur tous les elements de la chane de traitement.

5.2. GESTION DES DONNEES 161

Fig. 5.11 Procedure dintegration dune nuit dans la base de donnees

La taille dun fichier EPO est de lordre de 3Mo, ce qui est tout `a fait raisonnable. Cette
facon de proceder permet de reduire considerablement les temps de traitement puisquon ne
travaille plus directement sur les donnees brutes. Ainsi, le calcul de lhypnogramme dune
nuit par methode gaussienne prend moins de cinq secondes au lieu de plusieurs dizaines de
minutes auparavant.

Chane de traitement

La figure 5.12 decrit la facon dont sont interconnectees les differentes fonctions. Nous
avons pris soin de separer les programmes mathematiques de la gestion graphique, tout
comme des bases de donnees. Cette facon de proceder permet une evolutivite plus grande.
Ainsi, il est possible de modifier linterface graphique sans que les programmes de gestion de
donnees nen soient affectes.

Independance vis ` a vis de la normalisation De la meme facon, la base de donnees


stockee nest pas normalisee. En effet, la normalisation est determinee en fonction des vec-
teurs presents dans la base dapprentissage. Toute modification de celle-ci, par lintegration
dune nouvelle nuit par exemple, modifie les coefficients de normalisation. Cest pourquoi
ces coefficients sont calcules `a chaque fois quun apprentissage est declenche. Et les vecteurs
stockes ne sont donc pas normalises parce quau moment de lintegration dune nuit on ne
connat pas les coefficients de normalisation qui devront lui etre appliques.
162
CHAPITRE 5. DEVELOPPEMENTS AU CADRE CIFRE
LIES

Fig. 5.12 Schema de larchitecture du programme supervisant lexploitation des donnees

Ind ependance vis ` a vis des fonctions lin eaires discriminantes La meme raison ex-
plique que les donnees groupees par fonctions lineaires discriminantes ne soient pas stockees
telles quelles. Les coefficients de ces fonctions sont conserves `a part, et elles sont appliquees,
le cas echeant, sur les donnees de la base.

R eduction de matrice Enfin, nous avons fait le choix de stocker dans le fichier EPO
les vecteurs comprenant les valeurs calculees pour lensemble des param`etres soit 440 en
tout. De par la structure des programmes utilises, cela ne modifiait pas considerablement les
temps de calcul ni la consommation memoire, et nous avons ainsi pu experimenter diverses
configurations de param`etres, sans pour autant avoir besoin de retraiter les fichiers texte. Un
fichier permet dindiquer au programme de supervision les param`etres du vecteur que lon
souhaite conserver pour la classification et celui-ci se charge deliminer en consequence les
donnees avant leur traitement.

Proc
edure de traitement

Apprentissage Lapprentissage selectionne la base dapprentissage appropriee (celle des


stades de sommeil ou celle des groupes de stades de sommeil). Les lignes correspondant
aux param`etres non explicitement cites dans le fichier de reduction de matrice sont elimines
et les param`etres restants sont normalises selon des coefficients que lon determine `a cet
instant. Puis, si cette option est choisie, les fonctions lineaires discriminantes sont calculees
et sont immediatement utilisees pour combiner les param`etres. Dans ce cas, une nouvelle
normalisation est calculee puis pratiquee, afin de garantir que les donnees utilisees pour la
classification soient `a valeur dans lintervalle [-1 ;1]. Meme si la normalisation est pratiquee
pour lutilisation des reseaux connexionistes, nous lappliquons aussi, pour des raisons de
compatibilite, lorsquon utilise la classification gaussienne. Les param`etres de classification
sont calcules sur ces donnees. De meme, le mod`ele de Markov cache utilise pour le rescorage
5.3. CONCLUSION 163

est appris lors de cette procedure.

Test Le test de la classification est pratique selon la meme chronologie. Les seules differences
sont que la base selectionnee correspond, cette fois, `a la base de test. Les param`etres de
normalisation ne sont pas recalcules : ce sont les param`etres determines lors de la phase
dapprentissage qui sont appliques.

Realisation dun hypnogramme La realisation dun hypnogramme fait appel `a la


procedure de test ci-dessus. Seulement, au lieu de tester les elements de la base de test, le
syst`eme classe les vecteurs dune nuit donnee. A lissue de cette classification, le programme de
rescorage est applique, et on affiche lhypnogramme obtenu, ainsi que la matrice de confusion.

Les programmes ont ete concus pour maximiser la reutilisabilite des fonctions. Cela permet
de limiter les developpements `a realiser, de pouvoir realiser simplement des modifications, et
surtout de limiter les erreurs possibles.

5.3 Conclusion
La mise en place du cadre general de cette th`ese a necessite un travail considerable tant
administratif que technique. En effet, nous avons d u, dans un premier temps, contacter
plusieurs laboratoires de recherche specialises sur lanalyse du sommeil. Puis nous avons d u
formaliser le cadre de cette etude avec les equipes medicales. Il nous a fallu, pour cela, regler
un certain nombre de questions administratives, dautant plus delicates que notre etude se
place dans le domaine fortement reglemente quest la recherche biomedicale.

Ceci fait, nous avons developpe les materiels specifiques denregistrement utilises dans
les laboratoires de sommeil. Le bracelet SmartMedia a demande un effort de developpement
consequent, notamment car nous avons d u finaliser le prototype quil etait en un produit
de petite serie. Lorsque ces syst`emes ont ete en place, nous avons mis au point, en colabo-
ration avec les equipes medicales, les procedures utilisees par les techniciens denregistrement.

Enfin, nous avons developpe une chane, pour traiter ces donnees, qui offre une grande
evolutivite, ce qui nous a permis dexperimenter facilement de nouveaux algorithmes sur les
donnees `a notre disposition. Par ailleurs, un soin particulier a ete apporte `a sa conception de
sorte quelle resout les probl`emes lies `a la manipulation de fichiers de tr`es grande taille, ce
qui est le cas des enregistrements de nuits utilises dans cette etude.
Chapitre 6

Conclusion et perspectives

Nous avons presente dans ce document letude dun syst`eme de classification automatique
du sommeil, base sur un bracelet multicapteur permettant, entre autre, lacquisition du
signal de variation de londe de pression arterielle radiale.

Lidee premi`ere exploitee dans cette th`ese consiste `a exploiter les informations cardio-
respiratoires pour realiser letape de classification. Cest pourquoi nous developpons, dans
un premier temps, deux estimateurs de ces frequences, potentiellement compatibles avec
la nature embarquee du syst`eme. Le premier estimateur sappuie sur une modelisation
du syst`eme physiologique de generation des battements cardiaques. Apr`es avoir presente
les fondements theoriques des algorithmes destimation des entrees du mod`ele `a partir des
observations de sortie, nous avons valide cet estimateur de la frequence respiratoire sur des
signaux synthetiques. Puis, nous avons progressivement adapte le syst`eme `a lexploitation du
signal de variation de pression arterielle, sur lequel il sav`ere interessant. Il offre cependant
une mesure dont la variance est loin detre negligeable. Une etude temporelle rev`ele que
celle-ci est surtout le fruit derreurs isolees. Cest pourquoi il serait interessant de le completer
par un syst`eme permettant de sassurer de la pertinence des mesures delivrees, de sorte ` a
pouvoir eliminer les valeurs aberrantes.

Dans un second temps, nous avons utilise les connaissances dont on dispose sur la
generation du signal de variation de pression arterielle pour isoler les param`etres qui y sont
inclus. La modulation en amplitude et en frequence de ce signal a ete exploree. Il en ressort
que lestimation du signal de frequence instantanee fournit un bon estimateur de la frequence
cardiaque. Par contre, les modulations liees `a la respiration ne sont pas exploitables, car
trop tenues dans le signal. Nous avons alors developpe un autre estimateur de la frequence
respiratoire, utilisant lestimateur de la frequence cardiaque, et exploitant une estimation
adaptative du vecteur propre maximum associe `a la composante respiratoire additive du
signal de variation de pression arterielle. Ce dernier estimateur est satisfaisant pour notre
application.

Nous nous sommes alors atteles `a loperation de classification. Parmi les param`etres
que nous avons developpes `a cet effet, les plus pertinents concernent la decomposition
frequentielle du signal de variation de pression arterielle et la correlation `a court terme
(quelques millisecondes) de ce signal. On note que lorsquon se concentre sur un seul individu,
les param`etres pertinents sont ceux lies aux rythmes cardiaque et respiratoire, ainsi que la
166 CHAPITRE 6. CONCLUSION ET PERSPECTIVES

correlation `
a long terme (une seconde) du signal. Par ailleurs, limportance de la modulation
du signal de variation de pression arterielle par lactivite respiratoire sav`ere un param`etre
important dans les deux cas.

Deux techniques de classification utilisant ce jeu de param`etres sont ensuite etudiees : la


classification bayesienne, sappuyant sur une modelisation monogaussienne, et les reseaux de
neurones. Les etudes montrent quaucune de ces deux techniques ne permet une classification
efficace des donnees. Le regroupement des stades physiologiquement proches nameliore pas
significativement les resultats, ni meme lemploi de methodes combinant les param`etres
entre eux pour maximiser la discrimination. Par contre, lorsque lapprentissage et le test
sont pratiques sur un seul individu (mais sur des donnees differentes) les resultats sont tr`es
pertinents, meme pour la classification en six stades (la plus difficile `a realiser). Nous avons
egalement valide deux techniques de rescorage cest-`a-dire de correction des erreurs realisees
par le syst`eme de classification. La premi`ere utilise des r`egles et la seconde une modelisation
markovienne de la nuit.

Le syst`eme en lui-meme semble donc pertinent et la defaillance observee est probable-


ment en grande partie le fait de la nature de la base de donnees. Composee uniquement
denregistrements realises sur des patients pathologiques, les nuits ne poss`edent pas de
comportement similaire au niveau de la structure du sommeil, ce qui rend impossible
lapprentissage dune generalite par le syst`eme. Cest notamment tr`es genant pour le mod`ele
de Markov cache utilise pour le rescorage. Nous pensons egalement quune source derreur
provient des param`etres utilises, qui ne sont pas independants des sujets. Aussi, bien que
les resultats des classifications soient insuffisants, nous ne concluons pas `a linefficacite du
syst`eme. Au contraire, meme si des ameliorations sont `a apporter, le syst`eme a demontre
un potentiel interessant sur certaines applications, quil convient de generaliser en levaluant
sur une base denregistrements issus dindividus sains.

Un autre axe de recherche sappuyant sur les conclusions observees dans ce rapport
concerne le developpement dun syst`eme de detection automatique des apnees du sommeil.
Ce trouble concerne pr`es de 80% des personnes frequentant les laboratoires de sommeil. Sa
detection par un syst`eme automatique ambulatoire permettrait de desengorger les centres de
sommeil, dont les delais dattente atteignent couramment six mois. Sachant que nous avons
developpe, notamment au paragraphe 3.5, des techniques permettant dacceder `a une image
du signal respiratoire et que, de plus, la base denregistrements que nous avons constituee
est compatible avec une telle etude, le travail realise dans le cadre de cette th`ese pourrait
servir de point de depart `a une telle recherche.

Enfin, precisons quil est prevu que les estimateurs de la frequence cardiaque et de la
frequence respiratoire, developpes au paragraphe 3, soient integres tr`es prochainement au
sein du bracelet SereoZ.
Bibliographie

[1] O. BENOIT and F. GOLDENBERG, Exploration du sommeil et de la vigilance chez



ladulte, Collection Explorations fonctionnelle humaines. Editions medicales internatio-
nales, 1997.
[2] Science et vie hors serie : le sommeil, Septembre 2002.
[3] O. INGREMEAU, Etude de la fusion de donnees pour une architecture multi-capteurs
appliquees `
a la mesure de param`etres biologiques, Ph.D. thesis, universite de Rennes 1,
Decembre 1995, n 1433.
[4] O. BENOIT and J. FORET, Le sommeil humain, bases experimentales physiologiques
et physiopathologiques, MASSON, second edition, 1995.
[5] J.L. VALATX, Mecanismes du cycle veille-sommeil-reve, La revue du praticien, vol.
46, pp. 2404 2410, 1996.

[6] M. JOUVET, Eveil, sommeil reve, Le courrier du CNRS, vol. 55, pp. 40 48, 1984.
[7] J.F. LAMBERT, Un comportement vital : le sommeil, Lecole maternelle Francaise,
vol. 6, Fevrier 1992.
[8] A.L. LOOMIS, E.N. HARVEY, and G.A. HOBART, Cerebral states during sleep, as
studied by human brain potentials, Journal of experimental psychology, vol. 21, pp.
127 144, 1937.
[9] M. JOUVET, F. MICHEL, and J. COURJON, Sur un stade dactivite electrique
cerebrale rapide au cours du sommeil physiologique, Seances Soc. Biol., vol. 153, pp.
1024 1028, 1959.
[10] E. SHULLER, Les insomnies et le sommeil, Robert Laffont, 1976.
[11] J.M. GAILLARD, Structure du sommeil humain : analyse traditionnelle electronique
et pharmacologique, in Le sommeil humain. Bases experimentales, physiologiques et

physiopathologiques, Collection Explorations fonctionnelle humaines. Editions medicales
internationales, 1997.
[12] D. KURTZ, Sommeil et fonctions cardio-circulatoires, in Le sommeil humain. Bases
experimentales, physiologiques et physiopathologiques, Collection Explorations fonction-

nelle humaines. Editions medicales internationales, 1997.
[13] S. TELSER, M. STAUDACHER, Y. PLONNER, A. AMANN, H. HINTERHUBER, and
M. RITSCH-MARTE, Can one detect sleep stage transitions for on-line sleep scoring
by monitoring the heart rate variability ?, Somnology, vol. 8, no. 2, pp. 33 41, Mai
2004.
[14] E. VANOLI, P.B. ADAMSON, G.D. PINNA, R. LAZZARA, and W.C. ORR, Heart
rate variability during specific sleep stage, Circulation, vol. 91, Avril 1995.
168 BIBLIOGRAPHIE

[15] J. KRIEGER, Ventilation au cours du sommeil. du normal au pathologique, in Le


sommeil humain. Bases experimentales, physiologiques et physiopathologiques, Collection

Explorations fonctionnelle humaines. Editions medicales internationales, 1997.
[16] B.H. JANSEN and K. SHANKAR, Sleep staging with movement-related signals,
International journal of biomedical computing, vol. 32, pp. 289 297, 1993.
[17] J.C. PRINCIPE, S.K. GALA, and T.G. CHANG, Sleep staging automaton based on the
theory of evidence, IEEE transactions on biomedical engineering, vol. 36, pp. 503 509,
1989.
[18] C. BERTHOMIER, J. PRADO, and O. BENOIT, Eeg analysis using non-uniform
oversampled filter banks, Biomedical sciences instrumentation, vol. 34, pp. 119 124,
1998.
[19] E. STANUS, B. LACROIX, M. KERKHOFS, and J. MENDLEWICZ, Automated sleep
scoring : a comparative reliability study of two algorithms, Electroencephalography and
clinical neurophysiology, vol. 66, pp. 448 456, 1987.
[20] N. ITOWI, A. YAMATODANI, S. KIYONO, M. HIRAIWA, and H. WADA, Deve-
lopment of a computer program classifying rat sleep stages, Journal of neuroscience
methods, vol. 31, pp. 137 143, 1990.
[21] R.J. COLE, D.F. KRIPKE, W. GRUEN, D.J. MULLANEY, and J.C. GILIN, Auto-
matic sleep/wake identification from wrist activity, Sleep, vol. 15, pp. 461 469, 1992.
[22] A. SADEH, K.M. SHARKEY, and MA.A CARSKADON, Activity-based sleep-wake
identification : an empirical test of methodological issues, Sleep, vol. 17, pp. 201 207,
1994.
[23] J.B. WEBSTER, D.F. KRIPKE, S. MESSIN, D.J. MULLANEY, and G. WYBORNEY,
An activity-based sleep monitor system for ambulatory use, Sleep, vol. 5, pp. 389 399,
1982.
ONEN,
[24] J. LOTJ I. KORHONEN, K. HIRVONEN, S. ESKELINEN, M. MYLLYMAKI,
and M. PARTINEN, Automatic sleep-wake and nap analysis with a new wrist worn
online activity monitoring device vivago wristcare, Sleep, vol. 26, no. 1, pp. 86 90,
2003.
[25] C. BERTHOMIER, J. PRADO, and O. BENOIT, Automatic sleep eeg analysis using
filter banks, Biomedical sciences instrumentation, vol. 35, pp. 241 246, 1999.
[26] A. KUMAR, A real time for pattern recognition of human sleep stages by fuzzy system
analysis, Pattern recognition, vol. 9, pp. 43 6, 1977.
[27] P.J. DURKA, U. MALINOWSKA, W. SZELENBERGER, A. WAKAROW, and K. J.
BLLINOWSKA, High resolution parametric description of slow wave sleep, Journal
of Neuroscience methods, vol. 147, no. 1, pp. 15 21, 2005.
[28] G.S.F. RUIGT, J.N. VAN PROOSDIJ, and A.M.L. VAN DELFT, A large scale, high
resolution, automated system for rat sleep staging. i. methodology and technical aspect,
Electroencephalography and clinical neurophysiology, vol. 73, pp. 52 63, 1989.
[29] A. FLEXER, G. FLEXER, and A. DORFFNER, Improvements on continuous unsu-
pervised sleep staging, in Neural Networks for Signal Processing XII, Proceedings of
NNSP 2002, Institute of Electrical and Electronics Engineers, 2002, pp. 687 695.
[30] D. NOVAK, T. AL-ANI, Y. HAMAM, and L. LHOTSKA, Electroencephalogram pro-
cessing using hidden markov models, in 5th EUROSIM Congress on Modelling and
Simulation, September 06-10,2004, Paris, France, 2004.
BIBLIOGRAPHIE 169

[31] U. BARCARO, E. BONANNI, L. MURRI, L. PARRINO, and M. G. TERZANO, A


general automatic method for the analysis of nrem sleep microstructure, Sleep Medicine,
vol. 5, no. 6, pp. 567 576, Novembre 2004.
[32] M. HANAOKA, M. KOBAYASHI, and H. YAMAZAKI, Automatic sleep stage sco-
ring based on waveform recognition method and decision-tree learning, Systems and
computers in Japan, vol. 33, no. 11, pp. 1 13, 2002.
[33] M. KOIVULUOMA, A. VARRI, and A. FLEXER, Modelling sleep with gaussian mix-
ture model based on eye movements and delta-activity, in Proceedings of EUSIPCO
2000, 10th European Signal Processing Conference, 4-8 September 2000, Tampere, Fin-
land, 2000, pp. 35 38.
[34] C. BERTHOMIER, Modelisation de levolution des differents rythmes du signal dEEG
de sommeil, Ph.D. thesis, Ecole Nationale Superieure des Telecommunications, Sep-
tembre 1999, Specialite signal et images.
[35] T. SHIMADA, T. SHIINA, and Y. SAITO, Detection of characteristic waves of sleep
eeg by neural network analysis, IEEE Transactions on biomedical engineering, vol. 47,
pp. 369 379, 2000.
[36] G. JANDO, R.M. SIEGEL, Z. HORVATH,
and G. BUZSAKI, Pattern recognition
of the electroencephalogram by artificial neural networks, Electroencephalography and
clinical neurophysiology, vol. 86, pp. 100 109, 1993.

[37] M. GROZINGER,
J. ROSCHKE,
and B. KLOPEL, Automatic recognition of rapid
eye movement (rem) sleep by artificial neural networks, Journal of sleep research, vol.
4, pp. 86 91, 1995.
[38] N. SCHALTENBRAND, R. LENGELLE, M. TOUSSAINT, R. LUTHRINGER, G. CA-
RELLI, A. JACQMIN, E. LAINEY, A. MUSET, and J.P. MACHER, Sleep stage
scoring using the neural network model : comparison between visual and automatic ana-
lysis in normal subjects and patients, American sleep disorders association nad sleep
research society, vol. 19, pp. 26 35, 1966.
[39] G. PFURTSCHELLER, D. FLOTZINGER, and K. MATUSCHIK, Sleep classification
in infants based on artificial neural networks, Biomedizinishe Technik, vol. 37, pp.
122 130, 1992.
[40] C. ROBERT, P. KARASINSKI, R. NATOWICZ, and A. LIMOGE, Adult rat vigilance
states discrimination by artificial neural networks using a single eeg channel, Physiology
and behavior, vol. 59, pp. 1051 1060, 1996.
[41] A.N. MAMELAK, J.J. QUATTROCHI, and J.A. HOBSON, Automated staging of
sleep in cats using neural networks, Electroencephalography and clinical neurophysiology,
vol. 79, pp. 52 61, 1991.
[42] N. KERKERNI, F. ALEXANDRE, M. H. BEDOUI, L. BOUGRAIN, and M. DOGUI,
Automatic classification of sleep stages on a eeg signal by artificial neural networks, in
5th WSEAS International Confernece on Signal, speech and Image processing, WSEAS-
SSIP05, 2005.
[43] Z. SHINAR, A. BAHARAV, Y. DAGAN, and S. AKSELROD, Automatic detection
of slow-wave-sleep using heart rate variability, Computers in Cardiology, vol. 28, pp.
593 596, 2001.
[44] X. TANG, B. DWORKIN, and S. RESIMAN, Time frequency analysis of heart rate
variability in rat sleep/wakefulness cycles, in Bioengineering Conference, 1999. Procee-
dings of the IEEE 25th Annual Northeast , 8-9 Apr 1999, 1999, pp. 78 80.
170 BIBLIOGRAPHIE

[45] Y. ICHIMARU, K.P. CLARK, C.J. RINGLER, and W.J.WEISS, Effect of sleep stage
on the relationship between respiration and heart rate variability, in Computers in
Cardiology. Proceedings, 23-26 sep 1990, 1990, pp. 657 660.
[46] H. OTZENBERGER, C. GRONFIER, C. SIMON, A. CHARLOUX, J. EHRHART,
F. PICQUARD, and G. BRANDENBERGER, Dynamic heart rate variability : a tool
for exploring sympathovagal balance continously during sleep in men, American Journal
of Physiology - Heart and Circulatory Physiology, vol. 275, pp. H946 H950, 1998.
[47] A.J. WELSH and P.C. RIDCHARDSON, Computer sleep stage classification using
heart rate data, Electroencephalography and clinical neurophysiology, vol. 34, pp. 145
152, 1973.
[48] Z. ZHI, G. SHANGKAI, and G. XIAORONG, Sleep staging based on the analysis of
heart rate variability with hidden markov models, in 24th Annual Conference and the
Annual Fall Meeting of the Biomedical Engineering Society. EMBS/BMES Conference,
2002. Proceedings of the Second Joint, 2002, vol. 2, pp. 1619 1619.
[49] T. SALMI and L. LEINONEN, Automatic analysis of sleep records with static charge
sensitive bed, Electroencephalography and clinical neurophysiology, vol. 64, pp. 84 87,
1986.
[50] R.M. HARPER, V.L. SCHSCHTMAN, and K.A. KLUGE, Machine classification of
infant sleep state using cardiorespiratory measures, Electroencephalography and clinical
neurophysiology, vol. 67, pp. 379 387, 1987.
[51] T. KIRJAVENEN, D. COOPER, O. POLO, and C.E. SULLIVAN, Respiratory and
body movements as indicators of sleep stage and wakefullness in infants and young
children, Journal of sleep research, vol. 5, pp. 186 194, 1996.
[52] T. WATANABE and K. WATANABE, Noncontact method for sleep stage estimation,
IEEE Transactions on biomedical engineering, vol. 51, pp. 1735 1748, Octobre 2004.
[53] P. De CHAZAL, C. HENEGHAN, and R. B. REILLY, Automatic sleep apnoea detec-
tion using measures of amplitude and heart rate variability from the electrocardiogram,
in Proceedings of the 16th International Conference on Pattern Recognition, 11-15 Au-
gust 2002, 2002, pp. 775 778.
[54] T. AL-ANI, D. NOVAK, F. LOFASO, Y. HAMAM, P. T. POZZO MENDOSA, D. ISA-
BEY, L. LHOTSKA, and R. FODIL, Noninvasive automatic sleep apnea classification
system, in Conference on Modeling and Simulation in Biology, Medicine and Biomedical
Engineering, BioMedSim05 Link oping, Sweden, May 26-27,2005, 2005.
[55] J. E. MIETUS, C. K. PENG, P. C. IVANOV, and A. L. GOLDBERGER, Detection
of obstructive sleep apnea from cardiac interbeat interval time series, in Computers in
Cardiology 2000, 24-27 September 2000, Cambridge, Massachusetts, 2000, vol. 27, pp.
753 756.
[56] A.M. BIANCHI, U.J. SCHOLZ, L.T. MAINARDI, P. ORLANDINI, G. POZZA, and
S.CERUTTI, Extraction of the respiration influence from the heart rate variability si-
gnal by means of lattice adaptive filter, in Engineering in Medicine and Biology Society,
1994. Engineering Advances : New Opportunities for Biomedical Engineers. Proceedings
of the 16th Annual International Conference of the IEEE, 1994, vol. 1, pp. 121 122.
[57] L. ZHAO, S. REISMAN, and T. FINDLEY, Respiration from the electrocardiogram
during heart rate variability studies, in Engineering in Medicine and Biology Society,
1994. Engineering Advances : New Opportunities for Biomedical Engineers. Proceedings
of the 16th Annual International Conference of the IEEE, 3-6 Nov 1994, 1994, vol. 1,
pp. 123 124.
BIBLIOGRAPHIE 171

[58] C. MEDIGUE, J. CLAIRAMBAULT, F. KAUFFMANN, M. SORINE, and L. CURZI-


DASCALOVA, Utilisation du langage SIGNAL pur letude dalgorithmes de traitement
du signal electrocardiographique, INRIA, Juin 1992, Rapport de recherche n 1717.
[59] H.J. BURGESS, J. TRINDER, Y. KIM, and D. LUKE, Sleep and circadian influences
on cardiac autonomic nervous system activity, American Journal of Physiology - Heart
and Circulatory Physiology, vol. 273, pp. H1761 H1768, 1997.
[60] S.R. SEYDNEJAD and R.I. KITNEY, A parametric solution to integral pulse frequency
modulation model, in Proceedings of the first joint BMES/EMBS conference, Octobre
1999, p. 997.
[61] P. Z. ZHANG, W. N. TAPP, S. S. REISMAN, and B. H. NATELSON, Respiration
response curve analysis of heart rate variability, IEEE Transactions on Biomedical
Engineering, vol. 44, no. 4, pp. 321 325, Avril 1997.
[62] J.A. CADZOW, Least squares, modelling, and signal procesing, Digital Signal Pro-
cessing, vol. 4, pp. 2 20, 1994.
[63] J.A. CADZOW, Total least squares, matrix enhancement, and signal processing,
Digital Signal Processing, vol. 4, pp. 21 39, 1994.
[64] P. A. REGALIA, An adaptive unit norm filter with applications to signl analysis and
karhunen-lo`eve transformations, IEEE Transactions on circuits and systems, vol. 37,
pp. 646 649, Mai 1990.
[65] R. COLOMBO, F. MASSARI, M.V. PITZALIS, F. MASTROPASQUA, G. MINUCO,
and P. RIZZON, Spectral analysis of heart rate variability signal induced by noninvasive
modulation of venous return, in Computers in Cardiology 1995, 1995, pp. 103 106.
[66] P. MARAGOS, J. F. KAISER, and T. F. QUATIERI, On amplitude and frequency
demodulation using energy operators, IEEE Transactions on Signal Processing, vol.
41, no. 4, pp. 1532 1550, Avril 1993.
[67] J. PAN and W.J. TOMPKINS, A real-time qrs detecttion algorithm, IEEE Transac-
tions on Biomedical Engineering, vol. 32, no. 3, pp. 230 236, Mars 1985.
[68] P. MARAGOS, J. F. KAISER, and T. F. QUATIERI, Energy separation in signal mo-
dulations with application to speech analysis, IEEE Transactions on Signal Processing,
vol. 41, no. 10, pp. 3024 3051, Octobre 1993.
[69] A. V. OPENHEIM and R. W. SHAFER, Digital Signal Processing, Prentice-Hall, 1975.
[70] H.C. SO and K.W. CHAN, Reformulation of pisarenko harmonic decomposition method
for single-tone frequency estimation, IEEE Transactions on Signal Processing, vol. 52,
no. 4, pp. 1128 1135, Avril 2004.
[71] R. M. ADELSON, Frequency estimation from new measurements, Digital signal
processing, vol. 7, pp. 47 54, 1997.
[72] M. BELLANGER, Analyse des Signaux et Filtrage Numerique Adaptatif, MASSON,
1989.
[73] S.J. ORFANIDIS, Zero-tracking adaptive filters, IEEE Transactions on Acoustics,
Speech and Signal Processing, vol. 34, no. 6, pp. 1566 1572, Decembre 1986.
[74] D. DESBOIS, Une introduction `a lanalyse discriminante avec spss pour windows,
Revue du Modulad, vol. 30, pp. 21 51, 2003.
[75] A. CORNUEJOLS and L. MICLET, Apprentissage artificiel, concepts et algorithmes,
Editions EYROLLES, 2002.
[76] G. SAPORTA, Probabilite analyse des donnees et statistiques, Editions TECHNIP, 1990.
172 BIBLIOGRAPHIE

[77] C. BISHOP, Neural networks for pattern recognition, Oxford University Press, 1995.
[78] S. HAYKIN, Neural networks, a comprehensive foundation, MACMILLAN, 1994.
Annexe A

Param`
etres quantitatifs retenus

Param`etres quantitatifs retenus pour la classification


Indice Titre
1 Periode cardiaque moyenne
2 Variance des periodes cardiaques
3 Frequence cardiaque mediane
4 Variance du rythme cardiaque / Periode cardiaque moyenne
5 Periode cardiaque maximale - Periode cardiaque minimale
6 Periode cardiaque maximale / Periode cardiaque minimale
7 Periode cardiaque maximale - Periode cardiaque moyenne
8 Periode cardiaque minimale - Periode cardiaque moyenne
9 Periode cardiaque maximale / Periode cardiaque moyenne
10 Periode cardiaque minimale / Periode cardiaque moyenne
11 (Periode cardiaque maximale - Periode cardiaque minimale)/Periode cardiaque moyenne
12 Frequence respiratoire
13 Frequence cardiaque / Frequence respiratoire
14 Energie totale de la bande 1 ([0.1; 0.8]Hz) du signal de variations de pression arterielle
15 Energie totale de la bande 2 ([0.8; 1.5]Hz) du signal de variations de pression arterielle
16 Energie totale de la bande 3 ([1.5; 10]Hz) du signal de variations de pression arterielle
17 Energie totale de la bande 4 ([10; Fe /2]Hz) du signal de variations de pression arterielle
18 Energie bande 1 / Energie bande 2
19 Energie bande 1 / Energie bande 3
20 Energie bande 1 / Energie bande 4
21 Energie bande 2 / Energie bande 3
22 Energie bande 2 / Energie bande 4
23 Energie bande 3 / Energie bande 4
24 `a 36 Coefficients PARCOR n 1, 2, 3, 4, 8, 9, 11, 12, 13, 15, 16, 17, 19.
Decomposition `a F e = 256Hz, ordre 20.
37 `a 49 Coefficients PARCOR n 1, 2, 3, 4, 5, 7, 10, 11, 13, 16, 17, 18, 19.
Decomposition `a F e = 16Hz, ordre 20.
174 `
ANNEXE A. PARAMETRES QUANTITATIFS RETENUS

Param`etres quantitatifs retenus pour la classification


Indice Titre
50 Variance de lamplitude du signal de respiration present dans
le signal de variation de pression arterielle
51 Indice de modulation du signal de modulation dans le signal
de variations de pression arterielle
52 Rapport de lamplitude max du signal respiration / ampli-
tude standard du signal respiration
53 Rapport de lamplitude min du signal respiration / ampli-
tude standard du signal respiration
54 Rapport de lamplitude max du signal respiration / ampli-
tude min du signal respiration
55 Amplitude crete `a crete du signal de respiration present dans
le signal de variation de pression arterielle
56 `a 110 1/X (voir page 101)
111 `a 220 X(n, n 1) (voir page 101)
221 `a 330 X%(n, n 1) (voir page 101)
331 `a 440 X%(n, n 1) (voir page 101)
441 `a 550 X(n, n 3) (voir page 101)
551 `a 660 X%(n, n 3) (voir page 101)
661 `a 770 X%(n, n 3) (voir page 101)
Annexe B

S
election des param`etres
pertinents : cas g
en
eral

Valeur des lambdas de Wilks pour les param`etres 1 `a 110 (groupe X pour les param`etres
56 `a 110 et 1/X pour les param`etres 1 `a 55). Les param`etres 111 `a 440 (groupes S(1), D(1),
DC(1) et S(3), D(3), DC(3)) ne sont pas reportes car ils se sont averes non pertinents du
point de vue de ce test statistique (valeur superieure `a 0.98 dans la totalite des cas). Les
param`etres dont le lambda de Wilks est inferieur `a 0.98 sont indiques en gras. Parmi ceux-ci,
on indique par une etoile les param`etres retenus `a lissue du test de la correlation.
176
ANNEXE B. SELECTION `
DES PARAMETRES ERAL
PERTINENTS : CAS GEN

Parame`tres quantitatifs retenus pour la classification


n valeur n valeur n valeur n valeur
1 0.999 56 0.998 29 0.912* 84 0.999
2 0.993 57 0.993 30 0.982* 85 0.978*
3 0.995 58 0.998 31 0.949 86 0.998
4 0.994 59 0.992 32 0.972* 87 1.0
5 0.992 60 0.993 33 0.957* 88 1.0
6 0.992 61 0.993 34 0.957* 89 0.999
7 0.993 62 0.995 35 0.986 90 0.997
8 0.994 63 0.989 36 0.947* 91 0.996
9 0.992 64 0.995 37 0.987 92 0.988
10 0.992 65 0.996 38 0.986 93 0.988
11 0.991 66 0.993 39 0.977* 94 0.999
12 0.988 67 0.979 40 0.996 95 0.999
13 0.979* 68 0.989 41 0.982 96 0.998
14 0.968* 69 0.972* 42 0.978* 97 1.0
15 0.971 70 0.976* 43 0.983 98 0.989
16 0.971* 71 0.987 44 0.986 99 0.998
17 0.967* 72 0.964* 45 0.994 100 1.0
18 0.973* 73 0.990 46 0.985 101 1.0
19 0.964* 74 0.971* 47 0.977* 102 1.0
20 0.979* 75 0.990 48 0.980* 103 0.998
21 0.984 76 0.987 49 0.990 104 0.999
22 0.990 77 0.989 50 0.986 105 0.978
23 0.973 78 0.996 51 0.990 106 0.997
24 0.968 79 0.973 52 0.979 107 0.965
25 0.985* 80 0.999 53 0.994 108 0.996
26 0.955 81 1.0 54 0.990 109 0.993
27 0.979 82 0.975* 55 0.983 110 0.973*
28 0.953 83 0.999
Annexe C

S
election des param` etres
pertinents : cas du suivi de patient

Valeur des lambdas de Wilks pour les param`etres 1 `a 110 (groupe X pour les param`etres
56 `a 110 et 1/X pour les param`etres 1 `a 55). Les param`etres suivants (groupes S(1), D(1),
DC(1) et S(3), D(3), DC(3)) ne sont pas reportes car ils se sont averes non pertinents du
point de vue de ce test statistique (valeur superieure `a 0.98 dans la totalite des cas).

ANNEXE C. SELECTION `
DES PARAMETRES PERTINENTS : CAS DU SUIVI
178 DE PATIENT

Parame`tres quantitatifs retenus pour la classification


n valeur n valeur n valeur n valeur
1 0.88 56 0.85 29 0.89 84 0.95
2 0.90 57 0.86 30 0.90 85 0.95
3 0.82 58 0.83 31 0.86 86 0.98
4 0.87 59 0.88 32 0.88 87 0.92
5 0.90 60 0.87 33 0.92 88 0.97
6 0.92 61 0.88 34 0.90 89 0.98
7 0.91 62 0.88 35 0.89 90 0.94
8 0.90 63 0.89 36 0.90 91 0.93
9 0.91 64 0.88 37 0.92 95 0.92
10 0.90 65 0.93 38 0.85 93 0.86
11 0.89 66 0.88 39 0.88 94 0.96
12 0.87 67 0.89 40 0.89 95 0.95
13 0.87 68 0.86 41 0.87 96 0.97
14 0.91 69 0.89 42 0.87 97 0.95
15 0.89 70 0.88 43 0.86 98 0.90
16 0.89 71 0.87 44 0.89 99 0.98
17 0.89 72 0.88 45 0.87 100 0.97
18 0.86 73 0.85 46 0.87 101 0.95
19 0.89 74 0.89 47 0.84 102 0.98
20 0.89 75 0.87 48 0.85 103 0.97
21 0.88 76 0.90 49 0.91 104 0.98
22 0.88 77 0.87 50 0.87 105 0.86
23 0.86 78 0.85 51 0.84 106 0.86
24 0.89 79 0.89 52 0.94 107 0.92
25 0.89 80 0.97 53 0.95 108 0.94
26 0.87 81 0.92 54 0.96 109 0.95
27 0.87 82 0.89 55 0.89 110 0.88
28 0.91 83 0.96
Annexe D

R
esultats du mod`
ele gaussien

Matrices de confusion obtenues par utilisation de la classification gaussienne. BA corres-


pond aux 30% de la base dapprentissage nayant pas servi pour lapprentissage. BT corres-
pond `a la base de test. FLD signifie Fonctions Lineaires Discriminantes. La definition des
classes utilisee est la suivante :

Stade 0 : Eveil

Stade 1 : Stade 1 de sommeil

Stade 2 : Stade 2 de sommeil

Stade 3 : Stade 3 de sommeil

Stade 4 : Stade 4 de sommeil

Stade 5 : Sommeil paradoxal

Lorsque les stades physiologiquement proches son regroupes, on utilise les classes suivantes :

Groupe 0 : Eveil

Groupe 1 : Sommeil lent leger (regroupement des stades de sommeil 1 et 2)

Groupe 2 : Sommeil lent profond (regroupement des stades de sommeil 3 et 4)

Groupe 3 : Sommeil paradoxal

D.1 Classification en six stades, BA

Stade reel / stade affect


e Stade 0 Stade 1 Stade 2 Stade 3 Stade 4 Stade 5
Stade 0 63 3 6 3 17 5
Stade 1 36 12 18 0 19 12
Stade 2 18 1 29 5 29 14
Stade 3 14 0 12 27 41 4
Stade 4 5 0 1 6 82 3
Stade 5 16 2 11 0 21 48
180
ANNEXE D. RESULTATS `
DU MODELE GAUSSIEN

D.2 Classification en six stades, BT


Stade reel / stade affect
e Stade 0 Stade 1 Stade 2 Stade 3 Stade 4 Stade 5
Stade 0 59 2 10 2 10 14
Stade 1 59 6 17 2 9 4
Stade 2 36 6 32 1 14 9
Stade 3 38 7 30 1 8 12
Stade 4 40 10 25 0 14 8
Stade 5 26 5 42 5 17 3

D.3 Classification en quatre groupes, BA


Groupe reel / Groupe affect
e Groupe 0 Groupe 1 Groupe 2 Groupe 3
Groupe 0 84 6 3 5
Groupe 1 45 20 17 16
Groupe 2 23 6 64 4
Groupe 3 33 7 10 48

D.4 Classification en quatre groupes, BT


Groupe reel / Groupe affect
e Groupe 0 Groupe 1 Groupe 2 Groupe 3
Groupe 0 66 10 6 17
Groupe 1 48 30 7 13
Groupe 2 44 35 8 11
Groupe 3 51 30 7 9

D.5 Suivi de patient (Calculs sur une nuit et moyenne


g
eometrique des r
esultats) : Classification en six stades

Stade reel / stade affect


e Stade 0 Stade 1 Stade 2 Stade 3 Stade 4 Stade 5
Stade 0 49 13 27 4 1 4
Stade 1 18 39 24 0 3 15
Stade 2 2 11 66 6 3 8
Stade 3 2 6 31 38 14 8
Stade 4 2 1 14 3 77 1
Stade 5 4 2 20 0 4 66

D.6 Suivi de patient (Calculs sur une nuit et moyenne


ponder
ee des r
esultats) : Classification en quatre groupes

Groupe reel / Groupe affect


e Groupe 0 Groupe 1 Groupe 2 Groupe 3
Groupe 0 52 33 4 10
Groupe 1 7 66 15 10
Groupe 2 2 20 76 1
Groupe 3 8 24 8 57
`
D.7. COMBINAISON DES PARAMETRES PAR LES FLD. CLASSIFICATION EN SIX
STADES, BA 181

D.7 Combinaison des param`


etres par les FLD. Classification
en six stades, BA
Stade reel / stade affect
e Stade 0 Stade 1 Stade 2 Stade 3 Stade 4 Stade 5
Stade 0 20 1 48 1 9 17
Stade 1 8 6 61 0 11 12
Stade 2 4 1 67 0 11 14
Stade 3 3 0 64 4 21 7
Stade 4 3 1 35 0 56 2
Stade 5 3 0 55 0 5 34

D.8 Combinaison des param`


etres par les FLD. Classification
en six stades, BT
Stade reel / stade affect
e Stade 0 Stade 1 Stade 2 Stade 3 Stade 4 Stade 5
Stade 0 22 0 49 0 1 25
Stade 1 22 2 64 1 1 8
Stade 2 9 3 71 0 2 12
Stade 3 14 4 71 0 0 9
Stade 4 10 6 74 0 6 2
Stade 5 7 4 86 0 0 1

D.9 Combinaison des param`etres par les FLD. Classification


en quatre groupes, BA
Groupe reel / Groupe affect
e Groupe 0 Groupe 1 Groupe 2 Groupe 3 Stade 4 Stade 5
Groupe 0 18 55 14 12
Groupe 1 4 67 17 9
Groupe 2 3 36 57 3
Groupe 3 3 53 15 26

D.10 Combinaison des param`etres par les FLD. Classification


en quatre groupes, BT
Groupe reel / Groupe affect
e Groupe 0 Groupe 1 Groupe 2 Groupe 3
Groupe 0 26 47 7 18
Groupe 1 12 70 8 8
Groupe 2 14 72 12 0
Groupe 3 8 84 4 1
Annexe E

Apprentissage dun r
eseau de
neurones

Considerons le reseau connexionniste utilise dans le cadre de la classification que lon


souhaite mettre en place. Celle-ci est du type supervisee. La base dapprentissage est donc
composee de paires (x, s ), o` u x est le vecteur de param`etres et s indique le stade de sommeil
correspondant au vecteur dentree x (la classe dappartenance de x). Un reseau de neurones
poss`ede autant dunites de sortie quil existe de classes. Ainsi, s est un vecteur qui a toutes ses
unites actives `a 0, exceptee lunite associee `a la classe du vecteur en entree x qui est active `a 1.

Le schema E.1 illustre ce principe. En supposant que le reseau qui y est represente doit
classer les elements dentree en trois groupes, selon la classe dappartenance de lelement x,
le vecteur de sortie est de la forme [100]T si il sagit dun element de la classe C0 , [010]T si il
sagit dun element de la classe C1 , [001]T si il sagit dun element de la classe C2 , etc.

Fig. E.1 Representation des vecteurs dentree et de sortie du reseau

Ajustement des poids de la derni`


ere couche

Les donnees dapprentissage sont presentees sequentiellement. A chaque etape, la r`egle de


propagation permet de calculer la valeur des unites de sorties. Compte tenu des valeurs des
184
ANNEXE E. APPRENTISSAGE DUN RESEAU DE NEURONES

poids des connexions et des fonctions dactivations utilisees, la sortie observee est differente
de la sortie desiree (un vecteur binaire). On peut associer `a cette difference un terme derreur
quadratique calcule de la mani`ere suivante :

On calcule dans un premier temps lerreur instantanee sur le neurone j appartenant `a


la couche de sortie. Le neurone j est un noeud de sortie et son erreur est la difference
entre la sortie que lon souhaite, sj et la sortie reelle yj obtenue apr`es propagation des
calculs de lentree jusqu`a la couche de sortie. Lequation de lerreur `a linstant n sur le
neurone j de sortie est la suivante :

ej (n) = sj (n) yj (n) (E.1)

On en deduit lerreur de classification D(n), donnee par la distance euclidienne separant


la sortie observee de la sortie desiree :
1X 2
D(n) = ej (n) (E.2)
2
jc

O`
u C inclue tous les neurones de la couche de sortie du reseau.

Le but de lapprentissage est de tendre vers une minimisation de cette erreur, en modifiant
les poids du reseau. La mise `a jour des poids des connexions entre la derni`ere sous-couche et
la couche de sortie est calculee `a partir du gradient de lerreur, derive par rapport aux poids
des connexions :
E(n)
= ej (n) fj0 (j ) yi (n) (E.3)
wij (n)

Selon le principe des algorithmes de plus grande pente, le poids wij est `a corriger en lui
ajoutant la quantite suivante :
(
wij (n + 1) = wij (n) + wij (n)
E(n) (E.4)
wij (n) = wij (n) = j (n) yi (n)

O`u est une constante qui determine le taux dapprentissage de lalgorithme et j (n) est
le gradient local defini par :
j (n) = ej (n) fj0 (j (n)) (E.5)
Il est `a noter que plus le taux dapprentissage est petit et plus les variations des valeurs des
poids dune iteration `a lautre seront petites. Cela implique que la vitesse dapprentissage sera
relativement lente. Cest-`a-dire que lapprentissage necessitera plus de temps pour aboutir
`a une solution stable. A linverse, si on impose `a une valeur tr`es grande, la variation des
poids dune iteration `a lautre sera tr`es grande augmentant alors la vitesse dapprentissage
du reseau. Cependant il existe un risque, si cette valeur est trop grande, de rendre le reseau
instable, les valeurs des poids evoluant de part et dautre des sorties desirees. Il ny a pas de
convergence fine et les poids oscillent autour des valeurs desirees [78].

Ajustement des poids des couches internes

Si la methode decrite est directement applicable pour ajuster les poids de la derni`ere
couche, elle ne lest pas pour ceux des couches internes. En effet, on ne connat pas les sortie
desirees pour ces couches, et par consequent on ne connat pas directement le terme derreur
185

associe `
a chaque couche interne. Il faut donc tenter dexprimer lerreur `a la sortie de chaque
neurone dune couche quelconque `a partir de lerreur de la derni`ere couche, seule erreur
directement mesurable.

Un calcul differentiel montre que lon peut calculer le gradient local associe `a un neurone
j dune couche-cachee quelconque `a partir des erreurs des neurones de la couche suivante
ponderees par les poids wjk des connexions partant du neurone j vers les neurones k de la
couche suivante, `a laide de la formule suivante :
X
j (n) = fj0 (j (n)) k (n)wjk (n) (E.6)
k

La r`egle de modification des poids reste la meme. Cette r`egle est appelee la r`egle du Delta.

La mise `a jour de lensemble des poids dune couche necessite la connaissance des erreurs
associees `a chaque neurone de la couche suivante. On appliquera lalgorithme dajustement
des poids en partant de la derni`ere couche (pour laquelle les erreurs sont connues) vers la
premi`ere. Do` u lappellation de cet algorithme : algorithme de retropropagation du gradient
de lerreur.

Il existe une methode simple pour augmenter la vitesse dapprentissage du perceptron


tout en evitant le danger de linstabilite precedemment evoque. Cette methode consiste
`a modifier la r`egle delta en incluant un terme constant intitule momentum. Il suffit de
modifier la valeur de la quantite `a ajouter au poids en y adjoignant le produit de la constante
par la variation de poids de literation precedente. Cependant les resultats dexperiences
nont pas montre damelioration significative dans le cadre de notre application. Nous
navons donc pas persiste dans lemploi de cette methode.

Enfin, notons que les exemples dapprentissage doivent etre presentes au reseau de facon
aleatoire dune epoque `a la suivante. Ce caract`ere aleatoire joue un role considerable dans
lamelioration de la vitesse de convergence des poids vers leurs valeurs stables [78].
Annexe F

R
esultats des r
eseaux de neurones

Matrices de confusion obtenues par utilisation de la classification gaussienne. BA corres-


pond aux 30% de la base dapprentissage nayant pas servi pour lapprentissage. BT corres-
pond `a la base de test. FLD signifie Fonctions Lineaires Discriminantes.

F.1 Classification en six stades, BA

Stade reel / stade affect


e Stade 0 Stade 1 Stade 2 Stade 3 Stade 4 Stade 5
Stade 0 54 24 0 6 7 7
Stade 1 32 44 0 6 6 9
Stade 2 25 20 0 22 9 21
Stade 3 16 13 0 44 23 4
Stade 4 8 5 0 17 67 1
Stade 5 28 17 0 4 4 44

F.2 Classification en six stades, BT

Stade reel / stade affect


e Stade 0 Stade 1 Stade 2 Stade 3 Stade 4 Stade 5
Stade 0 33 29 0 9 15 12
Stade 1 43 17 0 12 6 20
Stade 2 30 16 0 14 13 25
Stade 3 35 17 0 18 13 15
Stade 4 27 32 0 19 9 10
Stade 5 35 11 0 12 19 21

F.3 Regroupement des stades physiologiquement proches :


classification en quatre groupes, BA

Groupe reel / Groupe affect


e Groupe 0 Groupe 1 Groupe 2 Groupe 3
Groupe 0 42 3 7 7
Groupe 1 5 63 16 15
Groupe 2 1 19 76 2
Groupe 3 3 35 5 56
188
ANNEXE F. RESULTATS
DES RESEAUX DE NEURONES

F.4 Regroupement des stades physiologiquement proches :


classification en quatre groupes, BT

Groupe reel / Groupe affect


e Groupe 0 Groupe 1 Groupe 2 Groupe 3
Groupe 0 8 48 25 16
Groupe 1 14 50 16 18
Groupe 2 13 60 12 12
Groupe 3 14 52 8 24

F.5 Combinaison des param`


etres par les FLD. Classification
en six stades, BA

Stade reel / stade affect


e Stade 0 Stade 1 Stade 2 Stade 3 Stade 4 Stade 5
Stade 0 31 16 6 12 18 14
Stade 1 18 28 11 11 18 12
Stade 2 10 8 14 23 22 21
Stade 3 10 5 5 32 36 11
Stade 4 5 0 3 10 75 4
Stade 5 10 14 4 12 16 41

F.6 Combinaison des param`


etres par les FLD. Classification
en six stades, BT

Stade reel / stade affect


e Stade 0 Stade 1 Stade 2 Stade 3 Stade 4 Stade 5
Stade 0 36 15 12 10 16 8
Stade 1 25 9 20 9 25 7
Stade 2 17 5 16 15 26 17
Stade 3 17 5 9 26 25 10
Stade 4 9 8 11 39 23 6
Stade 5 16 8 14 21 26 11

F.7 Combinaison des param`etres par les FLD. Classification


en quatre groupes, BA

Groupe reel / Groupe affect


e Groupe 0 Groupe 1 Groupe 2 Groupe 3
Groupe 0 23 10 24 42
Groupe 1 6 0 25 48
Groupe 2 4 14 61 19
Groupe 3 3 8 14 73
`
F.8. COMBINAISON DES PARAMETRES PAR LES FLD. CLASSIFICATION EN
QUATRE GROUPES, BT 189

F.8 Combinaison des param`etres par les FLD. Classification


en quatre groupes, BT
Groupe reel / Groupe affect
e Groupe 0 Groupe 1 Groupe 2 Groupe 3
Groupe 0 20 8 26 44
Groupe 1 11 19 27 41
Groupe 2 7 17 52 22
Groupe 3 9 24 31 35

F.9 Suivi de patient (Calculs sur une nuit et moyenne


ponder
ee des r
esultats) : Classification en six stades

Stade reel / stade affect


e Stade 0 Stade 1 Stade 2 Stade 3 Stade 4 Stade 5
Stade 0 70 7 11 2 3 7
Stade 1 13 33 32 9 2 11
Stade 2 6 6 59 9 5 15
Stade 3 6 1 24 47 18 4
Stade 4 2 0 6 15 72 5
Stade 5 4 3 14 2 3 74
Annexe G

Resultats dun r
eseau de neurones
simplifi
e

Matrices de confusion obtenues par des reseaux de neurones different du classique


E/16/10/S. BA correspond aux 30% de la base dapprentissage nayant pas servi pour lap-
prentissage. BT correspond `a la base de test. FLD signifie Fonctions Lineaires Discriminantes.

G.1 R
eseau de type E/6/5/4. Classification en quatre classes.
Combinaison des param`etres par les FLD. BA

Groupe reel / Groupe affect


e Groupe 0 Groupe 1 Groupe 2 Groupe 3
Groupe 0 57 23 9 8
Groupe 1 24 47 13 14
Groupe 2 21 24 48 6
Groupe 3 24 27 10 37

G.2 R
eseau de type E/6/5/4. Classification en quatre classes.
Combinaison des param`etres par les FLD. BT

Groupe reel / Groupe affect


e Groupe 0 Groupe 1 Groupe 2 Groupe 3
Groupe 0 52 31 10 5
Groupe 1 36 50 5 7
Groupe 2 23 63 12 0
Groupe 3 35 61 2 1
192
ANNEXE G. RESULTATS
DUN RESEAU
DE NEURONES SIMPLIFIE

G.3 Reseau de type E/6/5/4. Classification en six stades (pas


dutilisation des FLD), BA

Stade reel / stade affect


e Stade 0 Stade 1 Stade 2 Stade 3 Stade 4 Stade 5
Stade 0 2 77 7 7 1 4
Stade 1 0 65 18 7 2 5
Stade 2 1 40 18 18 6 15
Stade 3 1 34 12 35 13 3
Stade 4 0 13 2 44 36 3
Stade 5 0 34 14 5 3 41

G.4 Reseau de type E/6/5/4. Classification en six stades (pas


dutilisation des FLD), BT

Stade reel / stade affect


e Stade 0 Stade 1 Stade 2 Stade 3 Stade 4 Stade 5
Stade 0 0 53 11 8 7 19
Stade 1 0 65 4 8 3 17
Stade 2 0 61 9 8 5 14
Stade 3 0 54 6 21 1 16
Stade 4 0 71 10 10 1 6
Stade 5 4 68 10 12 1 3

G.5 Reseau de type E/8/7/6. Classification en six stades (pas


dutilisation des FLD), BA

Stade reel / stade affect


e Stade 0 Stade 1 Stade 2 Stade 3 Stade 4 Stade 5
Stade 0 27 30 3 1 11 24
Stade 1 6 40 0 3 11 37
Stade 2 5 10 1 8 19 54
Stade 3 2 3 3 19 44 28
Stade 4 1 2 2 3 81 9
Stade 5 2 7 0 0 8 79

G.6 Reseau de type E/8/7/6. Classification en six stades (pas


dutilisation des FLD), BT

Stade reel / stade affect


e Stade 0 Stade 1 Stade 2 Stade 3 Stade 4 Stade 5
Stade 0 11 14 2 4 17 49
Stade 1 28 11 4 11 11 33
Stade 2 17 6 7 4 19 44
Stade 3 30 3 7 1 14 41
Stade 4 23 6 12 1 13 42
Stade 5 15 9 7 6 17 43
Annexe H

Resultats des r
eseaux de neurones
pour une classification en trois
stades

Matrice de confusion obtenue par un reseau de neurone de configuration E/6/5/4. BA


correspond aux 30% de la base dapprentissage nayant pas servi pour lapprentissage. BT
correspond `a la base de test.

H.1 Classification en trois classes, BA

Stade r
eel / Stade affect
e
Eveil Sommeil orthodoxe Sommeil paradoxal

Eveil 75 16 8
Sommeil orthodoxe 15 74 9
Sommeil paradoxal 10 24 64

H.2 Classification en trois classes, BT

Stade r
eel / Stade affect
e
Eveil Sommeil orthodoxe Sommeil paradoxal

Eveil 36 45 18
Sommeil orthodoxe 25 67 7
Sommeil paradoxal 26 63 10
Annexe I

Matrices de confusion issues du


scorage par arbre de d
ecision

Matrices de confusion obtenues par utilisation dun arbre de decision pour realiser le
scorage du sommeil. Comme il fait appel `a des procedures de rescorage, ces matrices sont en
realite les moyennes des matrices de confusion obtenues sur les nuits composant la base de
test. La definition des classes utilisee est la suivante :
Stade 0 : Eveil
Stade 1 : Stade 1 de sommeil
Stade 2 : Stade 2 de sommeil
Stade 3 : Stade 3 de sommeil
Stade 4 : Stade 4 de sommeil
Stade 5 : Sommeil paradoxal

I.1 Rescorage global par r` egle. Gestion des


epoques non
class
ees par statistiques locales.

Groupe reel / Groupe affect


e Groupe 0 Groupe 1 Groupe 2 Groupe 3
Groupe 0 50 43 1 6
Groupe 1 34 58 3 5
Groupe 2 33 57 5 4
Groupe 3 24 68 3 5

I.2 Rescorage global par r` egle. Gestion des


epoques non
class
ees par le rescorage global.

Groupe reel / Groupe affect


e Groupe 0 Groupe 1 Groupe 2 Groupe 3
Groupe 0 40 37 5 17
Groupe 1 40 42 7 11
Groupe 2 47 38 8 7
Groupe 3 31 48 3 18
ANNEXE I. MATRICES DE CONFUSION ISSUES DU SCORAGE PAR ARBRE
196
DE DECISION

I.3 Rescorage global par HMM. Gestion des


epoques non
class
ees par le rescorage global.
Groupe reel / Groupe affect
e Groupe 0 Groupe 1 Groupe 2 Groupe 3
Groupe 0 81 15 0 4
Groupe 1 58 30 2 10
Groupe 2 57 30 8 5
Groupe 3 64 26 1 9
Annexe J

Hypnogrammes de la base de test :


scorage par methode gaussienne ou
connexioniste et rescorage par
r`
egles

Les stades de sommeil sont codifies comme suit :



0 (Stade 0) : Eveil
1 (Stade 1) : Stade 1 de sommeil (sommeil lent leger)
2 (Stade 2) : Stade 2 de sommeil (sommeil lent leger)
3 (Stade 3) : Stade 3 de sommeil (sommeil lent profond)
4 (Stade 4) : Stade 4 de sommeil (sommeil lent profond)
5 (Stade 5) : Sommeil paradoxal
198 ANNEXE J. HYPNOGRAMMES DE LA BASE DE TEST

Fig. J.1 Nuit n 1 de la base de test : classification par mod`ele gaussien et rescorage par
r`egle. Le taux daccord global est de 17%.

Fig. J.2 Nuit n 2 de la base de test : classification par mod`ele gaussien et rescorage par
r`egle. Le taux daccord global est de 26%
199

Fig. J.3 Nuit n 3 de la base de test : classification par mod`ele gaussien et rescorage par
r`egle. Le taux daccord global est de 36%

Fig. J.4 Nuit n 4 de la base de test : classification par mod`ele gaussien et rescorage par
r`egle. Le taux daccord global est de 21%t
200 ANNEXE J. HYPNOGRAMMES DE LA BASE DE TEST

Fig. J.5 Nuit n 5 de la base de test : classification par mod`ele gaussien et rescorage par
r`egle. Le taux daccord global est de 21%

Fig. J.6 Nuit n 1 de la base de test : classification par reseau de neurone et rescorage par
r`egle. Le taux daccord global est de 38%.
201

Fig. J.7 Nuit n 2 de la base de test : classification par reseau de neurone et rescorage par
r`egle. Le taux daccord global est de 31%

Fig. J.8 Nuit n 3 de la base de test : classification par reseau de neurone et rescorage par
r`egle. Le taux daccord global est de 24%
202 ANNEXE J. HYPNOGRAMMES DE LA BASE DE TEST

Fig. J.9 Nuit n 4 de la base de test : classification par reseau de neurone et rescorage par
r`egle. Le taux daccord global est de 18%t

Fig. J.10 Nuit n 5 de la base de test : classification par reseau de neurone et rescorage par
r`egle. Le taux daccord global est de 28%
Annexe K

Interface graphique de gestion de la


classification

Fig. K.1 Interface graphique de gestion de la classification


Annexe L

Interface graphique de mesure des


rythmes cardiaques et respiratoires

Fig. L.1 Interface graphique de gestion de la classification


R
esum
e
Cette th`ese sinscrit dans le cadre de letude dun syst`eme de classification automatique
du sommeil base sur un bracelet multicapteur. Celui-ci permet, entre autre, lacquisition
du signal de variation de pression de lart`ere radiale. Ce signal est decoupe en epoques de
trente secondes, que lon caracterise par un vecteur de param`etres. Le syst`eme propose classe
ces vecteurs dans lun des six etats de vigilance (eveil, stades de sommeil 1 `a 4, sommeil
paradoxal).

Les frequences cardiaque et respiratoire sont des variables importantes pour la classifica-
tion. Cest pourquoi nous nous sommes interesses `a leur estimation `a partir du signal acquis
par le bracelet. Nous etudions, dans un premier temps, lestimation de ces param`etres `a
partir dune modelisation du syst`eme physiologique de generation des battements cardiaques.
Les resultats sont interessants mais limplantation de lalgorithme dans un syst`eme embarque
tel que le bracelet necessite quelques adaptations.

Dans un deuxi`eme temps nous proposons deux estimateurs, lun de la frequence


cardiaque, lautre de la frequence respiratoire, exploitant une modelisation du signal de
variation de pression arterielle. Nous developpons un algorithme base sur une estimation en
deux phases successives. La premi`ere vise `a utiliser le signal de frequence instantanee, delivre
par loperateur de demodulation de Teager, pour estimer le rythme cardiaque. La seconde
phase consiste `a utiliser cette estimation pour isoler une composante respiratoire additive,
presente au sein du signal de variation de pression arterielle, puis `a estimer la frequence
respiratoire `a laide dun algorithme adaptatif visant `a poursuivre la composante principale
de la decomposition de Karhunen-Lo`eve de cette composante additive. Ces deux estimateurs
fournissent des resultats satisfaisants (faible biais et variance acceptable, entre 7 et 15%).

Dans une derni`ere partie nous etudions les techniques envisageables pour realiser
loperation de classification automatique en stades de sommeil. Nous en retenons deux :
lune utilise un classifieur bayesien sappuyant sur une modelisation monogaussienne, et
lautre, un reseau de neurone de type perceptron multicouche. Nous proposons egalement
deux methodes de rescorage permettant de corriger les erreurs de classification. Il ressort
des essais realises que si les deux techniques de classification envisagees sav`erent, dans
le cadre des bases de donnees utilisees, inadequates pour realiser la classification de nuits
ne participant pas `a lapprentissage, elles sont toutes deux performantes lorsquelles sont
appliquees `
a un seul individu.

Mots Cl
es
Sommeil, Rythme cardiaque, Rythme respiratoire, Reseaux de neurones, Classification