Vous êtes sur la page 1sur 38

Adel ARFAOUI

Universit Pierre et Matie Curie


Laboratoire de Statistiques Thoriques et Appliques
Universit PARIS VI - Jussieu

ESTIMATION DES MATRICES


ORIGINE-DESTINATION A
PARTIR DES COMPTAGES :
ETUDE DE QUELQUES
MODELES
RAPPORT DE STAGE

Septembre1999

Matre de stage:
Mehdi DANECH-PAJOUH
INRETS-GRETIA
Gnie des Rseaux de Transport et Informatique Avance
Remerciements

La ralisation de ce rapport repose sur la mise en commun de


connaissances et de recherches dveloppes par l'quipe du GRETIA et
autres rapports de recherches.
Je remercie tout particulirement Monsieur Mehdi Danech-Pajouh pour
son accueil, ses conseils et ses encouragements

Ma reconnaissance va galement :
Monsieur Paul Deheuvels pour m'avoir permis de suivre le Dea de
statistiques.
Monsieur D. Pierre-Loti-Viaud pour sa collaboration et ses conseils.
L'ensemble du GRETIA pour sa bonne humeur et sa coopration.

J'adresse un remerciement particulier toute l'quipe de la bibliothque


(Anne, Malika, et Pascal ) pour leur gentillesse et leur efficacit.

Merci Elsa qui a bien voulu m'accueillir dans son bureau.

1
RSUM
Ce document est un rcapitulatif de l'existant au niveau des mthodes d'estimation des matrices Origine-Destination
partir des comptages.
Il est compos de deux parties lune consacre lestimation dans un cadre statique lorsque lon ne tient pas compte
du temps, et lautre au cadre dynamique o le facteur temps intervient.

Cinq approches sont tudies dans la premire partie: l'approche gravitaire, la mthode de maximisation de
l'entropie, une approche bayesienne, une approche fonde sur le modle linaire gnralis et une approche fonde sur
le maximum de vraisemblance .
Ces mthodes ont t plus au moins appliques, selon leur nature et leur fiabilit, des cas concrets.
Par ailleurs, une grande partie de la premire partie de ce document est consacre la mthode de maximisation de
l'entropie (et/ou minimisation de l'information) vu l'intrt et la popularit de l'approche.
Les avantages et les limites de la mthode, notamment en ce qui concerne l'influence des erreurs en entre (
consistance des capteurs, matrices a priori, matrice d'affectation) ont t tudies. Une tude des modles entropiques
amliors qui prennent en compte ces dfaillances a aussi t ralise.

Dans la deuxime partie on a distingu deux types destimation : lestimation simultane qui est une extension de la
premire partie et lestimation squentielle qui considre la demande comme un processus stochastique. On a
particulirement tudi la notion de filtrage et plus particulirement celle du filtre de kalman sur lequel est fonde la
deuxime approche.
Une tude comparative des deux modles a t ralis.

Une bibliographie sommaire est finalement prcise la fin de chaque partie de ce document

2
SOMMAIRE

PARTIE I ESTIMATION DES MATRICES O-D : CADRE STATIQUE

Introduction _________________________________________________________ 5
1.Dfinition ______________________________________________________________ 5
2.Utilits des matrices O-D _________________________________________________ 5
3.Obtention des matrices O-D_______________________________________________ 5
4.Cadre gnral et problmatique ___________________________________________ 5
5.Moyens de rsolution ____________________________________________________ 6
Notations ____________________________________________________________ 7
A. Approche Gravitaire_________________________________________________ 8
A.1. Notations, hypothses et modle _________________________________________ 8
A.2 Mthode _____________________________________________________________ 8
A.3 Le Modle____________________________________________________________ 8
Conclusion et Remarques __________________________________________________ 9
B. Maximisation de l'entropie __________________________________________ 10
B.I. Le Modle entropique ordinaire ________________________________________ 10
B.II. Les incertitudes des donnes en entres _________________________________ 11
B.II.1 La matrice daffectation ___________________________________________________ 12
B.II.2 La matrice a priori_______________________________________________________ 12
B.II.3 Les comptages des capteurs ________________________________________________ 12
B.III. Modles entropiques amliors________________________________________ 12
B.III.1 La modelisation bi-objectifs _______________________________________________ 12
B.III.2 La modelisation multi-objectifs _____________________________________________ 13
B.III.3 Quelques remarques _____________________________________________________ 14
B.IV Construction dintervalles de confiances ________________________________ 14
Remarques et commentaires _____________________________________________________ 16
C. Approche Bayesienne_______________________________________________ 17
C.I Introduction _________________________________________________________ 17
C.II modle _____________________________________________________________ 17
C.III. Conclusion ________________________________________________________ 18
D. Mthode de Maximisation de la vraisemblance __________________________ 19
D.I Introduction ________________________________________________________ 19
D.II Le modle __________________________________________________________ 19
E. Mthode des moindres carees generalisees______________________________ 20
E.I Introduction _________________________________________________________ 20
E.II. Le modle __________________________________________________________ 20

3
E.III Remarques_________________________________________________________ 20
F. Bibliographie PARTIE I ____________________________________________ 22

PARTIE I ESTIMATION DES MATRICES O-D : CADRE


DYNAMIQUE

A.Introduction_______________________________________________________ 23
B.Hypothses et notations _____________________________________________ 25
BI. Notations globales ____________________________________________________ 25
B.II.Les erreurs de mesures _______________________________________________ 25
C.Mthodes Simultanes ______________________________________________ 27
C.I.Introduction _________________________________________________________ 27
C.II.Exemple____________________________________________________________ 27
C.III.Conclusion_________________________________________________________ 28
D.Mthodes Squentielles______________________________________________ 29
D.I.Introduction _________________________________________________________ 29
D.II.Notions de filtrage : Le filtre de Kalman _________________________________ 29
D.III.Application l'estimation de la demande de trafic ________________________ 30
E.Etude comparative des deux approches: tude d'un cas particulier___________ 34
E.I.Introduction _________________________________________________________ 34
E.II.Estimation de la demande de trafic _____________________________________ 35
F. Bibliographie PARTIE II ___________________________________________ 37

4
PARTIE 1 :ESTIMATION DES MATRICES O-D : CADRE
STATIQUE.

INTRODUCTION

Dans le cadre de la gestion du trafic en milieu urbain et inter urbain on est confront aux
problmes de l'estimation de la demande de trafic en unit de vhicules d'une zone i vers une zone
j, c'est la deuxime tape du modle quatre temps de la thorie du trafic :

Gnration : il s'agit d'tudier le nombre des dplacements mis et reus par zone.
Distribution: on essaye de calculer le nombre des dplacements entre les zones.
Choix modal : tude du mode de transport utilis.
Affectation : Il s'agit de connatre les chemins emprunts pour chaque couple Origine-
Destination

1.DFINITION

Une matrice Origine-Destination ( Matrice O-D ) est un tableau I lignes (nombre de zones
"origine" ) et J colonnes (nombre de zones de destination) dont les lments Tij reprsentent le
nombre des dplacements de la zone i vers la zone j pendant un intervalle de temps bien
dtermin k ( 24 heures, 1 heure, 15 min. etc..)
Cette matrice reprsente la demande de trafic en units de vehicule.

2.UTILITS DES MATRICES O-D

Les matrices O-D sont utilises court et moyen terme :


Court terme : gestion du trafic, prvision des dures des trajets. Lors de l'estimation de ces
matrices on tient compte du facteur temps do le nom matrices O-D dynamiques
Long terme : planification et construction des routes, modification des plans de circulation etc.
Et puisque ces matrices sont estimes sur une dure relativement longue (par exemple 24
heures)on ne tient pas compte du facteur temps on parle alors de matrices O-D statiques.

3.OBTENTION DES MATRICES O-D

Les matrices O-D peuvent tre obtenues par des moyens directs notamment par des photos
ariennes et/ou par des enqutes sur routes ou domicile.
L'inconvnient de telles mthodes est qu'elles sont coteuses et leurs mises en oeuvre ainsi que
l'exploitation des donnes recueillies sont d'une dure relativement longue ( plus d'un an).
Pour remdier ces problmes on emploie une mthode indirecte qui consiste l'exploitation des
mesures recueillies par des capteurs placs sur certains tronons.

4.CADRE GNRAL ET PROBLMATIQUE

L'aire ou la rgion tudie est dcompose en N zones ou "centrodes".


On dispose de m capteurs placs sur quelques tronons qui nous renseignent sur le dbit Va et
on cherche estimer le nombre de vhicules Tij se dplaant d'une zone i vers une zone j.
Dans la suite de ce rapport on supposera connues les proportions Pija des dplacements d'une
zone i vers une zone j passant par le tronon a ( a =1,..,m). Ces proportions sont obtenues au
pralable par des modles d'affectation qui sortent du cadre de notre tude.

On supposera par ailleurs que les coefficients d'affectation sont indpendants du temps et ne

5
varient pas en fonction des Tij. Ces hypothses tant valables dans le cas o les itinraires ne
seraient pas saturs et le rseau ne serait pas modifi.

On a donc pour chaque capteur la relation :

Va = Pija Tij a=1,..,m (1)


i, j
On note par ailleurs que les dbits et la matrice a priori correspondent au mme intervalle de temps
.
On dispose ainsi de m quations et N inconnues, comme en gnral on a m<< N le systme
admet une infinit de solutions.

5.MOYENS DE RSOLUTION

Pour remdier cette incertitude on essaye de trouver soit la matrice O-D la plus probable ou la
plus vraisemblable soit la matrice O-D qui se rapproche le plus d'une certaine structure fixe au
pralable, soit on combine les deux approches.
La structure utilise est dans la plupart des cas une ancienne matrice O-D obtenue soit par des
enqutes, soit par une autre estimation.
Ces matrices dont les lments sont nots (tij) jouent un rle important et portent selon les
mthodes d'estimation utilises soit le nom de matrice de rfrence soit celui de matrice a priori.

Il existe principalement deux types de modlisation :


Modlisation structure : Dans ce cas on impose une certaine structure aux Tij en essayant de
l'exprimer l'aide des donnes socio-conomiques des deux zones i et j.
Modlisation non-structure : On utilise soit des moyens probabilistes et statistiques (
approche bayesienne, maximum de vraisemblance, modle linaire) soit la thorie de l'information
(maximisation de l'entropie, minimisation de l'information ).
Notons cependant que certains modles utilisent des combinaisons des deux modlisations

6
NOTATIONS

N: nombre de centrodes ( au total N paires O-D).


m :nombre de capteurs ( entier strictement positif).
Va : dbit du capteur ( strictement positif).
Tij : La demande de trafic estimer (ou mettre jour*)de la zone i vers la zone j
t ij :trafic connu (ou a priori ) de la zone i vers la j .
Pija : proportion des dplacement d'une zone i vers une zone j et passant par le capteur a.
P est la matrice de dimension (mN) donne par:

P111 " P11N " PN1 1 " PNN


1


# # # #
# # # #
m m
P11 " P1mN " PNm1 " PNN

Il est important de remarquer que selon le modle tudi une matrice Origine-Destination sera
reprsente soit par une matrice (NN), soit par un vecteur colonne (N1)
On introduit les notations matricielles suivantes .
Les matrices sont reprsentes par des lettres en gras de taille plus grandes que les autres :
Par exemple : T = (Tij )i , j est la matrice O-D estimer.

Les vecteurs sont reprsents par des caractres en gras souligns :


La transpose d'une matrice ou d'un vecteur est not par le signe( ' ) .
Par exemples : T est le vecteurs colonne de dimension N dont les N premiers lments sont
constitus de la premire ligne de la matrice O-D prcdente, plus prcisment:

T = (T11 ,.., T1N ,..., TN1 ..TNN )

la notation matricielle exp(T) implique qu'on applique la fonction exponentielle tout les
lments de la matrice T .

La fonction logarithme est not Log


Dans toute la suite on considre que la quantit 0Log0=0.

* Selon le problme le nom donn la matrice O-D change.

Selon le problme le nom donn la matrice de "rfrence" change.

7
A. APPROCHE GRAVITAIRE

Dans ce type de modle on suppose que les Tij ont une certaine structure, les comptages ne
servent dans ce cas qu'au calibrage du modle.
Le modle tudi est celui propos par S DEBAILLE [8] et qui a servi l'laboration du logiciel
NEMROD l'INRETS.
On suppose ici que l'on cherche mettre jour une matrice O-D partir d'une ancienne matrice.

A.1. NOTATIONS, HYPOTHSES ET MODLE

Dans ce modle on suppose que les Tij ont la structure suivante :


T ij = A ij
i j

i et j sont respectivement des coefficients d'mission et de rception estimer et dpendants


du temps.

Aij est un indicateur de relation entre le couple (i, j), et l'une des hypothses les plus importantes
de ce modle est que ce paramtre est suppos constant ( dans le temps) et symtrique.

A.2 MTHODE

La dtermination des Tij est fonde sur deux problmes de minimisation de distances
euclidiennes :
Dans un premier temps on dtermine les Aij (supposs constants par rapport au temps) partir
de la matrice de rfrence.
On ajuste en effet la structure de distribution avec le trafic de la priode de rfrence de faon a
obtenir le meilleur ajustement de la matrice de rfrence sur elle mme ( voir premier problme au
paragraphe suivant)
Dans un deuxime temps on dtermine les coefficients d'attraction et d'mission i et j
qui minimisent l'erreur quadratique entre les dbits observs et thoriques ( voir paragraphe
suivant)

A.3 LE MODLE

Le premier problme s'crit en passant au logarithme pour linariser :

[log(t ) log( A )]
2
* *
Min ij i j ij
i, j

s.c Aij = A ji

S.DEBAILLE [8] montre que la solution particulire

8
*j = 1 j = 1,.., N
1/ N
N
t ij
j=1
*i = N i = 1,...N


t ji

j=1
Aij = t ij t ji / *i *j i, j = 1,.., N

ralise le meilleur ajustement de la matrice O.D. de rfrence sur la structure


de distribution retenue.

Le deuxime problme s'crit :

2
m a
Min Va i jAijPij


a =1
i, j
Cette forme quadratique est rsolue moyennant un algorithme itratif .

CONCLUSION ET REMARQUES

Ce modle a t test et semble donner des rsultats satisfaisants. Cependant la matrice estime est
trs sensible la matrice de rfrence choisie et au nombre des capteurs..
L'une des hypothses les plus importante est la symtrie des coefficient Aij.
Le deuxime problme de minimisation concerne une fonction qui n'est pas convexe en (, ) elle
n'admet donc pas de minimum thorique unique. L'algorithme utilis qui consiste fixer une
variable et trouver la valeur de la seconde n'assure pas que le minimum trouv est le minimum de
la fonction (un minimum d'une fonction en avec fix ne veut pas dire que c'est un minimum
de f.).

9
B. MAXIMISATION DE L'ENTROPIE

B.I. LE MODLE ENTROPIQUE ORDINAIRE

Cette approche a t dveloppe par plusieurs chercheurs. Le logiciel OEDIPE de


L'INRETS ( M Danech-Pajou [7 ] ) utilise ce modle pour la construction et l'estimation des
matrices O-D partir des comptages
Dans le cas o on ne possderait pas de matrice de rfrence on cherche maximiser le nombre
de faons d'affecter T individus aux N paires Origines/Destination. Comme ce nombre est gal
:

W (Tij ) =
T!
Tij !
i, j
Le problme de maximisation s'crit alors :

Max W Tij ( )
s.c. Va = Pija Tij a = 1,.., m (1) (2)
i, j

En revanche, si on possde une matrice a priori ( t ij ), on suppose que le vecteur ( Tij ) suit une loi
t ij
multinomiale avec la probabilit qu'un individu appartienne un couple
t
Origine/Destination (i,j) donn, soit:
t ij
(Tij )i, j ~ MultinomialeT,
t i, j
Tij
t ij
La probabilit que Tij individus appartiennent un couple O-D donn est donc
t
D'o la probabilit que T individus soient rpartis sur les N couples O-D est gale :
Tij
t ij
W (Tij ) =
T!

Tij! i, j t
i, j
Le problme revient donc maximiser cette quantit sous les contraintes de comptages (1).

Van Zuylen et al (1980) [16], Willumsen (1982) [19] proposent une rsolution fonde sur le
Lagrangien :

T = Ti, j
ij

t = t
i, j
ij

10
Aprs passage au logarithme et en utilisant l'approximation de Stirling :
Log ( x! ) = xLog ( x ) x ,
aprs limination des termes constants, le problme peut tre transform en ( voir. [16] ):
T
Max S = - Tij Log ij 1 (3)
t
i, j ij
Sous les contraintes (1).
En annulant les drives partielles du Lagrangien L ( avec 1 ... m les multiplicateurs de
Lagrange), et puisque la fonction maximiser est concave on trouve :
m
Tij = t ij X a ij
Pa
(4)
a =0

avec X a = exp( a ) a = 1,.., m .

Si on ne possdait pas de matrice a priori on donne aux ( t ij ) la valeur 1 pour tout couple (i,j), ce
qui rsout le problme le problme (2) cit ci-dessus.

Cette approche a t teste et valide, elle permet en effet lobtention dune matrice qui possde
une mme structure proche de celle de la matrice de rfrence et dont les coefficients (Tij)
satisfont les quations (1).
Bien que cette mthode soit trs populaire et malgr la satisfaction de ses rsultats elle prsente
plusieurs limites :

B.II. LES INCERTITUDES DES DONNES EN ENTRES

La premire est que la matrice estime est trs sensible aux variations de la matrice a priori.
Si le trafic augmente (ou baisse) dune manire sensible et puisque le modle fournit une matrice
proche de lancienne et qui reproduisent les comptages des capteurs on peut avoir des distorsions.
Pour contrecarrer ce problme Bell (1983) [2] a propos un modle qui prend en compte la
structure de la matrice a priori en rajoutant au problme de maximisation une contrainte de
proportionnalit :

T ij

=
i, j
, (5)
t ij
i, j
et qui est estime par la quantit:

 V a
= a
(5)'
t P
a i, j
a
ij ij

On trouve alors
m
Tij = t ij Xaij
Pa
(6)
a =0
Le rsultat ne diffre de la solution (4) de Willumsen que par le coefficient de proportionnalit .
Ainsi le nouveau modle reste invariant si la matrice a priori est multiplie uniformment par un
certain scalaire.
De plus Bell propose lutilisation de lalgorithme de Newton-Raphson pour la rsolution du
problme de maximisation...

11
Lautre type de limitation est dun ordre plus important, en effet, les modles prsents ci-dessus
considrent les donnes en entre comme tant parfaitement exactes or on peut avoir plusieurs
types derreurs :

B.II.1 LA MATRICE DAFFECTATION

Les proportions dutilisation des chemins sont obtenues en gnral par des procds qui ne
peuvent tre considrs comme exacts. Et daprs Nguyen (1983), il nexiste aucune procdure
permettant le calcul de ces erreurs. On ne peut donc pas intgrer les carts causs par les modles
daffectation

B.II.2 LA MATRICE A PRIORI

Premirement cette matrice peut tre considre comme une premire estimation de la vraie
matrice or en gnral les quations (1) ne sont pas vrifies do une erreur sur la matrice a priori.
Deuximement la matrice a priori peut tre obtenue par le biais de sondages ou denqutes, elle
nest donc pas exacte cent pour cent et peut donc dpendre des mthodes de collecte des
donnes.
Une certaine mesure de cette erreur peut alors tre tablie.

B.II.3 LES COMPTAGES DES CAPTEURS

Dun ct les donnes utilises sont des observations il y a donc un risque derreur lors de leur
rcupration. Dun autre ct les capteurs eux mmes ne peuvent pas tre considrs comme tant
parfaitement fiables . Aussi, les mesures recueillies ne correspondent pas toujours au mme
intervalle de temps pour tous les capteurs do un risque de non consistance des quations

Willumsen [18] 1994 identifie deux sortes de non consistances .

a) Il peut arriver que le nombre total du flux lentre dun noeud soit diffrent de celui
la sortie donc il ny pas de continuit de flux (total entre = total sortie).

b) Non compatibilit entre le modle daffectation et les flux observs : Par exemple il
peut arriver quun modle daffectation nalloue pas de trafic sur un tronon (peut tre flux faible)
et dans ces conditions il ny aura aucune matrice permettant de reproduire les dbits observs.
Comme mesure de lincertitude on peut utiliser soit une matrice de variance-covariance si on dispose
dune suite de mesures de dbits de capteurs, soit faire des hypothses sur la distribution des
erreurs.
Plusieurs modles ont alors t proposs pour essayer de minimiser ces erreurs.

B.III. MODLES ENTROPIQUES AMLIORS

B.III.1 LA MODELISATION BI-OBJECTIFS

Willumsen (1984) [18] partant dun dveloppement en srie de Taylor de la fonction


x
f ( x ) = xlog x y
y
au voisinage de 1 montre que :
Tij 1 (
Tij t ij )2
ij log t 1 2 t
T (7)
i, j ij i, j ij

12
Ce qui donne la fonction entropie une forme de mesure derreur, il suggre donc de rajouter la
fonction objective du problme de maximisation la quantit

V*
V * Log a 1

Va

** (8)
a
et il propose de rsoudre le problme suivant

Tij Va*
Min
S = Tij Log
1 + V Log
* 1
t ij V
i, j a a (9)
s.c. Va* = Pija Tij a = 1,.., m
i, j
La rsolution du problme par la mthode du Lagrangien conduit :
m
Tij = t ij X a ij
Pa

a =0

et
Va* = Va X a1 /
Willumsen na pas propos de mthode pour calculer et ne donnait pas la signification du
coefficient . Il prcisait cependant que pour des grandes valeurs de (>100) le dbit rel est
proche du dbit observ et donc la limite on se retrouve dans le cas du problme simple ( 3 ). Et
plus se rapproche de zro avec Va* proche de Va on tend vers le cas limite Tij = t ij .

B.III.2 LA MODELISATION MULTI-OBJECTIFS

M Brenniger-Gthe et al (1989) [4] ont propos un modle de programmation multi-


iobjectifs plus prcis en se fondant sur les dernires ides cites ci-dessus.
Dabord une formulation du problme (9) a t propose en affectant dans ce cas aux deux
fonctions objectifs deux coefficients 1 et 2 .
Ce premier modle tant trs proche de celui cit prcdemment mais les auteurs ont montr que
les coefficients 1 et 2 peuvent tre interprts comme linverse dune mesure dincertitude
Ensuite et partant du fait que les coefficients sont une mesure dincertitude M Brenniger-Gthe et
al proposent un modle o on a comme objectif tout les t ij et les Va .
le problme peut ainsi scrire dans un premier temps :

** Lastrisque * fait rfrence la vraie valeur du dbit ( non observ)

Le terme multi-objectif se rapporte au fait quon a plus dune fonction objectif dans le problme de maximisation.

13
T11
T11Log T11
t11
#

TNN
TNNLog TNN

min
t NN
s.c. Va* = Pija Tij a : 1..m (10)
V*Log V1 V*
*
i, j
1 V 1
1
#

V* Log Vm V*
*

m V m
m

Un problme formul par

T *
Log ij 1 + V * Log Va 1
Min ij ij t a a V
T (11)
i, j ij a a
s.c. Va* = Pija Tij a = 1..m
i, j
Comme mesure naturelle dincertitude, M Brenniger-Gthe et al, proposent linverse des variances
et montre quon obtient ainsi une amlioration du modle.

B.III.3 QUELQUES REMARQUES

Comme les coefficients de pondration sont linverse dune certaine incertitude on


en dduit que si on accorde une certitude totale aux donnes observes lincertitude est nulle et on
a donc un coefficient infini.
Le fait de prendre 1 comme coefficient pour toutes les fonctions nimplique pas
lgalit de la certitude quon accorde aux donnes. Il y a en effet un poids implicite correspondant
la valeur de chaque t ij et chaque Va, prcisment, plus la valeur est grande plus lcart relatif est
petit entre la valeur observe et estime donc plus on accorde de certitude aux grandes valeurs
observes.
On peut disposer facilement de matrice de variance-covariance pour les dbits, en
revanche, et si on ne fait pas dhypothses supplmentaires, une matrice de variance-covariance
des ( t ij ) est beaucoup moins facile obtenir do la difficult de lapplication du modle propos
par M Brenniger-Gthe et al.

B.IV CONSTRUCTION DINTERVALLES DE CONFIANCES

M.G.H Bell (1983) [3] a propos en effet une mthode pour calculer la matrice de variance-
covariance des ( t ij ) en supposant quils sont iid de variance , on pouvait ainsi construire des
intervalles de confiances.
On suppose rsolu le problme de maximisation (3) avec la contrainte de proportionnalit (5) :

14
m

Tij = t ij X a ij = t ij exp a = t ij exp a
Pa
(12)
a =0 a a

avec =Log()

Lide est dexprimer la matrice de variance-covariance en fonction de celle de dbits en supposant


quon possde plusieurs observations de comptages. Bell fait lhypothse que les (Tij) suivent une
loi log-normale, il construit dabord un intervalle de confiance pour le logarithme des (Tij) ensuite
il obtient un intervalle de confiance asymtrique pour les (Tij).

Avec les notations matricielles, la contrainte (1) scrit

v=PT
v de taille m x 1
P de taille m x N
T de taille N x 1
donc et avec lhypothse dindpendance

Var( v )=P.Var( T ).P=.P.P

soit D la matrice diagonale (NN) Diag( Tij ),


le vecteur colonne ((m+1) 1) : ( , 1 ,...., m )
y le vecteur colonne ((m+1)1) : : ( t , V1 ,...., V m )

1 " 1
P1 " P1
S = 11 NN

# #
m m
P11 " PNN

1 " 1
1 1
P " PNN
R = 11
# #
m m
P11 " PNN

do l'galit (13) :
T=D.exp( S ) ( 13 )
y=RT

donc
Log( T ) = D + S
et
Var( Log( T ) )= S.Var( ).S

Ensuite par lutilisation de lapproximation Var(y)JVar()J
Voir le paragraphe Notation pour plus de prcisions

Voir bibliographie pour plus de dtail concernant cette approximation

15
y
avec J = la matrice jacobienne (E(v) correspond aux dbits observs)
v v = E ( v )

On obtient donc la fin :

Var( Log( T ) ) = S' J - 1 Var( y) S(J 1 )

On calcule des intervalles de confiances pour Log(Tij) et en dduit des intervalles pour Tij.

REMARQUES ET COMMENTAIRES

Cette mthode a t teste et Bell a pu ainsi construire des intervalles de confiances ce qui
permet de donner une ide sur lerreur commise.
En revanche lhypothse dindpendance est une hypothse relativement forte, par ailleurs les
calculs sont trs lourds. Cette mthode peut tre intressante dans le cas o les matrices
manipuler seraient de petites tailles.
La matrice jacobienne est dfinie strictement positive dans le cas o les quations (1)
relatives aux dbits seraient indpendantes ( rang( P )=m ) et la matrice J serait donc inversible
dans ce cas. Par ailleurs si les quations ne sont pas indpendantes il faut alors considrer les L
premires lignes indpendantes, ce cas a t tudi.

16
C . APPROCHE BAYESIENNE

C.I INTRODUCTION

Cette approche est fonde sur le thorme de Bayes qui peut scrire:

f(x \ y)p(y)
p( y \ x ) = ( 14 )
f(x \ y)p(y)dy
Ce modle a t propos par M. J. Maher (1983) [11], lide principale est de considrer la
demande de trafic et les dbits comme tant des variables alatoires multivaries notes
respectivement et .
Mettre jour une matrice O-D revient alors a trouver la distribution postrieure d'une variable
alatoire sachant la valeur prise par la seconde ( les dbits).

C.II MODLE

La variable alatoire admet donc a priori une matrice de variance covariance 0 et une
moyenne priori t et on cherche la loi conditionnelle de sachant lobservation des dbits
=v.( les dbits v sont des observations de cette variable). Cette distribution sera la distribution
posteriori de
On suppose que les dbits et les dplacements suivent des lois normales.
On a
=P. +
Avec les hypothses

MVN*** ( t , 0 )
MVN(0, )

La distribution postrieure de la variable alatoire sachant =v serait aussi MVN .


En effet les densits de et de ( \ =T) sont donnes par :
N
(2) 1
exp ( t ) 01 ( t )
2

(15)
Det 02 2
1

N
(2) 1
exp ( v ) 1 ( v ) (16)
2

Det 2
1
2

Et en utilisant lgalit (14), Maher calcule la moyenne T et la matrice de variance-covariance


posteriori 1

*** MVN signifie Normale Multivarie

17
Daprs le thorme de Bayes, la distribution conditionnelle serait proportionnelle au produit des
deux densits (15) et (16) car le dnominateur de (14) ne dpend pas de .
Par identification en regroupant les termes et aprs simplification, il vient que :

1 = 0 0 P( + P0 P) 1 P0
et
T = t + 0 P( + P0 P) 1 (v Pt)

On a donc trouv une expression directe de la nouvelle matrice O-D ainsi quune matrice de
variance-covariance ce qui permettrait de faire des tests et de construire des intervalles de
confiances.

V. Pastinen et al (1992) [12] ont appliqu ce modle un secteur de Helsinki.


Les variances ont t obtenues en considrant une erreur fixe pour tout les t ij , et seules les
covariances entre t ij et t ji ont t supposes non nulles et sont donnes par :

Cov( t ij , t ji )=k Var( t ij ) Var( t ji )

Avec k constante (les valeurs de k ont t 0, 1, 0.8)


Plusieurs tests ont ainsi t raliss dans ce cadre et il a t montr que le modle bayesien tait
plus performant que le modle entropique condition de choisir une "bonne" matrice de variance
covariance. En effet plusieurs valeurs de variances ont t tests et pour un coefficient prcis
V.Pastinen et al arrivent des rsultats acceptables.

C.III. CONCLUSION

On peut dire que le modle bayesien est thoriquement trs intressant dans le sens o il permet
de prendre en compte les erreurs dues aux comptages et aux autres mesures et permet de faire des
tests statistiques . D'autant plus que la programmation informatique de rsolution ne prsente pas
de difficults majeures et est mme plus simple que le modle entropique.

L'inconvnient, si on admet les hypothses de normalit, est que cette mthode reste trs
dpendante de la dtermination de la matrice de variance-covariance des dplacements et qu'on ne
possde pas de moyen mathmatique capable de la calculer. En effet cette matrice dpend de la
construction de la matrice a priori et il existe par ailleurs dautres dpendances notamment avec la
matrice daffectation P.
Pour ces raisons il nexiste aucune mthode qui permet de calculer exactement cette matrice de
dispersion. Seules des hypothses simplificatrices sur la forme de la matrice sont utilises.
Lautre problme est que lutilisation de la solution bayesienne peut conduire des valeurs de T
ngatives ce qui est absurde (dans l'tude de V Pastinen et al ceci ne s'est pas ralis). Lhypothse
de normalit peut dailleurs tre mise dfaut si lon a des couples O-D avec des petits effectifs.
D'autres modles utilisent les lois de Poisson.

Dans lgalit (11) faire x= et y=

18
D. MTHODE DE MAXIMISATION DE LA VRAISEMBLANCE

D.I INTRODUCTION

Le principe est de donner une certaine signification statistique la matrice a priori qui est
considrer ici comme une estimation de la matrice O-D.
On considre ainsi que les t ij sont des observations issues d'une variable alatoire qui suit un
loi connue. L'ide est de maximiser la vraisemblance, d'observer l'chantillon issu d'une enqute .
H Spiess (1987) [14] prend comme hypothse de distribution la loi de Poisson, qui est une
approximation d'une loi multinomiale de faible moyenne. On considre en effet que l'on travaille
avec une matrice issue d'enqutes et on possde donc une matrice O-D faibles effectifs. Il est
donc important de noter la similitude avec le modle entropique qui prend comme hypothse de
distribution une loi miltinomiale.

D.II LE MODLE

Soit i , j un coefficient d'chantillonnage de la population des usagers de la paire O-D (i,j) i.e. la
fraction de la population recense ( suppose donc connue).

Les ( t ij )sont des observations d'une variable qui suit une loi de poisson de paramtre ijTij .
La probabilit d'observer t ij est donc donne par
( T ) t ij
exp( ij Tij )
Pr ob( = t ij ) = Pr ob{Poisson ( ij Tij ) = t ij } =
ij ij

t ij !
Donc la probabilit d'observer la matrice O-D a priori est donne par:

( T ) t ij
exp( ij Tij )
P= Pr ob[({t })] =
ij
ij ij

i, j t ij !

Le problme revient donc rsoudre :


Max. P
sous les contraintes (1) Va = P
i, j
a
ij Tij
Un problme qui s'crit aprs passage au logarithme et limination des termes constants :

Min { T
i, j
ij ij t ij Log(Tij )}

S.C. Va = Pija Tij a = 1..m


i, j
La fonction objectif est convexe et le problme admet donc une solution thorique unique .

19
E. MTHODE DES MOINDRES CAREES GENERALISEES

E.I INTRODUCTION

Il s'agit ici de calculer une matrice O-D partir d'une matrice obtenue par des sondages.
Cette matrice sera considre comme une premire estimation de la vrai matrice O-D.
Cette mthode, et contrairement la prcdente, permet d'obtenir une matrice sans que l'on
rajoute d'hypothses de lois sur l'ancienne matrice. On remarquera dans la suite qu'il existe une
grande ressemblance entre la matrice et la variance trouve par ce modle avec celles trouves par
l'approche bayesienne .

E.II. LE MODLE

Comme pour les derniers modles ici on considre les notations vectorielles.
On a alors les quations stochastiques suivantes :

t=T+
v =P. T +

est l'erreur due l'chantillonnage de matrice de variance-covariance et reprsentent et


l'erreur des dbits de matrice de variance-covariance .
L'estimateur de la mthode des moindres carres gnralises GLS est donn par

T = Min.{ (t - T)' 1 (t - T) + (v - P. T )' 1 (v - P. T )' }

On trouve ainsi:
T = ( 1 + P 1 P ) ( 1 t + P 1 v )
1

avec :
Var (T) = P (PP + ) 1 P
La matrice P (PP + ) 1 P est dfinie positive donc l'estimateur trouv est de variance
infrieure celle de la variance de l'estimateur initiale.
E. Cascetta(1984) [5] montre que cet estimateur est l'estimateur linaire sans biais de variance
minimale ( BLUE ).
L'inconvnient de cet estimateur est que l'on peut avoir des composantes Tij ngatives .
M.G.H Bell (1991) [1] propose de rajouter la contrainte Tij 0 au problme de minimisation
prcdent pour vincer les valeurs aberrantes .
Ce modle a t test par simulation d'une petite aire de circulation et les estimateurs trouvs
semblent tre meilleurs que ceux calculs par la mthode de maximisation de l'entropie.

E.III REMARQUES

Ce modle, et malgr les ressemblances, diffre de celui issue du modle bayesien propos par
Maher ( cf. ci-dessus) en effet:
Les thories probabilistes utilises sont diffrentes : dans l'une on minimise des distances
pondres et dans l'autres on cherche une distribution d'une variable alatoire.
Cette diffrence induit une interprtation diffrente des rsultats obtenus.
Dans les autres modles une distribution des Tij a t suppose, alors que dans ce modle
aucune hypothse n'a t prise.

20
Comme pour les autres modles le problme rside en l'approximation de la matrice des variance-
covariance Cascetta propose comme estimateur :

Ti. Tij Tij


Var (Tij ) 1
t i. t i.
Tij Tik
Cov(Tij , Tik )
t i.
Cov(Tij , Tlk ) 0 sinon

21
F. BIBLIOGRAPHIE PARTIE I

1.BELL M.G.H : The estimation of origin destination matrices by constrained generalized least
squares, Transport Research Vol 25B (1991).
2.BELL M.G.H.: The estimation of an origin destination matrice from traffic counts, Transport
Science 10 (1983)
3.BELL MG.H. : The estimation of origin-destination flows and their confidence intervals from
measurments of link volumes: a computer program, (1983).
4.BRENNINGER-GTHE M, KURT O,.JRNSTEN, JAN T. LUNDEGREN: Estimation of
origin destination matrices from traffic counts using multiobjectice programming
formulation
5.CASCETTA E. : Estimation of trip matrices from traffic counts and survey data : A generalized
least squares estimators . Transportation research Vol 18B (1984)
6.CASCETTA E., NGUYEN S : A unified framework for Estimating or Updating O_D matrices
from Traffic Counts Transportation. Research. Vol 18B (1988).
7.DANECH-PAJOU M : Estimation des matrices O-D par les comptages et la thorie de
l'information, Rapport INRETS N126 (septembre 1990)
8..DEBAILLE S. : Un modle de reconstitution des matrices Origines Destination en milieu
urbain ,Rapport de recherche IRT N 27 ( Dec1977).
9.GOLAN A., JUDGE G., MILLER D. : Maximum Entropy Econometrics Robust estiation with
limited data, Ed Series in financial and quantitative analysis
10.HALLEFJORD A. JORNSTEN K. : Multiobjective Gravity Models , Linkping Institute of
Technology , (1983)
11.MAHER M.J. : Inferences on trip matrices from observation on link volumes : A bayesian
statistical approach Transport Research. Vol 17B Vol N6( 1983)
12.PASTINEN V PURSULA M,: A bayesian approach to update traffic flows from traffic counts
12th International Symposium on Transportation and Traffic Theory (1993).
13.ORTUZAR J. de D. , WILLUMSEN L.G.: Modelling Transport
Second edition WILEY (1994)
14.SPIESS H : A Maximum likelihood model to estimate Origin-Destination Matrices, Transport
Research Vol 12B N5 (1987)
15.VAN VLIET D., WILLUMSEN L.G. : Validation of the ME2 model for estimating trip
matrices from traffic counts.8th International Symposium On transportation (1981)
16.VAN ZUYLEN H J.,WILLUMSEN L.G. : The most likely trip matrice estimated from traffic
counts, Transport Research Vol 14B (1980)
17.VAN ZUYLEN H J. : The estimation of errors traffic counts used for the estimation of an O-
D Matrix.
18.WILLUMSEN L.G : Estimating time-dependant trip matrices from traffic counts,
International Symposium on Transportation and traffic theory (1984)
19.WILLUMSEN L.G :Estimation of trip matrices from trafic volume counts validation of a
model under congested conditions. 10th Summer Meeting 12-15 July 1982 transportation
Analysis and Models

22
PARTIE 2 : ESTIMATION DES MATRICES O-D :
CADRE DYNAMIQUE.

A.INTRODUCTION

I l s'agit dans cette partie d'estimer la demande de trafic reprsente par des matrices Origine-
Destination pendant une dure de temps bien dtermine.
Il est important de noter la diffrence avec le cadre statique. Dans cette partie il est plus
judicieux de parler de demande de trafic que d'estimation moyenne des dplacements entre une
paire origine-destination.
L'effet dynamique peut se traduire de trois manires diffrentes :
1.On comptabilise le nombre des dplacements des vhicules partant pendant un instant, ou un
intervalle de temps, t fix et arrivant la destination l'instant, ou pendant l'intervalle de temps, h
(h>t). Le facteur temps intervient alors au dpart et l'arrive .

2.On comptabilise le nombre de vhicules partant de l'origine i et arrivant l'instant t la


destination j, dans ce cas la partie dynamique n'intervient qu' l'arrive .

3.La dernire approche d'estimation dynamique des dplacements consiste ne prendre en


compte le facteur temps qu'au dpart. On estime alors le nombre des dplacements des vhicules
qui se dirigent vers la destination j partant l'instant ou pendant un intervalle de temps t sans
considrer leur temps d'arrive leur destination. C'est ce dernier cas de figure qui sera tudi ici.

On estimera la demande non pas pendant un instant mais sur intervalle t. La priode de temps
sera ainsi subdivise en plusieurs intervalles t.
On rappelle que ces matrices servent mieux grer le trafic, estimer le temps des parcours et
faire des prvisions permettant, entre autres, le contrle du trafic et une meilleure gestion des
congestions.
L'estimation et la prvision du trafic dans le cadre dynamique est une tache complique dans le
sens o les dplacements sont fonction de l'espace et du temps.
Le trafic dpend ainsi de plusieurs variables difficilement quantifiables comme par exemple le
degr d'information reu par le conducteur sur le trafic, son comportement vis vis de
l'information reue etc.
Seules les donnes dont on dispose sont issues des capteurs ou d'informations concernant la
structure gnrale de la matrice O-D. On dispose ainsi de la vitesse des vhicules, du taux
d'occupation et des dbits des capteurs sur certains tronons de l'aire tudie. On supposera aussi,
comme pour le cas statique, qu'on dispose d'un historique concernant la demande de trafic
pendant toute la priode tudie. Cet historique se prsente sous la forme d'un ensemble de
matrices O-D correspondantes chacune un intervalle de temps de la priode tudie.

On distinguera deux types d'estimation :


L'estimation simultane : qui est en fait une extension des modles classiques du cadre
statique aux modles dynamiques on obtient ainsi toutes les matrices O-D simultanment durant
la priode choisie.

L'estimation squentielle : Il s'agit de mthodes plus rcentes qui considrent la demande du


trafic comme un processus stochastique, elles utilisent dans la plupart des cas la notion de filtrage
et plus particulirement le filtre de KALMAN.

Ces deux types de mthode d'estimation seront dvelopps dans la suite. On s'efforcera par
ailleurs de donner un aperu sur la notion de filtre de KALMAN et de son utilit dans la

23
mesure o plusieurs modles qui semblent donner de bons rsultats l'utilisent.

Notons cependant que certains modles ne sont valables que dans le cas d'un rseau simple
comme les autoroutes ou les carrefours. On les a cependant incorpors dans ce rapport dans la
mesure o ces modles peuvent tre amliors et donc tendus au cas de rseaux complexes. On
mentionnera le cas chant le domaine de validit de chacun des modles tudis

24
B.HYPOTHSES ET NOTATIONS

BI. NOTATIONS GLOBALES

Les notations matricielles de la premire partie seront globalement inchanges. Cependant, par
souci de clart de lexpos, on notera les matrices et les vecteurs respectivement par des lettres en
majuscules et en minuscules en gras.
Vu la complexit du problme et la diffrence des variables utilises pour chaque modle, on ne
mentionnera ici que les principales notations adoptes ainsi dans chaque dbut de modle
On prcisera le cas chant les nouvelles variables.
Dans tout ce qui suit, on considre un intervalle de temps H subdivis en nh intervalles supposs
sans perte de gnralit de mme dure et indexs par h. on a ainsi H=* nh .

On suppose que l'on possde N paires Origine-Destination indexes par "r".


m tant le nombre de capteurs qui seront indexs par a , a=1,..,m.
Vu le contexte et afin d'viter toute confusion avec le facteur temps on notera :
d rt : la demande de trafic en unit de vhicules ( ou ombre de dplacements) pour la paire O-D r
et partant de l'origine pendant l'intervalle t.
d rt : la demande de trafic a priori obtenue durant toute la priode H et pour chaque intervalle t.
On prsentera la demande de trafic sous forme de vecteurs colonnes (N 1) nots, selon qu'il
s'agisse de l'information a priori ou les paires O-D estimes, par d t ou d t .
On supposera connues les matrices d'affectation pour chaque intervalle de temps. L'obtention de
ces matrices dans le cadre dynamique n'est pas une tache facile. En revanche, il existe quelques
modles qui fonctionnent et les tudes dans ce sens restent d'actualit. Pour plus de dtails voir la
bibliographie se rapportant ce sujet.
Soit alors Pahrt la proportion des dplacements d rt pour la paire O-D r passant par le capteur a
pendant l'intervalle de temps h
On notera v ah le dbit issu du capteur a pendant l'intervalle de temps h.
on a donc la relation liant la demande du trafic avec les dbits des capteurs :

h
v ah = Pahrt d rt (1)
t =1 r

L'quation (1) peut s'exprimer en une forme matricielle en notant P la matrice d'affectation on
ht
obtient
h
vh = P dt
t =1
ht

B.II.LES ERREURS DE MESURES

Les mesures recueillies des capteurs ne sont pas les vraies valeurs du dbit ceci est caus par les
problmes de recueil des donnes et par les imperfections de mesures. On exprimera ces

25
imperfections par des erreurs notes wah pour chaque capteur a.
Avec les notations matricielles adoptes on aura donc la relation

v h = v h + w h (2)

Avec v h la vraie valeur des dbits et v h les dbits mesurs.

De mme que pour les capteurs, les modles d'affectation ne sont pas en gnral exacts. En effet
les matrices d'affectation qui traduisent les chemins emprunts et la probabilit de choix de ces
chemins n'est qu'une approximation de la ralit. Les proportions de la matrice Pah ne peuvent
donc pas traduire avec exactitude la relation (1) mme avec les vraies valeurs de la demande.
On traduit cette approximation par des erreurs alatoires ah (erreurs de modlisation) et on a
donc
h
v ah = Pahrt d rt + ah
t =1 r
qui s'crit sous forme matricielle :
h
vh = P dt + h (3)
t =1
ht
en notant h = h +w h
Lquation (3) devient
h
v h = P
t =1
ht d t + h

26
C .MTHODES SIMULTANES

C.I.INTRODUCTION

Comme on l'a montr dans la premire partie l'estimation de la demande de trafic peut tre obtenue
par la rsolution d'un problme de maximisation sous contraintes qui se traduit par :
d = arg min[ f 1 ( s, d ) + f 2 (v, v )].
sS

S est l'ensemble induit par les contraintes sur les capteurs, par exemple :
{
S = s N + , Ps = v + }
Les fonctions f 1 (.) et f 2 (.) dpendent du modle d'estimation choisi, du type de l'estimateur et
des informations dont on dispose.
Dans le cas statique l'estimation de la demande est relative une seule priode.
Les modles classiques ( cas statique) peuvent tre tendus au cas dynamique, notant que dans ce
cas on obtient simultanment toutes les matrices O-D en une seule rsolution.
Le vecteur de demande d est donc transform en un vecteur de taille n h N et de mme le
vecteur des dbits transforms en un vecteur de taille n h m .
La forme gnrale du problme d'estimation peut donc s'crire :

(d 1 ,.., d nh ) = arg min[ f1 ( s1 ,.., snh , d1 ,.., d nh ) + f 2 (v 1 ..v nh , v1 ,..vnh )].


s1 ,.. snh S
C.II.EXEMPLE

Comme on l'a prcis ci-dessus les fonctions f 1 (.) et f 2 (.) peuvent tre la log-vraisemblace ( [9 ],
[11] ) ou l'cart quadratique moyen rsultant de la mthode des moindres carres (
gnralises) [ 3 ] ou autres.
La fonction f 1 (.) peut tre dans le cas de l'estimateur de maximum de vraisemblance :

f1 ( s, d ) = [ r s r N log( r s r )]
r

Avec ( r )r les coefficients d'chantillonnage ( voir premire partie pour plus de dtails). Dans le
cas de la mthode des moindres carres la fonction f1 (.) s'crit :

f1 ( s, d ) = ( s - d )' V -1 ( s - d )

Avec V la matrice de variance-covariance du vecteur d. Cette quation reste valable dans le cas o
l'on appliquerait la mthode du maximum de vraisemblance en supposant une distribution
normale multivarie de la demande.
Dans le cas o l'on supposerait que la distribution suit une loi multinomiale la fonction f1 (.)
serait la fonction entropie [ 10 ].
L'expression la plus utilise pour la fonction f 2 (.) est la fonction quadratique :

f 2 ( s, d ) = W -1

= Ps- v

27
Avec la diffrence entre les dbits observs et les dbits calculs partir de la demande de trafic
selon le modle d'affectation choisi.
W tant la matrice de variance-covariance correspondant aux erreurs de mesures issues des
capteurs.
Cette forme quadratique rsulte de l'hypothse que les erreurs suivent une loi normale multivarie
dans un contexte du maximum de vraisemblance ou d'une estimation bayesienne. Cependant son
utilit dans un cadre de mthode des moindres carrs ne ncessite pas de telles hypothses.
Ainsi, si on prend comme modles la mthode de moindres carrs ou celle de la mthode
bayesienne avec une distribution multinomiale, on arrive l'quation

h

h = Pht s t v h
t =1

nh
(d1 ,..,dnh ) = argmin[(sh dh )Vh 1 (sh dh ) + h Wh-1 h
s1,..sn S h=1
h

C.III.CONCLUSION

Ces mthodes d'estimation ont t testes et valides sur des rseaux( [3] , [ 8 ]). L'efficacit de
telles mthodes t prouve
L'inconvnient est que de telles mthodes demandent des capacits de calculs trs puissantes vu le
nombre de paramtres et d'quations rsoudre. Aussi on ne peut pas les appliquer pour des cas
de prvision du trafic dans des programmes en ligne ( en temps rel). Cependant l'utilisation de
telles mthodes peut contribuer lobtention dune estimation du trafic qui elle-mme peut servir
dans le cas o l'on voudrait une estimation en ligne ( en temps rel) de la demande et
faire donc des prvisions.

28
D.MTHODES SQUENTIELLES

D.I.INTRODUCTION

Dans ce contexte, on estime pour chaque intervalle de temps h le vecteur demande correspondant.
On peut distinguer deux principaux avantages de cette mthode d'estimation :
Le premier est la rduction du problme d'optimisation plusieurs problmes de tailles plus
petites permettant ainsi un gain de temps de calcul. Le second avantage est que l'estimation pour
un intervalle h peut contribuer l'estimation de la demande pour (le ou) les intervalles de temps
qui suivent. Ce modle est principalement adapt une utilisation en temps rel.
Lorganigramme ci-dessous montre le fonctionnement dune estimation en temps rel.

L'ide principale de cette approche est de considrer la demande de trafic et les dbits (lis
dynamiquement par des quations linaires) comme des processus stochastiques auto-rgressifs.
La technique du filtre de KALMAN est l'approche utilise pour la rsolution d'un tel problme.

D.II.NOTIONS DE FILTRAGE : LE FILTRE DE KALMAN

On considre deux processus stochastiques ( X (t ) , Y (t ) ) valeurs dans ( N m ), de second


ordre et lis statistiquement par des quations du type :

X (t ) = (t 1)X(t 1) + (t 1) (quation de transition)

Y (t ) = (t )X (t ) + (t ) (quation de mesure ou d'observation)

Avec (t ) et (t ) deux bruits blancs faibles indpendants de moyenne nulle et de matrices de


variances-covariances V et W.
(t) s'appelle la matrice de transition.
X(t) s'appelle processus d'tat, il caractrise le phnomne physique que l'on cherche estimer. Ce
processus n'est pas directement accessible, il l'est par la mesure du processus

Y(t) qui est alors appel processus d'observation.


Le filtre de KALMAN est un algorithme qui produit le meilleur estimateur dans le sens de
minimisation de l'erreur quadratique parmi tous les algorithmes d'estimation de X(t) ( [ 2 ] ).
Il existe plusieurs formulations des quations du filtre, parmi lesquelles on cite :

29
X ( t ) = ( t 1 ) X ( t 1 ) + K ( t )[ Y ( t ) ( t 1 ) X ( t 1 )] (a)



estimation sans mesures terme de corrction

Avec K(t) la matrice gain de KAMAN dfinie par :

K ( t ) = S ( t ) 1 ( t 1 )[ W + ( t 1 )S ( t ) ( t 1 )] 1 (b)

Avec S(t) une matrice de variances-covariances qui satisfait le systme dquation suivant :

S ( t ) = ( t 1 )Q( t 1 ) ( t 1 ) + V

Q( t ) = S ( t ) K ( t ) ( t 1 )S ( t )

Avec comme condition initiale :

S(t 0 ) =cov[(X(t 0 ), X(t 0 )]


Ces 5 quations caractrisent le filtre de KAMAN dans le cas discret.
Lquation (a) est forme de la somme de deux termes, le premier serait lestimation de X(t+1)
dans le cas o il ny aurait pas de mesure de Y . Le second est appel le terme correcteur. Notons par
ailleurs que ce dernier terme est proportionnel la matrice gain de KALMAN . Cette matrice
comme le montre lquation (a) donne le niveau de crdibilit que lon attribue aux mesures par
rapport aux quations de transitions. En effet on montre que ( [ 7 ] ) plus lerreur des mesures (
prsente par la matrice de variance covariance) est grande par rapport lerreur de lquation de
transition plus K est petit en norme et donc le terme correctif est petit . Dans ce cas on accorde
moins dimportance aux mesures plus K est grand ( en norme) dans le cas contraire.

D.III.APPLICATION L'ESTIMATION DE LA DEMANDE DE TRAFIC

D.III.a. L'quation de transition

L'ide est d'essayer de formuler la demande du trafic pendant un intervalle h comme fonction des
autres observations des intervalles de temps prcdents.
Une premire formulation s'crit ( [ 6 ] , [ 4 ] ) :

h N
d rh +1 = f
t = h p r =1
r t
rh d rt + rt

p est le nombre d'intervalles de temps prcdant h o la demande est susceptible de contribuer la


demande durant l'intervalle h+1.
f rhrt exprime la part de l'effet de la demande d rt sur la demande d rh

Il a t montr ( [ 1 ] ) que ce modle n'explique que les dpendances temporelles entre les paires
O-D. Un tel modle auto-rgressif ne peut pas traduire l'information concernant la structure de la
matrice O-D. Pour amliorer ce modle on suppose que l'on dispose d'un historique (sur deux
jours ou plus) qui nous permet d'avoir une estimation de la demande sur tous les intervalles de
temps de la priode tudie. Ensuite on crit l'quation de transition non pas entre la demande de
trafic durant l'intervalle h et ceux qui le prcdent mais entre les carts par rapport la demande a
priori. L'quation de transition s'crit donc :

30
(d )
h N
d rh +1 d rh +1 = f
t = h p r =1
r t
rh
t
r d rt + rt

Cette quation s'crit sous forme matricielle :

(F (d ))
h
d h+ 1 d h+ 1 = h
t
t d t + h (4)
t = h p

Avec Fht une matrice (NN) des effets des vecteurs ( d t d t ) sur le vecteur ( d h+ 1 d h+ 1 ) et
h un vecteur d'erreur ( un bruit blanc faible ) de moyenne nulle et de matrice de variance-
covariance V h + 1 de taille (NN).
Le calcul de la matrice Fht peut tre obtenu par le biais des matrices a priori. Lors de la mise en
application de cette mthode elle a t suppose diagonale postulant ainsi qu'il n'y a pas de
corrlation entre les diffrentes paires O-D. La valeur de p peut tre obtenue l'aide d'une
estimation partir des informations dont on dispose.

D.III.b. L'quation de mesures


Soit q le nombre maximal d'intervalles de temps pass pour voyager parmi toutes les paires O-D.
L'quation (3) liant la demande de trafic et les dbits peut alors s'crire :
h
vh = Pht d t + h (5)
t = h q

h tant un bruit blanc de moyenne nulle et de matrice de variance-covariance W h de


dimension (m m) . On supposera par ailleurs que h et h sont indpendants.
L'quation (5) peut s'crire en terme d'cart par rapport aux donnes dont on dispose selon:

v h v h =
h

t = h q
( )
Pht d t d t + Pht d t v h + h
t = h q
h
(6)

Avec v h les valeurs des dbits a priori pour chaque intervalle h.

D.III.c. La rsolution
Les quations (4) et (6) ne peuvent pas tre appliques directement au filtre de KALMAN.
En effet l'quation de transition telle qu'exprime en (4) donne la dpendance des carts la
priode h+1 et plus d'une priode prcdente. De mme l'quation 6 exprime une relation entre
une priode et plusieurs priodes prcdentes. Pour pouvoir appliquer le filtre de KALMAN des
transformations s'imposent. La mthode la plus simple consiste augmenter le vecteur d'tat de
manire inclure tous les vecteurs des priodes prcdentes .
Posons avec s= max.(p , q)

31
dh d h

d h1
d h = h1
~ d
le vecteur n(s+1) 1
#

d h s d h s

vh v h
v v h1
v~h = h1 le vecteur m(s+1) 1
#

v h s v h s

Fhh Fhh1 " Fhh s



h =
0
de taille n(s+1)n(s+1) , I ns tant la matrice identit (nsns)
I ns #

0

[
Ph = Phh ]
Phh1 " Phh s de taille m n(s+1)

Avec F th =0, v h t v h t =0 pour t >p si p < q


Et P th =0, d h t d h t =0 pour t >q si q > p
On obtient ainsi les deux quations suivantes

~ ~
v h = Ph dh + B h + ~
h
~ ~ ~
dh+1 = dh + h

Avec
~
B h = Ph dh ~
vh

On suppose qu' l'tat initial le systme admet comme moyenne d0 et une matrice de variances-
covariances R0
Aprs ces transformations on montre que l'algorithme de KALMAN s'crit :

32
~ ~
(~ ~
d h = h 1d h-1 + K h v h Ph h 1d h-1 B h 1 )
Le gain tant
( ~ 1
K h = h Ph Ph h Ph + Wh )
Avec h solution du systme d' quations :

~
h = h 1 h 1 h 1 + V h 1

h = h K h Ph h

0 = R 0

On montre ( [ 2 ] , [ 7 ].) que ce filtre ( donne par les quations ci-dessous) fourni la plus petite
erreur quadratique parmi tous les estimateurs linaires.
Et sous lhypothse de normalit des erreurs, on obtient le meilleur estimateur parmi tous les
estimateurs ( linaires ou non-linaires)

33
E .ETUDE COMPARATIVE DES DEUX APPROCHES: TUDE
D'UN CAS PARTICULIER

E.I.INTRODUCTION

Il s'agit d'estimer une matrice O-D en supposant connu le nombre de dparts et d'arrives des
vhicules pour chaque nud. Ceci revient supposer qu'on connaisse les sommes marginales de la
matrice. Ce cas de figure peut se raliser dans le cas d'un petit rseau comme un carrefour ou dans
le cas dun rseau simple tel une autoroute o l'on placerait des capteurs chaque entre et
chaque sortie.

On introduit alors les notations suivantes :


y(t), le vecteur colonne de taille n dont les lments sont nots y j (t) et qui reprsentent le
nombre darrives la destination j durant lintervalle de temps t.
q(t), le vecteur colonne de taille m dont les lments sont nots q i (t) et qui reprsentent le
nombre de dparts de lorigine i.
B(t) est la matrice de taille mn dont les lments sont nots b ij (t) et qui reprsentent le
nombre les proportion de vhicules partant de lorigine i. vers la destination j.

Les lments de B(t) ( la matrice estimer ) doivent satisfaire les contraintes suivantes:

n
b ij (t) = 1 , i = 1,.., m. (1.a)
j=1
b ij ( t ) 0 i = 1,.., m, j = 1,.., n. (1.b)
b j (t): le j me vecteur c olonne de la matrice B(t)
B(t) et b j (t) sont des estimat eurs de B(t) et de b j (t )
On supposera ici que l'intervalle de temps t est assez grand par rapport au temps de voyage de i
vers j. On peut alors lier les quantits ci-dessous par la relation :

y' (t) = q' (t)B(t) (2)

Comme on l'a prcis dans les parties prcdentes, cette relation ne peut pas tre satisfaite cause
de diffrents types d'erreurs. On introduit ainsi le vecteur des erreurs e(t)= ( e j ( t )) j =1,..n
l'quation (2) devient ainsi :

y' (t) = q' (t)B(t) + e(t) (3)


On en dduit que chaque lment de y(t) peut s'exprimer en fonction de chaque colonne de la
matrice B indpendamment selon la relation :
y j ( t ) = q' (t)b j (t) + e j ( t ) (4).

Si on nglige les contraintes (1.a-1.b) le problme d'estimation de la matrice B(t) dcompos en n


problmes d'estimation grce la relation ci-dessus. Cette dcomposition permet de simplifier
considrablement les calculs et de rendre ainsi les programmes de calculs plus performants. Le
raisonnement sur l'quation (4) sans contraintes montre des liaisons entre les estimateurs issues
des mthodes classiques en l'occurrence la mthode des moindres carres et l'estimateur obtenu
par le filtre de KALMAN (Cremer et Keller [], Nihan et Davis []).

34
E.II.ESTIMATION DE LA DEMANDE DE TRAFIC

L'estimateur de chaque colonne peut tre obtenu par la mthode des moindres carres ordinaires
selon :
1

b j = q(t)q' (t) q(t) y(t)
t t

et pour une estimation pour chaque intervalle t :

1
t t
b j ( t ) = q(h)q' (h) q(h) y j (h)
h=1 h=1

Cet estimateur a t utilis par Cremer [ 4 ] pour estimer la demande de trafic dans un carrefour.
Nihan et Davis [ 5 ] ont amlior cette expression en appliquant un lemme sur les approximations
d'inversions des matrices:
On montre ainsi qu'on peut obtenir une relation de rcurrence qui permet le calcul de B :

En notant
1
1 1 t
P j ( t ) = q(h)q' (h)
t t h =1
on obtient les relations suivantes :
[ ]
b j ( t ) = b j ( t 1 ) + K j (t) y j ( t ) q' (t)b j (t 1)
P j (t 1)q(t)
K j (t) =
1 + q' (t)P j (t 1)q(t)
P j (t 1)q(t)q' (t)P j (t 1)
Pj ( t ) = Pj ( t 1 )
1 + q' (t)Pj (t 1)q(t)

Cette relation est trs proche de celle obtenue par le filtre de KALMAN si l'on considre le
systme suivant :
b j (t) = b j (t 1) + s(t)
y j ( t ) = q' (t)b j (t) + e j ( t )

Avec s un bruit blanc de moyenne nulle et de matrice de variance-covariance R j (t) et e j de


variances r j . Ceci suppose donc que les proportions de demande de trafic ne varient pas d'une
manire considrable dans le temps. En appliquant le filtre de Kalman ( cf. rf. ci dessus) on obtient
:

35
[ ]
b j ( t ) = b j ( t 1 ) + K j (t) y j ( t ) q' (t)b j (t 1)
P j (t 1)q(t)
K j (t) =
r j + q' (t)Pj (t 1)q(t)
P j (t 1)q(t)q' (t)Pj (t 1)
Pj ( t ) = Pj ( t 1 ) + R j
r j + q' (t)Pj (t 1)q(t)
Ce rsultat rappelle donc celui trouv dans le cas de l'estimateur des moindres carres. En effet, si
les mesures taient sans erreurs ( c'est dire R j =0 ) et dans le cas o l'on appliquerait la
mthode des moindres carres gnralise en minimisant la quantit :

r [y ]
t
1
( h ) q' (h)b j
2
j
h =1 j

on trouverait exactement les deux mme expressions.

On peut donc dire que si l'on possde assez d'information sur la demande de trafic
notamment si l'on dispose des matrices de variance-covariance l'emploi du filtre de KALMAN
peut contribuer amliorer la qualit de note estimateur.

Dans cette estimation on na pas pris en compte les contraintes (1.a-1.b). En effet les auteurs
cits ci-dessous ne prennent en compte les contraintes que dans les algorithmes proprement dite,
les mthodes utilises sont les mthodes classiques du Lagrangien et de Newton.

Les rsultats obtenus ne diffrent pas dune manire considrable lorsque ces diffrent
modles ont t appliqu lestimation de la demande du trafic sur une autoroute.

36
F. BIBLIOGRAPHIE PARTIE II

[1] Ashok K., Ben-Akiva E. (1993 ) : Dynamic Origin-Destination matrix estimation and
Prediction for real time trafic management systems. In
Proceedings of 21th international Symposium on trafic
Theory. Berkley Ca.
[2] Bertein J.C. Ceshi R. ( 1998 ) : Processus Stochastiques et filtrage de Kaman .
Collection traitement du signal. Ed Hermes.
[3] Cascetta E., Inaudi D. , Marquis G. ( 1993 ) : Dynamic estimators of Origin-Destination
mtrices using trafic counts. Transp. Res. Vol 27 No.
4, november 1993.
[4] Cremer M, Keller H. ( 1987 ) : A new class of dynamic methods for the
identification of Origin-DestinationO-D flows. Transp.
Res. Vol 21B .
[5] Nancy L.N., Davis G.A. ( 1987 ) : Recursive estimation of Origin-Destination matrices
from input/output counts. Transp. Res. Vol 21B .
[6] Okutani I. (1987) : The kalman filtering approach in some
transportation and trafic problems In International
Symposium On Transportation and Trafic Theory .
eds N.H. Gartner and N.H. Wilson. Elsevier
Publishing Company Inc.
[7] Vieville T. ( 1996) : Filtre de Kalman et estimation robuste en vision
Article ( support de cours)
[8] Wong S.C. Tong C.D. (1998) : Estimation of time dependant Origin-Destination
Matrices for transit networks. Transp. Res. Vol 32. B
[9] Wu J. , Chang G.L.. ( 1996) : Estimation of time varying Origin-Destination
distribution with dynamic screenlline flow. Transp
Res. Vol 30.B.
[10] Wu J. (1997) : Areal time Origin-Destination matrix updating
alogorithm for on-line applications. Transp. Res.
Vol 31. B.
[11] Zhou J. Yang H. ( 1998) : Optimal trafic counting locations for Origin-
Destination matrix estimation Transp. Res. Vol. 32.B.

37