Académique Documents
Professionnel Documents
Culture Documents
Les modèles
Introduction
Nous allons utiliser dans cette partie un plan de modélisation en trois étapes suggéré par
Pas (1993) [17] pour l’étude et l’utilisation d’un modèle d’interaction spatiale.
dans une première partie, la phase de pré-analyse, nous identifions deux types de
variables : n vecteurs de variables caractéristiques du phénomène observé, encore appelées
1Nous éviterons ici les appellations : variables dépendantes resp. indépendantes) pour ne pas faire de
confusion avec la dépendance (respectivement l’indépendance) des variables aléatoires que nous allons
introduire.
partition déterminée par un critère tel que l’appartenance à une même classe politique,
culturelle, linguistique, etc.). Il est évident que la détermination et la mesure des critères de
séparation jouent un rôle très important dans la qualité du modèle.
Nous allons énoncer ici quelque techniques de mesure de la séparation spatiale entre deux
régions et . Les principaux critères de séparation sont liés à l’espace physique dans lequel
le phénomène étudié est observé. C’est ainsi qu’on peut supposer que la quantité de
marchandises qui transitent d’une région vers une région dépend du coût du transport
entre ces deux régions. Cependant, comme évoqué précédemment, les critères de séparation
ne sont pas toujours de cette nature, c’est ainsi que cette quantité de marchandises peut aussi
dépendre du fait que ces deux régions appartiennent ou non à un même espace économique,
politique, linguistique, culturel, etc..
De manière générale nous allons désigner par le kième critère de
séparation utilisé dans la modélisation du phénomène observé. désigne l’ensemble des
régions de départ, l’ensemble des régions de destination, et l’ensemble des numéros
partant de 1 jusqu’au nombre de critères considérés. On sera amené dans certains cas
(échanges internes entre les éléments d’un même système) à poser .
Structure des variables explicatives
Dans la plupart des données que nous aurons à traiter par la suite, nous nous limiterons à
trois types de critères de séparation, à savoir :
un premier type de critères, que nous appelons critères d’interaction pure, qui sont liés
uniquement à l’origine ou à la destination , que nous noterons par abus ou ,
un critère physique que nous appelons critère d’interaction spatiale et qui peut
désigner, par exemple, la distance ou le coût généralisé de transport entre deux régions ; nous
le noterons dans ce cas : ou ,
un critère d’appartenance que nous nommerons critère d’interaction territoriale et qui n’est
pas forcément une forme d’interaction spatiale. Nous traiterons souvent le cas dit de partition
inconnue (C. Grasland). Dans ce cas on suppose qu’il existe un partitionnement, inconnu, de
l’ensemble de l’espace des régions, origines et destinations, qui se surimpose à l’interaction
spatiale. Ce partitionnement étant inconnu, on cherchera à déterminer celui pour lequel les
résultats fournis par le modèle sont les moins éloignés (au sens de la statistique de test
définie) des données recueillies par observation. Ce critère de séparation sera alors noté .
Une fois les différents critères de séparation énumérés, reste à poser la question de leur
mesure. Ces mesures sont des fonctions et à valeurs positives ou logiques (0 ou 1),
Lauman (1966) [16]. Dans le cadre de notre étude, par la suite, nous prendrons comme
mesures :
ou et si et n’appartiennent pas à un même ensemble et
dans le cas contraire. Dans tout ce qui suit, nous définissons par des lettres majuscules
les variables aléatoires et par des lettres minuscules les variables déterministes.
Le modèle poissonnien
L’hypothèse Poissonnienne est sans aucun doute celle qui offre le cadre analytique le
moins complexe pour intégrer des variables explicatives autres que les variables classiques de
distance et de taille des populations (Davies et Guy (1987) [7]). Le cadre analytique est
exposé dans le premier paragraphe et les hypothèses générales de la loi de Poisson dans le
deuxième paragraphe. Il semble évident qu’en pratique une telle décision va sous-entendre
une violation de certaines hypothèses Poissonniennes, même si cette violation peut dans
certains cas ne pas avoir de conséquences significatives sur la qualité de la modélisation.
Le modèle
La variable aléatoire représente ici la quantité de marchandises qui transite de la région
vers la région . On suppose que pour tout et , la variable aléatoire suit une
loi de Poisson de paramètre :
Notre étude ne portera ici que sur les techniques d’Estimation par Maximum de
Vraisemblance (EMV) de et de ceci pour les deux principales raisons suivantes :
une fois les estimations de et de obtenues, on saura trouver par une technique que
nous allons spécifier plus loin des EMV de et .
les EMV de et de sont uniques, alors que celles de et
ne le sont pas.
Dans la suite de l’exposé, nous utiliserons les notations suivantes :
désigne le cardinal de l’ensemble , c’est à dire le nombre d’éléments qu’il contient.
,
en remplaçant par sa valeur on obtient :
pour tout et :
pour tout :
pour tout et :
pour tout et :
C. Test d’adéquation des données estimées par le modèle aux données observées
La statistique de test utilisée pour les tests d’adéquation des données estimées par un
modèle linéaire généralisé aux données issues de l’observation est la déviance. Dans le cas du
modèle poissonnien, cette déviance s’écrit :
où :
désigne le logarithme de la vraisemblance, en supposant que pour tout ,
la variable aléatoire suit une loi de Poisson de paramètre ,
désigne le logarithme de la vraisemblance, en supposant que pour tout ,
la variable aléatoire suit une loi de Poisson de paramètre ,
Les calculs donnent :
Cette statistique de test suit une loi qui converge, quand les flux et le nombre de ceux-ci
deviennent grands, vers une loi du où représente le nombre de flux et le nombre
de paramètres estimés du modèle. Cette statistique a été au départ construite afin de savoir si
une variable devait être incorporée ou non au modèle [Hosmer et Lemeshow, 1989, McCullag
et Nelder, 1989] et ne doit donc pas nécessairement être utilisée comme une mesure de la
qualité générale du modèle.
Pour de plus amples informations, nous renvoyons le lecteur à se reporter à l’ouvrage de
Gouriéroux, cité en annexe [12]. Notons que d’autres types d’estimations existent
(intégrations numériques, approximations numériques, simulation des probabilités, etc.),
l’article de V. Hajivassiliou, D. McFadden, P. Ruud constituant la référence sur le sujet [13].
Cas où les hypothèses de Poisson ne sont pas vérifiées
Nous évoquons dans ce paragraphe, des alternatives à deux types de déviations possibles
des hypothèses de la modélisation Poissonnienne : un premier type de déviation lié à une sur-
dispersion et l’autre à la dépendance temporelle du phénomène observé.
cas d’une sur-dispersion :
Ce phénomène est souvent dû au fait que certaines sources de variation sont omises dans
les variables de cause. La méthode classique pour y remédier consiste à introduire une
variable aléatoire dite variable de nuisance dans la modélisation, pour représenter les effets
des variables omises (Davies et Cronceley, 1985). La formulation la plus simple suppose que
les variables suivent une loi de Poisson de paramètre :
où est une réalisation d’une variable aléatoire supposée indépendante des autres
variables de cause. On a alors :
ou encore :
en posant :
Conclusion
La modélisation par un processus de Poisson offre un cadre statistique permettant l’analyse
détaillée des données observées. Même dans le cas où les hypothèses du phénomène ne
cadrent pas avec les hypothèses poissonniennes, la régression poissonnienne peut être utilisée
en première approximation. On pourra alors, si les résultats fournis ne sont pas en adéquation
avec les données observées, utiliser des processus moins usuels, plus difficiles à appréhender
sur le plan mathématique, mais qui peuvent être vus comme une extension du processus de
Poisson.
Bibliographie
[1] Aitkin M., Flowerdew R. (1982), A Method of fitting the gravity model based on the
Poisson distribution, Journal of Regional Science 22(2), pp. 191-202.
[2] Barmby T., Doornik J. (1989), Modelling trip frequency as a poisson variable, Journal
of Transport Economics and Policy, septembre.
[3] Batty M., March L. (1975), Generalized measures of information, Bayes' likelihood
ratio and Jaynes' formalism, Environment and Planning B 2, pp. 99-105.
[4] Batten D.F., Boyce D.E. (1987), Spatial Interaction, Transportation, and Interregional
Commodity Flow Models, in Handbook of Regional and Urban Economics, P. Nijkamp, ed.
1, Chapter 9.
[5] Cameron A.C., Trivedi P.K. (1986), Econometric models based on count data :
comparisons and applications of some estimators and tests, Applied Econometrics, (1), pp.
29-53.
[6] Carrothers G.A.P. (1956), An historical Review of the Gravity and Potential Concepts
of Human Interaction, Journal of The American Institute of Planners, 22, pp. 94-102.
[7] Davies R.B., Guy C.M. (1987), The Statistical Modeling of Flow Data when the
Poisson Assumption is violated, Geographical Analysis.
[8] Dorigo, Tobler W. [1983], Push-Pull Migration Laws, Annals of the American
Geographers.
[9] Flowerdew R., Lovett A. (1986), Fitting Constrained Poisson Regression Models to
Inter-Urban Migration Flows, Annual Conference of The Institute of British Geographers.
[10] Fotheringham A.S., Williams P.A. (1983), Further Discussion on the Poisson
Interaction Model, Geographical Analysis 15, pp. 343-347.
[11] Gatrell A.C. (1983), Distance and Space, Clarendon Press, Oxford, England.
[12] Gouriéroux C. (1989), Econométrie des variables qualitatives, chapitre X, pp. 297-
305, Collection Economie et Statistiques Avancées, 2ème édition, Economica.
[13] Hajivassiliou V., McFadden D., Ruud P. (1996), Simulation of multivariate normal
rectangle probabilities and their derivatives Theoretical and computational results, Journal of
Econometrics 72, pp. 85-134.
[14] Isard W., Bramhall D.F. (1960), Gravity, Potential and Spatial Interaction models,
dans Methods of Regional Analysis, W. Isard, MIT Press, Cambridge, Massachusetts, pp.
493-568.
[15] Isard W. (1975), An Introduction to Regional Science, Prentice-Hall, Englewood
Cliffs, New-Jersey.
[16] Laumann E.O. (1966), Prestige and Association in Urban Community, Bobbs-Merill
Company, New-York.
[17] Pas E.I. (1995), The Geography of Urban Transportation, edited by Susan Hanson,
The Guilford Press.
[18] Olsson G.(1965), Distance and Human Interaction, Regional Science Research
Institute, Philadelphia, Pennsylvania.
[19] Ravenstein E. (1876), The Birthplaces of the People and the Laws of Migration, The
[20] Ravenstein E. (1885), The Laws of Migration, Journal of The Royal Statistical Society
48, pp. 167-235.
[21] Ravenstein E. (1885), The Laws of Migration : second paper, Journal of The Royal
Statistical Society 52, pp. 241-305.
[22] Rickard J.M. (1988), Factors influencing long distance rail passengers trip rates in
Great Britain, Journal of Transport Economics and Policy, 22, pp. 209-233.
[23] Rummel R.J. (1972), The Dimension of Nations, Sage Press, Beverly Hills,
California.
[24] Sen A., Smith T.E. (1995), Gravity models of spatial interaction behaviour, Advances
in spatial and network economics, Springer Verlag.
[25] Senior M. (1979), From Gravity Modelling to Entropy Maximising : a Pedagogic
Guide Progress in Human Geography.
[26] Somermeyer W. (1971), Multi-polar Human Flow Models, Papers and Proceedings,
The Regional Science Association 26, pp. 131-144.
[27] Tobler W. (1981), A model of Geographical Movement, Geographical Analysis 13,
pp. 1-20.
[28] Tversky A. (1977), Features of Similarity, Psychological Review, 84, pp. 327-352.
Geographical Magazine III, pp. 173-177, 201-206, 229-233.
[29] Webber M.J. (1979), Information Theory and Urban Spatial Structure, Croom Helm,
Beckenham, Kent.
Droits d’auteur
© CNRS-UMR Géographie-cités 8504
Résumé / Abstract
Ce document est le fruit d’une recherche effectuée en vue de la modélisation des flux
qui transitent entre les régions d’une communauté définie. Il a été réalisé au sein du
Laboratoire de Modélisation et Calcul de l’Université Joseph Fourier de Grenoble (IMAG)
en collaboration avec le Département des Etudes Economiques du Service Economique et
Statistique (METL)** et les laboratoires LABSAD* (UPMF Grenoble) et P.A.R.I.S.***
(CNRS Paris I). Les techniques statistiques parfois regroupées sous le terme de comptages, car
elles permettent de tenir compte de données individuelles (dénombrement de réalisations d’un
événement), permettent de prendre en charge la nature discrète de la variable dépendante des
flux. Les modèles poissonniens qui appartiennent à la famille des modèles linéaires généralisés
(Generalized Linear Models) constituent une approche à la fois simple et rigoureuse de
l’estimation de flux de différentes natures, ceci en fonction de variables explicatives,
quantitatives ou qualitatives.
Mots clés : modèle de Poisson, flux de marchandises, vraisemblance, surdispersion, modèle
d’interaction spatiale