Vous êtes sur la page 1sur 61

Spatial and spatio-temporal data science

Concepts de base des données


spatio-temporelles

Mme. Lilia Rejeb 1


Introduction
Que peux-on analyser avec ce genre de données?

2
Introduction
 Objectif :
 Acquérir des connaissances autour
 des entités en mouvement
 De l’environnement des entités en mouvement

= Géographie temporelle [Hagerstrand] qui permet à un


niveau agrégé d’étudier les tendances de la société
 Géographie temporelle : considération de
l’espace et du temps simultanément

3
Introduction

Chemin spatio-
temporel

Espace
tridimentionnel =
Cube espace-temps

4
Introduction

Prisme spatio-
temporel

Volume dans
l’espace et dans le
temps qu’une
personne peut
atteindre dans un
intervalle de temps
donné quand il part
de et retourne à la
même position
5
Exemples

Bateaux en
Voitures en mouvement mouvement

6
Les données de mouvement
 Définition :
 Le mouvement est le changement de la position
physique d’une entité en relation avec un système
de référence (espace géographique)
 Une trajectoire est le chemin engendré par l’entité
en mouvement dans l’espace considéré
 Se fait à travers le temps = chemin spatio-temporel
 Peut correspondre à une fonction qui associe les
instants (temporels ) aux positions dans l’espace
 Paires (temps-localisation)
 Le temps est discrétisé : 7
Les données de mouvement
 Trajectoire : types d’enregistrement des
données
 des séquences finies de localisations (espace-
temps)
 Enregistrement basé sur le temps : les positions sont
relevées à des intervalles de temps fixes
 Enregistrement basé sur le changement :
l’enregistrement se fait quand la position de l’entité
change

8
Les données de mouvement
 Enregistrement basé sur la localisation :
l’enregistrement se fait lorsqu’on s’approche d’une
localisation particulière (capteur)
 Enregistrement basé sur les évènements : a lieu
quand certains évènements apparaissent (ex appel
téléphonique)
 Des combinaisons de ces approches

Ces mesures sont prises avec incertitude


Il est possible de les raffiner en considérant des
contraintes (ex. Le réseau routier)
9
Les données de mouvement
 L’étude des données de mouvement cherche
un nombre de caractéristiques
 Caractéristiques instantanées: caractéristiques
d’un état à un instant précis
 Caractéristiques globales : caractéristiques du
mouvement sur un intervalle de temps donné
 Elle cherche aussi à comparer des
trajectoires

10
Les données de mouvement
 Caractéristiques d’un état à un moment
précis
 Temps
 La position
 Direction du mouvement
 Vitesse du mouvement
 Changement de direction
 Changement de vitesse
 Temps et distance du voyage accumulée
11
Les données de mouvement
 Caractéristiques du mouvement sur un
intervalle de temps donné :
 Forme géométrique de la trajectoire
 Distance parcourue
 Durée de la trajectoire
 Vecteur de mouvement ou la direction principale
 Vitesse médiane, minimale et maximale
 Dynamiques de la vitesse
 Durée, début et fin des accélérations, décélérations et
immobilité ainsi que l’ordre de leur apparition
12
Les données de mouvement
 Dynamiques de la direction
 Périodes de mouvements linéaires, circulaires ou sous
forme de courbes et leurs caractéristiques (début, fin
(temps et position), directions, angles de courbures,
etc.)
 Les déviations : localisation, direction initiale et finale,
temps, vitesse
 Ordre des déplacements et des déviations

13
Les données de mouvement
 Comparer des trajectoires :
 De différentes entités
 De la même entité à des intervalles de temps
différents
 Différents fragments de la même trajectoire
 Objectif : établir des relations entre les objets
comparés
 Egalité ou inégalité
 Ordre
 Distance
 Relations topologiques (inclusion, intersection, etc) 14
Les données de mouvement
 Relations entre trajectoires
 Similitude ou différence de la globalité des
caractéristiques des trajectoires (forme, distance
parcourue, vitesse, etc.)
 Relations spatiales ou temporelles :
 Co-localisation dans l’espace (globale ou partielle)
 Co-localisation ordonnée même ordre de positions
 Co-localisation désordonnée pas le même ordre

15
Les données de mouvement
 Relations spatiales ou temporelles :
 Co-existence dans le temps
 Coincidence dans le temps et les positions
 Coincidence dans le temps et les positions décalée : l’entité e1
atteint la même position que e0 mais après un écart dans le temps
 Distances dans l’espace et le temps

16
Les données de mouvement
En plus des caractéristiques des mouvements,
il faut considérer la structure et les propriétés
de l’espace et le temps où les mouvements
ont lieu

17
L’espace
 L’espace : ensemble de localisations ou de
places caractérisées par des distances qui les
séparent
 Nécessite un système de référence : ex.
Coordonnées géographiques
 Peut être traité selon les besoins
 Espace bi-dimentionnel
 Espace tri-dimentionnel
 Espace uni-dimentionnel (mouvement dans une route
standard. On fixe le début et les positions = distances du
début)
 Espace abstrait ( étudier tunis (politique et religieux)) 18
L’espace
 L’espace est traité comme un ensemble fini de
localisations :
 Exemple : étude des mouvements des touristes
 Limiter les localisations aux sites à visiter

 Discrétisation de l’espace continu


 Les localisations des entités ne peuvent pas être mesurées avec précision et
spécifiées en terme de région
 Cellules des téléphones mobiles
 Quartiers dans les villes

 L’espace peut être structuré en particulier en régions


 Hiérarchique : ville – municipalités – quartiers
 Décomposition géométrique : 1km2
 Réseaux routiers

19
L’espace
 La structuration de l’espace donne un système
de référencement :
 Référencement basé sur les coordonnées : tuples de
distances linéaires ou angulaires à un certain axe ou
angle
 Référencement basé sur la division : division
géométrique ou sémantique de l’espace ou
hiérarchique
 Référencement linéaire : positions relatives dans les
objets linéaires (num maison dans une rue)

20
L’espace
 Les positions ne peuvent être déterminées avec précision : données
avec incertitude
 Les positions peuvent être définies d’une manière relative selon les
besoins des experts : ex. définir les positions en terme de distances
et de directions par rapport à un point de référence
 L’analyse peut demander la considération des mêmes données
dans des systèmes différents de référencement spatial ou la
transformation d’un système de référence à un autre
(référencement basé sur les coordonnées vers référencement par
réseaux)
 On peut aussi considérer les localisations à partir de leurs
sémantique en relation avec le domaine

21
L’espace
 L’espace n’est pas uniforme : hétérogène et les
propriétés changent d’un endroit à un autre
 Caractéristiques des localisations individuelles
 Altitude, pente, aspects du terrain
 Accessibilité (il y a des routes ou pas)
 Caractère et propriétés de la surface : eau, désert, foret
 Objets présents dans la localisation . Des immeubles
 Fonction de l’endroit ex. Maison
 Caractéristiques des localisations définies comme
compartiment d’espace
 Mesure de l’espace et de la forme
 Capacité
 Homogéneité ou hétérogéneité des propriétés ci-dessus 22
L’espace
 Les propriétés d’une localisation peuvent changer à
travers le temps
 Marchés hebdomadaires
 Zones fermées le weekend
 Parcelle de route bloquée pour des travaux ou un accident

23
Le temps
 Le temps est un ensemble continu ordonné
linéairement et dont les éléments sont
séparés par une distance (instants, positions
dans le temps)
 Le référencement temporel est fait selon
 le calendrier Grégorien
 et la division de la journée en heure et l’heure en
minute etc.
 Spécifié selon la région ou par rapport au temps
de Greenwich (GMT) 24
Le temps
 Il peut y avoir un décalage dans le temps dû
au processus de mesure
 Le temps est spécifié d’une manière
imprécise
 Le temps physique est linéaire et
 contient des cycles qui peuvent être imbriqués
année, mois, semaine, jours,
 Contient des cycles relatifs au fonctionnement
des entités (weekend)
 Contient des cycles spécifiques au domaine 25
Le temps
 Il est important de connaitre les cycles
temporels les plus importants pour l’analyse
des mouvements dans un problème donné
 Nécessité de spécifier le numéro du cycle et la
position de l’entité à partir du début du cycle
 Les cycles temporels peuvent avoir des
périodes variables : nécessité de
standardiser la référence du temps :
 diviser le compteur de temps du début du cycle
par la longueur de ce cycle 26
Le temps
 Le temps relatif est utile pour comparer des mouvements
à des moments différents ou qui évoluent à des vitesses
différentes.
 Les propriétés du temps peuvent varier et influencer le
mouvement
 Variation régulière :
 Ex. Les journées de la semaine et le weekend
 Le matin et l’après-midi
 Variations soudaines :
 Les vacances
 Les fêtes

27
Le temps
 La régularité dans le temps peut varier selon le
cycle dans lequel elle est. Ex. La journée en hiver
et en été

 Cette variation des propriétés du temps n’est pas


prise en compte directement dans les données

28
Les entités en mouvement et
leurs activités
 Les caractéristiques des personnes en
mouvement influencent le mouvement
 Occupation
 Age
 Santé
 Statut marital
 Elle se déplace toute seule ou par un véhicule
 La façon de se déplacer peut agir sur les routes à
prendre

29
Les entités en mouvement et
leurs activités
 Les entités se déplacent pour un but
 Détermine le choix des routes
 Pour d’autres types d’entités (tornades,
particules) il faut considérer la cause du
mouvement
 Les caractéristiques du mouvement dépendent
aussi des activités des entités durant le
mouvement
 Shopping
 Marche
 Appel téléphonique 30
Evènements et phénomènes
relatifs
 Chaque mouvement a lieu dans un
environnement influencé par :
 Évènements
 Culturels
 Sportifs
 Sécurité
 Coutumes
 Phénomènes
 Guerres
 Climat
 L’analyste doit inclure d’autres données et des
connaissances d’arrière plan 31
Questions analytiques
 Bertin et French ont proposé un cadre pour la
conception de cartes et graphiques pour
l’analyse de données (visualisation de
l’information)
 Types des questions qui doivent être posées?
 Question formulées dans le langage des données et
 qui ont une importance
 indépendamment des méthodes d’analyse choisies
 Les types de question : vue abstraite de la structure
des données de mouvements
32
Les structures de données
 Structure des données :
 Quels sont les composantes des données ?
 Temps : Ensemble d’instants
 Population : un ensemble d’entités en mouvement
 Espace : un ensemble de localisations
 Relations entre ces composants ?
 Vue orientée Modèle de données abstrait :
 Une trajectoire : Fonction F: T  PE (Instant à localisation)
 Mouvement de plusieurs objets : F : TxEn  PE (instant et entité à
localisation)

33
Les structures de données
 Vue Orientée base de données :
 Table avec trois entrées : entité espace et temps

 La population d’entités et le temps : variables indépendantes ou


composantes de référence
 Une combinaison des composantes de référence est une référence
 L’ensemble des références est composé de toutes les références possibles
 Valeurs des composantes caractéristiques de ces références : caractéristiques des
références
 L’espace : variable dépendante

 Données en mouvement : F : Tx En  Pos x Vit x Dir (temps et entité à


ensemble de caractéristiques (position, vitesse, direction, etc)
 L’état d’une entité en mouvement à un instant donné :
 Localisation
 Autres caractéristiques  caractéristiques secondaires (dérivées à partir des
valeurs des composantes principales
34
Les structures de données
 Les localisations, temps et entités ont leurs propres
caractéristiques : indépendantes du mouvement
 Ne sont pas renvoyés aux paires (instant, entité)
 Mais aux valeurs individuelles (temps, population et espace) :
caractéristiques supplémentaires
 Ces caractéristiques des paires (instant, entité) incluant les
secondaires : caractéristiques du mouvement

 Les questions d’analyse s’adressent aux :


 Références
 Caractéristiques du mouvement
 Peuvent aussi s’intéresser aux Caractéristiques supplémentaires

35
Les questions élémentaires et
Synoptiques
 Les questions diffèrent selon
 Le niveau :
 références individuelles : élémentaire
 ensemble de références : synoptique
 Permettre une vue globale d’un tout
 Prendre la même vue
 Mettre en relation avec des conditions puisqu’elles existent simultanément sur une
large région (climat)
 La différence entre élémentaire et synoptique n’est pas le nombre
d’éléments
 Synoptique traite un ensemble comme un tout
 Quelle est la distribution spatiale de l’ensemble d’entités e1, e2,.. en à un instant t
 Questions élémentaires : destinées à des éléments individuels mais peut
correspondre à 1 ou plusieurs éléments
 Quels sont les positions des entités e1, e2,.. en à un instant t?

36
Les questions élémentaires et
Synoptiques
 Les questions peuvent porter sur
 Les positions
 Les caractéristiques secondaires du mouvement correspondant à une référence
 Vitesse de l’entité e à l’instant t
 Décrire la localisation à laquelle l’entité e était à l’instant t
 Déterminer la position spatiale de e à l’instant t
 Identifierr les caractéristiques supplémentaires de cette position

 Les différents niveaux de questions


 Elémentaire pour le temps et la population : position de e au temps t
 Elémentaire pour le temps et Synoptique pour la population : distribution spatiale d’un
ensemble d’entités à un instant t
 Synoptique pour le temps et élémentaire pour la population : Comment l’entité se
déplace t’elle durant la période t1 et t2
 Synoptique pour le temps et synoptique pour la population : Comment toutes les
entités se déplacent t’elles durant la période t1 et t2

37
Les comportements et
modèles
 Comportement : Configuration de caractéristiques pour
un ensemble ou sous-ensemble de références
 Généralisation de notions : distribution, variation, tendance,
dynamiques, trajectoires
 Trajectoire : configuration de localisations et de leurs caractéristiques sur
un intervalle de temps
 Configuration : caractéristiques arrangées selon la structure et
les propriétés de l’ensemble ou le sous-ensemble de références
et les relations entre ses éléments
 Trajectoire : temps
 Distributions spatiales d’un ensemble d’entités à un instant t
 Population d’entités (ensemble discret d’entités) : les mêmes
caractéristiques ou ensemble de caractéristiques peuvent apparaitre
plusieurs fois et traités différemment
38
 Comportement : distribution de fréquence des valeurs des caractéristiques sur
l’ensemble des entités
Les comportements et
modèles
 Population d’entités :
 Les caractéristiques qui définissent l’ordre ou les distances entre entités
peuvent être décrites arbitrairement.
 Ex. Parade militaire
 L’ordre peut apparaitre à travers les positions des entités et les distances qui les séparent
 L’ordre peut apparaitre au niveau des tailles, poids, age
 Il est utile de considérer différents arrangements ou ordres et les
arrangements correspondants de caractéristiques
 Comportement : Constructions complexes en relation où les valeurs des
caractéristiques sont positionnées selon l’ordre ou la distance entre les entités
associées à ce mouvement
 Le mouvement collectif d’une population d’entités durant une
période donnée est une configuration complexe conçue à partir
des caractéristiques du mouvement de toutes les entités à tous les
instants.

39
Les comportements et
modèles
 les questions synoptiques s’adressent à des ensembles de références et
leurs comportements
 Réponses : description du comportement ou la représentation de ce
comportement dans un langage donné (mathématique, graphique) : pattern
ou modèle
 Les patterns ou modèles :
 Un modèle n’énumère pas les faits mais les décrit tous ensemble
 Un modèle peut être élémentaire ou composite
 La plupart des gens ont tendance à aller au centre ville le matin et d’en
rentrer le soir
 Mouvement d’aller
 Mouvement de retour
 Décrit la direction du mouvement, et des caractéristiques
supplémentaires nature des entités, type de localisation (centre ville)
et le caractère du temps (matin et soir)
 Des résumés peuvent être émis sur les mouvements d’un ensemble de
références dépendant des caractéristiques individuelles des entités :
40
(Vitesse moyenne)
La structure d’une question
 Une question contient des informations connues (contraintes) par la personne
qui la pose pour connaitre des informations inconnues (But)
 Position de X à l’instant t
 Quelles sont les entités et quand ont-elles visité la place p

 Les références binaires (entités, temps) peuvent être divisées en contraintes et


but dans une question
 entités présentes dans p à l’instant t
 Questions synoptiques :
 Type 1 : Contraintes : ensemble de références et But : comportement
correspondant à cet ensemble
 Type 2 : Contraintes : Comportement décrit par un modèle et le but
correspond à l’ensemble de références
 Quels sont les groupes d’entités et quand se sont-ils déplacés selon le
modèle P?
41
La structure d’une question
 Une des composantes de références (ensemble d’entités ou intervalle de temps
) peuvent être divisés en contraintes et en but
 Quelles entités sont en mouvement selon le modèle P durant l’intervalle de
temps t1 à t2?
 Dans quelle période de temps le groupe d’entité e1, e2 .. en est-il en
mouvement tel que spécifié par le modèle P

 Les questions synoptiques demandent la recherche des occurrences de


modèles spécifiques (tâche de recherche de modèles) : reconnaissances de
modèles ou pattern recognition

42
Les questions de comparaison
 D’autres types de questions :
 Relations entre caractéristiques :
 Positions relatives de e1 et e2 à l’instant t
 Comment la localisation de e1 a-t-elle changé entre t1
et t2
 Relations entre Comportements :
 Quels sont les similarités et les différences entre les
comportements de mouvements de e1 et e2 ou
groupes dans l’intervalle t1 à t2
 Comment le comportement de l’entité e dans
l’intervalle t1 à t2 se diffère de celui de l’intervalle t3 à
t4? Qu-est ce qu’ils ont en commun? 43
Les questions de comparaison
 Relations entre références :
 Différence de temps de visite de e à p1 et p2
 Relation entre ensembles de références :
 Comparer les intervalles de temps quand l’entité e
s’est déplacée selon un modèle P1 et un autre modèle
P2.

44
Les questions de comparaison
 Les types de relations
 Relations entre caractéristiques :
 Position : relations spatiales (distance et direction) ,
relations topologiques (dans, intersection)
 Caractéristiques numériques : vitesse, accélération,
ordre
 Caractéristiques qualitatives : direction d’un
mouvement
 Relations entre Références :
 Instants : égalité, ordre, distance, relations entre les
caractéristiques auxiliaires d’un instant
45
 Entités : égalité
Les questions de comparaison
 Relations entre comportements :
 Égalité , similarité, conformité
 Relations entre les résumés des caractéristiques des
comportements (vitesse moyenne), direction privilégiée
 Relations entre ensembles de références :
 Intervalles de temps : ordre temporel, distance,
relations topologiques
 Relations entre les caractéristiques secondaires des
intervalles (longueur)
 Groupes d’entités : égalité, inclusion, intersection ou
non
 Relations entre les caractéristiques secondaires des
46
groupes (taille)
Recherche de relations
 Questions de comparaisons : relations
inconnues
 Questions demandant la recherche
d’occurrences de relations spécifiques
 Trouver tous les cas où deux ou plusieurs entités se
rencontrent au même emplacement? (entités?,
emplacement? Et temps?)
 Trouver tous les cas où deux ou plusieurs entités se
déplacent ensemble (séquences de localisations,
entités? Intervalles de temps)
47
Recherche de relations
 Trouver les cas où les entités répètent le même
chemin (intervalle de temps, chemin? Entité?)
 Trouver les groupes d’entités ayant des
comportements similaires (modèle commun ?,
entités? Intervalle de temps)
 Ces questions nécessitent une
décomposition

48
Recherche de relations
 Décomposition d’une question
 Détecter l’apparition d’une relation spécifique (au
moins deux caractéristiques ou 2 comportements)
 Trouver les références ou ensemble de
références correspondant aux caractéristiques ou
comportements détectés
 Ces comportements ou caractéristiques sont
décrits par les modèles adéquats

49
Construction d’un modèle
complet
 Objectif de l’analyse des données de
mouvement : construire le modèle le plus
approprié représentant le comportement global
des entités à travers le temps qui va être utilisé
pour un but donné
 Prédiction de comportement futurs
 Optimisation
 Le modèle doit être précis et compréhensible
 Modèle composé de plusieurs sous modèles
 Représentation de comportements partiels par des sous-
modèles 50

 Agrégation des sous-modèles


Construction d’un modèle
complet
 La décomposition : détection de similarité et
différences
 Relation de recherche
 Relations de comparaison
 Synthèse du modèle
 Recherche de modèle
 Où d’autre le sous-modèle apparait?
 Question de comparaisons
 Quelles sont les positions de ces sous-modèles en terme de
temps et d’espace?

51
Construction d’un modèle
complet
 Plusieurs techniques de décomposition :
 Diviser E en un ensemble d’entités de comportements
similaires : construire un modèle pour chaque groupe,
décrire le groupe pour lequel le modèle est valide
 Diviser la période [t0.. Tfin] en intervalles ou les
comportements sont homogènes : construire un
modèle pour chaque intervalle; décrire les intervalles
et relations entre eux, décrire l’arrangement temporel
entre les modèles
 Factoriser le temps en ses parties composantes
(composantes linéaires et cycliques); construire un
modèle pour chaque composante 52
Construction d’un modèle
complet
 En pratique ces techniques sont composées
 La précision est difficile à atteindre :
 Modèle : Abstraction et simplification des données donc
déviation des données réelles
 Les valeurs inhabituelles doivent être traitées toutes seules
 La division en ensemble d’entités ou périodes de temps
peut se faire selon
 les différences observées
 Les enfants ne réagissent pas comme les parents
 des comportements ou différences attendues
 Difference entre les périodes de la journée

53
Découverte des connexions
 L’objectif est de déterminer les composantes ou
les phénomènes et comprendre leurs
interactions
 Connaitre si le mouvement est relié à des
phénomènes spatiaux, temporels ou spatio-temporels
 Climat, évènements (accidents, embouteillage), activités des
personnes
 Détection d’interactions entre les parties d’un
comportement de mouvement global
 Mouvement du traffic et piétons
 Propriétés du mouvement : vitesse et direction
54
Découverte des connexions
 Découverte de connexion
 Interactions entre phénomènes ou différents aspects d’un même
phénomène
 Modèle descriptif : Description dans un langage donné de la
connexion découverte
 Types de connexions recherchées :
 Corrélation comme connexion non dirigée ou symétrique. Co-apparition
de caractéristiques de comportement avec un décalage dans le temps
ou l’espace
 Travail dans le centre ville avec utilisation de la voiture
 Dépendance ou influence : Connexion dirigée
 L’utilisation de la voiture ou du vélo dépend du climat
 Connexion structurelle : un comportement est composé de deux ou
plusieurs mouvements réalisés simultanément
55
 Mouvement des planètes : leur propre mouvement et celui de la terre
Découverte des connexions
 Les tâches à faire
 Détecter les corrélations et les dépendances entre les caractéristiques du
mouvement
 Détecter les corrélations et les dépendances entre le mouvement et une variété
de caractéristiques supplémentaires de la localisation, les instants et les entités
et /ou plusieurs phénomènes et évènements externes
 Représenter les mouvements observables comme une composition de plusieurs
mouvement en interaction de différentes sortes

56
Questions relatives aux
données de mouvement

Time

57
Questions relatives aux
données de mouvement
Population

temps

58
Relation des questions au data
mining

59
Relation des questions au data
mining

60
Exercice
 Application de ce qui a été étudié pour un cas
de votre choix
 Définir la structure de données (les composantes
et leurs caractéristiques qui influencent le
mouvement)
 Définir les questions élémentaires et synoptiques
qui vont permettre de dégager les connaissances
à partir de ces mouvements

61

Vous aimerez peut-être aussi