Vous êtes sur la page 1sur 20

LES METADONNEES

Les supports de la formation en ligne doivent répondre à l’acronyme suivant,


RAID,
RAID qui signifie : Réutilisabilité, Adaptabilité, Interopérabilité, Durabilité. Les
métadonnées doivent permettre cette réalisation.
Les métadonnées servent à décrire les objets d’apprentissage dans la formation en ligne.
Elles font partie du processus de normalisation. Elles se composent de descripteurs qui
visent à rendre les contenus d’apprentissage facilement identifiables et donc accessibles
et aisément manipulables (réutilisabilité, interopérabilité, durabilité, adaptabilité). Les
métadonnées sont au cœur de la normalisation de la formation en ligne. Elles doivent
décrire les ressources pédagogiques, le profil des apprenants, les éléments d’évaluation,
le suivi des apprenants, les médias proposés.
On retrouve les métadonnées à deux niveaux :
- Technique :
XML devient la norme pour la catégorisation des informations dans Internet. XML n’est
pas spécifiquement normalisé pour la formation en ligne, mais il peut le devenir.
- Pédagogique :
IMS-LOM : schéma de métadonnées largement soutenu par la communauté
internationale et objet de discussion au SC 36 de l’ISO. LOM est standardisé depuis
juillet 2002 par l’IEEE. Il compte 9 catégories de donnes et 80 éléments de métadonnées.
Dublin Core : autre schéma qui connaît des rapprochements avec LOM.
Cancore : d’initiative canadienne, le schéma s’appuie sur le Dublin Core en complétant
ses identifiants de base et sur LOM en simplifiant son schéma.
A noter : LOM domine aujourd’hui, il est intégré dans SCORM, modèle de référence.
Ces schémas restent encore très complexes et ne semblent pas à la porter de tous
les usagers de la formation en ligne.
Pour l’heure, le travail sur les métadonnées portent sur :
- la syntaxe et la sémantique des métadonnées, leur nombre ;
- permettre de faciliter la traduction des contenus en différentes langues ;
- favoriser les échanges ;
- trouver le bon protocole qui facilitera les échanges sur le réseau.
Mots clés : métadonnées, normalisation, Cancore, Dublin Core, IMS-LOM, SCORM,
XML

1
1. Les métadonnées au niveau
niveau technique

1.1. SCORM
SCORM1 (Sharable Content Object Reference Model) est une norme qui permet de
créer des objets pédagogiques structurés. C’est un modèle pour le déploiement et la
création de contenus pour l’apprentissage en ligne. La vague de fond qui porte SCORM
est « l’hypothèse sur le Web » selon laquelle le Web est le meilleur support pour l’accès à
l’apprentissage et la réutilisation des contenus d’apprentissage pour le Web. Dans cette
perspective, SCORM offre la capacité d’un système de gestion de l’apprentissage (SGA)
basé sur le Web à lancer un contenu multimédia et multisources et à échanger des
données avec ce contenu. D’un point de vue technique, SCORM est une suite de normes
techniques qui permet aux systèmes d’apprentissage en ligne de manipuler des contenus
pédagogiques.
SCORM, en tant que norme, doit répondre à un certain nombre d’exigences :
 accessibilité : repérer des composants d’enseignements sur des sites, y accéder et
des redistribuer. Il faut pouvoir repérer des contenus grâce à des mots clés,
inscrits dans les métadonnées ;
 adaptabilité : permettre de personnaliser la formation en fonction des besoins ;
 durabilité : résister à l’évolution des technologies, sans subir de mise à jour, de
recodage. Les plateformes évoluent rapidement, quand certaines émergent,
d’autres disparaissent. Les contenus doivent pouvoir toujours être exploités sans
subir les conséquences de ces changements technologiques ;
 interopérabilité : utiliser des composants d’enseignement développé sur un autre
site dans un autre site ou plate-forme. Exemple : un cours peut être mis sur
différentes plateformes et une plateforme peut lire des cours d’origines
différentes ;
 réutilisabilité : intégrer des composants d’enseignement sur tous supports.
SCORM est née d’un mouvement de standardisation entre universités, industriels
et organisations gouvernementales américaines. Au sein du DoD (Department of
Defense) nait le projet ADL. C’est l’ADL2 (Advanced Distibuted Learning), entre autres,
qui collecte les standards et outils permettant la construction de l’environnement
d’enseignement à distance et de la norme SCORM. Ainsi, les spécifications des
organisations suivantes ont été intégrées dans la norme SCORM :
 ARIADNE (Alliance of Remote Instructional Authoring & Distribution Networks
for Europe)
 AICC (Aviation Industry CBT/Computer Based Training Committee)
 LTSC (IEEE Learning Technology Standards Committee)
 IMS Global Learning Consortium, Inc
 TPSMG (Aeorspace and Defense Industries Association of Europe / ASD
Technical Publication Specification Maintenance Group).

1
http://fr.wikipedia.org/wiki/SCORM
2
http://www.adlnet.gov/about/index.aspx

2
SCORM,
SCORM ce sont plusieurs parties :
Un modèle d’agrégation de contenu (MAC) qui vise à décrire et échanger des éléments de
formation, au sein d’un entrepôt de documents pédagogiques. Il permet la
communication avec le LOM (Learning Object Metadata). Ce modèle comporte trois
types de métadonnées :
 Asset, ressources multimédia,
 SCO, grain de formation,
 Agrégation de contenus.
Le document SCORM sur le Modèle d'agrégation du contenu (MAC) décrit les
composants utilisés dans une expérience d'apprentissage, comment conditionner ces
composants pour effectuer des échanges d'un système à un autre, comment décrire ces
composants pour permettre la recherche et le repérage, et comment déterminer les règles
de séquencement en ce qui a trait aux composants. Le MAC assure la promotion de
méthodes cohérentes en matière de stockage, d'identification, de conditionnement,
d'échange et de repérage du contenu.
Ces métadonnées sont utilisées pour constituer un dictionnaire de termes
décrivant le contenu de l’objet d’apprentissage. Le modèle d’agrégation de contenu
permet aussi de lier les métadonnées et les fichiers XML afin que ceux-ci soient
interprétés par l’ordinateur et lisibles pour l’utilisateur. Enfin, le modèle d’agrégation
établit comment empaqueter un somme de contenus, leurs métadonnées et la façon dont
ils doivent être livrés à l’utilisateur. Pour ce faire, une archive zip est créée rassemblant
les fichiers concernés et un fichier xml.
La seconde partie de SCORM,
SCORM c’est l’environnement
l’environnement d’exécution.
d’exécution Pour qu’un
apprenant accède à un contenu d’enseignement, une communication doit se faire entre
l’objet pédagogique et le LMS (Learning Management System). Les organisations ADL et
AICC ont donc créé une API (Application Program Interface) en langage Javascript.
La communication entre le LMS et le contenu se fait de façon standard, quel que soit
l’outil pour développer le contenu. Les trois composantes de l’environnement d’exécution
de SCORM sont le lancement, l’API, et le modèle de données.
SCORM, c’est enfin un modèle de séquencement et de navigation.
navigation Ce modèle joue
les règles de séquencement établies par un concepteur de contenu pédagogique et le
modèle de navigation conçu par ce même concepteur, pris en main par l’apprenant.
La version de SCORM3 qui prévaut aujourd’hui est SCORM 2004, une version
améliorée de SCORM 1.24. Les applications permises par cette version de SCORM sont
les suivantes : les concepteurs de contenus de formation peuvent choisir la façon dont
l’apprenant passe d’une activité à l’autre. Ce qui permet d’adapter le parcours
pédagogique aux résultats de l’apprenant. On peut concevoir des questionnaires,
enregistrer les résultats de l’apprenant avec précision, développer des cursus dans le
cadre d’une gestion des compétences.
Des discussions ont actuellement cours pour déterminer ce que devra apporter la
prochaine version de SCORM. Les nouvelles capacités de SCORM pourraient ainsi être
l’intégration d’objets de simulation, le tutorat intelligent, l’intégration de technologies issues
des jeux.

3
http://www.formastore.net/data/mosclub/doc/scorm2004_2nd_doc_french.pdf
4
http://www.scorm.fr/?cat=36

3
1.2. XML
XML5 (eXtensible Markup Language) est un langage informatique portant sur le
balisage. Cette syntaxe est supportée par le W3C (World Wide Web Consortium). Son
principal caractère est l’interopérabilité puisqu’il facilite les échanges automatisés de
contenus entre systèmes d’informations différents. XML a été développé comme une
version simplifiée de SGML.
SGML XML est un langage fondé sur un système de balises comme
HTML mais il porte sur les données plutôt que la présentation des contenus.
Le langage XML repose sur une syntaxe générique et extensible. Un document
XML possède une structure logique et une structure physique. Sur le plan physique, le
document se compose d’unités, appelées entités. Une entité peut en appeler d’autres pour
les impliquer dans le document. Sur le plan logique, le document se compose de
déclarations, d’éléments, de commentaires, d’appel de commentaires, d’instructions de
traitement. Pour qu’un document XML soit valide, les structures logiques et physiques
doivent s’imbriquer correctement. Les composants d’un fichier XML peuvent être
représentés comme des nœuds généralement.
XML s’est imposé comme un format de référence pour l’échange de données, et de
métadonnées plus spécifiquement.
Lors de sa conception, les objectifs de XML sont les suivants6 :
 XML devra être directement utilisable sur l'internet.
 XML devra reconnaître une grande variété d'applications.
 XML devra être compatible avec SGML.
 L'écriture des programmes de traitement des documents XML devra être aisée.
 Le nombre des caractéristiques optionnelles dans XML devra être tenu au strict
minimum, idéalement à zéro.
 Les documents XML devraient être lisibles par un humain et raisonnablement
clairs.
 La conception de XML devrait être préparée rapidement.
 La conception de XML devra être formelle et concise.
 Les documents XML devront être faciles à créer.
 La concision dans le balisage XML est de peu d'importance.

Les applications de XML sont :


 Protocole de communication : règles de communication entre deux couches sur
une même machine et/ou règles de communication entre deux couches
d’abstraction entre deux machines différentes.
 Un format de données
 Un langage de description de format de document
 Un langage de programmation : code de communication entre une machine et un
humain.

5
http://fr.wikipedia.org/wiki/XML
6
http://www.yoyodesign.org/doc/w3c/xml11/

4
Ce que permet XML7 :
 De détacher un contenu de sa mise en forme.
 De générer autant de présentations que souhaitées pour ce contenu, sur plusieurs
médias.
 Les machines peuvent plus aisément interpréter ce langage et le contenu traité,
indépendamment d’une application spécifique.
Le système de balises sur lequel repose XML est essentiel. Il est défini par W3C.
Une mauvaise identification conduirait à une interprétation fausse par la machine. C’est
pourquoi W3C se concentre ses ces balises et entre autres les balises de nommage (name
spaces), les langages de présentation (css, xls).

2. Les métadonnées au niveau pédagogique


Comme nous venons de le dire, les métadonnées sont des données à propos des
données permettant de catégoriser l'information. Elles comprennent un certain nombre
de descripteurs qui permettent de les rendre plus facilement identifiables (accessibles) et
plus manipulables (interopérables, réutilisables, durables, adaptables).
En e-formation,
formation les métadonnées servent à décrire les objets d'apprentissage. Ces
derniers se définissent comme étant des blocs de contenus focalisant sur un objectif
d'apprentissage spécifique. Ils peuvent être constitués d'un ou de plusieurs composantes
ou blocs d'informations incluant du texte, des images, des vidéos, des sons, etc. Le but
principal de cette normalisation est de faciliter la réutilisation, la production des
documents pédagogiques numériques étant difficile, laborieuse et coûteuse.
Le comité ISO/IEC JTCI SC 36 (dont le CN36 est une commission miroir au sein de
l’AFNOR) s'intéresse aux métadonnées en e-formation. Elle travaille à la normalisation
des technologies de l’information destinées à l’apprentissage, à l’enseignement et à la
formation. Les thématiques du SC 36 sont les suivants (cf.
http://isotc.iso.org/livelink/livelink?func=ll&objId=806742&objAction=browse&sort=name) :
 WG 01: Vocabulaire
 WG 02: Technologies collaboratives
 WG 03: Contenus de formation
 WG 04: Gestion et livraison de l'apprentissage, l'enseignement et la formation
 WG 05: Contrôle de qualité et Descriptives des cadres
 WG 06: Culture, langues et fonctionnalité
Identification des contenus par les métadonnées (thématique trois du SC 36)
Les spécifications dans ce domaine visent principalement à :
 déterminer le nombre, la syntaxe et la sémantique des métadonnées afin que leur
description soit indépendante du contenu lui-même ;
 faciliter la traduction des contenus en différentes langues ;
 développer une structure ou schéma de métadonnées qui favorise les échanges ;
 élaborer un protocole léger pour faciliter les échanges.

7
http://www.chez.com/xml/initiation/

5
Plusieurs approches différentes sont actuellement utilisées pour éditer les
métadonnées LOM..
Mais d’abord que signifie LOM ?

2.1. LOM
LOM (Learning Object Metadata) est un standard international proposant un
modèle de description des métadonnées associées à des objets pédagogiques quels qu'ils
soient, numériques ou non. Il est proposé par le comité LTSC (Learning Technology
Standards Committee — Comité des normes technologiques d'apprentissage) de l'IEEE
(Institute of Electrical and Electronics Engineers — Institut des ingénieurs en électricité
et électronique).
Le LOM n'est pas une norme mais une recommandation de métadonnées adopté par les
IEEE en 2002. Il présente « un ensemble minimal d'attributs nécessaires pour la gestion,
la localisation et l'évaluation d'objets didactiques, qu'ils soient numériques ou non ». Une
correspondance avec la norme Dublin Core est annexée à la norme LOM. Le comité
LTSC de l'IEEE et la DCMI (Dublin Core Metadata Initiative) ont annoncé leur
engagement à définir des métadonnées compatibles.
Le profil français d'application du LOM est intitulé le LOMFR. Contrairement au
LOM, c'est une norme. Il a été élaboré dans le cadre d'une convention entre l'Education
nationale et l’AFNOR. Une version définitive du LOMFR a été publiée en décembre
2006.
Le LOMFR décrit des objets (ressources) pédagogiques : « Est considérée comme
ressource pédagogique toute entité (numérique ou non) utilisée dans un processus
d'enseignement, de formation ou d'apprentissage ». Il peut s'agir de livres, de films, de
scénarios pédagogiques, de sites web, de logiciels, etc.
Les objectifs de LOMFR sont les suivants :
 permettre une meilleure visibilité de l'offre d'objets pédagogiques, numériques ou
non ;
 disposer de normes à respecter pour garantir la pérennité, l'interopérabilité, et
une certaine ouverture des ressources numériques produites, en lien avec les
plates-formes de distribution et de consultation de ces ressources. (extrait de la
norme expérimentale).

Il concerne l’ensemble de la communauté éducative :


 Communauté éducative française (enseignements primaire, secondaire,
supérieur)
 Communauté de la formation (formation professionnelle, formation continue)
 Documentalistes et bibliothécaires
 Editeurs, entreprises
Pour plus d’information cf. www.lom-
www.lom-fr.org

6
2.2. Les éditeurs de métadonnées LOM
2.2.1. Dublin Core Education working group
Le Schéma de métadonnées générique « Dublin Core » a été développé par un
consortium international (Dublin Core Metadata Initiative) en 1995, au siège de l'OLC à
Dublin (Ohio) par le NSCA (National Center for Supercomputing Applications) et l'OLC
(Online Computer Library Center). Il comprend un nombre limité d’identificateurs mais
il est extensible. La sémantique de ces identificateurs a été établie par un consensus
international de professionnels provenant de diverses disciplines telles que la
bibliothéconomie, l'informatique, le balisage de textes, la communauté muséologique et
d'autres domaines connexes.
2.2.1.1. Les éléments du Dublin Core
15 éléments de base répartis en 3 groupes :

Contenu Propriété intellectuelle Instance particulière

Titre Créateur Date


Sujet (mot-clés) Éditeur Type
Description (résumé) Contributeur Format
Source Droits Identifiant
Langue
Relation
Couverture

2.2.1.2. Caractéristiques :
- Simplicité de création et de gestion,
- Sémantique communément comprise,
- Envergure internationale,
- Extensibilité,
- Applicable à presque tous les formats de fichiers à condition que la métadonnée
ait une forme interprétable à la fois par des moteurs de recherche et par des
humains,
- Utilisable avec HTML et XML
Le schéma Dublin Core n’a pas été conçu spécifiquement pour la formation en ligne et
plusieurs jugeaient qu’il n’est pas suffisamment complet et adapté au domaine. Au sein
de la Dublin Core Metadata Initiative fut crée un groupe de travail qui, lui, focalise sur
l'élaboration d'éléments, de qualificatifs et de valeurs (vocabulaires contrôlés) propres au
domaine de l'éducation, à employer avec la norme Dublin Core pour décrire des
ressources didactiques.

7
2.2.1.3. Exemples d’utilisation : Groupe de Travail Métadonnées Education
(GTME)
Le Groupe de Travail Métadonnées Education du CRDP de Montpellier a élaboré
un schéma de métadonnées pour les ressources éducatives en ligne qui est un profil
d'application du Dublin Core, auquel il a ajouté divers éléments d'autres schémas. Ce
schéma est évolutif. Il est destiné à être progressivement enrichi (cf. http://www.ac-
montpellier.fr/ressources/IntroGTME1-0.doc).

Proposition de schéma de métadonnées pour les ressources éducatives en ligne.


Cette proposition de schéma comprend :
12 des 15 éléments du Dublin Core : titre, auteur, sujets et mots clés, description,
éditeur, Date, format, type, identifiant, relation, droits, langue
Éléments complémentaires GTME : statut, niveau, discipline, nature, interactivité,
public
Les éléments de métadonnées du GEM (Gateway to Educational Materials)
Le Gateway to Educational Materials est une importante initiative lancée aux États-
Unis afin de procurer un accès par Internet à des ressources didactiques. Le GEM a créé
un ensemble d'éléments de métadonnées fondé sur la norme Dublin Core, auquel
s'ajoutent des éléments propres au domaine de l'éducation. Même s'il ne porte pas le nom
de norme, l'ensemble d'éléments du GEM est largement utilisé. Le personnel du GEM
travaille en étroite collaboration avec le Dublin Core Education Working Group.

2.2.2. L'IMS Global Learning Consortium (IMS)


IMS est un consortium mondial dont les membres œuvrent pour offrir un accès en
ligne à des ressources didactiques. Il participe à l'élaboration et à la promotion de
« spécifications ouvertes pour favoriser les activités d'apprentissage en ligne telles que la
recherche et l'utilisation de contenu éducatif, le suivi des progrès de l'apprenant, le
compte rendu de son rendement, ainsi que l'échange de dossiers d'étudiant entre divers
systèmes administratifs ».
IMS produit un ensemble de spécifications, notamment sur des métadonnées et
sur la présentation du contenu. Les travaux d'IMS sont fondés sur la norme LOM du
comité LTSC de l'IEEE. Une correspondance est possible entre les éléments de
métadonnées d'IMS et ceux, plus généraux, de la norme Dublin Core, ou ceux
d'ensembles propres au domaine de l'éducation. Un accord récent, conclu entre IMS,
Dublin Core et l'IEEE, promet « une harmonisation et une collaboration d'envergure (...)
en ce qui a trait à l'interopérabilité et à la mise en œuvre des métadonnées dans le
domaine de l'éducation ».
IMS Learning Design (http://www.epi.asso.fr/revue/articles/a0512c.htm)
La spécification IMS-Learning Design (ingénierie pédagogique) fait appel à des
concepts pédagogiques permettant de modéliser les unités d'apprentissage. Elle prend en
compte une grande variété de modèles pédagogiques, c'est là sa flexibilité. IMS-LD a été
publié en 2003 par le IMS/GLC. (Instructional Management Systems Global Learning
Consortium : Consortium pour l'apprentissage global avec les systèmes de gestion de
formations).
La source (EML) du langage proposé a été évaluée par le Comité Européen de
Normalisation (CEN) au cours d'une étude comparative de différents EMLs (CEN/ISSS
WS/LT, 2002), comme répondant le mieux aux critères satisfaisant la définition d'un

8
langage de modélisation pédagogique. Un EML (Educational Modelling Language
(langage de modélisation pédagogique) est défini par le CEN/ISS comme "un modèle
d'information et d'agrégation sémantique, décrivant les contenus et les processus
engagés dans une unité d'apprentissage selon une perspective pédagogique et dans le but
d'assurer la réutilisabilité et l'interopérabilité". Dans ce cadre, le consortium nord
américain IMS a entrepris d'étudier et de fournir une spécification d'un tel langage,
donnant naissance en février 2003, à la spécification Learning Design V1.0 (IMS-LD).
Cette proposition, très largement inspirée du langage EML développé par R. Koper,
(OUNL), fournit un cadre conceptuel de modélisation d'une Unité d'Apprentissage et
prétend proposer un bon compromis entre d'une part la généricité permettant de mettre
en oeuvre des approches pédagogiques variées et d'autre part, la puissance d'expression
permettant une description précise de chaque unité d'apprentissage.
Cette spécification permet de représenter et d'encoder des structures
d'apprentissages pour des apprenants à la fois seuls et en groupe, rassemblés par rôles,
tel que « Apprenants » et « Équipe ». On peut modéliser un plan de cours en IMS-LD, en
définissant des rôles, des activités d'apprentissage, des services et plusieurs autres
éléments et en construisant des unités d'apprentissage. Le plan de cours est modélisé et
construit avec des ressources assemblées dans un dossier Zip compressé puis mis en
route par un exécutable (« player »). Ce dernier coordonne les enseignants, les étudiants
et les activités aussi longtemps que les processus d'apprentissage respectifs progressent.
Un utilisateur prend un « rôle » à jouer et exécute les activités qui y sont liées de façon à
réaliser une unité d'apprentissage de manière satisfaisante. En tout, la structure de
l'unité, les rôles et les activités construisent le scénario d'apprentissage qui doit être
exécuté dans un système compatible avec IMS LD.
IMS-LD n'impose pas de modèle pédagogique particulier mais peut être utilisé
avec un grand nombre de scénarios et de modèles pédagogiques, prouvant ainsi sa
flexibilité. C'est pourquoi IMS-LD est souvent appelé un méta-modèle pédagogique. De
précédentes initiatives en e-formation se prétendent pédagogiquement neutres, IMS-LS
ne vise pas à la neutralité pédagogique mais cherche à sensibiliser la e-formation sur la
nécessité d'une approche flexible.
IMS-LD a été développé pour de la e-formation et des classes virtuelles mais un
cours en face à face peut être fait et intégré dans une structure créée avec cette
spécification, en tant qu'activité d'apprentissage ou activité de soutien. Si le but final de
créer des unités d'apprentissage riches, avec du soutien en vue de réaliser les objectifs
d'apprentissage en procurant la meilleure expérience possible, les rencontres en face à
face et toute autre ressource d'apprentissages sont permises telles que la
vidéoconférence, le tableau collaboratif ou n'importe quelle recherche-action de terrain.

2.2.3. Le protocole CanCore


(Canadian Core Learning Resource Metadata Protocol — Protocole canadien sur les
métadonnées centrales relatives aux ressources didactiques)
Le protocole CanCore a été mis au point par un groupe d'éducateurs et de
spécialistes techniques avec le soutien et l'appui financier du projet CANARIE
d'Industrie Canada et d'autres organismes. Il est le fruit d’un effort conjoint de plusieurs
universités canadiennes. Actuellement, il est supporté et promu principalement par
l’Université de l’Alberta, TéléÉducation Nouveau-Brunswick et l’Université du Nouveau-
Brunswick. Cancore veut offrir une alternative se situant entre le Dublin Core (jugé trop
réduit) et le LOM (jugé trop théorique et abstrait).
En effet, le protocole CanCore est une norme relative aux métadonnées dans le
domaine de l'éducation « fondée sur et entièrement compatible avec l'IMS Learning

9
Resource Metadata Information Model. CanCore définit un sous-ensemble d'éléments de
ce modèle en vue d'une description efficace et uniforme des ressources didactiques
numériques au Canada et ailleurs dans le monde. Il vise à faciliter l'échange
d'enregistrements qui décrivent des ressources didactiques ainsi que la recherche de
telles ressources au Canada et au-delà de ses frontières. »

2.2.4. IMS, Dublin Core et CanCore


Une comparaison entre ces trois schémas de métadonnées aura les résultats
suivants :
IMS-
IMS-LOM est le schéma le plus détaillé avec 80 identificateurs structurés en neuf
catégories. Il est appuyé par un large consortium international (IMS, CEN/ISS,
ARIADNE, ADL) et fait l’objet de discussion au SC 36 de l’ISO.
Dublin Core,
Core qui n’a pas été conçu spécifiquement pour la formation en ligne, continue
d’exister par lui-même et des rapprochements ont été effectués avec LOM.
CanCore est une initiative canadienne qui s’appuie à la fois sur le schéma Dublin Core
en complétant ses identificateurs dase et sur LOM en « réduisant » la complexité de son
schéma jugé trop abstrait.
Remarque
D’une part, il existe souvent un certain degré de flou à l’intérieur des catégories
proposées, ce qui rend difficile leur utilisation. D’autre part, les métadonnées demeurent
des concepts qui doivent être interprétés par des humains (les concepteurs, rédacteurs,
etc.) avant d’être interprétés par des applications (les plateformes de formation en ligne).
Or, si la machine utilise les signes pour interpréter la nature de tel ou tel mot, les
humains utilisent le sens pour exécuter la même tâche. Cette distinction pose donc un
défi particulier à l’utilisation des métadonnées en formation en ligne.

2.3. Structuration des contenus par les métadonnées (thématique


trois du SC 36)
Les spécifications par rapport aux contenus servent essentiellement à définir
« comment utiliser les objets d’apprentissage » pour l’apprenant et pour les plateformes
d’apprentissage.
Elles visent principalement à :
- définir le langage utilisé pour décrire et référencer les composantes d’information
(segment audio, vidéo, animation, texte, etc.);
- définir un mécanisme permettant d’assurer un design pédagogique et une
présentation des contenus agglomérés de façon à répondre aux besoins de
l’apprenant (sur mesure);
- définir une façon d’emballer (format, codage, décodage, attributs, interactions,
etc.) les contenus de formation.

Positions dominantes :

2.3.1. IMS – Content Packaging (gestion de lots de contenus)


Spécification développée pour normaliser l’emballage des contenus afin qu’il
puisse être reconnu automatiquement par un système répondant au standard. Ceci
permet au système qui doit l’exploiter (par exemple pour sa présentation, son édition ou

10
sa manutention) de rassembler automatiquement un certain nombre d’informations
relatives au contenu. Le standard doit donc spécifier les caractéristiques de l’enveloppe
utilisée pour la diffusion des modules d’apprentissage (contenus et activités). Le CP
(content packaging) fait l’objet de discussion au sein du SC 36 de l’ISO.
2.3.1.1. Objectifs IMS Content Packaging
 Transmission d’un contenu d’une plateforme vers une autre
 Importation d’un contenu (produit ailleurs, acheté, etc.) dans un répositoire ou
encore une plateforme e-learning
 Exportation de vos contenus pour les mettre à disposition d’autres
 Assemblage de contenus simples dans un paquet de distribution
 Production avec un outil d’édition indépendant de plateforme
 Architecture d’un Package Interchange File (PIF)
 Un fichier ZIP qui contient des éléments sous formes variées:
 HTML, JPEG, Animations Flash, Word, PPT, etc
Donc attention: Si votre ordinateur ne possède pas de client compatible (plugin
pour Flash, application pour XXX, etc.) certains contenus vous échapperont ...
Un manifeste (fichier XML) qui contient :
- une section meta-data qui décrit le package IMS dans son entier
- une section de ressources qui liste les éléments dans l’archive et des ressources
disponibles via un URL sur le Web (ou en intranet)
- une section d’organisation qui décrit la structure des ressources
2.3.1.2. Caractéristiques de l’enveloppe utilisée pour l’emballage :
Spécifier les caractéristiques de l’enveloppe utilisée pour l’emballage, c’est-à-dire :
- Contenu et ressource pédagogique numérique : méta-données, structure, relation,
structure, ressources (pointeurs)
- Activité : Ressources interactives, système de gestion de l’apprentissage, BD
d’apprentissage, système de Gestion des contenus d’apprentissage, BD de
contenus, indexation, recherche, structuration, composition, construction et
exploitation.

2.3.2. IMS – Question and Test Interoperability


Spécification développée en vue d’assurer l’interopérabilité des pratiques en
matière de mesures des apprentissages (tests, quiz, examens, etc.) et l’innovation grâce à
la fourniture d’extensions bien définies. Cette spécification fait l’objet de discussion au
sein du SC 36 de l’ISO.
L’IMS-QTI permet de décrire le contenu concernant les exercices interactifs. Elle
est proposée par IMS Global learning consortium et permet la séparation des données
(les questions, les bonnes réponses etc.) de la forme (affichage) et du traitement (calcul
des scores etc.). Ces spécifications se basent sur un schéma XML public.
La spécification permet donc d’échanger des exercices, des tests et des résultats
entre les différents outils d'authoring (droits d’auteur), les banques de données, les outils
de construction de test ainsi que les systèmes d'apprentissage et de livraisons des
devoirs.

11
Le modèle de données est décrit abstraitement, en utilisant UML (unified model
language) dans l’objectif de lier un large éventail d’outils de modélisation des données et
des langages de programmation. Par contre, les échanges entre systèmes sont proposés
conformément à la norme XML (eXtensible Markup Language).

3. INFORMATION SUR LE PARTICIPANT


La thématique n°6 dont se préoccupe le SC 36 concerne en particulier les normes
pour les échanges de données concernant les participants – identification, style
d’apprentissage, profils, etc.
L’un des objectifs de l’élaboration de normes de la formation en ligne est de créer
les conditions rendant l’apprentissage par les technologies plus efficace pour les
apprenants. Pour cela, il est nécessaire de mettre en place des normes qui aident à
définir les caractéristiques des apprenants et des autres participants (enseignants,
tuteurs, institution) de façon à ce qu’il soit plus facile d’adapter et de structurer les
contenus en fonction de leur profil d’apprentissage, les profils évoluant dans le temps, il
faudra donc surveiller leurs apprentissages, etc.
Les spécifications dans ce domaine visent principalement à :
1. Définir un langage commun du modèle de l’apprenant, qui présentera ses
caractéristiques (connaissances antérieures, habiletés, style d’apprentissage,
information personnelle, etc.) afin d’améliorer les expériences d’apprentissage ;
(cf PAPI, IMS LIP)
2. Proposer un moyen efficace d’identification du participant à des fins
administratives (cf standard « Participant Identifiers »);
3. Faciliter le cheminement pédagogique global de l’apprenant (planification, suivi
des apprentissages, certifications, etc.)
3.1. Principaux modèles de données participants existants
soit les standards et organismes impliqués dans la modélisation des données propres au participant
 Organismes : IMS, IEEE, CENS-ISSS WS-LT, ISO JTC1 SC36
 Standards : PAPI, LIP, (Autre initiative : EDS (European Diploma
Supplement) par l’UNESCO/CEPES)

3.1.1. Le modèle PAPI


PAPI (Public And Private Information for Learners) [PAPI 01] est un standard
développé au sein du groupe Learner Model Working Group (IEEE P1484.2 Learner
Model Working Group) qui n’a pas été accepté comme une norme par l’ISO. Il s’est donné
comme objectif de spécifier la sémantique et la syntaxe des informations sur l’apprenant.
Ces informations peuvent être de diverses natures : acquisition de connaissances,
préférences de l’apprenant, ses performances et ses compétences, ses relations avec
d’autres apprenants, etc.

12
Représentation de la proposition de standard PAPI Learner

Le profil d’apprenant PAPI comprend donc les éléments suivants :


 informations personnelles sur l’apprenant (PAPI Learner Personal).
 informations relationnelles, relatives aux relations entretenues par
l’apprenant avec les autres utilisateurs - professeurs, autres étudiants, etc.
(PAPI Learner Relations).
 informations sur la sécurité : Mot de passe, clés, etc. (PAPI Learner Security)
 informations sur la performance de l’apprenant (PAPI Learner Performance)
 informations « portfolio » qui constituent une collection représentative de
travaux de l’apprenant utilisées en tant qu’illustrations de ses capacités
(PAPI Learner Portfolio)
 informations liées aux préférences de l’apprenant (PAPI Learner Preference)
destinées à améliorer l’interaction homme-machine et à permettre
l’adaptation automatique des systèmes aux besoins spécifiques de l’apprenant.
Les préférences incluent des caractéristiques techniques, liées à l’interface, ou
à la présentation des contenus. Ces préférences peuvent être explicitement
identifiées par l’utilisateur ou être inférées à partir de son comportement.

3.1.2. Le modèle IMS LIP


Le modèle IMS LIP, qui désigne IMS Learner Information Package, définit une
structure
XML pour l'échange des données apprenant entre systèmes coopérants tels que :
les systèmes de gestion d'apprentissage, les systèmes des ressources humaines, les
systèmes de gestion des données des apprenants, les systèmes de gestion des
connaissances, et d'autres systèmes utilisant les processus d'apprentissage.
Il représente un modèle de données qui permet de décrire les caractéristiques
nécessaires d'un utilisateur pour des usages généraux tels que :
- Enregistrement et gestion de l'historique de l'apprentissage de l'apprenant.
- Engagement de l'apprenant dans une expérience d'apprentissage.
- Découverte des opportunités d'apprentissage de l'apprenant.

13
Ci-dessous sont présentées en bref les onze catégories du modèle IMS LIP.
Dans ces définitions, le terme «Personne» représente un apprenant, un organisme
ou autre utilisateur de système de e-formation.
1. Identification : Cette catégorie contient des éléments qui aident à identifier la
personne tels que son nom, son adresse, son email, etc.
2. Accessibility : Cette catégorie permet de décrire les préférences de la personne, ses
langues, et ses éventuels handicaps.
3. QCL : Cette catégorie permet de décrire les qualifications, les certifications et les
diplômes attribués à une personne.
4. Activity : Cette catégorie regroupe les données sur les activités liées au travail et à la
formation d’une personne.
5. Goal : Cette catégorie contient les données sur les objectifs des personnes.
6. Competency : Cette catégorie décrit les compétences associées avec la formation
formelle ou informelle d’une personne et son expérience de travail.
7. Interest : Cette catégorie regroupe les données sur les hobbies et les activités
créatrices d’une personne.
8. Transcript : Cette catégorie permet de décrire les données sur les bulletins de notes de
la personne.
9. Affiliation : Cette catégorie inclut les informations sur la description de l’organisation
associée à la personne.
10. Security key : Cette catégorie regroupe les données de sécurité d’une personne, tels
que les mots de passe et les codes de sécurité qui doivent être utilisés durant ses
communications. Pour chaque clé de sécurité une structure différente sera utilisée.
11. Relationship : Cette catégorie permet de décrire les relations entre les structures de
données utilisées pour stocker les données de la personne employée dans ce modèle.
Le LIP (Learner Information Package) a été au coeur de plusieurs efforts d’implantation
au Royaume-Uni au Canada et dans d’autres pays. Cette norme est un complément
important pour le soutien à la technologie des e-porfolios et à ses règles internes. Afin de
permettre au SC 36 de commencer le travail de normalisation du LIP, un autre effort de
normalisation pour la définition des informations sur l’apprenant, communément appelé
«l’apprenant PAPI» a été suspendu pour le moment.
Ce standard est en fait beaucoup plus complexe que le LIP et a été jusqu’à maintenant
seulement implanté par la défense pour l’information confidentielle. Le SC 36 a aussi
entrepris des négociations avec le consortium IMS afin de prendre la relève et de
continuer le processus de normalisation du LIP.
(informations extraites de la thèse de Lahcen OUBAHSSI)

En fait, ce modèle ne parvient pas à répondre à tous les besoins, notamment pour des
raisons d’ordre culturel. D’où des tentatives d’adaptation comme celle de
l’UNESCO/CEPES en 1996…

3.1.3. Conclusion
Conclus sur ces modèles existants
PAPI et IMS LIP forment une des premières bases de structuration des données
participant (ou utilisateur) qui peuvent être échangées entre les différents systèmes de
e-formation.

14
En effet, les six catégories du modèle PAPI forment l’une des premières
spécifications d’échange des données participant.
Nous remarquons dans le modèle IMS LIP une première tentative pour modéliser
les données pédagogiques apprenant. En effet, dans une partie de la catégorie
« Activity », nous retrouvons les activités pédagogiques liées à l’apprenant.
3.2. Standard relatif aux identificateurs de participant
C’est un des projets réalisés par le groupe international de travail (WG3) de
l’ISO/IEC JTC1/SC36 (http://www.jtc1sc36.org/) :
Le standard ISO/IEC 24703 (« participant identifiers ») a été publié en 2004
(http://participant-info.jtc1sc36.org/). Sur proposition de la France, le texte suivant a été
introduit dans une résolution SC36 spécifiant que : «Cette norme précise les types de
données à adopter pour identifier les participants dans le monde de l’éducation, la
formation et l’apprentissage. La sécurité et la protection des données personnelles
associés à l’utilisation de cet identifiant ne sont pas traitées dans la présente norme. La
politique pour nommer, enregistrer et authentifier les identifiants des participants sont
en dehors du domaine d’application.
Note : il y a un risque d’accès non autorisé et de mauvaise utilisation des données
personnelles et privées que peut permettre l’utilisation de l’identifiant. Il est donc de la
responsabilité de la personne qui met en œuvre un tel identifiant de s’assurer de
l’utilisation convenable de celui-ci. »
Ce projet s’appelait à l’origine « Simple Human Identifiers », dont l’élaboration de
spécification était soutenue par l’IEEE (spécification n°1484.13).
3.3. Les projets relatifs à l’information sur le participant sont en cours de
normalisation
Le groupe de travail 3 (WG3) de l’ISO/IECISO/IEC JTC1/SC36 établit des normes
relatives à l’information concernant les participants, qui se définit comme l’information «
principalement associée à, recueillie par, pour et sur les participants dans un
environnement numérique. » Cela pourrait comprendre :
• l’identification des données sur le participant (apprenant, enseignant,
institution…) utilisant un de ces systèmes;
• l’information sur les données qui ont fait l’objet d’interactions avec le
participant et le résultat de ces interactions.
WG3 travaille actuellement sur les grands projets de normes suivants :
- les données relatives à la performance du participant
- la conceptualisation d’un modèle de référence relatif aux compétences du
participant.
- Les données relatives à la nomadisation et au m-learning
(http://isotc.iso.org/livelink/livelink?func=ll&objId=4920601&objAction=browse&sort=na
me)

4. GESTION ET LIVRAISON DES CONTENUS


D’APPRENTISSAGE
(« Management and delivery of learning, education and training »)

15
4.1. La norme ISO/IEC 19788 MLR
Le groupe de travail WG4 se consacre à l’élaboration de normes pour les
technologies de l’information pour l’apprentissage, l’éducation et l’enseignement, et met
au point une norme internationale pour la description des REA. Cette norme porte le
numéro 19788 et est intitulée Metadata for Learning Resource.

La norme MLR repose sur trois principes fondamentaux :


 l’adaptabilité culturelle, indépendamment de la langue utilisée,
 la capacité d’extension pour tenir compte de besoins spécifiques
 et l’interopérabilité au moyen d’un ensemble d’éléments obligatoires.
Cette norme vise à répondre aux exigences particulières de communautés
culturelles ou régionales en prévoyant des mécanismes d’extension.
La partie 1 de la norme MLR est un cadre conceptuel décrivant les structures de
données utilisées et les règles pour la construction de grammaires en vue de décrire des
aspects précis des ressources d’enseignement et d’apprentissage.
Les structures de vocabulaire et les mécanismes d’association (binding, en
anglais) sont conçus de manière à permettre une grande flexibilité et, dans le cas des
vocabulaires, ils sont prévus pour supporter les applications du Web sémantique. Une
telle application, par exemple, pourrait automatiquement substituer «premières nations»
à «indigène» ou «indien» lorsque le contexte de recherche permet d’inférer que la requête
concerne des habitants du Canada. De même, la prise en compte automatique du
contexte permettra de résoudre des ambiguïtés liées aux mots ayant plusieurs sens.
De manière plus simple, la structure de données des vocabulaires permet
également de préciser le genre, qui joue un rôle parfois déterminant quant au sens.
La partie 2 se veut un modèle exemplaire de l’application de ces structures et
règles pour établir un ensemble commun d’éléments obligatoires. Parce que les
ressources décrites à l’aide de MLR partageront ces éléments, il sera désormais possible
d’effectuer des recherches simultanées dans un grand nombre de répertoires en
appliquant des critères comme le niveau scolaire ou la langue de la ressource.
Les rédacteurs de la norme MLR ont apporté un soin particulier à reproduire des
procédures familières aux utilisateurs de Dublin Core et de LOM, de manière à faciliter
le passage. Ainsi, les parties 3 à 11 de MLR correspondent aux 9 catégories de LOM et
plusieurs vocabulaires liés à des éléments, tels le type de relation entre les ressources,
les renseignements liés à la pédagogie, utilisent les mêmes que celles de LOM ou de
Dublin Core. La parution de MLR est prévue autour du printemps 2008. On peut suivre
l’évolution des travaux dans la section publique du site du SC36 :
http://isotc.iso.org/livelink/livelink?func=ll&objId=806742&objAction=browse&sort=name.

16
5. NOMENCLATURE
 IEEE Institute of Electronic & Electrical Engineers
 IMS/GLC IMS Global Learning Consortium, Inc.
 IMSMD IMS Meta-data
 LOM Learning Object Meta-data
 LRM Learning Resource Meta-data
 XML Extensible Mark-up Language
 XSD XML Schema Definition
 XSL XML Stylesheet Transform
 ISO International Organization for Standardization
 IEC International Electrotechnical Commission
 JTC1 Joint Technical Committee 1
 ITLET Information Technology for Learning, Education and Training
(Technologies de l’Information pour l’apprentissage, l’éducation et la formation)

17
6. WEBOGRAPHIE
Sites pour la partie consacrée aux informations sur les participants

Actes du colloque Initiatives 2005 – « La norme comme instrument de réussite d'une


société de la connaissance partagée », (Date de publication : 2 mars 2007),
http://www.initiatives.refer.org/Initiatives-2005/document.php?id=170

IMS : http://www.imsglobal.org/metadata/index.html

Specifications > Meta-data : http://www.imsglobal.org/metadata/index.html

Site de l’ISO/IEC JTC1/SC36 : http://www.jtc1sc36.org/

Section publique du site du JTC1/SC36 (évolution des travaux) :


http://isotc.iso.org/livelink/livelink?func=ll&objId=806742&objAction=browse&sor
t=name

Cadre conceptuel de la norme ISO/IEC 19788 MLR (Framework) :


http://isotc.iso.org/livelink/livelink?func=ll&objId=5494072&objAction=browse&so
rt=name

Modèle exemplaire de la norme ISO/IEC 19788 MLR (Data elements) :


http://isotc.iso.org/livelink/livelink?func=ll&objId=5495605&objAction=browse&so
rt=name

Standard ISO/IEC 24703 (« participant identifiers ») : http://participant-info.jtc1sc36.org/

Thèse de doctorat, Lahcen OUBAHSSI (2005) : Conception de plates-formes logicielles


pour la formation à distance, présentant des propriétés d'adaptabilité à
différentes catégories d'usagers et d'interopérabilité avec d'autres
environnements logiciels : http://www-lium.univ-
lemans.fr/~oubahssi/publications/Theseoubahssi_VFinale.pdf

Clic, Bulletin collégial des technologies de l’information et des communications, Numéro 64,
avril 2007 : « Pour mieux décrire les ressources d'enseignement et d'apprentissage »,
Pierre-Julien Guay, délégué canadien aux séances plénières d'ISO/IEC JTC1 SC36
(Vitrine Technologie-Éducation) http://clic.ntic.org/cgi-
bin/aff.pl?page=article&id=2036

« Normes et standards FOAD, Innovations pédagogiques, mutualisation des connaissances et


capitalisation des savoirs », Mokhtar Ben Henda :
http://www.benhenda.com/publications/2005_Rabat_normes-foad.ppt.pdf

Articles issus de Wikipédia :

http://fr.wikipedia.org/wiki/SCORM

http://fr.wikipedia.org/wiki/XML

Articles
Articles sur le XML :

http://www.yoyodesign.org/doc/w3c/xml11/

18
http://www.chez.com/xml/initiation/

Articles sur la norme SCORM :

http://www.formastore.net/data/mosclub/doc/scorm2004_2nd_doc_french.pdf

http://www.scorm.fr/?cat=36

http://www.adlnet.gov/about/index.aspx

http://www.benhenda.com/publications/2005_Rabat_normes-foad.ppt.pdf

http://foad.cariflr.fr/Default.aspx?idr=38&idsr=116

http://www.bibl.ulaval.ca/DublinCore/usageguide-20000716fr.htm#1.2

http://www.bibl.ulaval.ca/DublinCore/usageguide-20000716fr.htm#1.2

DCMI (Dublin Core Metadata Initiative Education Working Group) Objectif : discuter et
de développer une proposition d’utilisation des métadonnées Dublin Core pour la
description des ressources éducatives. http://dublincore.org/groups/education/

INRIA (éléments du Dublin Core) http://www-rocq.inria.fr/~vercoust/METADATA/DC-


fr.1.1.html

ABF (liens vers des sites) http://www.abf.asso.fr/enrichi/xmldoc.htm#md

http://www.educnet.education.fr/dossier/metadata/dc1.htm

Autres sites :

(Futura Sciences)
http://www.futura-sciences.com/comprendre/g/definition-web-
semantique_3993.php

Portail Semanticweb.org
http://www.semanticweb.org/

Site du W3C
http://www.w3.org/2001/sw/

Urfist de Toulouse
http://www.urfist.cict.fr/lettres/lettre28/lettre28-22.html

Voir une présentation du LOMFR sous forme de diaporama par Dorothée Danielewski,
sur le site Documentation (CDI) d'Educnet
http://www2.educnet.education.fr/sections/cdi/anim/interlocuteurs/reunions/reuni
on-2007/lom-fr

Article sur IMS-LD : http://www.epi.asso.fr/revue/articles/a0512c.htm

Norms et codages : http://www.rcip.gc.ca/Francais/Normes/metadonnees_codage.html

SCORM : http://oz-formation.nexenservices.com/?tag=manifest-ims

19
Un lecteur de quiz conforme aux spécifications IMS - QTI (1.2) : http://www.e-
teach.ch/qplayer/produits_qplayer10_faq.html

http://www.institut.minefi.gouv.fr/sections/themes/e-formation

Projet collaboratif d’environnements numériques d’apprentissage des universités


québécoises http://www.profetic.org/procena/spip.php?rubrique21

20