Vous êtes sur la page 1sur 61

Quel service public pour les

donnes de jurisprudence ?
Un cahier des charges en 30 propositions,
pour russir lopen data des dcisions de justice
Auteur de ltude : Bruno Mathis 1

bmathis@cegetel.net
+33 (0)6 17 12 13 65

Bruno Mathis est consultant chez Julhiet Sterwen et membre de lassociation Open Law. Plus de
dtail sur https://www.linkedin.com/in/bruno-mathis-5274086/
1

Quel service public pour les donnes de jurisprudence?


_____________________________________________________

SOMMAIRE

PRAMBULE............................................................................................... 5
LANONYMISATION DES DCISIONS .................................. 6

1.
1.1

LENJEU............................................................................................................... 6

1.2

DFINITIONS ........................................................................................................ 7

1.3

LES RISQUES LIS LANONYMISATION .............................................................. 8

1.4

LES RGLES DANONYMISATION ........................................................................ 10

1.4.1 Principes gnraux ............................................................................................................10


1.4.2 Rgles spcifiques aux juridictions ....................................................................................10

1.5

LES CAS PARTICULIERS ...................................................................................... 11

1.5.1 Les parties au procs non anonymisables..........................................................................11


1.5.2 Les personnes morales anonymiser ................................................................................12

1.6

LANONYMISATION DES TIERS AU PROCS ......................................................... 12

1.6.1 Respect de la vie prive et anonymisation .........................................................................12


1.6.2 Finalit et anonymisation...................................................................................................13

2.

LA GESTION DU RISQUE ........................................................ 14

2.1

LANALYSE DIMPACT ....................................................................................... 14

2.1.1
2.1.2
2.1.3
2.1.4

2.2

LES TECHNIQUES DE RDUCTION DU RISQUE DE R-IDENTIFICATION ................. 18

2.2.1
2.2.2
2.2.3
2.2.4

3.

Champ dapplication..........................................................................................................14
Quelle mthodologie? ........................................................................................................14
Le contenu de lanalyse......................................................................................................15
Les modalits de publication de lanalyse .........................................................................17

Tokenisation, randomisation et hachage ...........................................................................18


Analyse smantique et auto-apprentissage ........................................................................19
Le chiffrement ....................................................................................................................20
La mesure de qualit de lanonymisation automatise ......................................................21

LA CHAINE DE RESPONSABILITS .................................... 22


Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

Quel service public pour les donnes de jurisprudence?


_____________________________________________________
3.1

LA RESPONSABILIT DE LA PRODUCTION ........................................................... 22

3.1.1 Lanalyse dimpact .............................................................................................................22


3.1.2 Lanonymisation.................................................................................................................23
3.1.3 Les mtadonnes ................................................................................................................24

3.2

LA RESPONSABILIT DE LA DIFFUSION ............................................................... 24

3.2.1 La responsabilit de la DILA .............................................................................................24


3.2.2 La responsabilit dEtalab .................................................................................................24
3.2.3 Droits et devoirs des rutilisateurs ....................................................................................25

3.3

LA RESPONSABILIT DE LA CNIL ...................................................................... 26

3.3.1 Consultation pralable.......................................................................................................26


3.3.2 Obligations des rediffuseurs ..............................................................................................27

4.

LES MTADONNES DE LA JURISPRUDENCE ............... 27

4.1

LENJEU............................................................................................................. 27

4.2

ETAT DES LIEUX DE LA NORMALISATION DES MTADONNES ............................ 27

4.2.1 LECLI ...............................................................................................................................27


4.2.2 LELI ..................................................................................................................................28

4.3

LA DESCRIPTION DES DCISIONS ........................................................................ 30

4.3.1
4.3.2
4.3.3
4.3.4
4.3.5
4.3.6

4.4

Structure de lidentifiant ECLI ..........................................................................................30


La codification de la juridiction.........................................................................................32
Lcriture des mtadonnes ECLI obligatoires .................................................................34
Lcriture des mtadonnes ECLI facultatives ..................................................................35
Autres caractristiques dcrire .......................................................................................36
Le format de publication des mtadonnes ........................................................................37

EVOLUTIONS DES NORMES EUROPENNES DES DONNES JURIDIQUES ................ 38

4.4.1 Harmonisation des formats ................................................................................................38


4.4.2 Attributs de liens lgislatifs et jurisprudentiels..................................................................39
4.4.3 Ajout lECLI de mtadonnes supplmentaires ..............................................................41

5.
LE SERVICE PUBLIC DE DIFFUSION DE LA
JURISPRUDENCE .................................................................................... 42
5.1

DFINITIONS ...................................................................................................... 42

5.2

LE PRIMTRE DE LA DIFFUSION ........................................................................ 42


Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

Quel service public pour les donnes de jurisprudence?


_____________________________________________________
5.3

LE FAIT DCLENCHEUR DE LA DIFFUSION........................................................... 44

5.4

LES TAPES DE LA DIFFUSION ............................................................................ 45

5.4.1
5.4.2
5.4.3
5.4.4
5.4.5

5.5

Limmatriculation des dcisions ........................................................................................45


La normalisation des mtadonnes ....................................................................................45
Lajout de titres et de liens .................................................................................................46
Lanonymisation.................................................................................................................46
La mise disposition..........................................................................................................47

LE CIRCUIT DE PRODUCTION .............................................................................. 49

5.5.1 Scnario 1 : transmission simultane des dcisions et des mtadonnes ..........................49


5.5.2 Scnario 2 : transmission spare des dcisions et des mtadonnes ...............................50
5.5.3 Scnario 3 : immatriculation des dcisions par la DILA...................................................52

5.6

LES AUTRES TCHES DE GESTION ...................................................................... 53

5.6.1
5.6.2
5.6.3
5.6.4
5.6.5
5.6.6
5.6.7

La recherche de jurisprudence ..........................................................................................53


La gestion des droits dopposition, de rectification et de suppression ..............................55
La rectification linitiative de la juridiction ...................................................................56
La notification de dcision au justiciable ..........................................................................57
La dlivrance de copie de dcision ....................................................................................57
Ladministration des nomenclatures juridiques ................................................................58
Larchivage ........................................................................................................................58

Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

Quel service public pour les donnes de jurisprudence?


_____________________________________________________
PRAMBULE
La loi Rpublique numrique2, adopte le 8 octobre 2016, acte le principe de la mise
disposition des donnes publiques en open data , dans un format ouvert et interoprable.
Ce principe sapplique notamment la jurisprudence, dans les articles 20, relatif aux
dcisions de lordre administratif3, et 21, relatif celles de lordre judiciaire4, qui
disposent chacun : [Les] jugements sont mis la disposition du public titre gratuit dans le
respect de la vie prive des personnes concernes .
Ceci reprsente un dcuplement du volume actuel, soit quelque 1 500 000 dcisions par an
pour le seul ordre judiciaire5.
Le colloque La jurisprudence dans le mouvement open data , organis par la Cour de
Cassation le 14 octobre dernier6, a mis en vidence les enjeux juridiques de louverture de la
jurisprudence, mais ce projet, sans quivalent ltranger, est galement soumis des enjeux
techniques, organisationnels et oprationnels indits. De fait, le lgislateur a entrevu les
difficults de mise en pratique, les articles 20 et 21 annonant chacun quun dcret en
Conseil d'Etat fixe, pour les jugements de premier ressort, d'appel ou de cassation, les conditions
d'application du prsent article

. Ces dcrets pourraient sortir au cours du premier trimestre

20177.
Le propos de cette tude est de dvelopper ces diffrents enjeux et desquisser, sous la forme
de 30 propositions adresses aux pouvoirs publics, une liste dactions mener pour la mise en
uvre de ce projet.
La mise disposition des jugements devant tre faite dans le respect de la vie prive , le
premier chapitre de ltude porte sur lanonymisation des dcisions, ses enjeux, son
primtre, ses rgles gnrales et ses exceptions. Le deuxime traite la faon dont lapproche
par les risques, introduite par le rglement gnral sur la protection des donnes (RGDP),
dans son article 35, pourrait sappliquer concrtement au cas de louverture de la
jurisprudence8. Le suivant voque la chaine des responsabilits, ou plus exactement une liste,
non limitative, des enjeux juridiques portant sur chacun des acteurs de la filire, de la
juridiction jusquau rutilisateur final.

https://www.legifrance.gouv.fr/eli/loi/2016/10/7/2016-1321/jo/texte
https://www.legifrance.gouv.fr/eli/loi/2016/10/7/2016-1321/jo/article_20
4
https://www.legifrance.gouv.fr/eli/loi/2016/10/7/2016-1321/jo/article_21
5
https://www.courdecassation.fr/IMG/Jean-Paul%20Jean%20%20Open%20data.pdf
3

https://www.courdecassation.fr/publications_26/discours_entretiens_2039/discours_2202/premier_president_7084/juris
prudence_mouvement_open_data_35268.html
7
https://www.nextinpact.com/news/102640-loi-numerique-mise-en-open-data-decisions-justice-prendra-plusieursannees.htm?skipua=1#
8
http://data.europa.eu/eli/reg/2016/679/oj

Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

Quel service public pour les donnes de jurisprudence?


_____________________________________________________
Le chapitre 4 traite des mtadonnes de la jurisprudence, comment et jusquo elles dcrivent
les dcisions, quels usages leur maillage ouvre au public et comment les efforts normatifs
europens devraient les faire voluer.
Enfin, le dernier chapitre propose une dfinition du service public de diffusion de la
jurisprudence tel quissu de la loi Rpublique numrique.

1.
1.1

LANONYMISATION DES DCISIONS


Lenjeu
Constitue une donne caractre personnel toute information relative une personne
9
physique dit larticle 2 de la Loi Informatique & Liberts . Sil ne sagissait que des
donnes didentification directe, essentiellement dtat-civil et dadresse, lenjeu de
lanonymisation ne serait pas trs diffrent de celui de la grande majorit des
entreprises dans la mise en conformit de leurs traitements de donnes personnelles.
Les dcisions de justice ont la forme de donnes textuelles. Certaines dentre elles se
lisent comme un roman. La vie du justiciable y est quelquefois mise nu. Dans
certaines affaires, le risque de r-identification dun justiciable est significatif, malgr
la substitution ou la suppression de quelques caractristiques personnelles10.
Louverture de la jurisprudence est ainsi soumise un enjeu technique indit : les
dcisions de justice doivent y tre anonymises la hauteur des prjudices possibles
sur la vie prive, et en mme temps rester intelligibles, pour respecter le droit
linformation de dcisions rendues au nom du peuple franais 11.

https://www.cnil.fr/fr/loi-78-17-du-6-janvier-1978-modifiee
Par exemple, la phrase "J.K a t condamn verser 1 million d'euros la Socit gnrale" permet la ridentification par individualisation, du fait de la notorit du justiciable (une anonymisation parfaite comme X a t
condamn verser Y euros Z aurait en revanche sans doute rendu la dcision inexploitable)
11
Le droit linformation est encore plus prgnant dans la doctrine anglo-saxonne, selon Bndicte Fauvarque-Cosson,
dans une communication au colloque La jurisprudence dans le mouvement de lopen data du 14 octobre 2016,
https://www.courdecassation.fr/venements_23/colloques_formations_4/colloques_videos_6111/jurisprudence_mouvem
ent_open_data_35367.html
10

Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

Quel service public pour les donnes de jurisprudence?


_____________________________________________________
1.2

Dfinitions
Dans sa dlibration du 29 novembre 2001 portant recommandation sur la diffusion de
donnes personnelles sur internet par les banques de donnes de jurisprudence 12, la
CNIL recommande danonymiser le nom et l'adresse des parties et des tmoins, dans
tous les jugements et arrts librement accessibles sur Internet, quels que soient l'ordre ou
le degr de la juridiction et la nature du contentieux, mais cela seulement

Selon la fiche n10 de la CNIL consacre la scurit des donnes13, le terme


danonymisation est rserv aux oprations irrversibles. On utilise le terme de
pseudonymisation lorsque lopration est rversible. La pseudonymisation peut
permettre la r-identification, l'anonymisation non . Lirrversibilit serait assure par
la modification ou la suppression de toute information directement ou indirectement
identifiante.
En matire de sant, la pseudonymisation signifie le remplacement de lidentit
vritable par un identifiant conventionnel (souvent un numro danonymat ) qui
permet de suivre la mme personne tout au long dun parcours thrapeutique14.
Transpose la jurisprudence, cette dfinition signifierait que toutes les dcisions dun
mme parcours judiciaire dsigneraient la mme personne par un mme pseudonyme15.
Quoi quil en soit, ni lanonymisation ni la pseudonymisation ne sont dfinies dans la
loi16. La littrature acadmique prfre le terme de dpersonnalisation celui
danonymisation, plus trompeur en ce quil laisse accrditer une garantie danonymat.
En matire de jurisprudence, supprimer, cest--dire occulter, les civilit, nom et
prnom, y compris leurs initiales, brouillerait les rles des protagonistes et entamerait
coup sr lintelligibilit du texte. Ne reste donc, sur les patronymes, que la possibilit
de substituer.
On peut substituer M. Dupont par M.X et Mme Martin par Mme Y, en les ordonnant
alphabtiquement selon lordre dapparition des protagonistes dans le texte, comme le
font actuellement les cours suprmes. On peut aussi les substituer alternativement par
leurs initiales, ou par des codes plus longs, valeur mnmotechnique ou non, quon

12

https://www.legifrance.gouv.fr/affichCnil.do?oldAction=rechExpCnil&id=CNILTEXT000017653503
https://www.cnil.fr/sites/default/files/typo/document/FICHE10_PackConf_LOGEMENT_SOCIAL_web.pdf
14
Sous la coordination dAndr LOTH, 2015, Donnes de sant : anonymat et risque de r-identification , Dossiers
Solidarit Sant n64, Drees, Juillet, http://drees.social-sante.gouv.fr/etudes-et-statistiques/publications/les-dossiers-dela-drees/dossiers-solidarite-et-sante/article/donnees-de-sante-anonymat-et-risque-de-re-identification, page 9
15
La loi Rpublique numrique aussi est plus spcifique pour les donnes de sant que pour les donnes de
jurisprudence, le traitement des premires tant exempt, dans son article 34, de toute dclaration la CNIL ds lors
quelles ont fait lobjet dune opration cryptographique - elle-mme dclare et que leur rutilisation est
statistique et publique.
16
http://openlaw.fr/images/7/7d/Anom_Pseudo_Donnes_Justice_%28CASSAR_B%29.pdf, mmoire de Bertrand
Cassar sous la direction de Thomas Saint-Aubin (Paris I)
13

Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

Quel service public pour les donnes de jurisprudence?


_____________________________________________________
appellera spontanment pseudos . Mais ces trois mthodes relvent dune
pseudonymisation, et elles sont a priori rversibles.
Substitution et occultation peuvent tre combins. La premire technique
sappliquerait aux patronymes, la seconde aux adresses et aux donnes personnelles
non directement identifiantes, comme dans cet exemple appliqu par la Cour de
Cassation :
M. Dupont, demeurant 92 rue Richelieu Paris (75002), M Martin, demeurant 1
place du palais royal Paris (75001) devient M. X, demeurant [], M Y,
demeurant []
Ceci tant rappel, dans la suite de cette tude, nous continuons employer le terme
danonymisation de faon gnrique17.
1.3

Les risques lis lanonymisation


En renonant au principe de la dclaration pralable au profit de celui de
accountability , et en introduisant dans son article 35 lanalyse d'impact relative la
protection des donnes, le RGDP incarne une approche par la mesure des risques se
substituant la politique prcdente dinstruction de mesures de protection.
En matire douverture de la jurisprudence, le risque se subdivise en un risque de
msanonymisation , en particulier en cas de dfaillance dun programme bas sur
des rgles smantiques, et un risque de r-identification.
Lopinion sur les techniques danonymisation mise en avril 2014 par le groupe de
travail sur la protection des donnes18 dtaille encore trois types de r-identification :

Lindividualisation correspond la possibilit disoler une partie ou la totalit


des enregistrements identifiant un individu dans lensemble de donnes. Ce
risque est en particulier proportionnel au nombre de mentions de lindividu
dans le texte de la dcision.

La corrlation consiste dans la capacit de relier entre elles, au moins, deux


enregistrements se rapportant la mme personne concerne ou un groupe de
personnes concernes (soit dans la mme base de donnes, soit dans deux bases
de donnes diffrentes). Si une attaque permet dtablir (par exemple, au
moyen dune analyse de corrlation) que deux enregistrements correspondent
un mme groupe dindividus, mais ne permet pas disoler des individus au sein

17

Et le terme de jurisprudence pour dsigner un ensemble de dcisions de justice, conformment lusage dominant,
mme si le terme de contentieux serait techniquement plus exact
18
http://ec.europa.eu/justice/data-protection/article-29/documentation/opinionrecommendation/files/2014/wp216_fr.pdf

Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

Quel service public pour les donnes de jurisprudence?


_____________________________________________________
de ce groupe, la technique rsiste lindividualisation, mais non la
corrlation;

Linfrence est la possibilit de dduire, avec un degr de probabilit lev, la


valeur dun attribut partir des valeurs dun ensemble dautres attributs. Ce
risque croit en particulier avec chaque recours : le rapprochement de dcisions
anonymises sinscrivant dans une mme chaine de contentieux accroit le
risque de r-identification.

Ces sous-risques sont susceptibles dtre valus diffremment selon le type des
dcisions : par exemple, le risque dindividualisation est grand dans la jurisprudence
dtat-civil ou du Dfenseur des droits et le risque dinfrence important galement
dans la jurisprudence en proprit industrielle.
Lapproche par les risques rompt avec le principe de recherche du zro-dfaut et invite
renoncer lexhaustivit dun inventaire des donnes identifiantes ou pouvoir de
r-identification. Sil est vrai, pour prendre quelques exemples vidents, quune
adresse IP, une adresse email, un numro de tlphone, de scurit sociale, de compte
bancaire sont autant de donnes personnelles, les inclure dans une liste de termes ou
dexpressions rgulires dpister par un logiciel danonymisation aurait trois
inconvnients :

Cela serait vain en ce sens que cela nempcherait pas le pouvoir


didentification de fragments de texte non directement identifiants. Par
exemple, lexpression le petit garon a t jet vivant dans la Vologne
permet didentifier lAffaire Grgory et pourtant aucun des mots qui la
composent naurait pu figurer dans une liste de mots-clef dtecter ;

Cela alourdirait inutilement le temps de traitement de lanonymisation et


introduirait des risques derreur, au regard de la prvalence statistique de telles
occurrences ; le mieux est lennemi du bien , dit ladage ;

Cela nuirait lintelligibilit de certains textes o ces mentions sont centrales dans
la dcision : par exemple, mentionner une adresse email peut tre ncessaire la
comprhension dune affaire opposant un fournisseur daccs internet un de
ses clients.

Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

Quel service public pour les donnes de jurisprudence?


_____________________________________________________
1.4

Les rgles danonymisation

1.4.1

Principes gnraux
Certaines juridictions, comme le Dfenseur des Droits, pratiquent une anonymisation
maximale. Cela consiste retirer les civilit, nom, prnom, adresse postale, y compris
la commune, non seulement des parties au procs, mais galement celles des tiers au
procs. Cela est sans doute oprationnellement faisable pour un volume modr de
dcisions, mais risque de dgrader substantiellement lintelligibilit du texte rsiduel et
dtre contest au motif que le principe de publicit des dcisions consacr par la loi
nest plus respect.
La conception des rgles danonymisation devrait donc tre inspire par la recherche
du juste quilibre entre le droit la vie prive et le droit linformation :

1.4.2

Principe de minimisation : le texte doit viter de mentionner des donnes


caractre personnel non utiles sa comprhension

Lanonymisation dune personne anonymiser doit porter au moins sur son


nom, les autres donnes caractre personnel tant anonymisables selon les
rgles spcifiques chaque type de juridiction.

La procdure danonymisation ne doit pas empcher les magistrats, avocats et


justiciables, ayant droit den connatre, daccder la version originale de la
dcision, dans les mmes conditions de gratuit et daccessibilit que la version
anonymise.

Rgles spcifiques aux juridictions


Des diffrences de rgles danonymisation existent entre les cours suprmes, que ce
soit dans les techniques de substitution de chaines de caractres, ltendue de leur
application aux attributs indirects (coordonnes postales et autres) ou la gestion des
exceptions. Ainsi le Conseil dEtat anonymise les nom et prnom (le nom est remplac
par une lettre, le prnom est supprim) tandis que le Dfenseur des Droits retire aussi
titre, civilit et adresse postale, y compris le nom de la commune.
La date de naissance dune personne, qui est une donne fort potentiel de ridentification, devrait tre occulte ou remplace par lanne de naissance, sauf dans
certains cas, comme la jurisprudence dtat-civil.
Rappelons que le reste de la jurisprudence est transmis ltat brut aux diteurs
juridiques, qui lanonymisent selon leurs rgles propres. Il est donc possible que les
autres juridictions naient pas encore t amenes formaliser leurs rgles spcifiques
danonymisation.
Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

10

Quel service public pour les donnes de jurisprudence?


_____________________________________________________
Un inventaire des rgles pourrait donc tre dress pour les diffrents types de
juridictions. A chaque rgle devrait tre associ le volume de dcisions concernes.
La comparaison pourrait tre tendue aux autres Etats-membres de lUnion europenne
ayant dj publi de la jurisprudence en donnes ouvertes, tel que les Pays-Bas.

Proposition 1 : Dresser un inventaire


danonymisation par type de juridiction
1.5

Les cas particuliers

1.5.1

Les parties au procs non anonymisables

des

rgles

actuelles

Dans certains types de contentieux, les noms des parties au procs ne peuvent tre
retirs sans compromettre immdiatement lintelligibilit du texte ou contrevenir la
dcision-mme du juge. Cest le cas :

De la jurisprudence de l'tat-civil, notamment les changements de nom ou de


prnom ;

Du contentieux lectoral : lacte de candidature une lection vaut sans doute


consentement ce que toute dcision qui lui est relative soit rendue publique
sans anonymisation ;

Des dcisions rendues par la Haute Autorit la Transparence de la Vie


Publique ou la CNIL ;

Des dcisions stipulant la publicit du nom dune personne physique mise en


cause (la publicit a valeur de peine) ;

Darrts en matire de proprit intellectuelle en cas de marque ponyme. A


titre dexemple, une action intente par Ins de la Fressange pour dfendre la
proprit sur sa marque ne peut pas entrainer anonymisation de la dcision
rendue, puisque cest au contraire sa publicit qui est attendue. LINPI est la
juridiction concerne ;

De dcisions portant sur des personnes dcdes depuis une certaine priode
(prescriptibilit de lanonymisation). Cette question se posera dans la
perspective dune reprise de stock ancien de dcisions en vue de leur
publication.

Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

11

Quel service public pour les donnes de jurisprudence?


_____________________________________________________
1.5.2

Les personnes morales anonymiser


Si, par principe, les personnes morales ne sont pas concernes par Informatique &
Liberts, il y a des cas particuliers :

Dcision stipulant lanonymisation de la raison sociale dune personne morale


mise en cause (la publicit du nom vaudrait sanction plus lourde). LAMF et
lACPR au moins sont susceptibles de rendre ce type de dcision.

Dcision portant sur un personne morale dont la raison sociale identifie


directement une ou plusieurs personnes physiques (ex Etablissements Jean
Dupont & frres ). Les tribunaux de commerce sont les juridictions
concernes.

1.6

Lanonymisation des tiers au procs

1.6.1

Respect de la vie prive et anonymisation


Alors que les tiers au procs ne sont aujourdhui pas anonymiss, les articles 20 et 21
de la loi Rpublique numrique stipulent que les jugements sont mis disposition dans
le respect de la vie prive des personnes concernes, sans en exclure explicitement
les tiers au procs.
Dans la mesure o la publicit des noms des magistrats est motive pour prvenir tout
arbitraire dans le rendu des dcisions, on peut dfendre lide selon laquelle les
modalits actuelles de publicit suffisent apporter cette garantie sans quil faille
ltendre la diffusion des dcisions en open data .
Dailleurs, certains pays anonymisent aussi bien les tiers au procs que les parties au
procs. En France, la question danonymiser les noms des juges dans les affaires de
terrorisme ou de grand banditisme se pose aussi.
A linverse, une startup qui cherche faire de lanalyse comparative du rendu des
dcisions par magistrat pourrait mettre en avant la lgitimit dappliquer aux
magistrats ce scoring auquels les consommateurs sont habitus pour tout autre
secteur ou profession, et contester la validit de largument du respect de la vie prive
appliqu aux magistrats, alors que leur nom apparait en tout tat de cause sur la
dcision originale dlivrable par le greffe, sans quil soit assorti daucune autre donne
personnelle sur eux.

Proposition 2 : Privilgier la minimisation en amont et


lanonymisation en aval de la chaine de production des dcisions, de

Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

12

Quel service public pour les donnes de jurisprudence?


_____________________________________________________
faon pouvoir traiter les cas particuliers en fonction de la qualit du
lecteur ou du contrat de licence de rutilisation
1.6.2

Finalit et anonymisation
Lors du colloque La jurisprudence dans le mouvement open data du 14 octobre, le
Prsident Jean-Paul Jean a rappel que le traitement des donnes doit tre rattach
une finalit prcise. Si l'on s'interroge sur la finalit des bases de donnes juridiques, il
s'agit

certainement

de

permettre

une

meilleure

connaissance

et

une

meilleure

transparence des rgles de droit et de leur application des circonstances de fait. [] La


collecte massive d'informations sur la personne des juges, des greffiers ou des avocats,
permettant de gnrer des statistiques sur l'ensemble de leur activit professionnelle et
de leurs performances , voire de leur systme de valeurs (nombre d'affaires par an,
moyenne de temps de traitement, rsultats, motivation, etc...) n'intgre pas cette
finalit

19.

Labsence de telles finalits dans la loi, combine limpossibilit pratique de


solliciter le consentement ( opt-in ) de ces tiers au procs amne ainsi conclure au
besoin den anonymiser les noms.
Cependant, la comparaison des dcisions des juges peut tre lgitime prcisment
parce quelles sont rendues au nom du peuple franais et celle des performances des
avocats par le libre-arbitre du justiciable dans le choix de son avocat. LEtat a par
ailleurs un intrt lgitime tablir des statistiques de lactivit de la Justice pour
saider au pilotage oprationnel de linstitution. De telles finalits devraient donc tre
reconnues dans les textes.
Par ailleurs, un avocat peut rpugner ce que son nom apparaisse dans une affaire
quil a perdue ou parce quil se sent menac. Il devrait se voir accorder un droit
dopposition ( opt-out ) ce type de finalit.

Proposition 3 : Clarifier les finalits possibles de rutilisation de la


jurisprudence

19

https://www.courdecassation.fr/IMG/Jean-Paul%20Jean%20%20Open%20data.pdf

Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

13

Quel service public pour les donnes de jurisprudence?


_____________________________________________________
2.

LA GESTION DU RISQUE

2.1

Lanalyse dimpact

2.1.1

Champ dapplication
Lanalyse d'impact relative la protection des donnes, aussi appele tude dimpact
sur la vie prive (EIVP) par la CNIL, est obligatoire ds lors que le traitement est
susceptible d'engendrer un risque lev pour les droits et liberts des personnes
physiques

, et en particulier en cas de

traitement grande chelle de catgories

particulires de donnes vises l'article 9, paragraphe 1, ou de donnes caractre


personnel relatives des condamnations pnales et des infractions vises
l'article 10

Une partie au moins de la jurisprudence est donc assujettie une analyse dimpact
compter de lentre en vigueur du rglement, en 2018, avec une criticit sans doute
plus grande pour les juridictions pnales que pour les juridictions civiles.
La loi Rpublique numrique reprend cette disposition, dans ses articles 20 et 21, qui
stipulent : Cette mise disposition du public est prcde dune analyse du risque de
r-identification des personnes , ce qui revient avancer dun an environ lapplication
de larticle 35 du RGDP (lanalyse dimpact sur les donnes personnelles) la
jurisprudence.
Il reste toutefois dterminer si lananlyse dimpact incombe chaque juridiction,
leur tte juridictionnelle, Cour de Cassation ou Conseil dEtat.

Proposition 4 : Dsigner qui, de la juridiction ou de la tte


juridictionnelle, porte la responsabilit du traitement, dune part, et de
lanalyse dimpact, dautre part
2.1.2

Quelle mthodologie?
Lanalyse dimpact doit comprendre la partie descriptive du systme de traitement des
donnes quon trouve dj dans lactuelle dclaration CNIL. Mais elle doit comprendre
en outre une partie analytique, dans laquelle le responsable de ltude expose sa vision
des risques et des impacts possibles sur la vie prive.
Des mthodologies danalyse des risques informatiques existent. MEHARI (MEthode
HArmonise dvaluation du RIsque), dveloppe par le CLUSIF, un club de scurit,
dtaille lensemble des risques informatiques, sans bien rendre ceux lis aux donnes
personnelles. EBIOS, dveloppe par lAgence Nationale pour la Scurit des
Systmes dInformation (ANSSI) est plutt centr sur la cyberscurit.
Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

14

Quel service public pour les donnes de jurisprudence?


_____________________________________________________
Au Royaume-Uni, lInformation Commissioners Office (ICO), lhomologue de CNIL,
a procd en 2013 une tude comparative des mthodologies existantes de gestion de
projet ou de gestion des risques20.
Plus rcemment, lquipe Privatics de lINRIA a publi sa mthodologie PRIAM21,
conue spcifiquement pour le RGDP, et qui distingue 7 composants :

Le systme, les parties prenantes, les donnes, pour la partie descriptive;

Les sources du risque, les faiblesses ( privacy weaknesses ), les vnements


redouts ( feared events ), les dommages ( privacy harms ), pour la partie
consacre lanalyse dimpact proprement dite.

La jurisprudence contient potentiellement une trs grande varit de donnes


personnelles, une chelle bien suprieure ce que connaissent les autres organismes
concerns, en particulier les entreprises du secteur priv. Cela peut justifier la
dfinition dune mthodologie spcifique louverture de la jurisprudence.

Proposition 5 : Dfinir une mthodologie danalyse dimpact unique et


applicable lensemble des juridictions
2.1.3

Le contenu de lanalyse
Selon larticle 35 du RGDP, l'analyse contient au moins:
a)

une description systmatique des oprations de traitement envisages et des

finalits du traitement, y compris, le cas chant, l'intrt lgitime poursuivi par le


responsable du traitement;
b)

une valuation de la ncessit et de la proportionnalit des oprations de

traitement au regard des finalits;


c)

une valuation des risques pour les droits et liberts des personnes concernes

conformment au paragraphe 1; et
d)

les mesures envisages pour faire face aux risques, y compris les garanties,

mesures et mcanismes de scurit visant assurer la protection des donnes caractre


personnel et apporter la preuve du respect du prsent rglement, compte tenu des droits
et des intrts lgitimes des personnes concernes et des autres personnes affectes

Ces dispositions sont gnriques. Les critres de finalit et de proportionnalit,


dcrits aux alinas a) et b) sadressent plus particulirement au secteur commercial.

20

Privacy impact assessment and risk management, Trilateral Research & Consulting, rapport pour lICO, 4 mai
2013, https://ico.org.uk/media/1042196/trilateral-full-report.pdf
21
PRIAM: A Privacy Risk Analysis Methodology, Sourya Joyee De, Daniel Le Mtayer, PRIVATICS - Privacy
Models, Architectures and Tools for the Information Society - Inria Grenoble, https://hal.inria.fr/hal-01302541

Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

15

Quel service public pour les donnes de jurisprudence?


_____________________________________________________
Sagissant de jurisprudence, lanalyse dimpact renverra a priori sur les missions de
service public inscrites dans la loi.
Lattention de lanalyste devra porter sur lalina c). Les risques dindividualisation, de
corrlation et dinfrence mentionns plus haut mritent sans doute dtre dcrits dans
toute analyse dimpact lie louverture de la jurisprudence. Par exemple, les
juridictions judiciaires devraient logiquement faire ressortir un risque de ridentification plus lev que les juridictions administratives, en raison dune longueur
moyenne des texte de dcision galement plus leve. En cas danonymisation
automatise, lanalyse devra faire apparatre la marge derreur constate sur un corpus
de jurisprudence de rfrence. Les dfauts danonymisation les plus caractristiques
mriteront alors dtre documents titre dexemple.
Toujours selon la juridiction, cette analyse des risques pourrait tre assortie dune
analyse, qualitative, des prjudices. Par exemple, un dfaut danonymisation dune
dcision dun tribunal de prudhommes pourrait, selon le contentieux, compromettre
les chances dune personne licencie de retrouver un emploi.
Au titre de lalina d), lanalyste devra documenter la chaine de production de la
jurisprudence jusqu anonymisation, parce que les mesures de scurit visant
assurer la protection des donnes personnelles peuvent intervenir diffrentes tapes
de la chaine selon la juridiction. Citons en particulier :
1. Le recours un outil daide rdactionnelle, la gense de la dcision ;
2. lapplication dune guide de bonnes pratiques de rdaction (stylistique),
analogue dans son principe au guide de lgistique de la DILA ;
3. la pr-anonymisation doffice, par le juge ou le greffier, par suppression de
mentions inutiles ou emploi de priphrases22 ;
4. lannotation manuelle, mme le texte de la dcision, par surlignage ou par un
outil dannotation smantique, des fragments masquer (par caviardage) dans
une version anonymise ;
5. la pr-anonymisation faisant suite demande de consentement de publicit,
puis son refus par le justiciable23 ;
6. lapplication dune technique danonymisation automatise (cf 2.2) ;
7. la retouche manuelle de dcisions pralablement
automatiquement, ou annotes avec des fragments caviarder ;

anonymises

22

Au Conseil dEtat, la plupart des rapporteurs publics pr-anonymisent les dcisions, en surlignant tous les termes qui
permettraient selon eux de r-identifier la personne
23
En Italie, on demande durant laudience aux parties si elles acceptent lanonymisation ou pas

Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

16

Quel service public pour les donnes de jurisprudence?


_____________________________________________________
8. le cas chant, le chiffrement intgral de la dcision hors mtadonnes (cf
2.2.3).
Dautre part, il faut sans doute compter parmi les mesures de scurit une procdure
priodique de contrle qualit. Le corpus de rfrence sur la base duquel a t valu
un taux de dfaut danonymisation nest pas ncessairement statistiquement
reprsentatif des flux ultrieurs de dcisions. Un contrle priodique doit sassurer que
les hypothses formules initialement, notamment la marge derreur, restent valables.
Les mesures de scurit assures par des tches manuelles devront tre mises en
vidence ; si lexercice du jugement humain est un indice de prsomption de bonne
qualit danonymisation, il met en jeu la mobilisation des ressources humaines. Le cas
chant, il faudra rapporter la qualit danonymisation au dlai de publication24.
2.1.4

Les modalits de publication de lanalyse


Larticle 35 du RGDP ne stipule pas explicitement que lanalyse dimpact doit tre
publie, ni mme documente, mais cette analyse dimpact tant motive par la
perception dun risque lev sur la vie prive, il est logique quelle soit porte la
connaissance du public.
Plusieurs questions pratiques doivent encore tre traites. Il faut dfinir :

si le rapport intgral, y compris ses ventuelles annexes, a vocation tre


publi en open data , ou si seule une synthse doit ltre ;

si lanalyse dimpact doit distinguer le risque portant sur louverture des


dcisions du stock et celui portant sur louverture des dcisions futures,
supposer que louverture de la jurisprudence porte rtroactivement sur les
dcisions passes (cf 6.2) ;

si elle doit faire lobjet de rvisions priodiques, et dans cette hypothse, selon
quelle frquence ;

si elle est publie par le responsable du traitement, par la DILA, ou les deux
la fois.

Proposition 6 : Dfinir un modle oprationnel de publication de


lanalyse dimpact

24

Un dlai de publication excessif, et surtout variable, pourrait causer un dommage aux rutilisateurs licencis,
notamment aux diteurs juridiques, mme si ce risque-l ne relve bien videmment pas de lanalyse dimpact

Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

17

Quel service public pour les donnes de jurisprudence?


_____________________________________________________
2.2

Les techniques de rduction du risque de r-identification


La meilleure faon de rduire le risque de r-identification des personnes est
danticiper ce risque lors mme de la rdaction. Certaines mentions pouvoir
didentification mais non ncessaires au besoin de rdaction du jugement pourraient
tre vites. Dautres pourraient tre remplaces par des priphrases ( la victime ) ou
des anaphores ( il , celui-ci ) ou renvoyes des rfrences bibliographiques
protges.

Proposition 7 : Engager un projet de recherche avec un laboratoire de


linguistique en vue dune solution de reformulation automatique dun
texte selon le principe de minimisation
Cependant, dans la plupart des juridictions, en particulier du premier degr, la
complexit du processus de production des dcisions et la modicit des moyens ne
permettent pas denvisager un changement de procdure court ou moyen terme. A
dfaut dune anonymisation la source, on envisagera une anonymisation en aval,
juste avant la publication. Celle-ci peut encore tre faite la main, en automatique ou
en semi-automatique.
Dans un mode automatique, diffrentes techniques permettent de rduire le risque de
r-identification. Le choix et la stratgie dutilisation de ces techniques par toute
juridiction conditionne donc les rsultats de son tude dimpact sur la vie prive.
2.2.1

Tokenisation, randomisation et hachage


Les termes de tokenisation et de randomisation sont issus de linformatique. La
tokenisation est le procd permettant de remplacer une donne critique par un lment
quivalent qui naura aucune valeur intrinsque ou signification exploitable une fois
sortie du systme (source Wikipedia) tandis que la randomisation gnre des valeurs
alatoires.
Une tokenisation dsignera gnralement la premier personne par un X, la suivante par
un Y, etc ou par un pseudonyme issu dune table de correspondance choisi selon
lordre dapparition des protagonistes dans le texte de la dcision.
Une randomisation ne respecte pas dordre dapparition mais peut fabriquer un
pseudonyme par un mlange de chiffres et de caractres gnr la vole.
Le hachage est une fonction qui, partir dune donne, calcule une empreinte servant
identifier rapidement, bien qu'incompltement, la donne initiale25. Le calcul de la
fonction de hachage est facile et rapide tandis que le calcul de sa fonction inverse est
infaisable par calcul et donc non calculable en pratique. Cette technique est notamment

25

Voir https://fr.wikipedia.org/wiki/Fonction_de_hachage

Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

18

Quel service public pour les donnes de jurisprudence?


_____________________________________________________
employe pour masquer le numro de carte bancaire dans la transmission
dinstructions de paiement en ligne. Cette technique est facile appliquer au niveau de
la donne26.
2.2.2

Analyse smantique et auto-apprentissage


Pour modifier une donne patronymique ou dadresse en plein texte, il faut tout
dabord que le systme la dtecte, en procdant une reconnaissance des entits
nommes. Une rgle simple consiste considrer tout nom propre plac derrire une
civilit ou un titre comme celui dune personne. Tout terme avec majuscule et prsent
dans une liste de prnoms et immdiatement suivi dun autre nom propre prsume une
identification de personne physique27. Une expression demeurant au annonce une
adresse. Ces rgles, danalyse smantique, doivent tre affines, pour tenir compte des
rles des protagonistes dans laffaire et des rgles spcifiques une juridiction ou
type de contentieux.
Lauto-apprentissage ( machine-learning ) consiste pour lordinateur substituer ce
traitement smantique par une analyse statistique. A partir dun corpus de dcisions
brutes et de sa version anonymise, le systme peut, en utilisant des techniques
dintelligence artificielle, en dduire une logique danonymisation pour toute nouvelle
dcision28. La dcision anonymise participe ainsi du prochain raisonnement
statistique. Bien entendu, toute retouche manuelle dune dcision anonymise
automatiquement y participe aussi. Plus le volume de dcisions saccroit, plus
lanalyse statistique saffine et meilleur est le rsultat de lanonymisation.
Pour que cet auto-apprentissage fonctionne bien, il doit dmarrer partir dun corpus
pr-anonymis statistiquement reprsentatif. Il y faut du volume et un respect des
proportions entre juridictions car la longueur moyenne et le mode de rdaction des
dcisions dtermine le degr de complexit de lexercice. Si lon retient un chantillon
de 1000 textes, la charge danonymisation devient trop lourde si elle est faite la main.
On peut recourir la place une anonymisation par analyse smantique suivie dune
retouche manuelle. Une mcanique dauto-apprentissage peut ensuite tre enclenche.

26

Noter que si le hash ne permet pas de retrouver directement la donne en clair, il vaut signature lectronique
unique de celle-ci, et, appliqu lidentifiant dune personne, ne garantit pas que celle-ci ne puisse jamais tre ridentifie par recoupement avec tout autre jeu de donnes
27
Cette rgle apparemment simple peut cacher de nombreuses chausses-trapes : par exemple, le systme pourrait
interprter les mots Charlotte Poisson comme une suite de deux noms communs plutt que comme un patronyme,
surtout sil devait y manquer les majuscules, et par consquent les laisser apparents dans le texte. Les prnoms rares,
inconnus de tout rfrentiel, les prnoms trangers composs sans trait dunion, comme en portugais ( Jos Manuel ),
les noms trangers composs sans trait dunion, comme en espagnol ( Vargas Llosa ), en portugais, en arabe,
labsence dun blanc entre deux mots, labsence de majuscule, et a fortiori toute faute dorthographe, sont autant
dexemples qui vont induire en erreur le moteur danalyse smantique
28
Plus de dtails sur les modalits pratiques et les enjeux mthodologiques sur : https://medium.com/@supralegem/laqualit-de-lanonymisation-des-dcisions-de-justice-par-machine-learning-baisse-de-faon-fdc6bb46bc06#.qoo6lsci3

Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

19

Quel service public pour les donnes de jurisprudence?


_____________________________________________________
Il reste que le recours des techniques dauto-apprentissage introduit de la complexit
et pourrait susciter une critique en dfaut de transparence. Comment justifier auprs
dun justiciable que le traitement danonymisation sur une dcision le concernant
dpend du volume de dcisions dj analyses et quil aurait donn un meilleur rsultat
un an plus tard? Il y a l une exigence de pdagogie et une exigence de transparence de
lalgorithme.

Proposition 8 : Publier en open source le code informatique de toute


technique danonymisation par auto-apprentissage
2.2.3

Le chiffrement
Une technique de chiffrement dune dcision (non anonymise) permettrait de la
masquer dans son intgralit et de ne la rendre lisible que dune personne habilite
munie dune clef de dchiffrement.
Cette technique, qui sapplique un fichier, pourrait tre utilise pour des dcisions
qui, aprs anonymisation automatique et examen manuel, savreraient entrer dans lun
des cas suivants :

La dcision se rfrerait des dispositions lgislatives interdisant sa


communication ou sa publication29 ;

La dcision a t annule par la Cour de Cassation ;

Le contenu du texte deviendrait inintelligible aprs une anonymisation pousse


des donnes personnelles. Le chiffrement pourrait tre dcid par exemple pour
faire droit une demande de justiciable ayant invoqu son droit lopposition
suite un dfaut danonymisation le concernant.

Dans tous les cas, les mtadonnes pourraient en revanche rester en clair, pour laisser
possibles dventuels traitements statistiques.
Le chiffrement pourrait tre aussi un moyen doptimiser le besoin de stockage des
dcisions de justice, qui devront tre conserves dans leur version originale aussi bien
que dans leur version anonymise, et de scuriser la gestion des liens entre celles-ci.
Une solution pourrait consister ne stocker les textes que dans leur version originale
mais aprs chiffrement, de stocker les tables de correspondances entre noms rels et
pseudonymes galement sous forme chiffre, et provoquer la pseudonymisation la
vole, selon que le lecteur est une personne cite ou non dans ce texte. Elle pourrait
29

Par
exemple,
certaines
dcisions
rendues
par
les
tribunaux
de
commerce :
https://www.legifrance.gouv.fr/affichCodeArticle.do?idArticle=LEGIARTI000006257704&cidTexte=LEGITEXT0000
05634379

Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

20

Quel service public pour les donnes de jurisprudence?


_____________________________________________________
faire lobjet dun projet de recherche conduire par une laboratoire de cryptologie sous
le parrainage de la CNIL.

Proposition 9 : Engager, sous lgide dEtalab, un projet de recherche sur


lapport de la cryptographie lanonymisation
2.2.4

La mesure de qualit de lanonymisation automatise


Quand lanonymisation est effectue de manire automatise, par un outil danalyse
smantique, le risque peut tre quantifi sous forme de marge derreur. Cette marge
peut tre estime par confrontation dun corpus de dpart anonymis entirement la
main avec le corpus issu dune anonymisation automatique du mme corpus brut.
La mthodologie de mesure de la qualit doit tre spcifie. En matire danalyse
smantique, il est dusage de distinguer le taux de rappel et le taux de prcision30.
Le taux de rappel mesure lexhaustivit de lanonymisation, cest--dire par
soustraction le taux domission. Le calcul de ce taux doit tenir compte du nombre de
mentions dune mme personne dans le texte : si elle est mentionne 20 fois, et que
lanonymisation automatique sest applique 19 fois, la personne est quand mme
identifie.
Le taux de prcision mesure la justesse de lanonymisation, ou par soustraction, le taux
de sur-anonymisation. Lanonymisation de tiers au procs, notamment des experts, et
de personnes morales ou de leurs reprsentants lgaux, sont deux cas de suranonymisation trs plausibles. La sur-anonymisation dgrade lintelligibilit de la
dcision. Le calcul du taux de prcision doit tenir compte de la cohrence des
pseudonymes travers le texte : si une personne mentionne 20 fois est remplace 19
fois par un X et une fois par un Y, lanonymisation faillit au test de prcision.
Le taux de prcision reste toutefois moins critique que le taux de rappel.
Les rgles de paramtrage du moteur danalyse smantique pourraient devoir tre
raffines jusqu ce quune dernire itration de lanonymisation automatise produise
un taux domission en-de dun seuil de risque lev au sens de larticle 36 du
RGDP.

Proposition 10 : Elaborer un plan dassurance-qualit de lanonymisation


des dcisions de justice

30

Plus de dtails sur https://fr.wikipedia.org/wiki/Prcision_et_rappel

Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

21

Quel service public pour les donnes de jurisprudence?


_____________________________________________________
3.

LA CHAINE DE RESPONSABILITS

3.1

La responsabilit de la production

3.1.1

Lanalyse dimpact
Larticle 4 du RGDP dfinit le responsable du traitement comme la personne
physique ou morale, l'autorit publique, le service ou un autre organisme qui, seul ou
conjointement avec d'autres, dtermine les finalits et les moyens du traitement .
Sagissant de jurisprudence, il convient de dterminer quelle autorit publique ,
service ou autre organisme , au singulier ou au pluriel, doit (doivent) porter la
responsabilit, juridique et oprationnelle, de lanalyse dimpact.
En principe, cette responsabilit nchoit pas la DILA, dont la mission est limite la
diffusion de linformation publique, non pas au contrle de sa qualit. Elle ne devrait
pas tre plus garante de la qualit de la jurisprudence publie, et notamment de sa
qualit danonymisation, que lAutorit des Marchs Financiers, par exemple, nest
garante de la qualit des prospectus dOPCVM que les socits de gestion dactifs lui
remettent. La responsabilit du traitement se situe donc plutt du ct juridictionnel.
Cette responsabilit peut-tre exerce par chaque tribunal, les cours dappel, la
chancellerie, ou plus vraisemblablement la Cour de Cassation, pour ce qui relve de
lordre judiciaire. En effet, la base de donnes administre par son service de
documentation et dtudes inclut dj les dcisions prsentant un intrt particulier
31
rendues par les autres juridictions de l'ordre judiciaire . La Cour pourrait donc voir
son rle tendu aux dcisions du fond. Le Conseil dEtat recevrait la mme
responsabilit pour lordre administratif.
Si largument dun risque lev , au sens de larticle 35 du RGDP, peut tre
facilement invoqu pour les corpus de jurisprudence pnale, et donc exiger du
responsable de traitement deffectuer une analyse dimpact, il ne va pas de soi que
toutes les juridictions doivent sy soumettre. Un souhait danonymisation maximale
peut tre prsum pour une dcision relative une demande de drfrencement. A
linverse, un souhait de publicit peut tre prsum pour le justiciable qui vient
dfendre auprs de lINPI ses droits sur une marque ou un brevet. Il convient donc de
faire linventaire des juridictions ou des natures de contentieux assujetties cette
analyse.
Si chacune des cours suprmes, et sans doute la Cour des Comptes et lINPI, ont la
capacit oprationnelle ncessaire pour tre responsable de traitement et ont donc
une charge danalyse dimpact de louverture de leur jurisprudence, il convient de
dfinir si chaque juridiction, y compris du premier degr, devra en faire autant pour ses

31

article R433-3 du code de lorganisation judiciaire

Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

22

Quel service public pour les donnes de jurisprudence?


_____________________________________________________
dcisions propres, ou si, au contraire, les juridictions dappel et/ou la chancellerie
doivent exercer ce rle. La question se pose galement pour les Chambres Rgionales
des Comptes, pour lesquelles la Cour des Comptes pourrait tre responsable du
traitement. Quant aux Autorits Administratives Indpendantes (AAI), leur
indpendance les amnera vraisemblablement faire leur propre analyse dimpact 32,
mme si la publication de leur jurisprudence est prise en charge par la DILA, comme
cest dj le cas pour la CNIL.
Quel quen soit lorgane responsable, ce rapport danalyse publi pourra alors tre
utilis comme lment dapprciation par tout tribunal jugeant une plainte dun
justiciable pour une dcision le concernant et faisant apparaitre son identit en clair ou
ayant permis sa r-identification.

Proposition 11 : Faire de lanalyse dimpact un outil de transparence et


de pdagogie du risque de dfaut danonymisation
Enfin, rappelons que larticle 6 de la Loi Rpublique numrique dispose que
ladministration publie[..] en ligne les rgles dfinissant les principaux traitements
algorithmiques utiliss dans l'accomplissement de leurs missions lorsqu'ils fondent des
dcisions individuelles 33. Si larticle ne vise pas la jurisprudence, et si
lanonymisation ne fonde pas en soi une dcision individuelle, la publication de la
rgle danonymisation pourrait constituer une bonne pratique, y compris par toute
juridiction non astreinte une analyse dimpact du fait dun faible risque de la
publication de sa jurisprudence porter atteinte la vie prive.
3.1.2

Lanonymisation
Dautres points de droit se posent galement sur le sujet de lanonymisation,
notamment :

Si la loi Rpublique numrique prvoit, dans ses articles 20 et 21, une analyse
du risque de r-identification des personnes, elle ne dit pas si lEtat est
responsable de tout dfaut danonymisation et si cette analyse du risque est
opposable un justiciable faisant valoir un prjudice qui en serait la
consquence34.

La sous-traitance en traitement de donnes personnelles se dveloppe. On parle


dj de DPaaS, pour Data Protection as a Service . Si lEtat devait choisir de
sous-traiter lanonymisation de la jurisprudence un tiers de confiance,
comment se distribuerait la responsabilit juridique de ce traitement entre eux

32

pour autant quelles aient toutes des pouvoirs de sanction


https://www.legifrance.gouv.fr/eli/loi/2016/10/7/ECFI1524250L/jo/article_6
34
Blog de M. Benesty, Supralegem, https://medium.com/@supralegem/avec-la-loi-lemaire-la-responsabilit-deladministration-pourra-tre-engage-pour-chaque-dcision-a6864c6d5f61#.w5yjeq6pn
33

Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

23

Quel service public pour les donnes de jurisprudence?


_____________________________________________________
deux?
3.1.3

Les mtadonnes
La responsabilit du renseignement des mtadonnes devrait tre porte par la DILA.
Celle-ci doit tre garante de la qualit et la cohrence des mtadonnes ECLI quelle
transmet au portail europen ECLI.
Cest galement elle qui devrait contrler les mtadonnes complmentaires
ventuelles (cf 4.3.5).
Les mtadonnes, ECLI ou non, stockes dans un triple store ou tout autre type de base
de donnes devraient tre protges techniquement pour empcher toute criture ou
modification par un rutilisateur.

3.2

La responsabilit de la diffusion

3.2.1

La responsabilit de la DILA
La responsabilit de la primo-diffusion est porte par la DILA.
Les contrats de licence actuels avec les diteurs juridiques devront tre amends ou
remplacs mesure que les flux de jurisprudence non anonymise seront remplacs
par une mise disposition obissant un nouveau format technique et un nouveau
protocole de scurit, conforme au Rfrentiel Gnral de Scurit.
Mme si la mise disposition des donnes est gratuite, la signature dune licence
adapte aura pour mrite dassurer la traabilit des rutilisations, et dimposer des
obligations contractuelles aux rutilisateurs (cf 3.3.2).

3.2.2

La responsabilit dEtalab
La mission Etalab publie des fonds jurisprudentiels comme tout autre jeu de donnes
sous une Licence Ouverte, une licence libre quelle a cre en 2011, et qui nimpose
pour contraintes que la reconnaissance de paternit et la mention dune date de
dernire mise jour.
Le modle actuel de diffusion dEtalab est adapt un usage occasionnel, tandis que
celui de la DILA est adapt un usage rgulier, qui exige qualit de contenu et
continuit de service. Si Etalab devait envisager un redploiement des silos actuels en
une base jurisprudentielle unifie et conforme lECLI, de nature servir les besoins
des rutilisateurs professionnels, elle devra proposer une licence dont les termes soient
cohrents avec ceux de la licence que la DILA imposera ces propres rutilisateurs.
Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

24

Quel service public pour les donnes de jurisprudence?


_____________________________________________________
3.2.3

Droits et devoirs des rutilisateurs


Si les rutilisateurs licencis daujourdhui sont tous des diteurs juridiques de droit
franais, les rutilisateurs licencis de demain devraient pouvoir tre des personnes
physiques ou morales domicilies dans une juridiction relevant du champ dapplication
territorial de larticle 3 du RGDP. Les obligations spcifiques aux articles 20 et 21 de
la loi Rpublique numrique pourraient tre reprises dans leur contrat de licence.
Il ne devrait pas y avoir non plus de restriction lie au statut professionnel du
rutilisateur.

Proposition 12 : Ouvrir le droit de rutilisation de la jurisprudence sur le


champ territorial le plus large possible et sans restriction quant au statut
professionnel du rutilisateur
La licence de rutilisation devrait laisser aux rutilisateurs lopportunit denrichir les
mtadonnes de la jurisprudence avec les leurs propres, notamment des mtadonnes
de catgorisation des dcisions, dans le cadre dun service commercial payant. Une
licence de type ODbL35 pourrait avoir pour rsultat, a contrario, dvincer les diteurs
juridiques de leur march.
Les rutilisateurs devraient avoir le choix entre une licence de rutilisation de la
jurisprudence anonymise et une autre de rutilisation de jurisprudence originale avec
obligation danonymiser eux-mmes, comme cest dj le cas actuellement. Il sagit en
effet dassurer une quit de traitement des entreprises vis--vis du RGDP que les
donnes personnelles traites soient de nature juridique ou non. La licence de
rutilisation de jurisprudence originale, non anonymise, assujettira le rutilisateur au
RGDP et, ipso facto, lanalyse dimpact de son article 35.
Le rutilisateur anonymiserait les donnes personnelles dans les rgles du droit
commun. Il fixerait lui-mme son curseur entre traitement automatis et traitement
manuel, assumerait ses choix de type de traitement automatis, de logiciel et/ou de
prestataire. La mme dcision de justice publie par deux diteurs juridiques
concurrents pourrait ainsi marquer des diffrences, laffichage, notamment par :

35

la capacit mnmonique des pseudonymes,

lusage de conventions de police ou de couleurs pour distinguer les


protagonistes,

le retrait de fragments de texte en vertu du principe de minimisation,

https://fr.wikipedia.org/wiki/Open_Database_License

Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

25

Quel service public pour les donnes de jurisprudence?


_____________________________________________________

la non-suranonymisation des tiers au procs et des reprsentants lgaux de


personnes morales.

Il va de soi que la r-anonymisation par le rutilisateur ajoute au cot conomique de


la valorisation de la donne, mais celui-ci doit rester libre de faire de lanonymisation
par lui-mme des dcisions de justice un avantage comptitif.
En revanche, le rutilisateur de jurisprudence originale pourrait tre soumis aux mmes
rgles sappliquant aux diffuseurs publics : analyse dimpact, gestion des habilitations
aux donnes, scurisation technique des bases
Le rutilisateur de la jurisprudence anonymise pourrait se voir soumis des
obligations inscrites son contrat de licence, en particulier :

Labstention de
pseudonymises ;

La dsindexation des dcisions annules par la Cour de Cassation, et la


restriction de leur affichage au seul cadre dune chaine de contentieux affichant
aussi la dcision dannulation ;

La mise disposition en ligne dun formulaire de demande de rectification ou


de suppression de donnes personnelles ;

Lavertissement de la DILA de tout dfaut danonymisation constat ;

La signature dune licence comportant les mmes obligations pour toute


rutilisation par un client de deuxime niveau ; cela vaudrait notamment pour
toute rutilisation de donnes de jurisprudence par une entreprise de presse.

toute

3.3

La responsabilit de la CNIL

3.3.1

Consultation pralable

tentative

de

r-identification

des

personnes

La CNIL pourrait tre amene retarder louverture de la jurisprudence dun


responsable de traitement layant sollicite pour cause de risque lev, en vertu de
larticle 36 du RGDP. Dans la pratique, elle pourrait tre amene contester les choix
dalgorithmes danonymisation. A linverse, son acceptation tacite des mesures prises
pour rduire le risque ne semble pas engager sa responsabilit.

Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

26

Quel service public pour les donnes de jurisprudence?


_____________________________________________________
3.3.2

Obligations des rediffuseurs


Dautre part, travers le processus de mise disposition (cf 5.4.5), les rediffuseurs
privs rcupreront des dcisions de justice anonymises moyennant une marge
derreur ressortant lanalyse dimpact du type de juridiction concerne. La CNIL
devra prciser si, ou compter de quel niveau de risque, les rediffuseurs sont
galement soumis une analyse dimpact.

Proposition 13 : Editer un guide de bonnes pratiques lintention des


diteurs juridiques et autres rutilisateurs potentiels, sur le modle des
packs de conformit sectoriels existants

4.
4.1

LES MTADONNES DE LA JURISPRUDENCE


Lenjeu
Si louverture de la jurisprudence participe du mouvement gnral douverture des
donnes, la notion mrite dtre dtaille. Elle recouvre dune part laccs aux
donnes, ou open access , qui matrialise linformation qui saffiche sur un cran et
quon peut lire, et la rutilisation des donnes, ou open data , qui promet de
nouveaux services valeur ajoute aux citoyens et consommateurs.
Essentiellement textuelle et non structure, la jurisprudence est particulirement peu
propice la rutilisation. Cest l quinterviennent les mtadonnes.

4.2

Etat des lieux de la normalisation des mtadonnes

4.2.1

LECLI
Le European Case Law Identifier (ECLI) est une norme communautaire de description
des mtadonnes de la jurisprudence. Son cadre fonctionnel a t fix en 2011 par le
Conseil de lUnion europenne36. Chaque Etat-membre est libre dadopter lECLI.
LECLI a t adopt par la Cour de Justice de l'Union Europenne (CJUE) et l'Office
Europen des Brevets (OEB).

36

Conclusions du Conseil prconisant l'introduction d'un identifiant europen de la jurisprudence et un ensemble


minimal
de
mtadonnes
uniformes
pour
la
jurisprudence,
http://eur-lex.europa.eu/legalcontent/FR/ALL/?uri=CELEX:52011XG0429(01), Office des Publications de lUnion europenne, consult le 5
novembre 2016

Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

27

Quel service public pour les donnes de jurisprudence?


_____________________________________________________
La France fait partie des pays layant adopt37, et le Secrtariat gnral du
Gouvernement a dsign la DILA comme coordinateur national ECLI. Les cours
suprmes (Conseil Constitutionnel, Cour de Cassation, Conseil dEtat) identifient dj
leurs dcisions avec un ECLI. Conseil Constitutionnel et Conseil dEtat fabriquent
eux-mmes lidentifiant ECLI de leurs dcisions, avant de les transmettre par fichier
la DILA, qui les enregistre dans ses bases CONSTIT et JADE respectivement. Quant
la Cour de Cassation, elle identifie ses arrts propres, dans sa base JURINET, par un
identifiant interne, le numro daffaire, puis fournit les lments de base (mais pas le
numro de pourvoi) la DILA, qui construit ensuite lECLI38.
Ces dcisions sont affiches, aprs anonymisation, avec leur ECLI, aussi bien sur le
portail propre de chaque juridiction que sur le portail Lgifrance.
Dans tous les cas, la DILA complte les mtadonnes obligatoires associes aux ECLI,
et fournit les dcisions ainsi enrichies la Direction Justice de la Commission
europenne, selon le format XML attendu. Ces dcisions sont ainsi disponibles sur le
portail europen39.
La France ne fait pas partie du groupe dEtats-Membres constitu autour du projet
Building on ECLI lanc en octobre 2015 pour une dure maximale de 2 ans40.

Proposition 14 : Faire participer la France la poursuite des travaux de


normalisation europenne sur lECLI
4.2.2

LELI
La Commission Europenne a lanc peu aprs, en 2012, linitiative dune norme de
lgislation (European Legislation Identifier, ou ELI) galement facultative pour les
Etats-membres. La France fait partie des 6 Etats-Membres ayant dj adopt lELI.
La norme ELI consiste affecter chaque texte lgislatif dun identifiant unique
lchelle europenne, au format dune URI, pour une accessibilit sur le Web
smantique, et associ dattributs, ou mtadonnes, qui dcrivent les caractristiques
du texte41. Chaque article dun texte lgislatif est galement dot de son propre ELI,
mais na pas de mtadonnes associes.
Les versions initiales des textes gnraux de la lgislation franaise, stockes dans la
base JORF, sont dores et dj dotes dun ELI, et ce, rtrospectivement jusqu 2002.

37

https://e-justice.europa.eu/content_european_case_law_identifier_ecli-175-FR-fr.do?clang=fr
La DILA a pu reconstituer des ECLI rtroactivement jusquen 2008, mais pas au-del, car le numro daffaire ntait
pas fourni dans le fichier remis jusqualors
39
https://e-justice.europa.eu/content_ecli_search_engine-430-fr.do
40
http://bo-ecli.eu/
41
http://publications.europa.eu/mdr/eli/documentation/ELI_Ontology-v1.0.htm
38

Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

28

Quel service public pour les donnes de jurisprudence?


_____________________________________________________
La normalisation ELI de la lgislation consolide (stocke dans la base LEGI),
notamment des Codes, est en cours.
Les mtadonnes de la lgislation communautaire sont stockes dans un triple store
RDF, appel le CELLAR42, sous la responsabilit de lOffice des Publications de
lUnion europenne43, quivalent communautaire de la DILA. RDF est le langage de
base du Web smantique, dvelopp par le W3C. En annotant des documents non
structurs, RDF permet une certaine interoprabilit entre des applications changeant
de l'information non formalise et non structure, comme les dcisions de justice, sur
le Web44.
En France, la mise la norme ELI seffectue par lencapsulation dtiquettes RDFa
dans les pages HTML des textes dans leur version initiale. Lutilisateur de Lgifrance
peut faire un clic-droit et afficher source pour dcouvrir les tiquettes ELI non
apparentes dans la page HTML, ainsi quil est montr ci-dessous sur lexemple de la
loi Rpublique numrique.

La conversion des mtadonnes HTML/RDFa au format RDF et leur interoprabilit


de la lgislation franaise avec la lgislation communautaire a t dmontre lors de la

42

Plus
de
dtails
sur
https://www.researchgate.net/publication/283877502_The_OntologyBased_Approach_of_the_Publications_Office_of_the_EU_for_Document_Accessibility_and_Open_Data_Services
43
Sur le portail Eur-lex, gr par lOffice, les mtadonnes dun texte apparaissent dans longlet Informations sur le
document ,
comme
dans
lexemple
suivant :
http://eur-lex.europa.eu/legalcontent/FR/ALL/?qid=1478426032359&uri=CELEX%3A32016R0679
44
https://fr.wikipedia.org/wiki/Resource_Description_Framework

Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

29

Quel service public pour les donnes de jurisprudence?


_____________________________________________________
confrence Access to and Reuse of EU Legal Information Conference organise
par lOffice des publications de lUnion europenne le 21 mars 201645.
Les travaux de normalisation de lELI et de lECLI sont conduits en parallle par des
groupes de travail diffrents. Les relations 1 loi peut tre lorigine de N dcisions
de justice ou 1 dcision de gestion peut invoquer N lois nont pas t modlises
ce jour. LOEB et la CJUE versent leur jurisprudence respective depuis peu dans le
CELLAR, o elles constituent deux silos spars de la lgislation46.
4.3

La description des dcisions

4.3.1

Structure de lidentifiant ECLI


Lannexe 1 des Conclusions du Conseil prconisant l'introduction d'un identifiant
europen de la jurisprudence et un ensemble minimal de mtadonnes uniformes pour
la jurisprudence stipule que lECLI doit tre constitu des cinq lments suivants :
a)

l'abrviation ECLI ;

b)

le code pays du pays ou de l'organisation sous la comptence duquel la dcision de


justice est rendue,

soit FR pour la France ;

45

http://publications.europa.eu/documents/2050822/2138819/Florent-Andr-14-ELI-LLDD-21-march.pdf
Par exemple, le CELLAR lie cette dcision de lOffice Europen des Brevets https://ejustice.europa.eu/ecli/EPO01/en/1475227983388/ECLI:EP:BA:2016:T100514.20160811.html?index=0&lang=fr. 4
autres dcisions mais aucun texte. Dans la base propre de lOEB, qui nest pas la norme ECLI, les liens vers la
lgislation de cette mme dcision sont restitus, dans le
champ relevant legal provisions :
https://www.epo.org/law-practice/case-law-appeals/recent/t141005eu1.html
46

Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

30

Quel service public pour les donnes de jurisprudence?


_____________________________________________________
c)

le code juridiction, qui :


1) doit comporter au moins un et au plus sept caractres,
2) doit toujours commencer par une lettre mais peut aussi contenir des chiffres,
3) devrait tre choisi de manire sembler logique aux personnes familiarises avec
l'organisation de l'appareil judiciaire du pays concern,
4) doit au minimum correspondre une abrviation du nom de la juridiction, tout en
pouvant aussi contenir une indication de la chambre ou de la section concerne au
sein de cette juridiction, notamment s'il est habituel de dsigner la chambre ou la
section dans les renvois la jurisprudence du pays concern ; le Conseil dEtat fait
usage de cette facult47.
5) ne devrait pas contenir d'informations relatives au type de document,
6) doit tre fix conformment au paragraphe 5, point 1

(cette abrviation doit


pouvoir apparatre comme telle dans une interface de recherche commune
lensemble des juridictions franaises),

7)

ne peut prendre la valeur XX que pour les dcisions de juridictions ne figurant


pas sur la liste tablie par

[la DILA], [] ; Ce code pourrait sappliquer aux

sentences darbitrage.
d) l'anne de la dcision, qui doit tre inscrite avec quatre chiffres ;
e) un numro d'ordre, qui doit tre unique en ce sens qu'il ne doit pas y avoir plus d'un
jugement rendu la mme anne par la mme juridiction et possdant le mme numro
d'ordre. La longueur maximale du numro d'ordre est de 25 caractres. Le numro d'ordre
peut contenir des points (.) mais aucun autre signe de ponctuation ne peut y figurer.

Le
point peut donc servir structurer le numro dordre en fonction de critres propres
chaque juridiction. Le Conseil Constitutionnel use de cette facult pour y marquer le
type de dcision, comme dans ECLI:FR:CC:2012:2012.270.QPC, o QPC dsigne une
Question Prioritaire de Constitutionnalit.
Toutes les parties d'un ECLI sont spares par le signe deux-points (:).Un ECLI ne
doit contenir ni espacements ni signes de ponctuation, ni dans ses parties ni entre
celles-ci48.
47

https://donneesjuridiques.wordpress.com/2012/09/11/lidentifiant-ecli-sur-les-decisions-du-conseil-detat-et-de-lacour-de-cassation/
48
Compte tenu de la longueur rsultant de la concatnation de ces diffrents lments, et sagissant dun identifiant
potentiellement applicable des dizaines de millions de dcisions lchelle europenne, on peut regretter labsence
dune clef de contrle

Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

31

Quel service public pour les donnes de jurisprudence?


_____________________________________________________
Il faut noter que les cours suprmes, ne renseignant pas les mtadonnes elles-mmes,
ont t amenes enrichir la smantique de lidentifiant ECLI lui-mme : le Conseil
dEtat insre la formation de jugement dans le code juridiction et la Conseil
Constitutionnel le type de dcision dans le numro dordre.
Enfin, le numro dordre est unique par juridiction et non unique au niveau de la
jurisprudence franaise : un justiciable qui entrerait ce numro dordre comme seul
critre de slection dans un moteur de recherche de jurisprudence est donc susceptible
de voir safficher plusieurs dcisions de juridictions diffrentes. Il est donc prfrable
que le code juridiction port dans lECLI soit galement report dans les actes de
procdure et soit facile retenir.
4.3.2

La codification de la juridiction
Parmi les diffrents composants de lidentifiant, la dfinition du code juridiction mrite
une analyse.
La spcification de lECLI stipule que le code juridiction devrait

tre choisi de

manire sembler logique aux personnes familiarises avec l'organisation de l'appareil


judiciaire du pays concern

Une extraction des bases de la DILA donne le dcompte suivant (hors juridictions
pnales) :
Juridictions dans les bases de la
DILA
Conseil constitutionnel
Conseil de prud'hommes
Conseil d'Etat (chambres)
Cour administrative d'appel
Cour d'appel
Cour de cassation
Tribunal administratif
Tribunal de commerce
Tribunal de grande instance
Tribunal de premire instance
Tribunal des conflits
Tribunal d'instance
Tribunal du Travail
Tribunal mixte de commerce
Tribunal suprieur d'appel
Total gnral

nombre
1
210
6
8
36
1
42
134
164
4
1
301
6
8
1
923

Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

32

Quel service public pour les donnes de jurisprudence?


_____________________________________________________
Le nombre important de juridictions, plus prcisment de ressorts juridictionnels, est
du leur dcoupage sur une base gographique. Si la notion de ressort tait reporte
sous forme dattribut (dans le champ coverage , voir 4.3.3), le code juridiction
pourrait alors contenir le type de juridiction, et relever ainsi dune nomenclature
limite quelques dizaines de valeurs. La liste tablie par le Syndicat National de
lEdition dans son Guide de citation des rfrences juridiques49 en compte 73.
Il faudrait galement examiner les nomenclatures dj utilises au Ministre de la
Justice, pour les juridictions judiciaires, et du Conseil dEtat, pour les juridictions
administratives, qui ont sans doute install des habitudes chez les futurs utilisateurs de
lECLI. Les rutiliser permettrait dviter de crer une deuxime nomenclature exnihilo et de devoir en assumer la charge dadministration, en fonction des volutions
des cartes judiciaire et administrative. Toutefois, il faut encore que les nomenclatures
existantes soient compatibles avec la contrainte dun code sur 7 positions maximales,
commenant par une lettre, impose par lECLI.
Le Ministre de la Justice gre ses nomenclatures dans le Systme de Rfrence Justice
(SRJ), bientt renomm SyRJus. Il y en a sans doute une distincte pour les
juridictions civiles, alimentant Portalis, et une autre pour les juridictions pnales,
alimentant Cassiope. Quant aux juridictions administratives, elles ont sans doute t
codes par le Conseil dEtat dans son systme dinformation Ariane.
La nomenclature cible doit donc tre constitue partir de 5 types de juridictions :

Les juridictions exploitant dj lECLI et dj pourvues de code : Cour de


Cassation, Conseil dEtat, Conseil Constitutionnel ;

Les juridictions civiles, coder de prfrence en cohrence avec le systme


dinformation Portalis ;

Les juridictions pnales, coder de prfrence en cohrence avec le systme


dinformation Cassiope ;

Les juridictions administratives, coder de prfrence en cohrence avec le


systme dinformation Ariane ;

Les autres juridictions : Cour des Comptes et CRC, Autorits Administratives


Indpendantes, INPI, etc

Si cette nomenclature ne peut tre constitue partir des nomenclatures existantes, il


faudra en btir une. La premire position, qui doit tre une lettre, pourrait alors tre un
A, pour lordre administratif, un C, pour Civil, P, pour Pnal et I pour les autorits
administratives indpendantes. Le chiffre 1 ou 2 pourrait indiquer le degr de la
49

http://reflex.sne.fr/abreviations-juridictions-francaises

Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

33

Quel service public pour les donnes de jurisprudence?


_____________________________________________________
juridiction, une ou deux positions pourraient dsigner le type de juridictions (prudhommes, commerce, instance, grande instance, etc) et 3 ou 4 positions pourraient
dsigner le ressort. Celui-ci pourrait tre constitu des 2 chiffres du dpartement puis
dun numro dordre ou dun code alphabtique pour dsigner la ville au sein du
dpartement50.
Dautres combinaisons sont bien entendu possibles. Par exemple le ressort peut tre
identifi par les 4 premires lettres de la ville (ALBE pour Albertville) mais il y aurait
des cas particuliers grer (par exemple pour distinguer Boulogne-sur-Mer et
Boulogne-Billancourt).
Ltablissement de cette nomenclature incombe la DILA, en sa qualit de
coordinateur national ECLI.

Proposition 15 : Etablir une nomenclature des codes de juridictions


homogne, intuitive, exhaustive et compatible lECLI
4.3.3

Lcriture des mtadonnes ECLI obligatoires


Les attributs de lECLI doivent tre dcrits selon la norme de mtadonnes du Dublin
Core51. Celle-ci est reconnaissable, ci-aprs, par le prfixe dcterms.
Chaque dcision doit tre dcrite de la mme faon, quelle que soit sa juridiction, son
type daffaire ou de contentieux :

Le champ dcterms:identifier contiendra lURL permettant d'accder au


document considr. Cette URL devrait tre construite de prfrence en y
faisant apparatre lECLI en clair.

Le champ dcterms:isVersionOf contiendra lECLI52.

Le champ dcterms:creator pourrait contenir le nom complet de la juridiction


correspondant au code juridiction renseign en 3e position dans lECLI.

Le champ dcterms:coverage dsigne en principe le primtre gographique sur


lequel la dcision sapplique. Si cette notion devait tre peu utile en droit
franais, le champ pourrait alternativement dsigner le ressort gographique de
la juridiction, sous la forme du code INSEE de la commune sige du ressort, et
non de son lieu physique53. A dfaut dun primtre applicable, le champ

50

Le code SIRET de la commune ne peut pas servir. Il prendrait 5 chiffres sur les 7 positions disponibles.
Le Dublin Core est un schma de mtadonnes gnrique qui permet de dcrire des ressources numriques ou
physiques et dtablir des relations avec d'autres ressources (source : Wikipedia)
52
Nous navons pas compris ce champ
53
Par exemple, pour le tribunal de Lille, on retiendrait le code INSEE de la commune de Lille, 59350, mme si le
tribunal se trouve physiquement Tourcoing
51

Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

34

Quel service public pour les donnes de jurisprudence?


_____________________________________________________
pourrait prendre la valeur FRA, code ISO de la France.

4.3.4

Le champ dcterms:date contiendrait la date dimmatriculation de lECLI ;


comme une mme dcision est susceptible dtre mise en ligne diffrentes
dates par diffrents portails juridictionnels, il est prfrable, pour prserver
lunicit des mtadonnes, de retenir la date laquelle lECLI a t form, date
qui leur est ncessairement antrieure ou gale.

Le champ dcterms:language aura pour valeur FR .

Le champ dcterms:publisher pourrait avoir pour valeur DILA , SGG ou


Secrtariat Gnral du Gouvernement .

Le champ dcterms:type pourrait distinguer le type de dcision : par un juge, par


un jury, par une autorit administrative indpendante, par un tribunal arbitral,
par une plateforme numrique darbitrage. Il serait obligatoire.

Lcriture des mtadonnes ECLI facultatives


La norme ECLI considre les champs suivants comme facultatifs :

Le champ dcterms:title pourrait reprendre tout titre port en entte du texte de


la dcision, sil existe, ou le numro interne propre la juridiction, par exemple
Jugement n 2015-0011 .

Le champ dcterms:subject pourrait dcrire une liste des descripteurs assurant la


classification thmatique des dcisions. Le SRJ contient peut-tre une
nomenclature applicable. Le cas chant, le contenu de ce champ pourrait
provenir de thsaurus diffrencis selon le type de juridiction54 ou dun
thsaurus unifi qui serait spcialement conu par la DILA.

Le champ dcterms:abstract pourrait contenir le rsum de la dcision quand il


existe.

Le champ dcterms:description aurait valeur de commentaire et serait renseign


librement et facultativement par la juridiction.

Le champ dcterms :contributor est rserv aux noms des juges, du procureur ou
d'autres membres du personnel judiciaire concerns. Ceux-ci doivent donc tre
isols par un sparateur de virgule. Si leur rle respectif doit tre mentionn, il
faudra convenir dune rgle syntaxique pour quil apparaisse : par ex
juge:Jean Dupont,procureur:Jacques Leroy .

54

Voir la synthse faite ce sujet par Emmanuel Barthe sur http://www.precisement.org/blog/+Des-thesaurusjuridiques-de-valeur+.html

Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

35

Quel service public pour les donnes de jurisprudence?


_____________________________________________________

4.3.5

Le champ dcterms :issued dsigne la date de publication. Il sera donc renseign


en fonction du fait dclencheur choisi de cette publication (cf 5.3).

Le champ dcterms :references permet de lier la dcision dautres documents


juridiques, nationaux ou communautaires. On peut y mettre une URL ou tout
autre moyen didentification. On y revient au 4.4.2.

Le champ dcterms :isReplacedBy, sil est renseign, contient lECLI de la


dcision de rectification.

Autres caractristiques dcrire


Les caractristiques suivantes mais pas ncessairement exhaustives - ne sont pas
prvues par lECLI, mais devraient tre dcrites par des mtadonnes
complmentaires :

Le ressort de la juridiction55 ; il pourrait tre dsign par le code INSEE (5


chiffres) de la commune du ressort ;

La date de dernire modification, utile cas denrichissement ultrieur de


champs facultatifs ;

Le type de chambre ;

La chambre elle-mme ;

La nature daffaire ou de contentieux ;

Le prononc public ou non du jugement ;

Le type de diffusion ;
o les arrts de la Cour de Cassation peuvent combiner les valeurs
suivantes : P (publi), B (publi au bulletin), R (publi au rapport), I
(publi et sur internet)56 ;
o pour le Conseil dEtat, le type de diffusion pourrait reprendre le code
de publication , avec A pour les dcisions prsentant un intrt
jurisprudentiel majeur, B pour les dcisions signales et C pour celles
ne prsentant pas dintrt juridique particulier57. Une autre position
pourrait indiquer sil y a publication ou non au Recueil Lebon ;

55

A moins quil soit port dans le champ dcterms:coverage, cf supra


Cf https://www.courdecassation.fr/jurisprudence_2/assemblee_pleniere_22/p._b._11926.html
57
http://www.precisement.org/blog/La-base-ArianeWeb-des-decisions-de.html
56

Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

36

Quel service public pour les donnes de jurisprudence?


_____________________________________________________
o une valeur non publiable doit pouvoir sappliquer certaines
juridictions, comme lAMF ;
o dautres juridictions pourraient avoir dautres types de diffusion ;

Le type danonymisation : manuelle, assiste, automatise, aucune. Ce champ


sera utile lapprciation de la qualit prsume de lanonymisation. La valeur
aucune sappliquerait en cas de dcision ayant explicitement requis la
publicit des noms ;

La dcision lie prcdente : une dcision dune juridiction de 2e degr se


rfre ici une dcision du 1er degr ; cette dcision serait bien entendu
identifie par son ECLI58 ; ce lien permettrait de reconstituer de proche en
proche toute la chaine du contentieux ;

La dcision lie prcdente rectifie : si la norme ECLI prvoit un champ


isReplacedBy pour marquer sur une dcision le lien vers la dcision suivante de
rectification, ce champ en serait la rciproque.

Le quorum : la majorit, lunanimit

Un indicateur qui permettrait de stipuler que lanonymat a t explicitement


demand dans la dcision (cf exemple de lAMF au 1.5.2), explicitement
exclu (idem au 1.5.1) ou relve du droit commun ;

La date dannulation ventuelle par la Cour de Cassation, ou date damnistie59.

Proposition 16 : Dresser linventaire dtaill des mtadonnes, ECLI ou


non, requises par la rutilisation des dcisions de justice, selon leur
juridiction ou type de contentieux
4.3.6

Le format de publication des mtadonnes


Quant lECLI, il dcrit un vocabulaire60, mais pas de format technique, et en
particulier ne stipule pas que lidentifiant doit prendre la forme dune URI.
Par ailleurs, plusieurs initiatives proposent un balisage spcifique aux documents
juridiques laide dune taxonomie XML, parmi lesquelles Akoma Ntoso61 est une

58

Une dcision de la Cour de Cassation se rfre un numro de pourvoi, identifiant de la procdure administrative. Le
processus pourrait tre revisit pour examiner la faisabilit de son remplacement par le numro ECLI de la dcision
lorigine de ce pourvoi
59
Cf http://www.village-justice.com/articles/publication-decisions-justice-Internet,14623.html
60
Dans lannexe 2 de http://eur-lex.europa.eu/legal-content/FR/ALL/?uri=CELEX:52011XG0429(01)
61
Rcemment renomm LegalDocML ; voir http://www.akomantoso.org/

Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

37

Quel service public pour les donnes de jurisprudence?


_____________________________________________________
proposition dj mise en uvre dans de nombreux pays extra-europens ainsi que par
le parlement europen, qui lutilise pour structurer ses propositions damendements.
Il serait judicieux de publier la jurisprudence du fond directement en RDF puisqu'il n'y
a rien sur quoi se greffer.
4.4

Evolutions des normes europennes des donnes juridiques


Cette tude est rdige sur la base de la premire version de lECLI publie en 2011.
Peut-tre certaines volutions ont-elles t dj actes. Quoi quil en soit, la norme
actuelle ne suffit pas couvrir tous les besoins.

4.4.1

Harmonisation des formats


Les formats techniques de reprsentation de l'ELI et de l'ECLI devraient converger de
faon garantir leur interoprabilit. RDF est aujourdhui le format qui permet de
porter la lgislation sur le Web smantique. Si RDF doit rester la cible de l'ELI, alors il
faudrait qu'il le soit aussi pour l'ECLI. La CJUE et lOEB ont en tout cas dj fait ce
choix tactique en injectant leurs propres dcisions dans le CELLAR.
Dans ce cas, lidentifiant dctersm :identifier prendrait la forme dune URI. A titre
dexemple, ECLI.FR:CCASS:2016:SO01309 aurait pour URI : http://
www.legifrance.gouv.fr/ECLI.FR:CCASS:2016:SO01309.
ELI se fonde par ailleurs sur le modle bien tabli des Fonctionnalits requises des
notices bibliographiques (FRBR)62. Ce modle fait une distinction entre les concepts
doeuvre (cration intellectuelle ou artistique dtermine), dexpression
(ralisation intellectuelle ou artistique dune oeuvre) et de manifestation
(matrialisation de lune des expressions dune oeuvre)63. Lexpression permet en
particulier de distinguer la langue de rdaction, et la manifestation le format de
reprsentation, PDF, HTML ou XML.
Chacun de ces formats a son utilit :

62

http://archive.ifla.org/VII/s13/frbr/ en anglais; version franaise sur http://www.bnf.fr/documents/frbr_


rapport_final.pdf
63
Cf http://eur-lex.europa.eu/legal-content/FR/TXT/PDF/?uri=CELEX:52012XG1026(01)&from=FR, page 325/10

Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

38

Quel service public pour les donnes de jurisprudence?


_____________________________________________________

Le PDF est le format de prdilection de la majorit des lecteurs, notamment


dans les professions juridiques ;

Le HTML permet dassurer une lecture commune par les humains et les
machines, grce lencapsulation dtiquettes RDFa ;

Le XML permet une reprsentation unifie du texte et de ses mtadonnes et


une structuration du texte proprement dit laide dune taxonomie comme
Akoma Ntoso (cf 4.3.5).

Pour faciliter le maillage de la jurisprudence sur la lgislation, il serait judicieux de


soumettre galement lECLI au modle FRBR ; si la langue est un critre dexpression
pertinent sagissant de juridictions supra-nationales (CJUE ou CEDH), les dcisions de
justice de juridictions franaises seront toujours crites en franais ; en revanche, ce
niveau dexpression pourrait servir distinguer une version originale certifie non
anonymise et une version anonymise.
LECLI ECLI.FR:CCASS:2016:SO01309 en exemple plus haut pourrait ainsi se
dcliner en 4 URI correspondant 4 manifestations diffrentes de la dcision :
https://www.legifrance.gouv.fr/ECLI.FR:CCASS:2016:SO01309/original/pdf, pour le
texte original en format PDF,
http://www.legifrance.gouv.fr/ECLI.FR:CCASS:2016:SO01309/pdf, pour le texte
anonymis en format PDF,
http://www.legifrance.gouv.fr/ECLI.FR:CCASS:2016:SO01309/html, pour le texte
anonymis en format HTML,
http://www.legifrance.gouv.fr/ECLI:FR:CCASS:2016:SO0139/xml,
anonymis en format XML.

pour

le

texte

La premire URI, donnant accs au texte original, ne serait accessible qu une


personne habilite aprs authentification.
4.4.2

Attributs de liens lgislatifs et jurisprudentiels


Tout texte de dcision invoque normalement les textes lgislatifs sur lesquelles cette
dcision est fonde64. Ces rfrences juridiques sont gnralement regroupes dans un
expos des motifs ou des griefs.
Or la mtadonne dcterms:references est un champ gnrique du Dublin Core, qui ne
distingue pas les dcisions de la lgislation, et ne dcrit pas de rgle dcriture pour

64

nullum crimen sine lege : c'est la loi de dfinir les infractions; le juge ne peut inventer un dlit

Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

39

Quel service public pour les donnes de jurisprudence?


_____________________________________________________
une dcision o plusieurs rfrences de chaque seraient ncessaires. Elle est
aujourdhui utilise par la CJUE et lOEB seulement pour lier une dcision une ou
plusieurs autres dcisions (cf 4.3.3).
Il est donc propos ici de crer une mtadonne ddie pour contenir un lien vers un
texte lgislatif et une autre pour contenir un lien vers une autre dcision de justice.
Elles pourraient sappeler invokes_legislation et invokes_case pour respecter la
convention de nommage de lELI.
Si le format technique devait tre de type CSV (fichier plat avec champs spars par
des point-virgules), et si plusieurs liens de mme nature devaient tre dcrits, ils
pourraient tre concatns ensemble spars par des virgules, lintrieur de ce
champ. Si le format technique devait tre RDF, la dcision fera lobjet dune criture
dautant de lignes (triplets) quil y a de rfrences lmentaires.
Ces textes lgislatifs devraient tre identifis par leur ELI, sil existe65. La dcision
devrait pouvoir indiffremment invoquer un texte communautaire ou un texte de
nimporte quelle juridiction dun Etat-membre dans ce champ.
Pour gagner en prcision, le lien lgislatif devrait pouvoir renvoyer vers un article
plutt que vers le texte lui-mme.
Par exemple, une dcision pourrait avoir dans sa mtadonne invokes_legislation le
contenu :
http://data.europa.eu/eli/reg/2016/679/oj,
texte
europen,
ou
https://www.legifrance.gouv.fr/eli/decret/2002/8/7/2002-1064/jo/article_3, article de
texte franais.
Le champ invokes_legislation serait obligatoire tandis que invokes_case serait
facultatif. Chaque dcision pourrait ainsi avoir n triplets de liens lgislatifs et p triplets
de liens jurisprudentiels dans son format RDF. Le champ dcterms :references ne serait
plus utilis que pour des liens autres que de type ELI ou ECLI.

65

Les Conclusions de 2011 stipulent quun instrument lgislatif communautaire doit tre identifi par son code CELEX
et nimposent aucune rgle didentification dun instrument lgislatif national

Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

40

Quel service public pour les donnes de jurisprudence?


_____________________________________________________
Ces liens sont fondamentaux. En permettant un maillage de la jurisprudence sur la
lgislation, ils ouvrent des perspectives de valorisation des donnes judiciaires et
juridiques et des opportunits de nouveaux services commerciaux pour le secteur
priv. Voici quelques exemples danalyses rendues permises par de tels liens :

Textes jamais, ou au contraire souvent, invoqus dans les dcisions de justice

Textes invoqus par diffrents juges type daffaire gal

Comparaison des sanctions prononces dans des dcisions invoquant les


mmes textes

Classification des dcisions de justice selon la classification thmatique des


textes invoqus66

Proposition 17 : Inciter la Commission europenne rapprocher les


groupes de travail sur lELI et lECLI pour une meilleure interoprabilit
des deux normes
4.4.3

Ajout lECLI de mtadonnes supplmentaires


Lorganisation de la Justice en France requiert, pour une recherche efficace des
dcisions de jutice, de descripteurs complmentaires (cf 4.3.5) non dcrits
actuellement par la norme ECLI.
Le coordinateur national ECLI pourrait soumettre chacun de ces autres descripteurs
proposition dinclusion dans la norme. Linstance ECLI europenne examinerait
lintrt de proposer ces descripteurs aux autres juridictions nationales.
A dfaut, ces champs constitueraient une norme nationale complmentaire lECLI, et
leur contenu ne serait pas transmis au portail europen ECLI.

Proposition 18 : Rechercher des convergences de besoins normatifs avec


les autres Etats-membres ayant adopt lECLI

66

Par exemple, les dcisions invoquant des textes europens peuvent tre classes selon les descripteurs Eurovoc
renseigns dans le champ is_about faisant partie des mtadonnes ELI. Les dcisions franaises invoquant des
textes nationaux pourraient ltre selon les descripteurs SARDE si Lgifrance les reportaient dans cette mme
mtadonne.

Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

41

Quel service public pour les donnes de jurisprudence?


_____________________________________________________
5.
5.1

LE SERVICE PUBLIC DE DIFFUSION DE LA JURISPRUDENCE


Dfinitions
La loi pour une Rpublique numrique instaure dans son article 14 un service public de
la donne pour les donnes de rfrence67. Les donnes de la jurisprudence sont plutt
des donnes de production et ne sont pas couvertes par larticle 14. Pour autant,
louverture de la jurisprudence contraint les pouvoirs publics crer, nolens volens, un
certain niveau de service public de la donne jurisprudentielle, en raison du grand
nombre de rutilisateurs potentiels, du caractre continu de la production, de
lexistence dun cycle de vie et de lexigence de qualit de ces donnes.
Dans la suite de cette tude, nous dfinissons le service public de diffusion de la
jurisprudence comme lensemble des services suivants :

5.2

La mise disposition des dcisions anonymises

La recherche de jurisprudence

La gestion des droits dopposition, de rectification ou de suppression

La rectification linitiative de la juridiction

La notification de dcision au justiciable

La dlivrance de copie de dcision

Ladministration des nomenclatures juridiques

Larchivage des dcisions

Le primtre de la diffusion
Les articles 20 et 21 de la loi Rpublique numrique voquent les jugements et
dcisions de justice pour les ordres administratif et judiciaire respectivement. Il
convient den prciser les dfinitions et de dterminer notamment si louverture de la
jurisprudence inclut les diffrents types dordonnance, les rfrs, les non-lieu, les
relaxes, les dcisions damnistie, les nominations

67

https://www.legifrance.gouv.fr/eli/loi/2016/10/7/2016-1321/jo/article_14. La nomenclature des juridictions constitue


un jeu de donnes de rfrence, et devrait, ce titre, tre couverte par le dcret dapplication paratre

Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

42

Quel service public pour les donnes de jurisprudence?


_____________________________________________________
Les quelque quarante Autorits Administratives Indpendantes (AAI) 68 rendent aussi
des jugements ou des dcisions. Mais leur nature et leur volume respectifs sont trs
varis. Les seuls avis motivs de la CNIL introduits par la loi Rpublique numrique,
par exemple, en font-ils partie?
Il conviendrait de faire la liste prcise des AAI pour lesquelles la mise en place dun
dispositif de diffusion spcifique serait justifie. On prcisera aussi si les arrts
locaux, pris par les prfectures ou les municipalits, entrent dans le primtre.
Certains actes de procdure valent peut-tre dcision , tandis que certaines
dcisions formelles ou indites ne sont pas susceptibles dintresser des
rutilisateurs. A linverse, dautres dcisions sont susceptibles dapparaitre identiques
aprs anonymisation mais rester pertinentes replaces dans le contexte de leur chaine
de contentieux propre, ou encore rester pertinentes simplement par leur nombre.
Certaines dcisions peuvent tre explicitement non diffusables, en vertu de la
lgislation ou de la dcision elle-mme, mais garder le bnfice dune identification
par un ECLI et dune publication de leurs mtadonnes. Le texte de la dcision peut
alors tre publi chiffr, ou non publi.
Le primtre de diffusion peut aussi pouser un primtre de juridictions. Par exemple,
les juridictions pour mineurs ou de lapplication des peines doivent-elles en faire
partie? Un rapport de la Cour des Comptes relve-t-il de la jurisprudence?
Larbitrage, bien que hors juridiction par nature, mriterait dtre inclus au
primtre. Une sentence devrait pouvoir tre identifiable par un ECLI, en utilisant le
code juridiction XX prvu par la norme. Laffectation de lidentifiant ECLI et des
mtadonnes pourrait tre initie soit par la plateforme ou le tribunal darbitrage, soit
par le juge de lordre judiciaire qui lhomologue.

Proposition 19 : Adopter un primtre aussi large que possible des


dcisions rendre accessibles et des dcisions rendre ligibles
rutilisation
Enfin, la question du primtre de diffusion porte aussi sur le stock de dcisions
reprendre au moment de lentre en vigueur du dispositif. La profondeur historique du
stock de dcisions clifiable dpendra, selon le juridiction ou le type daffaire ou
de contentieux, de lanciennet de la base de donnes existante, de la facilit relative
dextraction, et des moyens humains disponibles pour effectuer cette opration
exceptionnelle.

68

http://www.vie-publique.fr/decouverte-institutions/institutions/administration/organisation/etat/aai/quelles-sontdifferentes-autorites-administratives-independantes-aai.html

Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

43

Quel service public pour les donnes de jurisprudence?


_____________________________________________________
Proposition 20 : Dfinir une stratgie spcifique de reprise du stock de
dcisions
5.3

Le fait dclencheur de la diffusion


Avec les rectifications, les appels et les pourvois en cassation, une dcision a un cycle
de vie. Quel que soit le processus envisag, il faut assurer le chaine des dcisions lies
entre elles. Et quel que soit le fait dclencheur, laffectation pralable dun ECLI est
prfrable.

Ce fait dclencheur dune publication peut varier selon les juridictions. Cest soit :

La rdaction ou la rectification : dans ce scnario, toute dcision est publiable


ds que sa version initiale ou rectifie est rdige et vrifie, mme si elle est
susceptible de recours.

Le recours : dans ce scnario, la publication est concomittante la


transmission du dossier une juridiction suprieure, y compris jusquau niveau
communautaire. Un dcision non susceptible dappel resterait publiable selon
lun des faits dclencheurs cits plus haut.

Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

44

Quel service public pour les donnes de jurisprudence?


_____________________________________________________

Lpuisement des recours : latteinte de la date dchance du dernier recours


peut entrainer la relche de la dcision dfinitive et avec elle des dcisions
intermdiaires. Lintrt de ce scnario est de permettre de ne publier que les
dcisions qui nont pas t annules.

5.4

Les tapes de la diffusion

5.4.1

Limmatriculation des dcisions


On utilise ici dessein le terme dimmatriculation, dj utilis pour les vhicules, les
entreprises ou les valeurs mobilires. Elle dsigne ici la cration dun identifiant ECLI,
de ses mtadonnes associes et de lURL renvoyant au texte de la dcision. La saisie
des mtadonnes peut tre effectue en mme temps que la cration de lECLI, ou
ultrieurement.
Trois procdures peuvent tre envisages (cf 5.5).

Proposition 21 : Etudier les modalits dintgration du processus


dimmatriculation des dcisions de justice dans les chaines applicatives
civile, pnale et administrative
5.4.2

La normalisation des mtadonnes


Il est vraisemblable que toutes les juridictions ne fourniront pas leurs mtadonnes
dans un mme format. Par exemple, Portalis pourrait fournir ses dcisions de justice
dans un format propre, et Cassiope les siennes dans un autre, notamment parce que
ces structures de fichiers leur servent dj pour communiquer avec dautres systmes
dinformations de lEtat. Du reste, les flux dj reus par la DILA en provenance des
cours suprmes ont chacun leur propre format.
La normalisation consiste donc remanier les (mta)donnes entrantes pour les loger
dans une mme base de donnes de la DILA.

Proposition 22 : Confirmer la DILA dans sa responsabilit de


normalisation des mtadonnes ECLI et complmentaires
Plusieurs AAI ont mutualis leurs moyens et locaux travers le projet Fontenoy-Sgur.
La mme dmarche pourrait prsider la conception dun format unique de mise
disposition de leurs dcisions auprs de la DILA. Cela rduirait dautant la charge de
normalisation chez celle-ci.
Quoi quil en soit, un inventaire des applications appeles fournir des fichiers la
DILA simposera.
Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

45

Quel service public pour les donnes de jurisprudence?


_____________________________________________________
5.4.3

Lajout de titres et de liens


Cet enrichissement en mtadonnes porte sur :

les liens, vers la lgislation ou dautres dcisions

le classement thmatique de la dcision

La DILA procde dj un traitement danalyse smantique sur les textes lgislatifs,


puisquelle extrait les rfrences juridiques pour les transformer en hyperliens vers
dautres textes et quelle procde aussi au titrage de ces textes avec son systme
SARDE. Elle pourrait donc tre naturellement appele exploiter son savoir-faire sur
les corpus jurisprudentiels.
Toutefois, le classement thmatique des dcisions pourrait sappuyer sur le thsaurus
Jurivoc dvelopp par la Chancellerie au lieu de SARDE.

Proposition 23 : Dfinir des rgles dcriture des mtadonnes assurant


linteroprabilit de la jurisprudence franaise avec la jurisprudence
europenne et la lgislation
5.4.4

Lanonymisation
Le traitement danonymisation peut tre distribu sur toute la chaine de production.

Lcriture en privacy by design : le principe de minimisation est ici pris


en compte ds la rdaction de la dcision, en particulier quand elle la dcision
est saisie dans un outil daide la rdaction. Elle a lieu au tribunal et peut tre
issue dun change itratif entre le juge et le greffier. Les donnes personnelles
ncessaires lintelligibilit dune dcision par un lecteur ayant droit den
connatre sont en clair ce stade.

La pr-anonymisation : dans ce scnario, ljanonymisation nintervient


quune fois la dcision de justice signe, ou du moins valide. Elle est effectue
au tribunal. Elle peut tre issue dun accord avec les parties, et dans ce cas
effectue manuellement. Elle peut aussi tre effectue avec un outil
danonymisation automatique, paramtr selon les rgles dfinies pour le type
de juridiction et le type daffaire concerne. Les donnes ayant subi ce niveau
danonymisation sont perdues dfinitivement.

Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

46

Quel service public pour les donnes de jurisprudence?


_____________________________________________________

Lanonymisation centralise : dans ce scnario, lanonymisation est


postrieure la signature de la dcision et comprend ncessairement une
premire phase dautomatisation. Le traitement peut tre pris en charge par la
tte juridictionnelle (Cour de Cassation ou Conseil dEtat) ou par la DILA.

Proposition 24 : Mesurer leffort dinvestissement requis dans les chaines


applicatives civile, pnale et administrative, pour les rendre conformes au
principe de privacy by design
Lcriture en privacy by design , conue pour supprimer tout besoin
danonymisation ultrieur, ne peut tre quun objectif long terme pour la plupart des
juridictions, compte tenu de linvestissement requis. Dans un premier temps,
lanonymisation peut tre effectue en une seule fois, dans un traitement centralis. En
cible, il peut aussi tre distribu selon ces 3 tapes de la chaine de production.
5.4.5

La mise disposition
La mise disposition peut tre effectue par :

mise en ligne, pour affichage sur un portail web,

export de fichier, dans un format structur lintention de rediffuseurs,

enregistrement sur le Web smantique,

ou une combinaison de ces trois modes.


La dcision peut tre mise en ligne soit par la juridiction elle-mme, soit par la Cour de
Cassation, si elle relve de lordre judiciaire, et par le Conseil dEtat, si elle relve de
lordre administratif. Les dcisions de chacune des cours suprmes sont dj
disponibles sur leur portail respectif. Cela peut aussi dpendre du type de juridiction.
Par exemple, la jurisprudence dune chambre rgionale des comptes peut encore tre
mise en ligne par celle-ci ou par la Cour des Comptes. Dautres juridictions peuvent
sans doute mettre en ligne leur jurisprudence cot raisonnable sur leur portail dj
existant.
La DILA devrait avoir un rle de centralisation et de normalisation69 des mtadonnes
et de mise disposition de lensemble de la jurisprudence. En mettant en ligne chaque
dcision, elle encapsulera les mtadonnes dans la page HTML sous forme dtiquettes
RDFa. Cette mise en ligne ne sera pas redondante avec celle des juridictions, car elle
seule permet la rutilisation par des machines.
69

Les 3 flux existants en provenance des cours suprmes fonctionnent en 3 silos utilisant des rgles de gestion
diffrentes. Les processus existants ne peuvent donc tre extrapols. Au contraire, il faudrait envisager un processus de
centralisation qui puisse englober le jour venu les cours suprmes.

Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

47

Quel service public pour les donnes de jurisprudence?


_____________________________________________________
Cette mise en ligne peut tre complte par un enregistrement sur le Web smantique.
Le scraping (grattage) des tiquettes RDFa et leur transformation en triplets RDF
devrait une opration simple. Elle permettrait de diriger les rutilisateurs vers le triple
store plutt que vers le portail Lgifrance. La collecte des mtadonnes devrait sen
trouver facilite pour les rutilisateurs et le serveur du portail Lgifrance sen trouver
soulag : sa priorit reste dassurer un bon confort dutilisation pour les internautes. La
constitution dun triple store permettrait aussi dassurer linteroprabilit de ses
mtadonnes avec celles du CELLAR, et dviter ainsi la gnralisation du flux de
transfert existant avec le portail europen.

Proposition 25 : Dfinir des modalits de mise disposition de la


jurisprudence de nature assurer une quit de traitement entre
rutilisateurs publics ou privs
Le flux de jurisprudence peut encore faire lobjet dun export de fichier XML. Le
mme format de fichier peut tre propos aux rutilisateurs privs, au portail open
data franais70, administr par Etalab, et au portail europen. Il reste que
ladministration dun tel flux a un cot. La DILA pourrait imposer aux rutilisateurs
(les diteurs juridiques, mais aussi le Barreau de Paris, qui a son propre projet de base
de donnes juridiques) de venir interroger un triple store chez elle au lieu de recevoir
chez eux un flux prt lemploi.
Il faut encore dterminer si la mise en ligne (pour une rutilisation par des humains),
lenregistrement dans le triple store et lexport de fichier (pour un rutilisation par des
machines) doivent tre simultans, ou si les deux derniers doivent tre subordonns
la premire.

70

Les contenus des bases de jurisprudence ouvertes de la DILA sont dj transmis quotidiennement Etalab, mais en
autant de silos quil y a des bases sources, et ces donnes ne sont pas normes selon ECLI

Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

48

Quel service public pour les donnes de jurisprudence?


_____________________________________________________
5.5

Le circuit de production
Le schma ci-aprs illustre le circuit de la dcision des producteurs jusquaux
rutilisateurs :

Schma gnral des flux


Ordre
judiciaire

Ordre
administratif

lgifrance

data.gouv.fr

e-justice.europa.eu

diteurs juridiques

La partie du circuit situe chez les producteurs peut tre organise de diffrentes
manires.
5.5.1

Scnario 1 : transmission simultane des dcisions et des mtadonnes


Dans ce scnario, qui sapplique dj au Conseil Constitutionnel et au Conseil dEtat,
limmatriculation est laffaire de la juridiction elle-mme. Elle fabrique lECLI en
structurant en particulier le numro dordre de faon discrtionnaire. Elle veille
labsence de doublons, et prend en charge rectifications et annulations.
Les dcisions sont transmises simultanment avec leurs mtadonnes au sein dun
mme fichier de format XML, conformment au schma ci-aprs :

Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

49

Quel service public pour les donnes de jurisprudence?


_____________________________________________________

Le format XML tant dfini par chaque juridiction, la DILA assure alors un rle de
normalisation, en distinguant les mtadonnes propres lECLI et les autres
mtadonnes propres aux spcificits franaises.
Ce scnario a lavantage de prserver lautonomie oprationnelle de la juridiction.
Cependant, il suppose que celle-ci ait des moyens techniques (XML) et humains
(gestion des rectifications) comparables ceux des deux hautes juridictions. De plus,
lenrichissement des mtadonnes sera vcu comme une contrainte, et le flux transmis
la DILA risque dtre pauvre.
5.5.2

Scnario 2 : transmission spare des dcisions et des mtadonnes


Ce scnario consisterait superposer un circuit de diffusion des mtadonnes parallle
la chaine de traitement des dcisions actuelle, que ce soit dans Portalis, pour les
affaires civiles, Cassiope, pour les affaires pnales, ou Ariane pour les contentieux de
lordre administratif.
Chaque juridiction numrote et qualifie ses dcisions, et les envoie la DILA dans son
format spcifique, charge pour cette dernire de les normaliser comme dans le
scnario prcdent.
Ce scnario pourrait sappliquer pendant une priode de transition jusqu ce que dans
les chaines applicatives Portalis, Cassiope et Ariane intgrent lECLI et la saisie des
mtadonnes la source des dcisions.
Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

50

Quel service public pour les donnes de jurisprudence?


_____________________________________________________

Des variantes de ces deux scnarios peuvent tre imagines selon les juridictions. En
particulier, le processus danonymisation peut aussi tre assur par la DILA ou un
prestataire de confiance dont cest la spcialit.
Ces scnarios, tactiques, peuvent tre tudis avec la participation des personnels
concerns. Magistrats, greffiers, fonctionnaires de la Direction des Services Judiciaires
et de la DILA pourraient tre runis dans des ateliers de co-conception ddis aux
filires civile et pnale respectivement. Des ateliers similaires pourraient tre monts
avec des magistrats du Conseil dEtat pour la filire administrative. Les ateliers
seraient orients vers la recherche de solutions damlioration simple ( quick wins )
de nature faciliter louverture de la jurisprudence sur un plan pratique.

Proposition 26 : Animer des ateliers de co-conception, dans chaque filire


juridictionnelle, en vue de dgager des quick wins facilitant
louverture de la jurisprudence

Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

51

Quel service public pour les donnes de jurisprudence?


_____________________________________________________
5.5.3

Scnario 3 : immatriculation des dcisions par la DILA


Une immatriculation des dcisions totalement dcentralise est ncessairement source
derreur, dautant que les juridictions sont nombreuses et htrognes. Dans cet autre
scnario, qui pourrait tre la cible, la saisie des mtadonnes, contrle et adapte au
type de juridiction, pourrait tre assure par un portail unique, qui renverrait un
identifiant ECLI en temps rel.
Cest un modle analogue NORIA, le systme mis en place par la Banque de France
pour limmatriculation avec un code ISIN des titres de crances ngociables mis par
lensemble des banques franaises71.

Ce portail pourrait tre exploit par la DILA et seules des personnes habilites dans les
juridictions y auraient accs.

71

Banque de France, Identification des Titres de Crances Ngociables par le code ISIN dans le
projet NORIA, https://www.banquefrance.fr/fileadmin/user_upload/banque_de_france/Stabilite_financiere/Analyses_de_la_bdf/utilisation_code_isin.pdf

Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

52

Quel service public pour les donnes de jurisprudence?


_____________________________________________________

Lidentifiant ECLI renvoy par le portail serait ensuite report dans la chaine de
traitement des dcisions.

Proposition 27 : Choisir pour les dcisions futures un scnario de circuit


de production de la jurisprudence anonymise et enrichie en mtadonnes
5.6

Les autres tches de gestion

5.6.1

La recherche de jurisprudence
En principe, toute dcision publiable devrait tre disponible sur au moins 3 portails :
celui de lordre judiciaire (justice.fr et/ou courdecassation.fr) ou administratif (conseiletat.fr), selon le cas, celui de la DILA (legifrance.fr) et celui de lUnion europenne (ejustice.europa.eu).
Cela ne signifie pas que ces portails font triple emploi. Comme le montre le tableau ciaprs, ils se diffrencient par le jeu de critres de recherche et le dtail du contenu
affichable.

Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

53

b
b

b
b

b
b
b

b
b
b
b

b
b

b
b
b

b
b

data.gouv.fr

e-justice.europa.eu

lgifrance.fr

dcisions de l'ordre judiciaire


dcisions de l'ordre administratif
recherche par identifiant ECLI
recherche par autre identifiant
recherche avance :
- mtadonnes ECLI
- mtadonnes complmentaires
version originale certifie
chaine des actes de procdure
versions traduites anonymises
doctrine d'Etat
hyperliens sur lgislation

conseil-etat.fr

(hypothse de cible)

courdecassation.fr

Fonctionnalits des
portails de recherche de
jurisprudence

justice.fr

Quel service public pour les donnes de jurisprudence?


_____________________________________________________

b
b

b
b
b

Justice.fr et conseil-etat.fr72 ont une vocation daide au justiciable, donc ces portails
pourraient proposer une interrogation sur un numro dacte de procdure ou sur un
ECLI. A terme, ils devraient galement proposer au justiciable un accs de type
extranet , lui permettant de consulter lensemble des affaires et actes le concernant.
Les dcisions pourraient alors y apparatre dans leur version non anonymise et
certifie (ayant valeur probante). Affiche au format PDF, la dcision serait mme
tlchargeable par le justiciable.
Lgifrance, quant lui, a une vocation gnraliste. Toute personne devrait pouvoir y
lancer une recherche de dcision(s) de justice, sans authentification pralable 73. Cest
alors bien entendu la version anonymise qui serait affiche. Le portail pourrait
proposer comme critres de recherche non seulement les mtadonnes ECLI, mais
galement des mtadonnes complmentaires communes lensemble des juridictions
franaises, celles affectes par la DILA au terme du processus de normalisation.
Lgifrance jouerait ainsi un rle comparable au portail amricain PACER74.

72

http://www.conseiletat.fr/content/download/2392/7204/version/1/file/manuel_utilisation_base_jurisprudence_internet.pdf
73
Comprenant a minima les critres de recherche actuels sur
https://www.legifrance.gouv.fr/Aide/Utilisation/Jurisprudence-judiciaire-recherche-experte
74
Public Access To Court Electronic Records, https://www.pacer.gov

Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

54

Quel service public pour les donnes de jurisprudence?


_____________________________________________________
Proposition 28 : Clarifier les rles respectifs des diffrents portails
publics dans la publication de la jurisprudence
Le portail europen a la mme vocation gnraliste que Lgifrance, mais il ne
proposera par dfinition que des mtadonnes ECLI comme critres de recherche.
Ces deux portails devraient proposer un mode de recherche plein texte . Ils
pourraient tre soumis une saisie de captcha afin dinterdire tout traitement
itratif automatis par une machine, et donc prvenir toute rutilisation frauduleuse.
Data.gouv.fr, le portail dEtalab, continuerait publier la jurisprudence fournie par la
DILA selon des modalits analogues tout autre jeu de donnes ouvertes. Il sadresse
des utilisateurs occasionnels, qui tlchargent une base entire dune source donne,
prsente en format XML et poursuivent leur recherche de dcision aprs rapatriement
chez eux.
Enfin, ces portails porteront la mention du caveat CNIL75.
5.6.2

La gestion des droits dopposition, de rectification et de suppression


Lanalyse dimpact sur la vie prive dun corpus donn de jurisprudence peut laisser
entrevoir des dfauts danonymisation sur une petite proportion des dcisions. Des
noms peuvent avoir travers les mailles du filet (par exemple, le nom dun avocat qui
savre tre partie au procs) ou avoir donn lieu r-identification. Le justiciable
sapercevant de cela peut alors exercer son droit dopposition en vertu des articles 38
et 40 de la Loi Informatique & Liberts76.
Dautre part, comme on la vu plus haut, une dcision a pu explicitement sipuler la
publicit du nom de la personne condamne. Cette publicit devrait tre limite dans le
temps, et cette dure devrait tre spcifie dans la dcision, ou dfaut tre une dure
prvue par la CNIL. A lexpiration de cette dure, la dcision devrait tre anonymise
de prfrence la seule initiative du producteur du corpus concern. Au-del de ce
dlai, elle doit pouvoir ltre linitiative du justiciable.

75
76

http://rip.journal-officiel.gouv.fr/index.php/content/download/620/3209/file/CAVEAT_RIP_2015_09_10.pdf
https://www.legifrance.gouv.fr/affichTexte.do?cidTexte=JORFTEXT000000886460&dateTexte=20161226

Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

55

Quel service public pour les donnes de jurisprudence?


_____________________________________________________
Les rgles danonymisation post-diffusion doivent tre spcifies :

Dfinition de lorgane responsable (DILA, CNIL, chancellerie, juridiction


concerne) et du service responsable dans cet organe ;

Dfinition des modalits de saisine par le justiciable : canal de communication,


guichet

Choix du processus danonymisation : la main, si le processus automatique


initial sest rvl dfaillant, automatique, si le processus automatique a t
amlior depuis, voire chiffrement pur et simple de la dcision, si toute
anonymisation manuelle parfaite devait retirer toute intelligibilit au document
rsiduel ;

Modalits de notification des anonymisations post-diffusion lintention des


signataires de licence de rutilisation (en premier lieu les diteurs juridiques),
pour rpercussion de lanonymisation dans leurs bases de donnes.

Enfin, un justiciable ayant fait lobjet dune dcision avec publicit de son nom peut
exiger une rectification des donnes personnelles qui y figurent, si elles sont errones.
5.6.3

La rectification linitiative de la juridiction


Certains types de juridiction prvoient spcifiquement une fonction de rectification,
par laquelle une erreur factuelle contenue dans une dcision de justice dj publie se
trouve corrige.
La norme ECLI prvoit quune rectification entraine renumrotation de la dcision :
Une fois qu'un ECLI a t associ un document, il doit le rester. Les
renumrotations sont pourtant invitables en raison d'erreurs administratives ou
lorsqu'un ECLI est attribu des dcisions pour lesquelles il y avait dj un ancien
code juridiction de type XX [conformment au paragraphe 1, point 1 c) vii)] .
La rectification doit tre effectue sur la base du texte initial, donc avant
anonymisation.
En plus de limmatriculation dun ECLI de rectification, il faudra donc mettre jour
lECLI initial en y renseignant lECLI de rectification dans le champ
dcterms :isReplacedBy (cf 4.3.3). Comme la rectification porte sur la rdaction de la
dcision, lECLI de rectification doit reprendre les mmes mtadonnes que lECLI
initial, et donner lieu autant de manifestations que lECLI initial (cf 4.4.1).
Outre cette rectification au sens dun acte de procdure, il faudrait laisser ouverte la
possibilit, pour la puissance publique, de modifier ultrieurement et plus forte raison
enrichir les mtadonnes ECLI facultatives ainsi que les mtadonnes
Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

56

Quel service public pour les donnes de jurisprudence?


_____________________________________________________
complmentaires non-ECLI. Il suffit de mettre jour simultanment une mtadonne
contenant la date de dernire mise jour (cf 4.3.5).
5.6.4

La notification de dcision au justiciable


La dcision de justice est notifie en fin dinstance aux justiciables, que le jugement ait
t prononc publiquement ou non. Sauf exception, la dcision mentionne les noms,
adresses et professions des parties, ne serait-ce que pour que cette dcision leur soit
opposable77.
Cette notification, aujourdhui effectue uniquement sur support papier, devrait tre
dmatrialise. Conformment au rglement EIDAS sur lidentification lectronique et
les services de confiance78, la notification devrait tre produite avec un certificat
lectronique de faon lui confrer une valeur probante pour le justiciable.

5.6.5

La dlivrance de copie de dcision


Larticle 11-3 de la loi n 72-626 du 5 juillet 1972 affirme que les tiers sont en droit
de se faire dlivrer copie des jugements prononcs publiquement 79.
Louverture de la jurisprudence permet denvisager la suppression terme de cette
procdure la charge des greffes.
La dlivrance de copie pourrait tre prise en charge par les applications Portalis,
Cassiope et Ariane, selon la juridiction et le calendrier du projet de dmatrialisation
des processus des greffes. Lenjeu fonctionnel sera de diriger la requte vers la version
originale ou la version anonymise de la dcision selon le statut du requrant,
notamment selon quil est partie ou non au procs, et selon le type de contentieux, tout
en lui proposant pour critres de recherche les mmes mtadonnes que celles
rutilisables par les rediffuseurs privs.

Proposition 29 : Etudier lopportunit de ramnager les services de


notification et de dlivrance de copie de dcision la faveur de ce projet

77

Synthse de lintervention aux Journes Europennes dInformatique Juridique de novembre 2012 Paris sur le
droit des donnes juridiques , Thomas Saint-Aubin (Paris I), http://www.patrimoine-immateriel.fr/wpcontent/uploads/2014/02/Intervention_Legal_Access_2012_droit_donnees_juridiques_Thomas_Saint-Aubin.pdf
78
https://www.ssi.gouv.fr/entreprise/reglementation/confiance-numerique/le-reglement-eidas/
79
https://www.legifrance.gouv.fr/affichTexte.do?cidTexte=LEGITEXT000006068446

Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

57

Quel service public pour les donnes de jurisprudence?


_____________________________________________________
Ladministration des nomenclatures juridiques

5.6.6

La nomenclature cible des juridictions (cf 4.3.2) devra tre mise jour en fonction
des volutions de la carte judiciaire et des autres juridictions. Ce rle dadministration
devrait tre assur par la DILA.
Si la formation de lECLI incombe aux juridictions (scnarios 1 et 2 supra), il faudra
spcifier la procdure de rectification dECLI comprenant un code juridiction non
conforme la nomenclature en vigueur.
Il appartiendra aux diteurs juridiques de procder dventuels retraitements pour
restituer une cohrence des dcisions de la justice avant et aprs des changements dans
la nomenclature des juridictions.
Larchivage

5.6.7

Le volume cible de la jurisprudence ouverte, en version brute et en version


anonymise, na de commune mesure ni avec le volume actuel de la jurisprudence
ouverte ni avec le volume de la lgislation ouverte.
Les pouvoirs publics seront donc amens dfinir une politique darchivage qui tienne
compte en particulier de deux facteurs :

Le besoin de consultation des dcisions dcroit avec leur anciennet ;

Les rgles applicables au traitement des donnes dune personne tombent avec
son dcs80 : toute dcision relative une personne dcde peut tre dite en
clair.

Cette politique pourra sarticuler sur le projet, initi en 2015, appel VITAM (Valeurs
Immatrielles Transmises aux Archives pour Mmoire)81, qui pourrait par ailleurs
devenir un outil big data pour ltat et les administrations centrales82.

Proposition 30 : Anticiper une politique darchivage de la jurisprudence

80

Considrant 27 du RGDP : Le prsent rglement ne s'applique pas aux donnes caractre personnel des personnes

dcdes
81

Plus de dtails sur http://www.modernisation.gouv.fr/ladministration-change-avec-le-numerique/par-son-systemedinformation/vitam-vers-un-socle-d-archivage-electronique-commun-toute-l-administration


82
http://www.fnccr.asso.fr/wp-content/uploads/2016/11/Rapport-final_TACTIS_PARME-avocats.pdf, p40

Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

58

Quel service public pour les donnes de jurisprudence?


_____________________________________________________

Les 30 Propositions
Proposition 1.

Dresser un inventaire des rgles actuelles danonymisation par type


de juridiction

Proposition 2.

Privilgier la minimisation en amont et lanonymisation en aval


de la chaine de production des dcisions, de faon pouvoir traiter
les cas particuliers en fonction de la qualit du lecteur ou du contrat
de licence de rutilisation

Proposition 3.

Clarifier les finalits possibles de rutilisation de la jurisprudence

Proposition 4.

Dsigner qui, de la juridiction ou de la tte juridictionnelle, porte la


responsabilit du traitement, dune part, et de lanalyse dimpact,
dautre part

Proposition 5.

Dfinir une mthodologie danalyse dimpact qui soit unique et


applicable lensemble des juridictions

Proposition 6.

Dfinir un modle oprationnel de publication de lanalyse


dimpact

Proposition 7.

Engager un projet de recherche avec un laboratoire de linguistique


en vue dune solution de reformulation automatique dun texte
selon le principe de minimisation

Proposition 8.

Publier en open source le code informatique de toute technique


danonymisation par auto-apprentissage

Proposition 9.

Engager un projet de recherche sur lapport de la cryptographie


lanonymisation

Proposition 10.

Elaborer un plan dassurance-qualit de lanonymisation

Proposition 11.

Faire de lanalyse dimpact un outil de transparence et de


pdagogie du risque de dfaut danonymisation

Proposition 12.

Ouvrir le droit de rutilisation de la jurisprudence sur le champ


territorial le plus large possible et sans restriction quant au statut
professionnel du rutilisateur

Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

59

Quel service public pour les donnes de jurisprudence?


_____________________________________________________
Proposition 13.

Editer un guide de bonnes pratiques lintention des diteurs


juridiques et autres rutilisateurs potentiels, sur le modle des
packs de conformit sectoriels existants

Proposition 14.

Faire participer la France la poursuite des travaux de


normalisation europenne sur lECLI

Proposition 15.

Etablir une nomenclature des codes de juridictions homogne,


intuitive, exhaustive et compatible lECLI

Proposition 16.

Dresser linventaire dtaill des mtadonnes, ECLI ou non,


requises par la rutilisation des dcisions de justice, selon leur
juridiction ou type de contentieux

Proposition 17.

Inciter la Commission europenne rapprocher les groupes de


travail sur lELI et lECLI pour une meilleure interoprabilit des
deux normes

Proposition 18.

Rechercher des convergences de besoins normatifs avec les autres


Etats-membres ayant adopt lECLI

Proposition 19.

Adopter un primtre aussi large que possible des dcisions


rendre accessibles et des dcisions rendre ligibles rutilisation

Proposition 20.

Dfinir une stratgie spcifique de reprise du stock de dcisions

Proposition 21.

Etudier les modalits dintgration du processus dimmatriculation


des dcisions de justice dans les chaines applicatives civile, pnale
et administrative

Proposition 22.

Confirmer la DILA dans sa responsabilit de normalisation des


mtadonnes ECLI et complmentaires

Proposition 23.

Dfinir des rgles dcriture des mtadonnes assurant


linteroprabilit de la jurisprudence franaise avec la jurisprudence
europenne et la lgislation

Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

60

Quel service public pour les donnes de jurisprudence?


_____________________________________________________
Proposition 24.

Mesurer leffort dinvestissement requis dans les chaines


applicatives civile, pnale et administrative, pour les rendre
conformes au principe de privacy by design

Proposition 25.

Dfinir des modalits de mise disposition de la jurisprudence de


nature assurer une quit de traitement entre rutilisateurs publics
ou privs

Proposition 26.

Animer des ateliers de co-conception, dans chaque filire


juridictionnelle, en vue de dgager des quick wins facilitant
louverture de la jurisprudence

Proposition 27.

Choisir pour les dcisions futures un scnario de circuit de


production de la jurisprudence anonymise et enrichie en
mtadonnes

Proposition 28.

Clarifier les rles respectifs des diffrents portails publics dans la


publication de la jurisprudence

Proposition 29.

Etudier lopportunit de ramnager le service de dlivrance de


copie de dcision la faveur de ce projet

Proposition 30.

Anticiper une politique darchivage de la jurisprudence

Un cahier des charges en 30 propositions, pour russir lopen data des dcisions de justice

61