Vous êtes sur la page 1sur 8

Etapes de prise en charge des demandes

en science des données

Visualiser

Ordonner
Importer Transformer Communiquer
(tidy)
Modéliser

Explorer
Programmer

Source : R for Data Science,


Hadley Wickham, r4ds.had.
co.nz
Application en R

Visualiser
Plot
Ordonner Ggplot
Importer Transformer Communiquer
(tidy) tables Rmarkdown
Readr, Readxl Tidyr Dplyr
Haven Modéliser Knirt
Dplyr
DBI DT
Lubridate base
Httr, xml Explorer Shiny
Janitor Caret Openxlsx
Programmer H2O OfficeR
BupaR
Target
Stan
...
Flux de prise en charge des demandes d'analyse de données hospitalières

La prise en charge d’une demande en science des


/ demandes SciDonHUS Légende
Dernière date de mise à jour : 07/04/2021
Document de travail Debut / fin du processus
Qui ? Base documentaire / Support
Action

donnée ne se limite pas au traitement des données


Acteur (1 couleur = 1 acteur)

Initiation de la demande
Commentaires, éléments à
Demandeur
discuter
(tout personnel des HUS Besoins d'analyser des données du système d'information hospitalier Action détaillée à
ou extérieur) part (fonction)

Ouvrir un ticket sur la plateforme recherche


Sélectionner les ressources demandées
Plateforme recherche

Cadrage
Définir ce qui entre dans les finalités de
Cadrage de la demande
SciDonHUS
= travaux scientifiques Autre circuit (DIM,
Comité des études Demande entrant dans les finalités de Non DSI, DRCI, autre
Expert référent SciDonHUS ?
service)
1 référent par ticket. Oui Nouveau ticket avec même référent
Il demande des avis.

Comprendre problématique métier


A voir si à intégrer dans
Echange pour valider en première lecture les principaux Courriel / Téléphone / Ouvrir un nouveau plateforme recherche


prérequis (scientifique, méthodologique, technique, Echange direct ticket avec le même
règlementaire, éthique, sécurité, faisabilité) référent en effectuant
Faisabilité = vérifier en particulier si les modifications
données disponibles ou pouvant être
Mise à jour du ticket intégrées

Evaluer le faisabilité
Comité des études oui
Après échanges et modifications, vérifier si la demande
Expert + responsable plateforme est valide sur les principaux éléments sans changement
majeurs et dans un délai compatible ●
Est-il possible à terme de modifier

Rédiger un protocole
Demande valide non Clore ticket la demande pour qu'elle soit
valide ?

Comité des études - Expert


oui
Aide à l'écriture du protocole pour la partie minimiser les non
Demande non prise

en charge
extraction et analyse des données données exposées

Important ++
A la charge du demandeur Finaliser le protocole
avec l'aide des experts
des données, méthodo...
pour écrire Signature de la charte d'utilisation de la
plateforme

Validation règlementaire, scientifique et éthique

Comité de gouvernance
Ouvrir un ticket règlementaire

décide par quelle(s) structure(s) la


Comité de gouvernance
(ou comité des études par
Ouvrir un ticket avis scientifique et éthique

décide vers quelle(s) structure(s)


Validation
Scientifique
(ou comité des études par envoyer la demande
partie règlementaire doit être évaluée délégation)
délégation)


Expert ethique et scientifique
Expert règlementaire

Avis déjà acquis et


Expert règlementaire (DPD, Accompagner la réaliser des démarches reconnu ou non oui
DRCI...) (inscription au registre local, conformité MR,

Règlementaire
nécessaire
registre public des traitements, demande


CNIL...)
Possibilité d'un circuit plus court si dans le Experts scientifiques et
ticket est coché certaines conditions (ex : éthique
suit parfaitement une MR ou recherche examen CPP et/ou CESRESS et/ou
interne) Contexte multicentrique Conventionnement / Comité gouvernance (selon le cas)

Ethique
(partenariat extérieur) Valorisation / Contrat /
Partenariat


non

Documenter Documenter
Clore ticket règlementaire Clore ticket avis scientifique ou éthique

Comité des études constate que tous les pré-requis sont


valides et que l'étude est autorisée

Etude autorisée non

Accès aux données


Mise en place des accès, extraction des données Publier l'étude sur le portail recherche publique ?

Le besoin création de flux a déjà été évalué aux


premières étapes de faisabilité Demandes de création de flux ou

Consommateur
Besoin de création de flux ? oui d'accès complémentaires (ex : flux

Identifier sources / nettoyer / valider


Création du flux peut être initiée plus tôt dès que de données non existant)
l'étude est viable

non ●
DSI
Création de nouveaux flux /

Créer datamart / Gérer les droits de temps


Comité des études
modification
Datamanager/dataenginer

Comité des études


Extraction des données dans l'EDS

Datascientist
Création du datamart de l'étude

Lier le datamart au ticket


Créer un dossier partagé
sécurisé sur réseau pour les
artefacts ?

Demandeur Exploitation du datamart via eHOP

Analyse, production des résultats

Besoins d'une plateforme Signature charte de la plateforme


d'analyse avancée ?
oui
d'analyse Charte
Comité des études

Visualiser
Ne procède aux analyses que
Datamanager Création d'un datamart matérialisé ceux qui ont les compétences
Méthodologiste avec mes outils fournis

Ouverture d'un accès à la plateforme


d'analyse avancée (ex : Rstudio Server)
non
Lier datamart à la plateforme d'analyse

Réalisation autonome des analyses

Plannification des ressources humaines selon le


Importer Ordonner Transformer Communiquer
(tidy)
Besoin d'une prestation oui
besoin (simple analyse, biostat avancée,
d'analyse ? apprentissage auto...)

Réalisation des analyses, mise en forme,

Modéliser
vérification

Remise des résultats

Explorer
Validation des résultats (recette)

Valorisation en citant SciDonHUS

Programmer
Cloture du ticket
Outils « traditionnels »
Cadrage

Comprendre problématique métier Problèmes :

Evaluer le faisabilité Traitement de texte ● Multiplicité des outils

Rédiger un protocole Tableurs ●
Non reproductible
Validation Emails ●
Non traçable

Scientifique Papier / Crayon ●
Puissance calcul

Règlementaire ●
Données sur disque

Ethique ●
Difficile de mettre à l’échelle

Manque de visibilité
Accès aux données Saisie dans tableur

Identifier sources / nettoyer / valider SQL

Créer datamart / Gérer droits Export csv / xlsx depuis logiciel BI

Visualiser
4 – 8 Go de RAM
Ordonner … dont 2 à 4 occupé par système
Importer Transformer Communiquer Sous Windows
(tidy)
CPU i3
Modéliser Interdiction données sur disque
Explorer Réseau max 10Mo/s
Certains datant de 2011
Programmer Pas de GPU possible
Plateforme cible aux HUS
Cadrage

Comprendre problématique métier

Evaluer le faisabilité

Rédiger un protocole
Suivi par système de « ticketing »
Validation

Scientifique

Règlementaire

Ethique
Analyse reproductible
Accès aux données DB : Infocentre / eHOP / autre

Identifier sources / nettoyer / valider

Créer datamart / Gérer droits

Visualiser

Importer Ordonner Transformer Communiquer


(tidy)
Modéliser
Explorer
Programmer
Piles logicielles Client HTTP

Frontend:

Backend :

Services : HTTP, PostGreSQL, SSH...

OS : GNU/Linux
(Debian / Ubuntu / RHEL / Centos / SUSE)
Plateforme cible BioConductor CRAN GitHUB INLA

BDD R SPM
Géré à part en root
par SysAdmin

(à voir par la suite)

Permet de faire de
datamart l'intégration continue Internet

Forge logicielle
interne (GitLab) ?
VM

EDS HTTPS
RStudio Connect

ODBC

Permet d'avoir

RStudio Package différents runtimes de
Rstudio WorkBench
manager R (et packages liés à
ODBC une version de R
donné)
Infocentre

Dossiers utilisateurs
HTTPS
(Scripts, résutlats,
données intermédiaires)

Serveur d'archive ?
/home/jmuller
/home/eas
Que du stockage
(> 1To)
SAMBA chiffré 
LDAP
Poste client

Vous aimerez peut-être aussi