Vous êtes sur la page 1sur 14

TD3- Exploration des

données supplémentaires

BS1/CB1/BE6/BS3/CB3/BS5/
Pour la séance asseyez vous près des membres de votre équipe

Objectif:
Explorer les données supplémentaires d’un article scientifique

TD3: s’approprier les données


- comprendre d’où viennent les données
- identifier et comprendre la nature des données
- identifier 2 questions scientifiques à partir de ces données
- pour chaque question identifier les variables X et Y

TD4: synthétiser et présenter: pour les 2 questions


- décrire synthétiquement les variables Y et X
- représenter graphiquement les données
TD5:pour les 2 questions
- travail en autonomie en équipe sur l’analyse statistique et le rapport

TD6: pour les 2 questions


- point d’avancement
- point sur les tests d’inférence
- point sur la rédaction du rapport
Comprendre d’où viennent les données?

Si pas déjà fait en TD1, télécharger le dossier


https://datadryad.org/stash/dataset/doi:10.5061/dryad.7v72n64

-désarchiver

- ouvrir le tableau ALAN data proc b CSV.csv dans excel ou calc

- ouvrir le fichier README.txt


Comment ces données ont été acquises ?
Livrable 1 pour le 15 janvier 2022, 2 pages max
=> introduction + insertion d’au moins 2 références
bibliographiques avec Zotero

=> résumé du matériel et méthode


et un schéma du plan expérimental

=> liste des références bibliographiques utilisées dans


l’introduction
Exercice: 15-20 min
1- Lire le résumé de l’article et fin de l’introduction de l’article:
quels sont les objectifs des auteurs?

2- Lire le matériel et méthode:


Identifier:
- Le modèle biologique
- Le nombre d’individus testés
- le nombre de sites
- les traitements expérimentaux
- le nombre de réplicats par traitement
- les variables mesurées

HPA: axe hypothalamo-hypophyso-surrénalien contrôle les réactions au


stress et régule aussi la digestion et le système immunitaire
Dexamethasone: hormone glucocorticoïde de synthèse qui a un effet anti-
inflammatoire et immuno-suppresseur

BSL-3 facility: laboratoire confiné de sécurité microbiologique de


niveau 3,pour les agents infectieux responsables des maladies
graves mais que l’on peut soigner

PFU : unité formant plage de lyse,


méthode de dénombrement des virus sur un milieu de culture

Viraemia: virémie,
quantité de virus dans le sang
Exercice: 10-15 min

dans le tableau ALAN data proc b CSV

- Quelles sont les variables et de quel type sont-elles?

(aidez vous du fichier readme.txt)


Exercice: Quelles questions peut-on se poser à partir des
données du tableau ALAN data proc b CSV ?

- identifier deux questions :


“J’explique la variabilité de quelle variable en fonction de quelle variable?”
“ il y a un lien entre quelle variable et quelle variable?”
“ il y a une corrélation entre quelles variables?”

Y=f(X)

=> hypothèse de travail: je m’attends à quoi ? selon mes connaissances,


le papier de Kernbach et al…..
=> variable à expliquer Y? quel type?
=> variable explicative X? quel type?
Préparer votre tableau de données pour l’analyse statistique
- faites des calculs si nécessaires
- changer les noms de colonnes si nécessaire (pas d’accent, pas
d’espace)
- votre tableau dans un fichier seul, pas de blabla, figures autour, juste
une ligne avec vos entêtes de colonne
- décimales homogènes (soit “.”, ou “,” mais pas un mélange)
- enregistrer en CSV, séparateur “;”, pas d’accent, pas d’espace
Rstudio: charger votre tableau:

#Définir votre dossier de travail (pas d’accent, pas d’espace)


setwd(“monpc/mesdocuments/mondossier”)
#Importer le tableau
montableau< - read.csv(“montableau.csv”, sep=”;”, h=T, dec=”,”,
check.names=FALSE)

vérifier que les variables quantitatives = numeric, integr


et les qualitatives =characters
entête grisée
décimales ok

à vous de jouer en équipe projet!


prenez votre arbre de décision pour vous aider
répartition équitable?
lien?

corrélation?

début
puis suivre tests
les flèches finaux qui
répondent
à la
question
différence
?
Effet du
facteur X?

tests intermédiaires pour choisir le test final


https://rstudio.cloud/plans/free

je n’arrive pas à installer RStudio sur mon PC, ma tablette…


=> Rstudio en ligne!
Renseigner le fichier partagé
https://docs.google.com/spreadsheets/d/1g5Pz8zyoxjt3EB91BhGE_u96HasRP_yd5oBjZ6h_3Uo/edit?usp=sharing

TD4 : description des données et graphiques avec le logiciel RStudio


=> commencez à y travailler avant d’arriver en TD => quels graphiques?

TD5 : séance libre asynchrone


en équipe, finir les graphiques, rédiger, réfléchir aux tests d’inférences, les mettre
en oeuvre

TD6 : point d’avancement, questions sur les test d’inférences, sur le rapport

Livrable 2: rapport sur l’analyse des données supplémentaires


1er février 2022- exemple sur Eprel
épreuve QCM le 18-janv à 15h-16h30, QCM d’entrainement sur Eprel v2

Vous aimerez peut-être aussi