Académique Documents
Professionnel Documents
Culture Documents
Solena Le Scouarnec
solena.lescouarnec@univ-nantes.fr
UE Bioinformatique appliquée 1
10 octobre 2022
Transcriptome
Génome Protéome
https://nccr-rna-and-disease.ch/about/
Partie 1 :
La révolution RNA-seq
RNA-Seq
https://www.khanacademy.org/science/biology/gene-expression-central-dogma/central-dogma-transcription/a/nucleic-acids
RNA-Seq
http://girke.bioinformatics.ucr.edu/CSHL_RNAseq/
RNA-Seq
+ Sensibilité
+ Nouveaux transcrits
+ Espèces
- Matériel
PMID 19015660
Questions scientifiques
• Développement embryonnaire ?
• ...
Annotation des génomes
Single-cell
Structure
mRNA
Interactions
(poly-A)
...
RNA-
seq
Long non-
Small RNA
coding RNA
Méthodes pour le séquençage d’ARN
Transcription ARN
RNA-seq, GRO-seq...
Interactions ARN-Protéine
Ribo-Seq, CLIP-Seq...
Modifications ARN
MeRIP-Seq, PSI-Seq...
Stucture ARN
SHAPE-Seq...
1-2 %
majoritaire
PMID: 28486418
mRNA-Seq
https://slideplayer.com/slide/3419847/
Applications du mRNA-Seq
hPps://www.ebi.ac.uk/training/online/course/funcQonal-genomics-ii-common-technologies-and-data-analysis-methods/number-replicates
Réplicats biologiques
Design de l’étude
Quelle est la question biologique ?
Nombre de reads
hPps://slideplayer.com/slide/4835310/
Contrôle qualité des ARN
• Concentration et contamination par les protéines/sels (Nanodrop)
260/280 > 1,8
260/230 > 1,8
• Etat de dégradation (BioAnalyzer)
RIN (RNA Integrity Number) > 8
28S/18S > 1,8
https://www.gene-quantification.de/rna-integrity.html
• Quantité requise : 50 ng – 4 µg (200 ng)
1. Electropherogram of a good quality RNA 2. Electropherogram of a degraded RNA 3. Electropherogram of a RNA sample with
sample sample DNA contamination
Préparation de librairie
• Réparation et phosphorylation
• A-tailing P
P
A A
P
Exemple ·3h15
• Liga\on des adaptateurs de séquençage
• Kit DNA1000
qPCR : Quantification
Reagents
FlowCell
cBOT
• Séquençage · 10jrs
Paired-end, 2x100 pb
HiSeq2500
32
Analyse RNA-Seq
hPps://www.ebi.ac.uk/training/online/course/funcQonal-
genomics-ii-common-technologies-and-data-analysis-
methods/performing-rna-seq
Analyse RNA-Seq (plateforme GenoBiRD)
R1
Fastq
R1 • FastQC : qualité des fastq et du séquençage
Quality Check Data cleaning
(FastQC) (cutadapt, prinseq) • Prinseq : élimine les reads de mauvaise qualité (seuil
R1 bad 30)
R1
Fastq
R2 good
• Cutadapt : coupe les fragments d'adaptateurs
illumina séquencés
Mapping .bam
(STAR) • STAR : aligne les reads sur le génome de référence
Abundance estimation
• DESeq2 : normalisation et calcul de l'expression
(HTSeq) différentielle des gènes
List of differentially
Differential Gene Expression expressed genes
(DESeq2) (DEG)
https://www.youtube.com/watch?v=tlf6wYJrwKY
Ancienne méthode : (F/R)PKM
Fragments/Reads Per Kilobase of transcript per Million mapped reads
hPps://home.cc.umanitoba.ca/~frist/PLNT3140/l17/l17.4.html
Autre méthode : TPM
Transcripts per Million
https://home.cc.umanitoba.ca/~frist/PLNT3140/l17/l17.4.html
TPM vs RPKM
RPKM
TPM
h+ps://rna-seqblog.com/rpkm-fpkm-and-tpm-clearly-explained/
Volcano Plot
→ enrichissement fonctionnel
Biais possibles
• Design de l’étude
Nombre de réplicats
Nombre et longueur des reads (gènes faiblement exprimés)
2017
PMID 29022597
GTEx
Genotype-Tissue Expression
Ø RNA-seq et génotypage
SCN5A
PMID 24798236
GTEx
Genotype-Tissue Expression
PMID 28424332
RNA-Seq et diagnostic
PMID 28424332
RNA-Seq et diagnostic
PMID 28424332
RNA-Seq et diagnostic
dystrophine
PMID 28424332
Exemple 3
PMID 29093270
ParYe 4 :
AlternaYves au mRNA-seq
Coûts
R1 R2
RNA-seq UMI
R1
Fastq
R1 By
Demultiplexing R1 sample
R1
Fastq
R1
R1
Fastq
R2
Expression
UMI counts
Matrix
List of differentially
Differential Gene Expression expressed genes
(DESeq2) (DEG)
Liens
https://www.rna-seqblog.com/tag/kegg/
https://rnaseq.uoregon.edu/
hpps://www.illumina.com/science/sequencing-method-explorer.html