Vous êtes sur la page 1sur 19

Correction TP2

version 2

Pr. S EL AKIL
Soit le numéro d’accession suivant :

NM_000207.3
1. A quoi correspond-t-il (ADN, ARN, Protéine……) ?
Ce numéro d’accession correspond à un ARN car il commence par NM

Pr. S EL AKIL
2. Chercher dans la base de donner Nucléotidique de NCBI le nom correspondant
à cette séquence, qu’elle est sa taille en Pb ?
Le nom de la séquence est: Homo sapiens insulin (INS), transcript variant 1,
mRNA
Sa taille: 465 bp
3. La date affichée sur la base est la date de création ou de modification ?
C’est la date de modification car il s’agit de la troisième version (VERSION
NM_000207.3)
4. Quelle est la date de création initiale de cette séquence (chercher dans la
bibliographie) ?
La date de création de la séquence correspond à la date de la première version, vers la
fin de la bibliographie en trouve la version 2 (NM_000207.2) puis de la même façon si
en cherche dans la page correspondante à la version 2 en trouve la version 1
(NM_000207.1); en peut également chercher directement la version 1 sur la base
nucléotide avec le numéro d’accession (NM_000207.1)
La date de création de la version 1 est le 28-MAY-2006
5. S’agit-il de quelle version ?
Il s’agit de la version 3 (VERSION NM_000207.3)

Pr. S EL AKIL
6. S’agit-il de quel variant de transcription ?
Il s’agit du variant de transcription 1
7. Cette séquence code pour quel gène ? donner son rôle dans l’organisme
Cette séquence code pour le gène de de l’insuline, ce gène joue un rôle essentiel
dans la régulation du métabolisme glucidique et lipidique
8. Quels sont les différents phénotypes associés au polymorphisme de ce gène ?
Une multitude de mutants
Des allèles ayant des effets phénotypiques ont été identifiés, y compris le diabète
sucré insulino-dépendant, diabète néonatal permanent sucré, le diabète jeune
type 10 et l’hyperproinsulinémie

Pr. S EL AKIL
9. Le variant suivant est le plus long ou le plus court ?
Le transcrit est le plus court

10. Combien contient-il d’exons ? Donner leur localisation ?


Le gène comporte 3 exons leurs localisation est:
Exon 1: 1..42
Exon 2: 43..246
Exon 3: 247..465

Allez maintenant sur la base de donner RefSeq GENE et chercher la séquence

11. Donner les autres appellations de ce gène ?


Les autres appellations de ce gène sont: IDDM; ILPR; IRDN; IDDM1; IDDM2;
PNDM4; MODY10

Pr. S EL AKIL
12. Donner la localisation chromosomique actuelle exacte de cette séquence (current)
?

Sa localisation est sur le chromosome 11 entre les bases NC_000011.10


(2159779..2161209

13. Ce gène a combien de transcrits ? donner leurs numéros d’accession

Pr. S EL AKIL
Le gène comporte 4 transcrits : NM_000207.3, NM_001185097.2, NM_001291897.2
et NM_001185098.2

14. Quel est le nom du gène orthologue chez la souris ? donner son numéro d’accession
(choisir le premier transcrit sur le graphique)

Pr. S EL AKIL
• Le nom du meme gene chez la souris (gene orthologue) est:
Ins2 insulin II [ Mus musculus (house mouse) ]
• Son numéro d’accession est; NM_001185083.2
➢ Nous voulons faire un alignement des séquences de ce gène entre homme et la souris
15. A quoi sert l’alignement ?
L’alignement de séquence est l’écriture de deux séquences une sur l’autre afin de
ressortir les régions de similarité ainsi que le pourcentage de similarité indiquant la
distance évolutive qui existe entre les deux séquences
16. Quel programme allons-nous utiliser pour comparer entre nous deux séquences ?
Méthode 1: Nous pouvons utiliser ‘’Global Alignment’’ pour effectuer un alignement
global entre les deux séquence en utilisant les deux numéros d’accession comme
requête

Pr. S EL AKIL
71% de similarité
Méthode 2: Nous pouvons également utiliser BLASTn en cliquant sur Align two or
more sequence pour pouvoir comparer deux sequences

Pr. S EL AKIL
83,43% de similarité

17. Quel est le pourcentage de similarité entre les deux séquences/


Le pourcentage de similarité avec le global alignement est de 71% alors que pour
Blastn qui effectue un alignement local le pourcentage est de 83,43%. Donc le
pourcentage de similarité change en fonction du type d’alignement effectué

18. Combien existe-t-il de bases similaires et de bases différentes entre les deux
séquences
Pour l’alignement local: le nombre de base similaires est de 282 sur 338, et donc il
existe 56 bases différentes
Pour l’alignement global: le nombre de base similaires est de 354/496, et donc il existe
142 bases différentes

Pr. S EL AKIL
Pour l’alignement local

Pr. S EL AKIL
Pour l’alignement global

Pr. S EL AKIL
➢ Nous voulons retrouver le gène sur la base de donnée ‘Ensembl’

19. Donner sa localisation selon la base ensembl

Location
Chromosome 11: 2,159,779-2,161,221 reverse strand.

Pr. S EL AKIL
20. Combien de transcrit du gène sont disponible sur Ensembl*
About this gene
This gene has 5 transcripts (splice variants), 253 orthologues, 2 paralogues and is associated
with 6 phenotypes.

Ce gene comporte 5 transcits


21. La premier transcrit sur le tableau comporte combien de bases ? il code pour une
protéine de combien d’acide aminées
ENST00000381330.5 INS-202 465 110aa
Il comporte 465 bases donnant une protéine de 110aa
1. Ce transcrit se compose de combien d’exons? Donner leur localisation
chromosomique ? 3 exons (en clique sur exons pour voir la localisation des exons)

Pr. S EL AKIL
Localisation chromosomique:
Exon 1: ENSE00001938789 (2,161,209 2,161,168)
Exon 2: ENSE00003494357 (2,160,988 2,160,785)
Exon 3: ENSE00003901829 (2,159,997 2,159,779)

23. Revenez au tableau des transcrit et choisir le deuxième transcrit. Il se compose de


combien d’exons ? expliquer la différence dans le nombre d’exons entre les deux
transcrits ?

Le deuxième transcrit se compose de deux exons et c’est du à l’épissage alternatif


Pr. S EL AKIL
24. Choisir le deuxième transcrit, Sur sa localisation chromosomique y’a-t-il un autre
gène ? si oui donner son nom ?
Non il n’existe aucun gène dans cette région

Pr. S EL AKIL
➢ Nous voulons comparer ce gène avec d’autres séquences sur les base de données
Nous disposons du numéro d’accession suivant (NM_000207.3) quel programme de
BLAST doit-on utiliser ?
Nous allons utilisé BLASTn car il s’agit d’un numéro d’accession d’ARNm
(nucléotidique)
Lancer le programme et choisir ‘some what similar sequence’

25. Quel est l’espèce la plus proche de l’Homme concernant cette séquence ?
L’espèce la plus proche de l’Homme est GROILLA GORILLA (Gorille)
26. Quel est son pourcentage de similarité ? 98,25%
27. Que signifie le E value ? La pertinence (est ce que le résultat est vrai ou du au
hasard Pr. S EL AKIL
➢ Nous voulons amplifier l’exon 2 de ce gène, retourner sur GENE et retrouver la
séquence FASTA de cet exon
On va sur la représentation graphique sur GENE puis en place le curseur sur le
numéro d’accession et sur la liste qui apparait on va choisir télécharger FASTA exons
pour télécharger la séquence des exons

Download FASTA: NP_000198.1


NM_000207.3
NM_000207.3 exons
Pr. S EL AKIL
Exon 2:
>ref|NM_000207.3|:43-246 Homo sapiens insulin (INS),
transcript variant 1, mRNA
ATCACTGTCCTTCTGCCATGGCCCTGTGGATGCGCCTCCTGCCCCTGCTGGCGCTGCTGGC
CCTCTGGGGACCTGACCCAGCCGCAGCCTTTGTGAACCAACACCTGTGCGGCTCACACCTG
GTGGAAGCTCTCTACCTAGTGTGCGGGGAACGAGGCTTCTTCTACACACCCAAGACCCGCC
GGGAGGCAGAGGACCTGCAGG

28. Quel programme doit-on utiliser ? Pimer-BLAST


29. Combien de couple d’amorces nous donne le programme ? 10 Amorces
30. Quel couples d’amorces permet d’amplifier une très grande région du gène ?
Le Couple 2 amplifie une région de 98pb

Pr. S EL AKIL

Vous aimerez peut-être aussi