Académique Documents
Professionnel Documents
Culture Documents
version 2
Pr. S EL AKIL
Soit le numéro d’accession suivant :
NM_000207.3
1. A quoi correspond-t-il (ADN, ARN, Protéine……) ?
Ce numéro d’accession correspond à un ARN car il commence par NM
Pr. S EL AKIL
2. Chercher dans la base de donner Nucléotidique de NCBI le nom correspondant
à cette séquence, qu’elle est sa taille en Pb ?
Le nom de la séquence est: Homo sapiens insulin (INS), transcript variant 1,
mRNA
Sa taille: 465 bp
3. La date affichée sur la base est la date de création ou de modification ?
C’est la date de modification car il s’agit de la troisième version (VERSION
NM_000207.3)
4. Quelle est la date de création initiale de cette séquence (chercher dans la
bibliographie) ?
La date de création de la séquence correspond à la date de la première version, vers la
fin de la bibliographie en trouve la version 2 (NM_000207.2) puis de la même façon si
en cherche dans la page correspondante à la version 2 en trouve la version 1
(NM_000207.1); en peut également chercher directement la version 1 sur la base
nucléotide avec le numéro d’accession (NM_000207.1)
La date de création de la version 1 est le 28-MAY-2006
5. S’agit-il de quelle version ?
Il s’agit de la version 3 (VERSION NM_000207.3)
Pr. S EL AKIL
6. S’agit-il de quel variant de transcription ?
Il s’agit du variant de transcription 1
7. Cette séquence code pour quel gène ? donner son rôle dans l’organisme
Cette séquence code pour le gène de de l’insuline, ce gène joue un rôle essentiel
dans la régulation du métabolisme glucidique et lipidique
8. Quels sont les différents phénotypes associés au polymorphisme de ce gène ?
Une multitude de mutants
Des allèles ayant des effets phénotypiques ont été identifiés, y compris le diabète
sucré insulino-dépendant, diabète néonatal permanent sucré, le diabète jeune
type 10 et l’hyperproinsulinémie
Pr. S EL AKIL
9. Le variant suivant est le plus long ou le plus court ?
Le transcrit est le plus court
Pr. S EL AKIL
12. Donner la localisation chromosomique actuelle exacte de cette séquence (current)
?
Pr. S EL AKIL
Le gène comporte 4 transcrits : NM_000207.3, NM_001185097.2, NM_001291897.2
et NM_001185098.2
14. Quel est le nom du gène orthologue chez la souris ? donner son numéro d’accession
(choisir le premier transcrit sur le graphique)
Pr. S EL AKIL
• Le nom du meme gene chez la souris (gene orthologue) est:
Ins2 insulin II [ Mus musculus (house mouse) ]
• Son numéro d’accession est; NM_001185083.2
➢ Nous voulons faire un alignement des séquences de ce gène entre homme et la souris
15. A quoi sert l’alignement ?
L’alignement de séquence est l’écriture de deux séquences une sur l’autre afin de
ressortir les régions de similarité ainsi que le pourcentage de similarité indiquant la
distance évolutive qui existe entre les deux séquences
16. Quel programme allons-nous utiliser pour comparer entre nous deux séquences ?
Méthode 1: Nous pouvons utiliser ‘’Global Alignment’’ pour effectuer un alignement
global entre les deux séquence en utilisant les deux numéros d’accession comme
requête
Pr. S EL AKIL
71% de similarité
Méthode 2: Nous pouvons également utiliser BLASTn en cliquant sur Align two or
more sequence pour pouvoir comparer deux sequences
Pr. S EL AKIL
83,43% de similarité
18. Combien existe-t-il de bases similaires et de bases différentes entre les deux
séquences
Pour l’alignement local: le nombre de base similaires est de 282 sur 338, et donc il
existe 56 bases différentes
Pour l’alignement global: le nombre de base similaires est de 354/496, et donc il existe
142 bases différentes
Pr. S EL AKIL
Pour l’alignement local
Pr. S EL AKIL
Pour l’alignement global
Pr. S EL AKIL
➢ Nous voulons retrouver le gène sur la base de donnée ‘Ensembl’
Location
Chromosome 11: 2,159,779-2,161,221 reverse strand.
Pr. S EL AKIL
20. Combien de transcrit du gène sont disponible sur Ensembl*
About this gene
This gene has 5 transcripts (splice variants), 253 orthologues, 2 paralogues and is associated
with 6 phenotypes.
Pr. S EL AKIL
Localisation chromosomique:
Exon 1: ENSE00001938789 (2,161,209 2,161,168)
Exon 2: ENSE00003494357 (2,160,988 2,160,785)
Exon 3: ENSE00003901829 (2,159,997 2,159,779)
Pr. S EL AKIL
➢ Nous voulons comparer ce gène avec d’autres séquences sur les base de données
Nous disposons du numéro d’accession suivant (NM_000207.3) quel programme de
BLAST doit-on utiliser ?
Nous allons utilisé BLASTn car il s’agit d’un numéro d’accession d’ARNm
(nucléotidique)
Lancer le programme et choisir ‘some what similar sequence’
25. Quel est l’espèce la plus proche de l’Homme concernant cette séquence ?
L’espèce la plus proche de l’Homme est GROILLA GORILLA (Gorille)
26. Quel est son pourcentage de similarité ? 98,25%
27. Que signifie le E value ? La pertinence (est ce que le résultat est vrai ou du au
hasard Pr. S EL AKIL
➢ Nous voulons amplifier l’exon 2 de ce gène, retourner sur GENE et retrouver la
séquence FASTA de cet exon
On va sur la représentation graphique sur GENE puis en place le curseur sur le
numéro d’accession et sur la liste qui apparait on va choisir télécharger FASTA exons
pour télécharger la séquence des exons
Pr. S EL AKIL