Vous êtes sur la page 1sur 33

UNIVERSITE MARIEN NGOUABI

FACULTE DES SCIENCES ET TECHNIQUES


DEPARTEMENT DES LICENCES
PARCOURS : BIOLOGIE
OPTION : L3 BCM

RAPORT DU TRAVAIL PRATIQUE DE


BIO-INFORMATIQUE
ETUDE IN SILICO DU GENE DE LA
PROTEINE OMPG

Présenté par : Responsable du cour


Le Groupe :25 prof :Aimé chritian KAYATH
Membres du groupe
NOMS ET PRENOMS
1.MOTONDE-DAKAUD ALSHEN
2.YOLOUKA BOUYOU CHERYL
3. ITANGISHAKA ANGELIQUE
4. BATCHI REGIE BERDIE
5. BAKALA NGUIMBI SEPHORA
Plan
I. Introduction
II. Développement
1. Recherché du gène
Recherché de la séquence nucléotidique
2. Taille de la séquence
3. Faire la PCR
4. Faire l’électrophorèse
5. Recherché de la séquence en acide amine
a) Recherche des paramètres physico-chimique
b) Recherche des interaction proteine-proteine
c) Recherche des domaines membranaires
d) Recherche de la séquence signal
e) Recherche des coileds-coils
f) Recherche de le structure 3D
g) Recherche des homologues
h) Recherche des épitopes
i) Recherche de la localisation
j) Recherche de la glycosylation
k) Recherche la phosphorylation
l) Faire la digestion enzymatique
I. Introduction
Dans le but précis de lier la biologie à l’informatique, nait l’idée de la bio-
informatique qui est un champ de recherche multidisciplinaire de la
biotechnologie dont l’objectif est de résoudre un problème scientifique
poser par la biologie. De ce fait plusieurs techniques ont été mise en
place pour étudier, comprendre, prédire, les phénomènes et les
processus biologiques. En effet, plusieurs gènes font objet d’une étude
in silico. Parmi lesquels figure OMPG. OMPG est un gène qui code pour
la protéine(porine) souvent trouvée chez certaines bactéries comme
Escherichia Coli, jouant un rôle crucial dans le transport de molécules à
travers la membrane externe de la cellule. Elle agit comme un canal pour
permettre le passage sélectif des composés essentiels tels que les ions
et les petites molécules. Notre travail consistera en une étude in silico du
gène et de la protéine ompg de E. Coli en utilisant une méthodologie bio-
informatique au moyen de l’analyse de diverses bases des données et
navigateur web open source telle que ncbi, string uniprot.

II. Développement
1. Recherche du gène
 Définition du gène
Le gène est une portion de l’ADN portant l’information génétique codant
pour une protéine donnée qui assure une fonction biologique donnée
indispensable pour la vie des êtres vivants.
Nom du gène : ompG, b1319, JW13
OMPG est un gène qui code pour une porine souvent trouvée chez
certaines bactéries comme Escherichia Coli, jouant un rôle crucial dans
le transport de molécules à travers la membrane externe de la cellule.

2. Recherche de la séquence nucléotidique


 Définition
La séquence nucléotidique est l’ordre spécifique des nucléotides le long
d’une molécule d’acide nucléique. Cette séquence constitue le code
génétique qui détermine les instructions pour la synthèse des protéines
et d’autres processus cellulaires.

 Séquence nucléotidique (FASTA)


GATCTCGGTTGGGCTGGCTTCTGTCTCCCTGAATGCGCCGACGATTTTAGCGGCGCTGGAGCTGCGCGAG
TTTTTCACCTTCTGCGCGGATGCTTCCCAACTTAAAAACTCGAAACCGGACCCGGAAATCTTTCTCGCCG
CCTGTGCAGGGCTGGGCGTGCCGCCGCAGGCATGTATCGGCATTGAAGATGCGCAGGCGGGCATTGACGC
CATTAACGCCAGCGGTATGCGCTCGGTGGGGATCGGCGCGGGCTTAACCGGGGCGCAATTACTGTTGCCT
TCAACGGAATCACTCACCTGGCCGCGGTTATCGGCCTTCTGGCAAAACGTATAGCAAAGGAATCAACATG
GCTCAGCTTTCGTTACAACATATTCAAAAAATCTACGATAACCAGGTGCATGTGGTGAAGGACTTCAACC
TGGAAATTGCCGATAAAGAGTTCATCGTGTTTGTCGCCGCGTCGGGCTGCGGTAAGTCGACCACCCTGCG
CATGATTGCCGGGCTTGAGGAGATCAGCGGCGGCGATCTGTTGATCGACGGCAAACGAATGAATGACGTT
CCAGCCAAAGCACGCAATATAGCGATGGTGTTCCAGAACTACGCGTTGTATCCGCATATGACGGTTTACG
ACAACATGGCGTTTGGTCTGAAGATGCAAAAAATCGCCAAAGAGGTGATTGATGAGCGGGTGAACTGGGC
GGCGCAAATTCTCGGCCTGCGTGAGTACCTGAAACGTAAGCCGGGGGCGCTTTCCGGCGGGCAACGTCAG
CGAGTGGCGCTTGGGCGGGCGATTGTACGCGAAGCGGGCGTGTTTTTAATGGATGAACCGCTCTCTAACC
TTGATGCCAAGCTGCGCGTGCAAATGCGCGCAGAGATCAGCAAGCTGCATCAGAAACTGAACACCACCAT
GATCTACGTGACCCACGATCAGACCGAAGCGATGACCATGGCGACGCGGATTGTGATTATGAAAGACGGG
ATTGTTCAGCAAGTAGGTGCGCCGAAAACCGTTTATAACCAACCCGCGAATATGTTTGTTTCCGGATTTA
TTGGATCACCAGCGATGAATTTTATTCGCGGCACGATCGATGGCGATAAATTCGTTACGGAAACGCTTAA
ATTAACCATTCCCGAAGAGAAATTAGCGGTTCTGAAAACACAGGAAAGTTTGCATAAGCCCATCGTGATG
GGAATACGACCGGAAGATATTCATCCGGACGCGCAAGAGGAAAATAACATTTCCGCCAAAATTAGCGTGG
CAGAATTAACCGGTGCGGAATTTATGCTCTACACCACGGTTGGGGGCACGAGTTAGTGGTCCGTGCTGGT
GCGTTAAATGATTATCATGCAGGAGAAAATATCACTATTCATTTTGATATGACGAAATGTCATTTCTTTG
ATGCAGAAACGGAAATAGCAATTCGCTAAATACAGGGGGAAGGCATTCCCCAGGATAATACAAGGAACAA
TAATGAAAAAGTTATTACCCTGTACCGCACTGGTGATGTGTGCGGGAATGGCCTGCGCACAGGCCGAGGA
AAGGAACGACTGGCACTTTAATATCGGCGCGATGTACGAAATAGAAAACGTCGAGGGTTATGGCGAAGAT
ATGGATGGGCTGGCGGAGCCTTCAGTCTATTTTAATGCCGCCAACGGGCCGTGGAGAATTGCTCTGGCCT
ATTATCAGGAAGGGCCGGTAGATTATAGCGCGGGTAAACGTGGAACGTGGTTTGATCGCCCGGAGCTGGA
GGTGCATTATCAGTTCCTCGAAAACGATGATTTCAGTTTCGGCCTGACCGGCGGTTTCCGTAATTATGGT
TATCACTACGTTGATGAACCGGGTAAAGACACGGCGAATATGCAGCGCTGGAAAATCGCGCCAGACTGGG
ATGTGAAACTGACTGACGATTTACGTTTCAACGGTTGGTTGTCGATGTATAAATTTGCCAACGATCTGAA
CACTACCGGTTACGCTGATACCCGTGTCGAAACGGAAACAGGTCTGCAATATACCTTCAACGAAACGGTT
GCCTTGCGAGTGAACTATTATCTCGAGCGCGGCTTCAATATGGACGACAGCCGCAATAACGGTGAGTTTT
CCACGCAAGAAATTCGCGCCTATTTGCCGCTGACGCTCGGCAACCACTCGGTGACGCCGTATACGCGCAT
TGGGCTGGATCGCTGGAGTAACTGGGACTGGCAGGATGATATTGAACGTGAAGGCCATGATTTTAACCGT
GTAGGTTTATTTTACGGTTATGATTTCCAGAACGGACTTTCCGTTTCGCTGGAATACGCGTTTGAGTGGC
AGGATCACGACGAAGGCGACAGTGATAAATTCCATTATGCAGGTGTCGGCGTAAATTACTCGTTCTGATA
ATGGGCTAAATTGCCGGATGCGGCGCGAGTACTTTATCCGATCTATAAATGTAGGCCGGATAAGATGCGC
TAGCATCGCATCTGGCATTCAGGCAAGGTAGCTGGTATTTATTTCAGCGTCATATGCGTGGCAACGGTAA
TATTCTGTGGTGACGGTTTTCCAGAAATTAAGCGGAATAATAACTCGCAGCTTTGTTGACCTAACTCCTG
CGTCGGAACATCGAT

Vraie séquence
ATGAAGAAGCTGCTGCCCTGCACCGCCCTGGTGATGTGCGCCGGCATGGCCTGCGCCCAG
GCCGAGGAGAGGAACGACTGGCACTTCAACATCGGCGCCATGTACGAGATCGAGAACGTG
GAGGGCTACGGCGAGGACATGGACGGCCTGGCCGAGCCCAGCGTGTACTTCAACGCCGCC
AACGGCCCCTGGAGGATCGCCCTGGCCTACTACCAGGAGGGCCCCGTGGACTACAGCGCC
GGCAAGAGGGGCACCTGGTTCGACAGGCCCGAGCTGGAGGTGCACTACCAGTTCCTGGAG
AACGACGACTTCAGCTTCGGCCTGACCGGCGGCTTCAGGAACTACGGCTACCACTACGTG
GACGAGCCCGGCAAGGACACCGCCAACATGCAGAGGTGGAAGATCGCCCCCGACTGGGAC
GTGAAGCTGACCGACGACCTGAGGTTCAACGGCTGGCTGAGCATGTACAAGTTCGCCAAC
GACCTGAACACCACCGGCTACGCCGACACCAGGGTGGAGACCGAGACCGGCCTGCAGTAC
ACCTTCAACGAGACCGTGGCCCTGAGGGTGAACTACTACCTGGAGAGGGGCTTCAACATG
GACGACAGCAGGAACAACGGCGAGTTCAGCACCCAGGAGATCAGGGCCTACCTGCCCCTG
ACCCTGGGCAACCACAGCGTGACCCCCTACACCAGGATCGGCCTGGACAGGTGGAGCAAC
TGGGACTGGCAGGACGACATCGAGAGGGAGGGCCACGACTTCAACAGGGTGGGCCTGTTC
TACGGCTACGACTTCCAGAACGGCCTGAGCGTGAGCCTGGAGTACGCCTTCGAGTGGCAG
GACCACGACGAGGGCGACAGCGACAAGTTCCACTACGCCGGCGTGGGCGTGAACTACAGC
TTC

3. Taille de la séquence
La taille d’une séquence nucléotidique est déterminée par le nombre de
nucléotide qui la compose. Elle est généralement exprimée en nombre
de bases. Cette taille peut varier énormément allant de quelques paires
de bases pour des courtes séquences à des milliers voir des millions de
paires de bases pour des séquences génomiques complets.
Notre séquence contient 301 acides aminés.

4. Réalisation de la PCR
 Définition
La réaction en chaine par polymérisation (PCR) est une technique
d’amplification ciblée in vitro de l’ADN permettant à partir des quantités
peu abondantes d’obtenir d’importante quantité d’ADN.
 Principe
Le principe consiste à amplifier une région spécifique d’une
séquence d’ADN à partir des amorces spécifiques capable de
s’hybrider avec notre séquence en présence de l’ADN
polymérase.
 Analyse
Les résultats de la PCR indiquent la présence ou l’absence d’une
séquence d’ADN spécifique dans l’échantillon testé. Cela peut être
interprété de différente manière en fonction de l’objectif de la PCR. Si la
séquence cible est détectée, cela peut signifier la présence de l’agent
pathogène ou de l’ADN étudié. Par contre, si la séquence n’est pas
détectée cela suggère son absence dans l’échantillon analysé.
L’interprétation peut varier en fonction du contexte spécifique de la PCR,
qu’il s’agisse de diagnostiquer une maladie, de détecter des gènes
spécifiques, ou d’autres applications scientifiques.
Séquence obtenue après PCR :
MKKLLPCTALVMCAGMACAQAEERNDWHFNIGAMYEIENVEGYGEDMDGLAEPSV
YFNAANGPWRIALAYYQEGPVDYSAGKRGTWFDRPELEVHYQFLENDDFSFGLTG
GFRNYGYHYVDEPGKDTANMQRWKIAPDWDVKLTDDLRFNGWLSMYKFANDLNTT
GYADTRVETETGLQYTFNETVALRVNYYLERGFNMDDSRNNGEFSTQEIRAYLPL
TLGNHSVTPYTRIGLDRWSNWDWQDDIEREGHDFNRVGLFYGYDFQNGLSVSLEY
AFEWQDHDEGDSDKFHYAGVGVNYSF
Interprétation
Nous sommes partis de d’un fragment à 30 nucléotides pour obtenir une
séquence de 303 acides aminés. La séquence a donc été amplifier.

5. Réalisation de l’électrophorèse sur gel d’Agarose


 Définition
L’électrophorèse sur gel d’Agarose est une technique utilisée pour
séparer les molécules en fonction de leur taille en les faisant migrer à
travers un gel par application d’un champ électrique.

 Principe
C’est une technique qui permet aux molécules de traverser une couche
de gel sous l’impulsion d’un champ électrique en fonction de leur taille :
Les molécules de petite taille se déplacent plus rapidement et migreront
plus loin que les molécules de taille inférieure en fonction des
paramètres physicochimiques.
INTERPRETATION
Les résultats de l’électrophorèse nous montrent la migration des
protéines en fonction de leur taille. Les petites molécules migrent plus
loin et plus rapide que les molécules de grande taille.
6. Séquence en acides aminés
Une séquence en acide aminés est une série ordonnée en acides aminés
qui constitue une protéine spécifique. Ces aminés sont liés entre eux par
des liaisons peptidiques en unissant leur coté N-terminal et leur coté C-
terminal.
MKKLLPCTALVMCAGMACAQAEERNDWHFNIGAMYEIENVEGYGEDMDGLAEPSVYFNAA
NGPWRIALAYYQEGPVDYSAGKRGTWFDRPELEVHYQFLENDDFSFGLTGGFRNYGYHYV
DEPGKDTANMQRWKIAPDWDVKLTDDLRFNGWLSMYKFANDLNTTGYADTRVETETGLQY
TFNETVALRVNYYLERGFNMDDSRNNGEFSTQEIRAYLPLTLGNHSVTPYTRIGLDRWSN
WDWQDDIEREGHDFNRVGLFYGYDFQNGLSVSLEYAFEWQDHDEGDSDKFHYAGVGVNYSF

a. Paramètres physicochimiques
Les paramètres physicochimiques d’un gène renseignent sur divers
aspects liés à la structure et aux propriétés du matériel génétique. Ces
paramètres peuvent inclure la longueur du gène, la séquence
nucléotidique (composition en bases azotées : adénine, cytosine,
guanine et thymine), le point de départ de la transcription, site de
terminaison, etc.
Number of amino acids: 301

Molecular weight: 34913.25

Theoretical pI: 4.45

Amino acid composition:


Ala (A) 20 6.6%
Arg (R) 16 5.3%
Asn (N) 21 7.0%
Asp (D) 27 9.0%
Cys (C) 3 1.0%
Gln (Q) 9 3.0%
Glu (E) 23 7.6%
Gly (G) 28 9.3%
His (H) 7 2.3%
Ile (I) 7 2.3%
Leu (L) 22 7.3%
Lys (K) 8 2.7%
Met (M) 8 2.7%
Phe (F) 18 6.0%
Pro (P) 9 3.0%
Ser (S) 12 4.0%
Thr (T) 16 5.3%
Trp (W) 10 3.3%
Tyr (Y) 22 7.3%
Val (V) 15 5.0%
Pyl (O) 0 0.0%
Sec (U) 0 0.0%

(B) 0 0.0%
(Z) 0 0.0%
(X) 0 0.0%

Total number of negatively charged residues (Asp + Glu): 50


Total number of positively charged residues (Arg + Lys): 24

Atomic composition:

Carbon C 1567
Hydrogen H 2253
Nitrogen N 411
Oxygen O 482
Sulfur S 11

Formula: C1567H2253N411O482S11
Total number of atoms: 4724

Extinction coefficients:

Extinction coefficients are in units of M-1 cm-1, at 280 nm measured in water.

Ext. coefficient 87905


Abs 0.1% (=1 g/l) 2.518, assuming all pairs of Cys residues form cystines

Ext. coefficient 87780


Abs 0.1% (=1 g/l) 2.514, assuming all Cys residues are reduced

Estimated half-life:

The N-terminal of the sequence considered is M (Met).

The estimated half-life is: 30 hours (mammalian reticulocytes, in vitro).


>20 hours (yeast, in vivo).
>10 hours (Escherichia coli, in vivo).

Instability index:

The instability index (II) is computed to be 36.32


This classifies the protein as stable.

Aliphatic index: 58.67

Grand average of hydropathicity (GRAVY): -0.672

b.Interaction protéine-protéine
L’interaction protéine-protéine apparait lorsque deux ou plusieurs
protéines se lient entre elles généralement pour mener à bien
leur fonction biologique.
Dans l’organisme Escherichia coli, la protéine ompg, incluse dans
le complexe ompg, interagit avec plusieurs protéines.
Le réseau d’interaction montre que la protéine ompg interagit
avec dix autres protéines.
c. Domaines membranaires
Les domaines membranaires d’un gène font référence aux régions
protéiques qui sont susceptibles d’interagir avec les membranes
cellulaires. Ces domaines peuvent inclure des séquences ou des motifs
spécifiques dans la structure d’une protéine qui facilitent son insertion,
son ancrage ou son interaction avec les membranes lipidiques.
d.Séquence signal
La séquence signal joue un rôle crucial en indiquant le début ou la
fin d’une fonction particulière, comme le début de la traduction ou
la localisation d’une séquence génétique spécifique.
Analyse
La séquence signal apparait sous forme de ligne indiquant le type de
peptide signal prédit et la probabilité de son obtention le long de la
séquence protéique. Chaque type de peptide signal est représenté par
une couleur :
: indique un signal peptidique de type OTHER
: indique un signal peptidique de type Sec/SPI
: indique un signal peptidique de type Sec/IP h
: indique un signal peptidique de type Sec/IP c
: indique un signal peptidique de type CS

La prédiction de la séquence signal est celui d’un peptide signal de type


Sec/SPI dont la séquence est la suivante :
"MKKLLPCTALVMCGMACAQA" ; elle compte vingt (20) acides aminés.
Le site de clivage est entre le 21ème et le 22ème acide aminé, le motif est :
"AQA-AE".
La probabilité d’obtention de cette séquence est supérieure à quatre-
vingt pourcent (80%), plus précisément égale à 92,59%, si on se réfère à
la figure ci-dessous.

Interprétation
Le peptide signal sert à adresser les protéines lors de leur exportation
vers la membrane des compartiments cellulaires (noyau, réticulum
endoplasmique, etc.), ou à les sécréter. La présence d’un peptide signal
stipule que la protéine OMPG est compartimentée puis sécrétée. Plus le
peptide signal est de type Sec/PI alors l’exportation de OMPG est assurée
par le système Ses/YEG au sein de E. Coli.
e. Recherche des coiled-coils
Les coiled-coils sont des structures en hélice formées par l’assemblage
de deux ou plusieurs chaine polypeptidique. Elle joue un rôle essentiel
dans la formation de protéines et structure biologique. Ces structures en
hélice sont courantes dans les protéines notamment dans les domaines
de liaison de régulation et d’interaction moléculaire au sien des cellules.
Elles contribuent à la stabilité des a la régulations processus biologiques.

Interprétation
Les coiled-coils apparaissent sous formes d’histogrammes en bâton
indiquant le type de fenêtre prédit
(Windows) et la probabilité d’apparition de ces fenêtres le long de
la chaine peptidique. Chaque fenêtre est représentée par une
couleur :
: indique un Windows 21 ;

: indique un Windows 28 ;

: indique un Windows 14 ;

Le coiled-coils prédit pour OMPG est un Windows 14 dont la


composition en acides aminés et la localisation au niveau la chaine
peptidique est donnée par les tableaux ci-dessous.

f. Structure 3D
La structure 3D de la protéine OMPG est une forme de tonneau constitué
de feuillets bêta antiparallèles. Ces canaux facilitent le passage sélectif
des molécules à travers la membrane. Elle est constituée de trois
domaines : les domaines de la paroi poreuse souvent constitués de feuillet
bêta antiparallèles, les domaines de liaison qui sont responsables des
liaisons spécifiques à des ligands ou des molécules spécifiques qui
traversent la membrane et les domaines de signalisation qui jouent un rôle
dans la régulation de l’ouverture ou de fermeture du canal contrôlant ainsi
le flux des molécules à travers la membrane.
g.Recherche des homologue
. Deux protéines sont homologues lorsqu’elles descendent d’une même
protéine ancestrale. Dans ce cas, leurs séquences présentent des
similarités. Ce sont ces similarités qui nous permettent de les identifier
comme homologues.
h.Les épitopes
s

i. localisation
le gene ompg est localise dans la membrane externe de la cellule de
E.Coli
j. La glycosylation
La glycosylation est un processus post-traductionnel où des glucides sont
ajoutés à des protéines pour former des glycoprotéines. Cette
modification joue un rôle crucial dans la structure, la fonction et la
stabilité des protéines. Elle peut affecter la solubilité, la localisation
cellulaire et la reconnaissance des molécules par d’autres protéines. La
glycosylation est impliquée dans de nombreuses fonctions biologiques
notamment la signalisation cellulaire, l’immunité et la stabilisation des
protéines

Analyse :

: Seuil de prédiction de N-glycosylation


: Potentiel de N-glycosylation
Ce graphique montre quatre (4) sites de N-glycosylations au niveau de
la séquence peptidique de ompg Parmi ceux-ci, trois (3) sont prédits
glycolysés, car le potentiel dépasse le seuil (Threshold) de glycosylation.
Interprétation :
La glycosylation est une réaction enzymatique consistant à lier une
molécule de glucide à une protéine sur un acide aminé précis. La N-
glycosylation se fait au niveau des asparagines disponibles
préférentiellement au niveau des séquences Asn-Xaa-Ser/Thr ; mais elle
ne peut se faire au moment où le deuxième (2ème) acide aminé de la
séquence est la proline. Voir la figure ci-dessous

k.La phosphorylation
La phosphorylation est un processus biologique dans lequel un groupe
phosphate est ajouté à une molécule, souvent une protéine, par une
enzyme appelée kinase. Cette modification post-traductionnelle joue un
rôle crucial dans la régulation des protéines influençant leur activité, leur
localisation cellulaire et leur interaction avec d’autres molécules. Elle est
un mécanisme clé de régulation des voies de signalisation cellulaire
contrôlant des processus telsques : la croissance cellulaire, la
différenciation et le métabolisme.
Analyse
Potentiel de phosphorylation de la sérine
Potentiel de phosphorylation de la thréonine
Potentiel de phosphorylation de la tyrosine
Seuil de prédiction de phosphorylation
Ce graphique montre cinquante (50) sites de phosphorylations au niveau
de la séquence peptidique de ompg Parmi ceux-ci, trois (26) sont prédits
phosphorylés, car le potentiel dépasse le seuil (Threshold) de
phosphorylation et 24 n’ont pas atteint le seuil de phosphorylation.
La phosphorylation est une réaction enzymatique consistant à lier une
molécule de phosphate à une protéine sur un acide aminé précis. La
glycosylation se fait au niveau des asparagines disponibles
préférentiellement au niveau des séquences Asn-Xaa-Ser/Thr ; mais elle
ne peut se faire au moment où le deuxième (2ème) acide aminé de la
séquence est la proline. Voir la figure ci-dessous
l. Digestion enzymatique
Définitions
1. Identité
Elle fait référence à des caractéristiques distinctives qui la différencient
des autres protéines. Cela inclus sa séquence d’acides aminés
spécifiques, sa structure tridimensionnelle, ses interactions moléculaires
et sa fonction biologique.
2. Homologie
L’homologie entre deux protéines indique une similarité ou une parenté
au niveau de leur séquence d’acides aminés ou de leur structure. Cette
similitude peut résulter d’une ascendance évolutive commune.
3. Similarité :
Ressemblance de structure dans au moins deux espèces homologues,
Attribuable à un ancêtre commun.
4. Epitope
L’épitope d’une protéine est une région spécifique de cette protéine qui
est reconnue et liée par le système immunitaire en particulier
les anticorps.
5. PCR Nichée
La PCR nichée est une variante de la PCR (réaction en chaine par
polymérisation (PCR)) est une technique permettant d’amplifier
spécifiquement une séquence de l’ADN. Dans la PCR nichée une
deuxième paire de premiers est utilisée pour amplifier une région
spécifique à l’intérieur du produit de PCR obtenu avec les premiers
primer
6. Blaste n/Blaste p
Blast (basic local alignement search Tools) Blast est un outil bio-
informatique largement utilise pour compare des séquences
biologiques différentes versions spécifiques pour des types de
séquence spécifiques telles que Blaste n pour les séquences d’ADN et
Blast p pour les séquences protéiques
7. Alignement
Lalignement fait reference au processus de comparaison de sequences
biologiques pour identifier des regions similaires et etablir une
corespondance entre celle-ci
8. Alignement local et alignement global
L’alignement local fait reference a la comparaison des region
specifiques des pour identifier des simultudes locales tandisque
l’alig,ement globale cherche a aligner l’integralité des sequences même
si cela implique l’insertion ou la suppression des sequences pour
trouver le meilleur alignement global
9. Difference entre alignement optimal et alignement multiple
L’alignement optimal fait référence à la recherche de l’alignemet qui
maximise un score donné ,par exemple en minimisant le nombre de
brèchesou de mésappariements .l’alignement multiple fait référence à
l’alignement simultané de plus de deux séquences
10. Score
Le score est une mesure pour évaluer la qualite d’un alignement .il est
calculé en tenant compte de la similitude entre les mésappariements
11. Brèches
Les brèches fait référence aux espaces insérés dans un alignement
pour compenser les insertion ou les supressions des nucleotides ou
d’acides aminés entre les séquences alignées
12. Mésappariement
Les mésappariement se produisent lorsqu’il y a une difference les
acides aminés ou nucleotides alignés dans les séquences
Rôle de chaque moteur bio-informatique
Les outils informatiques permettent l’identification : de la source des
gènes, des ressemblances entre gènes d’une part et protéines d’autre
part (NCBI, UniProt, …) ; la prédiction ou l’analyse de la structure 3D du
gène et de la protéine (Predict-Protein, Swiss Model, I-Tasser, …) ; de
connaître les interactions soit entre gènes, soit entre protéines ou soit
entre gène et protéine (STRING, ...). C’est sur la caractérisation du gène
OMPG et sa protéine OMPG que sera basé notre travail de recherche.

Conclusion
Les résultats de l’étude in silico montrent clairement que le gène OMPG
code pour la protéine membranaire (porines) qui est une protéine
d’organisme E. Coli qui intervient dans l’interaction et la régulation du
cycle cellulaire. La protéine de OMPG est intracellulaire et est de nature
hydrophobe, sa structure 3D est constituée de plusieurs feuillets
formant les domaines 1,2 et 3 et plusieurs épitopes. Celle-ci est
localisée dans la membrane externe de E.Coli. OMPG est donc une
protéine indispensable à l’organisme. Ainsi, malgré certaines difficultés
rencontrées, ce TP de bio-informatique nous a permis de comprendre
le fonctionnement et l’utilisation des sites liés aux études biologiques.

. VII. REFERENCES WEBOGRAPHIES


: https://www.ncbi.nlm.nih.gov

https://blast.ncibi.nlm.gov/Blast.cgi?PAGE_TYPE=BlastSearch#
https://www.uniprot.org/help/ https://www.expasy.org/tools/
https://web.expasy.org/protparam/
https://www.cbs.dtu.dk/services/SignalP/
https://swissmodel.expasy.org https://embnet.vital-
it.ch/software/Coils_form.html
https://www.cbs.dtu.dk/services/TMHMM-
2.0/
https://www.cbs.dtu.dk/services/NetNGlyc/
https://string-db.org/cgi/
https://www.predictprotein.org
https://www.rasmol.org/
https://www.acaclone.com
https://www.wikipedia.org

Vous aimerez peut-être aussi