Vous êtes sur la page 1sur 9

l’ organisation du génome humain

1-Généralités

• Le génome est la combinaison des mots « gène » et « chromosome ».


• Génome : Ensemble de l'information génétique d'un organisme contenu dans chacune de ses cellules sous la forme
de chromosomes.
• Le génome humain est notre patrimoine génétique, il existe dans toutes nos cellules, il possède 23 paires de
chromosomes dans chacune de ses cellules Pour chaque paire, un chromosome provient du père et l’autre provient
de la Mère:
Les 22 premières paires sont appelées chromosomes autosomiques, la 23e paire détermine le sexe d’un
individu. Il s’agit des chromosomes sexuels X et Y.
• Le génome humain comprend au moins 3 milliards de paires de bases (A, C, G, T) et entre 20 000 et 25 000 gènes
(M 22000)

2-Organisation du génome ?

L’organisation du génome humain est très vaste et assez complexe.


Elle comporte les différents niveaux d’organisation de l’ADN, de la double hélice jusqu’à la chromatine, puis de cette
dernière arrivant au chromosome, qui est le niveau de compaction le plus élevé de l’ADN, IL comporte aussi
l’organisation du gène et des séquences d’ADN, en séquence codante et non codantes;
3-LES DIFFÉRENTS TYPES DE GÉNOME
1- Le génome procaryote:
Il est constitué:

- d'un unique chromosome circulaire (rarement plus d’un chromosome ou un chromosome linéaire super
enroulé) qui baigne dans le cytoplasme en une région irrégulière appelée : nucléoïde (non délimité par une
membrane nucleaire)
- de petits éléments d'ADN circulaire en nombres variables : les plasmides

•Le chromosome circulaire : c’est le support de l’information génétique, il est replié en longues boucles dont la base
est reliée à un ensemble protéique, le core qui fixé à la membrane plasmique et empêche donc l'ADN de se déplacer
librement dans le cytoplasme.
L’axe de la double hélice d’ADN peut s’enrouler sur lui-même en formant un super enroulement ce qui rend l’ADN
plus compact et diminue ainsi le volume occupé dans la cellule.
• les plasmides: C’est une molécule d’ADN double brin, généralement circulaire, douée de réplication autonome
(indépendamment du chromosome), elle n‘est pas essentielle à la survie de la cellule et elle est transmise au cours
des générations, Elle est porteuse de divers caractères : de fertilité (Facteur F), de résistance aux antibiotiques
(Facteur R), de bactériocines (plasmides Col), de virulence, de résistance aux antiseptiques, de caractères
métabolique etc….
2- Le génome eucaryote: Il comprend

• le génome nucléaire, contenu dans le noyau qui caractérise les eucaryotes. C'est de ce génome dont on
parle en général quand on parle du génome d'un eucaryote (animal, plante, champignon, etc.)

• les génomes non-nucléaire, contenus dans des organites :


le génome mitochondrial, contenu dans les mitochondries chez la quasi-totalité des eucaryotes: des molécules
d'ADNmt circulaires ressemblant à l'ADN des bactéries ;
le génome chloroplastique, contenu dans les chloroplastes, chez les eucaryotes photosynthétiques (algues et
plantes).
• 2-1 le génome nucléaire:
Il possède une structure linéaire et ouverte qui est entourée d’une membrane nucléaire.
il est composé de 46 chromosomes qui contiennent 3,3 milliards de nucléotides avec 20 000 à 25 000 gènes
codant pour toutes les protéines nécessaires à sa fonction, ce qui inclut également les gènes mitochondriaux.
Il est caractérisé par son polymorphisme, c’est-à-dire formé par :

*4-5% d’ADN codant pour des protéines


*95-96% d’ADN (non codant le plus souvent) composé de séquences répétées appelé ADN répété ou
répétitif,
Les séquences répétées sont des séquences d'ADN de longueur variable, qui ne codent aucune protéine et
que l'on retrouve en plusieurs variétés dans un génome. On distingue :

✓Les répétitions en tandem : (ex: ATTCGATTCGATTCG 3 répétitions de 5 nucléotides)


il s'agit de répétitions de séquences d'ADN les unes à la suite des autres (adjacentes), classées en :
- Satellites ou macro satellites
- Mini satellites ou VNTR (Variable Number Tandem Repeats)
- Microsatellites ou STR (Short Tandem Repeats)

✓Les répétitions dispersées : elles sont dispersées sur l'ensemble du génome. On les trouve partout, dans les régions
géniques et inter-géniques. Ce sont essentiellement des éléments transposables (ou éléments génétiquement
mobiles) :
- LINEs (Long interspersed repeated sequences)
- SINEs (Short interspersed repeated sequences)
I- L’ADN répétitif (ou séquences répétées): peut être
hautement ou moyennement répétitif
• A. ADN hautement répétitif:
➢A-1 Satellites ou Macrosatellites :
-Répétitions en tandem (adjacentes les unes aux autres
sans interruption)
- de motif formé de 100 – 300pb,
-Bloc de 100 kb à plusieurs Mb de longueur (constituent
la majeure partie de l’heterochromatie)
- Ils constituent 3-5% de l’ADN de chaque chromosome
-Se trouvent dans les régions centromériques des
chromosomes

Le nom « ADN satellite » vient de ce que l’ADN de ces


séquences, en raison de leur nature répétitive, a une
composition en nucléotides fortement déformée par
rapport au reste du génome; en conséquence, il sédimente
différemment (densité différente) et forme une bande secondaire,
dite « satellite », dans un gradient de chlorure de césium.

➢A-2 Minisatellites : VNTR : Variable Number of Tandem Repeat


-Séquences Répétées en tandem de 10 à 100 pb ,
-Organisés en bloc de 0.1 à 20 kb
-Ils ont un polymorphisme de taille et de nombre de
répétitions qui les constituent ; -Ils sont présents sur tous
les chromosomes et dans les régions télomériques
(l’hexamère TTAGGG)
Applications :
- Médicale; dans le cas de recherche de monozygotisme chez des
jumeaux pour 1 greffe

- Médicolégale, dans le cadre de criminalistique

- Test de paternité +++

➢ A-3 Microsatellites ou STR:


-Séquences répétées en tandem de 1 -9 pb, Exemples:
- répétition de 2pb CACACACA
- répétition de 3pb GTTGTTGTTGTT
- répétition de 4pb ATGGATGGATGGATGG

- Organisés en bloc de longueur comprise entre 10 et 100 pb ;


-Très souvent le motif répété est le motif CA /GT d’où le nom de
VNDR ou CA repeats donné aux microsatelites (CACACACA)
- Elles sont dispersées à peu prés régulièrement le long génome
tous les 25 à 100 kb
-Localisés au niveau de centaines de milliers de sites le long du chromosome.

• Bien qu’elles soient situées sur des régions non codantes, certaines répétitions anormalement augmentées d’une
séquence tri nucléotidique peuvent être à l’origine de maladie
• Il existe au moins 14 types différents de maladies neuromusculaires dues à ce type d’anomalie, parmi lesquelles on
trouve :
- la maladie de Huntington
- le syndrome de l’X fragile
- la
dystrophie
myotonique
de Steinert
- l’Atrophie
musculaire
de Kennedy
Maladies héréditaires
à triplets
Différence entre microsatellite, minisatellite et macrosatellite

B- L’ADN moyennement répétitif:


-Séquences nucléotidiques dont la taille du motif varie de 100 à plus de 1000 pb
-Répétées des centaines voire des milliers de fois dans le génome.
2 groupes de séquences moyennement répétées :
-L’ADN répété en tandem : ADN codant
-L’ADN répété dispersé : ADN non codant
B-1 L’ADN répété en tandem codant : il comprend
-Les gènes de classe I qui sont regroupés en Clusters de 200 copies, localisés sur les chromosomes 13, 14, 15,
21 et 22.
-les gènes de classe III
B-2 L’ADN répété dispersé non codant
-Représenté par les éléments génétiques mobiles capables de transposition à de nouveaux sites. Ce sont des
séquences répétées de 100 à 6 000 pb voire même plus, dispersées dans tout le génome. Elles sont classés en 2
groupes:

* Séquences SINE: Short Interspersed Repetitive Element.


-10% du génome humain, ayant 100 – 500pb
-majoritairement localisées dans les régions les plus riches en GC.-
-la famille Alu est la plus abondante
Séquence Alu qui sont des séquences de 300 pb, avec 900.000 copies/génome humain, caractérisées par la présence
d’un site de restriction AG/CT reconnu par l’endonucléase Alu (isolée d’Arthrobacter luteus)
* Séquences LINE : Long Interspersed Repetitive Element
- représentent 17% du génome humain
- Leurs longueurs sont comprises entre 6 et 7 kb
- La plus abondante est la séquence LINE-1 (encore appelée L1):
Il en existe environ 1 500 000 copies dans le génome, mais 3 000 à 5 000 seulement sont des copies complètes
Elles sont dispersées dans tous le génome, mais elles sont majoritairement retrouvées dans les régions riches en AT
II- Les copies en Nombre Variable CNV et les SNPS:

A- les SNPs ou Single Nucléotide Polymorphisms:


• C’est le polymorphisme le plus répandu dans le génome humain.
• Ce sont des variations de la séquence nucléotidique de l'ADN d'un gène dans une population et le plus souvent il
s’agit de substitutions ne portant que sur une base
• Ils sont bialléliques et ils sont souvent phénotypiquement neutres
• Ils sont répartis sur l’ensemble du génome au niveau des régions codantes et non codantes.

B- les CNV ou Copies en Nombre Variable:


-C’est une forme particulière de polymorphisme dans lequel le nombre de copies d'un même gène ou d'un segment
d’ADN de 1 kb ou plus dans le génome est variable entre les individus de la même espèce.
-Le mécanisme exact de l'élaboration de nouvelles CNV n'est pas clairement compris (duplications, délétions,
duplications segmentaires, insertions, inversions et des translocations).
-Les CNV sont stables généralement et peuvent être héritées. Parfois, ils peuvent aussi se développer spontanément
au cours de la méiose.
-Plus de 12 % du génome humain (en 2006) serait concerné par le polymorphisme de nombre de copies géniques

Exemple de CNV
Cette duplication a créé une variabilité du nombre de copies Ce
chromosome a désormais 2 copies de cette section d’ADN
▪2-2 le génome mitochondrial:
Situé dans la matrice mitochondriale, il obéit à une hérédité dite cytoplasmique ou maternelle.
Sa quantité est non négligeable, il représente 1 à 2% de la masse totale d ’ADN de la cellule. Une cellule
possède plusieurs mitochondrie (1000) et chacune contient 4-10 molécules ADN mt.
C’est un ADN bicaténaire circulaire non associé à des histones, L’ADN mt humain a été entièrement
séquencée. Il contient 16 569 pb Il est dépourvu d’introns et ne contient pas de longues séquences codantes.
Il code pour des protéines constituant le système de phosphorylation oxydative. et des ARNt, ARNr.
Son code génétique est diffèrent du code génétique universel
Schema du génome mitochondrial Caractéristiques du code génétique
humain mitochondrial

Notion de GENES : unité de l’information génétique

• Un gène est l'unité physique et fonctionnelle de base de l'hérédité.


• Ce sont des fragments d’ADN (double hélice) localises sur les
chromosomes qui contiennent l’information nécessaire à la synthèse des
protéines
• Ils sont donc constitués d’ADN et ils sont de tailles différentes : chez
l’Homme, leur taille varie de quelques centaines de bases à plus de 2
millions de bases.
• Le site physique où se situe un gène sur le chromosome est est
dénommé locus

Classification des gènes


Il existe 3 classes de gènes chez les eucaryotes:

• Les gènes de classe I ou gènes transcrits par l’ARN polymérase I:


Ce sont les gènes ribosomaux codant pour la synthèse des 3 ARN du ribosome : ARN28S, 18S et 5,8S Ces
gènes ne sont pas dispersés dans le génome mais rassemblés en groupes Ils appartiennent à la catégorie de l’ADN
moyennement répétitive codante et ont comme caractéristique d’être répétés plusieurs milliers de fois.

• Les gènes de classe II ou gènes transcrits par l’ARN polymérase II:


Ils codent pour les protéines, ils sont le plus souvent uniques ou en faible nombre sauf pour les gènes codant
pour une histone.
Ils sont classés selon le nombre de leur copies, on distingue :
- les gènes uniques ou quasi uniques : la majorité des gènes appartiennent à cette classe
- les familles de gènes: ils codent pour des protéines grossièrement analogues (exemple: famille de gène de
la beta-globine, de la myosine)
- les gènes domestiques (house keeping gene) :
Ce sont des gènes qui assurent des fonctions indispensables à la vie de tous les types de cellules. Ils codent
pour des protéines domestiques comme les enzymes de la respiration, de la glycolyse Ces gènes ont un taux de
transcription faible et continu.
- les pseudo gènes :
Ce sont des séquences nucléotidiques non fonctionnelles qui ne sont ni transcrites , ni traduites. Ceci étant du soit à
l’absence d’un cadre de lecture suffisant (excès de codons stop) soit à l’absence de codon méthionine initiateur ou de
région promotrice par l’apparition de mutations.
• Les gènes de classe III transcrits par l’ARN polymérase III:
Ils codent pour les petits ARN (ARNt, ARNsn ou petits ARN nucleaires, ARNr5S). Ces gènes sont répètes en
Tandem.
Rôles des gènes

• Environ 1% seulement de l’ADN est constitué de gènes codant pour des protéines qui sont responsables des
différents caractères phénotypiques de l’individu: EXOME

• Les 99% restants sont non codants : ADN non codant, il ne fournit pas d'instructions pour la fabrication de
protéines,
ADN non codant = ADN poubelle, ADN satellite
ADN non codant:
- les introns
-des séquences répétées
-des séquences uniques
Rôles:
contrôle de l’activité des gènes codants (certaines séquences de cet ADN non codant sont régulatrices, permettant
l’activation ou la désactivation des gènes, elles informent les gènes codant du moment et de l’endroit où ils doivent
être actifs càd transcrits.
Anatomie d’un gène codant pour une protéine
Les gènes codant une protéine ou gènes de classe II ne présentent pas une structure absolue définie.
-ils sont parmi les gènes les plus fréquents.
-Leur information génétique presque toujours morcelée.
- Ces gènes commencent en 5’ par une séquence non transcrite dont la présence est nécessaire pour que la
transcription s’effectue quantitativement et qualitativement de manière normale.
Ces séquences peuvent êtres très éloignées (qques kb en amont) et sont difficiles à délimiter de manière précise,
c’est la région régulatrice d’un gène.
Anatomie d’un gene codant pour une protéine
- Vers -100 pb par rapport au site d’initiation
de la transcription commence la région dite
promotrice.
- Vers -70 à -80 pb se trouve très souvent une
séquence CAAT, ou se fixent un ou plusieurs
facteurs protéiques de transcription.
- Vers - 25 à -30 pb on retrouve sauf dans de
rares cas (gènes domestiques) la séquence
TATA appelée TATA box (Goldberg –Hogness
box), c’est à ce niveau que se fixe la RNA
polymérase II.
Si cette séquence est délétée, le taux de transcription est diminuée et la fidélité du point exact d’initiation est
perdue.
- Vient ensuite le site d’initiation de transcription, la base correspondant à ce site est le plus souvent une purine, suit
une partie non codante de longueur variable et ce jusqu’à la séquence ATG, codon méthionine qui signale le lieu
d’initiation de traduction.
Suivent ensuite une alternance de séquences conservées les exons ou non conservées les introns dans la version
finale du RNAm cytosolique:
• On appelle exon :
toutes les séquences transcrites retrouvées dans le messager cytosolique (Cela ne veut pas dire qu’ils
correspondent aux parties codantes du gène), en effet des séquences exoniques non codantes plus ou moins longues
peuvent exister en aval du codon STOP.

• On appelle intron :
toute séquence transcrite éliminée par l’épissage au cours de la maturation du transcrit primaire, donc non
retrouvée dans le messager cytosolique mur.
• Le signal pour l’arrêt de traduction est donné par un codon STOP : UAA, UAG, UGA.
• Enfin 10 à 20 bases avant la fin du dernier exon est retrouvée la séquence AATAAA improprement appelée
séquence de polyadénylation, séquence de reconnaissance pour la coupure du transcrit primaire ,site de fixation de
la poly A polymérase.
• Le gène se termine en 3’ par une région riche en G et C dont la nature n’est pas connue.
• Les limites du gène sont imprécises, leurs tailles sont très variables pouvant atteindre jusqu’à 2 millions de paires de
bases. Il n’y a pas de relation directe entre la taille de la protéine et la longueur du gène.

Anatomie d’un ADN procaryotique:

• Les gènes sont continus sans introns.


• Le messager correspondant est polycistronique.
• Organisés sous forme d’opérons

Un opéron est une unité d'ADN


fonctionnelle regroupant des gènes qui
opèrent sous le signal d'un même
promoteur, une section d'ADN qui
déclenche leur transcription.
Il est constitué de 3 composants
principaux :
-Le promoteur: c'est une séquence de nucléotides qui permet la transcription du gène en ARNm. Il est
reconnu par l'ARN polymérase qui initie la transcription.
Lors de la synthèse de l'ARN, le promoteur indique quel gène doit s'exprimer et donc quelles protéines la cellule doit
produire.
Donc un
opéron est
commun à
tous les
gènes.
-

L'opérateur : c'est un segment d'ADN et/ou de l'ARN messager auquel un signal chimique (une molécule régulatrice)
se lie. Ce peut être soit un signal répresseur soit un signal activateur de la transcription (opérateur ADN) ou de la
traduction (opérateur ARN) des gènes de l'opéron.
- Les gènes structuraux : ce sont les gènes contrôlés de manière coordonnée grâce à l'opérateur, c'est-à-dire
co-transcrits sous forme d'un ARN messager polycistronique
- Il en existe deux grands types :
-les opérons inductibles: codent pour des enzymes de la voie catabolique (dégradation). Exemple : Opéron
lactose.
-les opérons répressibles : codent pour les enzymes de la voie anabolique (biosynthèse). Exemple : Opéron
tryptophane.
Structure de l’Opéron Lactose

Vous aimerez peut-être aussi