Vous êtes sur la page 1sur 21

Etude de la rpartition

des squences Alu sur le


gnome humain
Projet de bioinformatique
Lucas von Gastrow, Tho Foutel--Rodier
L3 ens Cachan
9 mai 2014

Introduction
Le gnome humain est en majorit compos de squences rptes

Les squences Alu

Squence Alu canonique

Les squences Alu sont des SINEs et il y en a ~ 1000000 dans le gnome humain
Les Alu drivent de lARN 7S (~300pb)

Evolution des squences Alu

Les Alu sont les seuls SINEs


tre encore actif dans le
gnome humain

Les Alu ne se retrouvent


que chez les primates

Rle des alu


Implication potentielle dans les origines de rplication ?
Linsertion dun Alu dans un intron peut donner naissance un nouvel exon
piss alternativement.

Un Alu peut aussi accumuler des mutations et devenir une squence


rgulatrice de type enhancer

Problmatique

Comment les Alus se rpartissent-ils au sein


du gnome humain et quels sont les facteurs
susceptibles dinfluencer leur rpartition ?

Dmarche suvie :
Chromosome GRCh37
RepeatMasker
Localisation des Alu

Calcul du milieu de chaque Alu

Dtermination du nombre dAlus par


bloc de 300kb sur le
chromosome

Reprsentation de la rpartition des Alus sur le chromosome :

Graphe position et log(pos)


Il y a des zones qui sont plus denses en Alus que dautres

Dmarche (2)

Hypothse : rpartition alatoire des Alu = rpartition uniforme

Calcul du nombre thorique dAlus attendus sur une squence de 300kb

Comparaison de la rpartition des Alus une rpartition alatoire :

La rpartition des Alu ne semble pas alatoire sur le gnome humain. Il y a des
zones qui sont plus denses en Alus, comment se rpartissent alors les Alus les
uns par rapport aux autres ?

Etude des distances entre deux Alu successifs :


(Chromosome 15)

Les Alus apparaissent pour la majorit trs proches les uns des autres

Etude des distances entre deux Alu successifs :

Les Alus ne sont pas rpartis quitablement entre les chromosomes


Mais graphiquement toujours le mme type de distribution des distances

La rpartition des Alus nest donc priori pas la


mme pour deux chromosomes diffrents mais il y a
toujours une majorit dAlus trs proches les uns des
autres

Dmarche (3)

On cherche dterminer le caractre group ou isol des Alus

Ralisation de groupes dAlus dans lesquels la distance entre deux Alus voisins
est infrieure une valeur seuil

Etude des distances entre deux alu successifs (2)

Etude des distances entre deux alu successifs (2)

Dmarche (3)
Les gnes des chromosomes GRCh37
ont dj t rpertoris

Rcupration des gnes codant les


protines

Superposition de la rpartitions de ces gnes


celle des Alus suivant la mme dmarche

Etude de la proximit entre gnes et Alus :

Il semble que la prsence dAlu soit corrl la prsence de de gnes codant


des protines.

Etude du %GC corrl la prsence de squences Alu :

Il semble y avoir une bonne corrlation entre le %GC et la


quantit dAlu prsents lchelle considre sur le
chromosome 17.

Conclusion
Densit des squences Alu en certains
endroits
Variabilit de rpartition interchromosomique
Corrlation possible entre la prsence dAlus
et de gnes codant des protines
Corrlation possible entre prsence dAlu et
pourcentage de GC