Académique Documents
Professionnel Documents
Culture Documents
UE Biodiversité1.
Exercice1 :
Dans le premier exercice, le noeud le plus ancien des deux arbres se situe en bas de
la figure, et le temps s’écoule du bas vers le haut. Par conséquent, la grenouille et
l’homme partagent un ancêtre commun plus récent que la grenouille et la carpe. Du
point de vue évolutif, la grenouille est donc plus proche parente de l’homme que de la
carpe. Ceci n’empêche pas que la grenouille et la carpe soient dessinées côte à côte
sur l’arbre 1. Malgré quelques rotations autour des branches internes, la topologie de
l’arbre 2 est strictement identique à celle de l’arbre 1. Les conclusions
phylogénétiques demeurent inchangées.
Exercice2 :
Dans le deuxième exercice, le noeud 1 constitue la racine (représentation en
trifurcation de base). Le noeud 2 matérialise l’ascendance commune des
Champignons et des Animaux Bilatériens (Protostomiens + Deutérostomiens), et donc
en particulier celle des Champignons et des Deutérostomiens. Les autres noeuds
numérotés matérialisent respectivement les ancêtres communs hypothétiques les plus
récents des Choanoflagellés + Bilatériens (3), Bilatériens (4), Deutérostomiens (5) et
Protostomiens (6).
Exercice3 :
Dans le troisième exercice, trois arbres phylogénétiques possèdent la même
topologie qui peut s’écrire de la manière parenthésée suivante :
(O,(((A,B),(C,D)),(((E,(F,G)),(H,I)) ,((J,K),(M,(L,N)))))); [Il s’agit des phylogénies 1
à 3]. En revanche, la topologie de l’arbre 4 s’écrit : (O,(((A ,B
),(C,D)),(((E,(F,G)),(H,I)),((J,K),(N,(L,M)))))); [La différence implique le
branchement relatif des feuilles M, L et N]. Cette différence sera visible si les arbres
2, 3 et 4 sont réenracinés par la feuille O.
Exercice4 :
Dans le quatrième exercice, 8 arbres parmi les 9 ont leur topologie qui peut s’écrire
de la manière parenthésée suivante : (((((A,B),C),(D,(E,(F,G)))),H),(I,J)); [Il s’agit
des phylogénies 1, 2, et 4 à 9]. En revanche, la topologie de l’arbre 3 s’écrit :
(((((A,B),C),(E,(D,(F,G)))),H),(I,J)); [La différence implique le branchement relatif
des feuilles D et E].
LA RECONSTRUCTION DES ARBRES PHYLOGENETIQUES
Exercice 5 :
A) Reconstruction d’un arbre phylogénétique avec la méthode WPGMA.
Bst +
Bsu Lvi Amo Mlu
Bst + Bsu 0 25,5 32,5 22
Lactobacillus viridescens (Lvi) 0 28 39
Acholeplasma modicum (Amo) 0 43
Micrococcus luteus (Mlu) 0
Calcul de la somme des carrés des écarts entre distances génétiques et patristiques.
Méthode NJ :
Cette méthode ne travaille pas sur les taxons terminaux mais par agglomération successive au
niveau des nœuds de l’arbre. Méthode rapide qui fournit un arbre en relativement bonne adéquation
avec les données de départ. Cette méthode ne fait pas l’hypothèse d’égalité des taux d’évolution.
Méthode FITCH :
Cette méthode n’est pas un algorithme d’agglomération de séquences mais un critère d’optimisation
(cf. maximum de parcimonie en cladistique). L’algorithme va choisir l’arbre qui minimise la somme
des carrés des écarts entre distances génétiques et patristiques : ∑ (dg-dp)2.
Toutes ces méthodes résument l’information contenue dans les séquences sous forme de distances or la
similitude globale n’est pas un bon indicateur de la parenté.
Exercice 6 :
A)
Exercice 7 :
A)
EQ EB EZ EC BT
EQ 0 0,98 5,88 6,86 17,65
EB 0 4,9 5,88 16,67
EZ 0 6,86 15,69
EC 0 14,71
BT 0
EQ + EB EZ EC BT
EQ + EB 0 5,39 6,37 17,16
EZ 0 6,86 15,69
EC 0 14,71
BT 0
EQ + EB +
EZ EC BT
EQ + EB +EZ 0 6,62 16,43
EC 0 14,71
BT 0
EQ + EB +
EZ + EC BT
EQ + EB +EZ
+EC 0 15,57
BT 0
B)
Nombre de sites constants = 81
Nombre de sites variables = 21
Nombre de sites informatifs = 4
3 9 66 102
EQ A C T T
EB A C T T
EZ A T C T
EC G T C C
BT G T C C
Les mutations en rose représentent les synapomorphies portées par les sites
informatifs et les mutations en vert représentent les autapomorphies portées par les
sites variables non-informatifs.
Attention :
• Ne pas confondre un état de caractère présent chez le groupe externe avec un état de caractère
ancestral !
• Il n’est pas possible de connaître la polarité des caractères présentant un état différent
seulement chez la vache car on ne sait pas quel était l’état de caractère ancestral. L’utilisation
d’un 2d groupe externe permettrait de régler cette question mais un nouveau problème se
poserait pour tous les états de caractères présents uniquement chez ce deuxième groupe
externe. L’utilisation de plusieurs groupes externes permet la stabilisation de l’arbre
phylogénétique.
D) Les mutations ont lieu le plus souvent au niveau de la 3ème position du codon.
Ces mutations entrainent rarement le remplacement d’un acide aminé ; on parle de
mutation synonyme ou silencieuse du à la redondance du code génétique. Toutes les
transitions en 3ème position du codon sont synonymes. La pression de sélection est
plus forte en 1ère position du codon car il existe moins de mutations synonymes et
finalement, aucune mutation en 2ème position du codon n’est synonyme. Toutes les
positions ne sont pas libres de muter de la même façon.
On peut douter du fait que la mutation observée au site 101 chez le quagga (T) soit
apparue du vivant de l’animal car :
- une mutation en 2d position du codon est peu fréquente
- tous les autres vertébrés possèdent une cytosine à ce site
Il est raisonnable de penser que l’on a ici affaire à un artéfact expérimental.
Lorsque l’on travaille sur de l’ADN ancien on met en place des étapes de contrôle
pour s’assurer de l’authenticité de la séquence :
- On répète les manipulations en laboratoire (2 expérimentateurs différents dans
2 labo différents).
- On répète la manipulation à partir d’échantillons différents.
Exercice 8 :
A) Trois hypothèses évolutives
Sur la diagonale, d.g. et d.p. sont identiques, il n’y a pas d’homoplasie. Ces
données ne contiennent pas beaucoup d’homoplasie (conf. Ci et Hi)
L’homoplasie provoque l’augmentation des distances patristiques et déplace donc
les points dans la partie inférieure du graphe (sous la diagonale).
Plus les taxons sont distants, plus il y a d’homoplasie et plus les valeurs s’écartent
de la diagonale. Lorsque l’homoplasie est très importante un plateau se dessine, on
dit alors qu’il y a « saturation » des données.
Intérêts du graphique :
- Voir si les données contiennent de la saturation
- Voir entre quels individus il y a de la saturation
Remarque :
Le choix du marqueur moléculaire est très important :
- s’il est peu variable il ne contiendra pas assez d’information pour la reconstruction
phylogénétique ;
- s’il est trop variable il pourra être « saturé » (homoplasie) et donc contenir beaucoup de
« bruit de fond » avec un risque important de fausser les conclusions.
D) Valeurs de bootstrap
Les valeurs de bootstrap (BP) sont attachées au nœud étudié. Elles sont corrélées
avec la quantité de signal présent dans les données, c’est à dire au nombre de
substitutions se trouvant sur la branche conduisant au nœud. S’il on utilise un
marqueur moléculaire rapide ou lent cela va changer la proportion de caractères qui
définie chacune des branches de l’arbre.