Académique Documents
Professionnel Documents
Culture Documents
SEMESTRE 2
IV Génétique humaine
Introduction
1Maladies congénitales et maladies héréditaires
2 Hérédité des caractères normaux: cas des groupes sanguins
3 Maladies génétiques et chromosomiques
V Mutations
1 Mutations géniques
2 Mutations chromosomiques
V.2.1 Variations numériques des chromosomes
V.2.2 Variations structurales des chromosomes
Périodes et Contenues
Leçon 1 : Introduction : Objectifs, méthodes de la Génétique, terminologie et
symbolisme en Génétique
Leçon 2 : Bases structurales de l’Hérédité (1): acides nucléiques, soma, germen,
caryotype,
Leçon 3 : Bases structurales de l’Hérédité (2): Division Cellulaire, cycle cellulaire,
gamétogenèse chez les organismes supérieurs, fécondation
Leçon 4 : Première évaluation sur les leçons précédentes:
Leçon 5 : Mono hybridisme : relations entre allèles ; croisements mono factoriels ; loi de la
ségrégation mendélienne ; autres croisements mono factoriels faits par Mendel ; absence de
dominance ; codominance.
Leçon 6 : Di hybridisme, Poly hybridisme : croisements di hybridiques ; interprétation des
résultats ; loi de la disjonction indépendante des différentes paires de facteurs ; croisements
poly hybridiques et test cross ; modification des proportions classiques.
Leçon 7 : Deuxième évaluation sur les leçons précédentes
Leçon 8 : Interactions génétiques : interaction à 2 facteurs ; interaction d’épistasie ; autres types
d’interactions ; interaction à 3 facteurs ou plus ; pléiotropie.
Leçon 9 : Hérédité liée au sexe : importance de la sexualité ; mécanisme de la détermination
du sexe ; hérédité liée au sexe ; types particuliers d’hérédité liée au sexe ; caractères influencés
par le sexe ; caractère limité à un sexe ; changement de sexe ; phénomène sexuel chez les
plantes.
Leçon 10 : Liaisons génétiques : recombinaison entre gènes liés ; carte factorielle ; mesure
de la liaison à partir de la F2 ; combinaisons CIS et TRANS et pourcentage de
recombinaison ; linkage et crossing over ; mécanisme et types de crossing over ; crossing
over double ; facteurs qui affectent le crossing over ; conversion génique.
Leçon 11 : Allèles multiples : exemples de séries d’allèles multiples ; génétique de groupes
sanguins ABO ; applications pratiques des connaissances sur la génétique des groupes
sanguins ABO.
Leçon 12 : Evaluation finale.
Méthodes pédagogiques
Exposé magistral
Travail d’équipe
(Travaux dirigés)
Travail individuel (lecture en bibliothèque)
Evaluation
o Moyens d’évaluation
- Examen intra
- Examen final
o Pondération
- Examens intra : 60%
- Examen final : 40%
o Critère d’évaluation
- Précision, justesse, clarté, rigueur et concision
- Acquisition de connaissances
- Compréhension des processus et intégration entre les notions.
BIBLIOGRAPHIE
1 J.R. BEAUDRY Génétique Générale ; Uni. Montréal, 1985
2 WILLIAMS D. Stansfield Génétique : cours et problèmes ; 2ème Ed. 1986, série
SCHAUM. Paris.
3 J.L. ROSSIGNOL ABREGE DE GENETIQUE, Masson, 1978
4 Gérard LUCOTTE Génétique et évolution, Ed. VIGOT, 1978
5 Gérard LUCOTTE Biologie Animale et Humaine PCEM1. Masson, 1980.
6 CLAUDE HUMEAU L’essentiel en Génétique, S.M., Montpellier, 1987.
Introduction
La génétique est une discipline biologique qui étudie les phénomènes d’hérédité et de
variabilité des organismes vivants.
_l’hérédité est la transmission aux descendants, les caractères parentaux sous forme
d’un programme, par le biais de la réproduction sexuée.
_la variabilité est le changement, transmissible ou non héréditairement sous
l’influence du milieu ou autres facteurs éxogènes.
Objectifs : la génétique cherche à résoudre les grands problèmes que pose l’hérédité :
_Quelle est la nature du matériel héréditaire transmis par les parents à leurs
descendants ? Selon quelles lois ?
_ Parquel processus, selon quelles modalités, le programme est-il appliqué par les
descendants ?
Nature, transmission, application du programme héréditaire sont les trois questions
fondamentales auxquelles la génétique cherche à repondre.
La génétique et la Biologie
La génétique n’est pas une discipline isolée. Elle a des rapports très etroits avec les
autres disciplines biologiques : Cytologie, Embryologie, Biochimie, Systhématique,
Physiologie, ….. Elle montre que la base héréditaire est la même chez tous les êtres
organisés : C’est l’ADN.
Terminologie et définitions
Génétique : Science de l’Hérédité et de la Variabilité
Hérédité : transmission aux descendants des caractères des ascendants
Espèce : ensemble d’individus ayant même caractères morphologiques et
physiologiques héréditaires, des chromosomes égaux en nombre et en forme. Ils se
ressemblent suffisamment, occupent une aire définie et ils sont interféconds.
Population : ensemble d’individus de même espèce vivant dans un milieu donné
Lignée pure : ensemble d’individus de générations successives semblables pour tous
les caractères héréditaires considérés; les enfants sont donc identiques en tous points
aux parents.
Patrimoine héréditaire : ensemble de caractères héréditaires
Gène : facteur héréditaire déterminant l’apparition des différents caractères (forme,
couleur, taille.) ; à chaque gène correspond un caractère héréditaire. On peut dire aussi
ségment d’ADN (molécule d’ADN) responsable de l’apparition et de la manifestation
d’un caractère héréditaire. Le gène est transmis de génération en génération.
Gène dominant : est un gène qui manifeste ses effets toujours, qu’il soit à l’état
homozygote ou à l’état hétérozygote.
Gène récessif : est un gène dont les effets sont masqués par ceux du gène dominant.
Un gène récessif ne peut manifester son action que lorsqu’il est à l’état homozygote.
Allèle : état d’existence d’un gène
Allèles (gènes allélomorphes) : sont les diverses formes d’existence d’un gène,
occupant le même locus sur les deux chromosomes d’une même paire (paire
homolgue).
Locus (pluriel loci) : Emplacement du ou des gènes sur les deux chromosomes
homologues. Il faut bien noter que chaque gène peut exister en deux ou plusieurs
exemplaires qui occupent les mêmes loci.
Caractère : est une unité morphologigique, pysiologique, ou biochimique qui permet
de distinguer les êtres vivants. Les caractères héréditaires sont contrôlés par les gènes.
Génotype : caractères héréditaires déterminés par les gènes qui se trouvent sur les
chromosomes
Phénotype : Aspect extérieur traduisant chaque caractère. Un même phénotype peut
avoir des génotypes différents.
Hybridisme : croisement des deux races pures différentes aboutissant à la naissance
d’une 1ère génération formée d’individus appelés hybrides.
Hybride est, en génétique formelle, un individu issu du croisement de deux parents
ne présentant pas les mêmes versions pour un caractère.
Homozygote : est un génotype qui possède une paire d’allèles identiques en ou
plusieurs loci sur une paire de chromosomes homologues.
Hétérozygote : est un génotype qui possède une paire d’allèles différents en ou
plusieurs loci sur une paire de chromosomes homologues.
Somation : variation d’origine écologique qui n’affecte que le corps ou soma, c’est
une variation adaptative non héréditaire, elle est due aux facteurs du milieu
Mutation : variation d’origine génétique qui affecte le matériel génétique donc
héréditaire.
Mutation génique : Modification de la séquence nucléotidique de l’ADN : mutation
ponctuelle
Mutation chromosomique : anomalie portant sur le nombre de chromosomes ou
changement sur la structure des chromosomes (perte ou déplacement du ségment).
Codominance : si les deux allèles d’une paire sont tous exprimés à la fois chez
l’hétérozygote qui les porte et les caractères qu’ils déterminent sont tous apparents,
ces allèles sont dits codominants.
Superdominance : c’est la supériorité de l’hybride hétérozygote (hétérosis) par
rapport aux homozygotes parentaux (X1X2 > x1x1 et x2x2).
Absence de dominance ou dominance incomplète ou partielle : si aucun des deux
allèles d’une paire ne s’est exprimé chez l’hétérozygote qui les porte, mais un
caractère nouveau se manifeste, on parle d’absence de dominance ou de dominance
incomplète. C’est l’hérédité intermédiaire.
Variabilité : est le changement, transmissible ou non héréditairement sous l’influence
des conditions du milieu ou autres facteurs éxogènes.
• Les molécules d’acide désoxyribonucléiques sont formées de deux chaînes dont les
nucléotides sont hybridés deux à deux sur toute la longueur.
• Les deux chaînes sont antiparallèles, c’est à dire que l’extrémité 5’ de l’une est du
côté de l’extrémité 3’ de l’autre.
• Pour que tous les nucléotides puissent s’hybrider ; il faut que l’ordre dans lequel ils
sont liés ensemble soit complémentaire de la chaîne opposée.
• Les bases azotées liées par les liaisons hydrogènes sont tournées vers l’intérieur,
tandis que les riboses et les acides phosphoriques, hydrophiles sont tournés vers
l’extérieur.
• La chaleur peut dissocier les deux chaînes : c’est la fusion du DNA. Cette fusion est
réversible : les deux chaînes peuvent s’hybrider à nouveau.
La double hélice (modèle rubans)
• La structure secondaire du DNA est telle que les deux brins sont enroulés l’un autour
de l’autre. Chacun des deux brins est orienté (5’3’) dans le sens opposé à celui de
l’autre brin (3’5’). On dit qu’ils sont antiparallèles.
• Les bases azotées sont tournées vers l’intérieur de la double hélice de façon à ce que
chacune s’hybride avec une base de l’autre brin (A avec T, C avec G, etc..). On dit
que les bases successives de chacun des brins sont complémentaires.
• La double hélice a un « pas » de 3,4 nm c’est à dire qu’il y a environ 10 paires de
nucléotides pour chaque tour d’hélice.
• Lorsqu’on représente la double hélice selon son axe, on met en évidence deux
particularités.
• L’ensemble des désoxyriboses et des phosphates se trouve à l’extérieur de la
molécule et les fonctions acides des phosphates sont orientées vers l’extérieur.
• Les bases azotées sont tournées vers l’intérieur de la double hélice et unies à la base
complémentaire par des liaisons hydrogènes. Les nucléotides complémentaires
n’étant pas tout à fait diamétralement opposés, l’axe de l’hélice est vide.
5. Rôles : Ensemble, l’ADN et l’ARN jouent un rôle fondamental : ils sont le support
de l’information génétique.
5.1- Rôle de l'ADN : L’ADN est le support de l’information génétique et détermine
l'identité biologique de l’organisme (plante, grenouille ou humain). La préservation
de cette information génétique se fait grâce à une duplication des molécules d'ADN
avant la mitose (création de deux cellules filles identiques).
5.2 - Rôle de l'ARN : L’ARN possède de nombreux rôles. Il existe différents types
d’ARN et chacun d’entre eux joue un rôle spécifique.
_ L'ARN messager (ARNm) : est le produit de la maturation de l'ARN pré-messager
(ARNpm), qui lui est le produit de la transcription opérée sur l’ADN. La maturation
des ARNpm consiste en différentes modifications de la séquence telles que l'édition
ou l'épissage. L'épissage de l'ARNpm consiste à enlever les introns et à relier les exons
les uns à la suite des autres. Cette chaîne d'exons constitue alors l'ARN messager
« produit final ». Contrairement à l'ARN prémessager, l'ARN messager quitte le
noyau et est ultimement traduit en peptide dans le cytosol ou encore dans le réticulum
endoplasmique. L'ARNm est le « plan de construction » d’une protéine. Il n'y a pas
d'épissage chez les Procaryotes où l'ARN produit par la transcription est directement
l'ARNm (en effet ces organismes ne possèdent pas de noyau et les ribosomes se fixent
sur la molécule d'ARN pendant qu'elle est synthétisée). Dans le cas des eucaryotes
L'ARN prémessager nucléaire peut aussi être appelé ARN nucléaire hétérogène
(ARNnh) car il se retrouve strictement dans le noyau et est composé d'introns et
d'exons.
_ L'ARN de transfert (ARNt) : est impliqué lors de la traduction de l’ARN messager
en peptide. Il est chargé d’apporter les bons acides aminés en décryptant le langage
que constituent les codons et à les traduire en séquence d'acides aminés. Un codon est
constitué de trois nucléotides adjacents. Un codon correspond à un seul acide aminé,
mais un même acide aminé peut être spécifié par différents codons.
Voir code génétique pour savoir quels acides aminés sont associés à quels codons.
_ L'ARN ribosomique (ARNr) : constitue le ribosome après maturation et
association à des protéines. Les ribosomes sont des usines de fabrication de protéines.
Le ribosome s’associe à l’ARN messager et « lit » les codons qui s’y retrouvent. Il
gère ensuite l’entrée et la sortie des ARN de transfert qui transportent les acides
aminés. S’ensuit la naissance d’un peptide qui sera éventuellement, après plusieurs
étapes de maturation et d’assemblage, transformé en protéine.
_ Les microARN (miARN) : découverts en 1993 par Victor Ambros chez le ver
Caenorhabditis elegans. Ils possèdent une structure simple brin et sont longs de 19 à
25 nucléotides. Ils jouent un rôle dans le métabolisme cellulaire en empêchant la
traduction de certains ARN messager en peptides. En se liant à des ARN messagers
dont ils sont partiellement complémentaires, les microARN entraînent le blocage de
la traduction de l'ARNm par les ribosomes. Les miARN peuvent réguler l'expression
de plusieurs gènes (peut-être une centaine pour certains d'entre eux).
_ Les petits ARN interférents (pARNi) sont des petits ARN de 21-22 nucléotides
parfaitement complémentaires à leurs ARNm cibles. Contrairement aux miRNA, les
petits ARN interférents ne sont pas codés par le génome de la cellule hôte mais plutôt
apportés par un éventuel envahisseur tel que les virus. De plus, ils possèdent une
structure en double brin, et leur action consiste à dégrader les ARNm. Elle s’effectue
en collaboration avec des protéines appelées RISC (RNA Induced Silencing
Complex).
Ces dernières se fixent sur le brin antisens (complémentaire au brin codant) du petit
ARN interférent, le brin sens est abandonné, et le complexe (RISC + ARN simple brin
antisens) ainsi formé peut reconnaître le fragment d'ARNm correspondant et le
détruire, empêchant ainsi l'expression du gène associé. Les petits ARN interférents
sont plus spécifiques que les microARN : ils sont conçus pour reconnaître un seul
gène.
Ces ARN courts sont devenus un outil très utilisé en biologie moléculaire pour
éteindre un à un les gènes dont on souhaite déterminer le rôle métabolique. Leur
spécificité d'action fait des petits ARN interférents une voie très étudiée dans la lutte
contre le cancer et les maladies virales.
_ Petit ARN nucléaire, Petit ARN nucléolaire, scaRNA (small cajal bodies RNA) : ce
sont de courtes chaînes de ribonucléotides (qui se retrouve exclusivement dans le
noyau et plus précisément dans des compartiments du noyau comme le nucléole pr les
snoRNA et les corps de Cajal pour les scaRNA. Ces ARN non codants s’associent à
des protéines pour former des complexes nommés petites ribonucléoprotéines
nucléaires (pRNPn), essentiels lors du processus d'épissage des ARN prémessagers
et lors du processus de maturation des ARNr et ARNtm
6. Acides nucléiques dans les virus : Les cellules eucaryotes et procaryotes
possèdent à la fois de l’ADN et de l’ARN. À l'inverse chez les virus, il n’y a qu’un
seul type d'acide nucléique : soit de l’ADN soit de l’ARN, qui peuvent être
monocaténaire ou bicaténaire.
On sépare les virus en plusieurs classes, selon la forme sous laquelle est présenté leur
matériel génétique. Par exemple le génome du VIH est sous forme d'ARN.
Comparaison entre ARN ADN: L’A RN diffère de l’A DN par plusieurs caractères
:
1. il est plus court (70 à 10 000 nucléotides)
2. le squelette de pentoses et de phosphates contient du ribose à la place du
désoxyribose
3. parmi les bases azotées l’uracile (U) remplace la thymine (T)
4. Les RNA sont simple brin mais certaines régions sont appariées sur une courte
distance par leurs bases complémentaires selon un ajustement au hasard (épingles
à cheveux). L’ADN possède deux brins qui sont enroulés l’un autour de l’autre.
La transcription
Les « plans de fabrication » des proteines se trouvent dans le noyau, alors que les
« ateliers de fabrications » sont dans le cytplasme. La synthèse des proteines se fait
donc à partir de « photocopies ». Chaque photocopie sert de « matrice » pour la
fabrication de 10 à 20 molécules de proteine, puis elle est détruite.
Le code génétique :
• Le codon génétique correspond à l’enchainement ordonné de 3 bases
nucléotidiques (triplet) permettant de définir un code d’un acide aminé.
• Le codegénétique est transcrit en ARN et traduit en protéines.
• Dansles protéines, on trouve 20 acides aminés différents.
• Le codegénétique est universel (le même chez les eucaryotes et procaryotes).
• Il est dégénéré car un même acide aminé peut être codé par plusieurs codons.
La mise en pkace des acides animés dans une chaîne polypeptidique n’est pas
commandée directement par la séquence des nucléotides de l’ADN mais par celle de
l’ARN messager : c’est donc au niveau de cette molécule qu’il nous faut définir les
différentes unités du code génétique, c’est-à-dire les séquances de nucléotides
capables de commander chacune la mise en place d’un acide aminé déterminé.
Les expériences décrites dans la figure 1, ainsi que de nombreuses autres, ont permis
de vérifier que :
- l’information élémentaire, ou codon, correspondant à un acide aminé est portée par
triplet de nucléotides ;
- l’information est redondante, c’est-à-dire que la plupart des acides aminés sont
désignés par plusieurs triplets.
- le code génétique est commun à tous les êtres vivants, de la bactérie à l’homme, chez
les animaux comme chez les végétaux ; il est universel.
Le code génétique est « le dictionnaire que la cellule utilise pur traduire le language
en 4 lettres des acides nucléiques en un language à 20 lettres de protéines » (F.
Crick). Les « mots » du dictionnaire sont des triplets de nuclétides ou codons. Parmi
les 64 triplets possibles, 61 désignent un acide aminé défini ; les 3 autres ne
« codent » pas pour des acides aminés mais commandent l’arrêt de la synyhèse
d’une protéine et sont appelés pour cette raison « codons-stop ».
Cycle cellulaire : Le cycle cellulaire est l'ensemble des étapes qui constituent et
délimitent la vie d'une cellule. Ce cycle est composé de plusieurs phases de croissance
dans lesquelles la cellule grossit et duplique son matériel génétique (interphase) et
d'une phase où celle-ci se divise (mitose) pour donner naissance à deux cellules filles
identiques (dans le cas de la mitose). Les cellules filles reproduiront ce cycle, et ainsi
de suite.
1 Durées : Les durées des différentes phases du cycle cellulaire ont pu être mesurées
in vitro en condition optimale :
_ Chez les procaryotes (bactéries) : environ 20 minutes (Escerichia.coli possède un
cycle de 20 minutes)
_ Chez les eucaryotes :
_ Levure : 1h30 à 2 heures
_ Fibroblastes (humains) 16 à 24 heures.
Avec, selon les espèces et les types cellulaires :
_ Phase G1 : quelques heures à plusieurs années.
_ Phase S : 6 à 20 heures.
_ Phase G2 : 2 à 6 heures.
_ Phase M : 1 à 2 heures.
2 Phases du cycle cellulaire
2.1 Notations quantitatives
Le génome des eucaryotes comprend un nombre N de types de chromosomes. Ce
nombre diffère d'une espèce à l'autre. Chaque cellule diploïde contient deux
chromosomes homologues (ayant les mêmes fonctions) par type – un en provenance
du père et un en provenance de la mère – au total 2 fois N, abrégé « 2N »,
chromosomes. Chaque cellule haploïde ne contient qu'un chromosome par type – un
mélange de gènes du père et de la mèree ; obtenu par le processus d’enjambement,
voir ci-dessous :
– au total 1 fois N, abrégé « 1N » chromosomes.
Les chromosomes produits par le processus de réplication sont appelés « chromatides
» ou « chromatides-soeurs » et ne reprennent leur nom de « chromosome » qu'après
leur séparation en mitose/anaphase ou en méiose/anaphase2.
D'autres sources n'utilisent le vocable « chromatide » qu'à partir du moment où les
centromères des chromosomes sont en contact l'un avec l'autre. Le nombre de
chromatides par type de chromosome dans une cellule est indiqué par un chiffre, suivi
de la lettre C. Par exemple, « 4C » pour 4 chromatides par type de chromosome.
Quelques exemples :
_ Une cellule diploïde à deux chromatides (avant la phase S et en mitose : télophase)
sera donc notée : « 2N-2C »
_ Une cellule diploïde à quatre chromatides (mitose : prophase à anaphase) : « 2N-
4C»
_ Une cellule haploïde à deux chromatides (méiose : télophase1 à anaphase2) « 1N-2C
»
_ Une cellule haploïde à une chromatide (méiose : télophase2) : « 1N-1C »
Note : Par souci de clarté, les illustrations et les textes qui suivent sont rédigés
comme s’il n'existait qu'un type de chromosomes. Il faut évidemment retenir
qu'ils s’appliquent à l'ensemble des N types de chromosomes.
2.4 Méiose : Le but de la méiose est double : d'une part le mélange de génome
paternel et maternel, assurant ainsi une variation génétique maximale, et d'autre part
la production de cellules haploïdes à une chromatide pour la reproduction sexuée.
_ Prophase I (2N-4C) : Comme pour la prophase de la mitose on a au départ une
paire de chromatides soeurs paternelles et une paire de chromatides soeurs
maternelles. C'est à ce stade que se produit l'enjambement permettant le mélange du
génome maternel et paternel. Jusqu'à présent les chromosomes du père et de la mère
se côtoyaient. Maintenant ils s’unissent. Lors du processus appelé « synapse », les
chromatides sont alignées côte à côte. Les chromatides homologues forment des
chiasmas (croisements) au niveau desquels des segments de chromatide sont échangés
et recombinés par coupures et sutures successives.
_ Métaphase I (2N-4C) : Les paires de chromatides sont alignées sur le plan
équatorial du noyau. Comme pour la mitose, un fuseau de microtubules se forme à
partir des pôles du noyau. Des microtubules kinétochores s’attachent aux kinétochores
de chaque chromatide. L'enveloppe nucléaire se dissout.
_ Anaphase I (2N-4C) : Les deux paires de chromatides sont attirées chacune vers un
pôle de la cellule. À ce stade seules les paires de chromatides sont séparées mais non
pas les chromatides soeurs ellesmêmes.
_ Télophase I (1N-2C) : Une nouvelle enveloppe nucléaire se forme autour des
paires de chromatides respectives, formant deux noyaux haploïdes, contenant chacun
une seule paire de chromatides. Cette division est appelée « réductionnelle » parce
qu'elle implique un passage de diploïde à haploïde. La cellule se divise à son tour par
cytokinèse.
_ Prophase II (1N-2C) : Chaque cellule haploïde formée lors de la télophase 1
contient une paire de chromatides d'origine maternelle ou paternelle, mais dont les
gènes sont constitués d'éléments mixtes suite au phénomène d'enjambement.
_ Métaphase II (1N-2C) : Comme lors de la métaphase mitotique, les fuseaux de
microtubules se forment et maintiennent les centromères des chromatides au niveau
du plan équatorial.
_ Anaphase II (1N-2C) : Contrairement à la division « réductionnelle » de l'anaphase
1 qui sépare deux paires de chromatides, la division « équatoriale » de l'anaphase 2
sépare les chromatides soeurs, comme dans l'anaphase de la mitose.
_ Télophase II (1N-1C) : Une enveloppe nucléaire se reforme autour de chacune des
deux chromatides et la cellule se divise donnant naissance à deux cellules, toujours
haploïdes, mais ne contenant chacune qu'une chromatide.
Lors de la fécondation une cellule 1N-1C fusionnera avec un gamète d'un autre
organisme pour produire un zygote 2N
Résumé de la Méiose
Comparaison entre Mitose et Méiose
La recombinaison
•La principale source de diversité chez les espèces
•Crée les cross-over dans les chromosomes
•La recombinaison se passe:
–Lors de la méiose chez les eucaryotes
–Lors de l’intégration d’ADN externe chez les procaryotes
Gamétogenèse chez les organismes supérieurs
Fécondation : La fécondation, pour les êtres vivants organisés, est le stade de la
reproduction sexuée consistant en une fusion des gamètes mâle et femelle en une
cellule unique nommée zygote. Elle a été observée et décrite pour la première fois par
Gustave Adolphe Thuret en 1854 chez l'algue brune Fucus.
La fécondation permet le passage de deux cellules haploïdes, c'est-à-dire les gamètes,
en une cellule diploïde qui est le zygote.
1. Historique
Les Grecs utilisaient la fécondation artificielle du dattier au Ve siècle av. J.-C.
L'insémination artificielle était pratiquée par les Arabes pour la reproduction des
chevaux depuis le XIVe siècle.
2. Fécondation chez les végétaux : Le processus complet de la fécondation est encore
mal compris. Ce n'est que récemment qu'on a compris la manière dont le tube
pollinique était chimiquement guidé vers l'ovule en s’enfonçant dans les tissus de
reproduction féminins avant de cesser sa croissance, se casser pour libérer deux
spermatozoïdes, l'un fécondant l'ovule et l'autre fusionnant avec une cellule femelle
pour générer l'endosperme, le tissu de nutrition de l'embryon végétal. Ce n'est que
récemment qu'on a identifié le mode de signalisation permettant aux cellules mâles et
femelles de se reconnaître et produire l'embryon. Au début des années 2000, Thomas
Dresselhaus et ses collègues à l'Université de Ratisbonne (Allemagne) trouvaient
quatre protéines défensines exclusivement exprimées dans le sac embryonnaire, ce
type de protéines étant habituellement impliqué dans le système immunitaire des
végétaux, mais aussi d'insectes et d'autres animaux. Elles auraient pu être destinées à
tuer d'éventuels microbes qui auraient pénétré l'ovaire, mais via d'autres études
d'expression des gènes et la création de plantes knock-down, on a montré que l'une de
ces quatre protéines (la Defensine-like, ZmES4) est rejetée par le sac embryonnaire
au cours du processus de fécondation et provoque la rupture du tube pollinique qui
peut alors libérer les spermatozoïdes. La fonction de cette protéine n'était pas la
défense, mais la rupture de l'extrémité du tube pollinique; il pourrait s’agir d'un
détournement de fonction originellement de protection immunitaire. La protéine cible
du tube pollinique est celle des canaux potassiques. Quand elle est contactée par
ZmES4, un flux d'ions potassium et d'eau est brusquement apporté dans les canaux
potassiques, rompant l'équilibre osmotique et provoquant une mini-explosion qui
libère également les deux spermatozoïdes. La protéine n'agit ainsi que sur le tube de
sa propre espèce (La fécondation a même été retardée de 30 min dans le tube
pollinique d'une sous espèce proche de maïs, Tripsacum dactyloides). Certains
généticiens souhaitent mieux comprendre ces mécanismes pour créer des outils
biotechnologiques permettant de nouvelles fertilisations croisées voire la création de
chimères (ce qui demanderait aussi de résoudre des problèmes d'incompatibilités
génomiques). Des outils ou tests de sélection pourraient aussi dériver de cette
découverte.
Dans le domaine des végétaux, la fécondation se réalise selon deux modalités :
_ L’autofécondation (autogamie), ou fécondation par son propre pollen (cas général
chez le pêcher). Ce mode de fécondation favorise un taux élevé d'homozygotie. ;
_ L’interfécondation (allogamie), ou fécondation croisée (cas général chez le
pommier et le poirier), les insectes et particulièrement les abeilles assurant
fréquemment la pollinisation. Ce mode de fécondation favorise un taux élevé
d'hétérozygotie.
2. 1). Double fécondation : Chez les angiospermes la fécondation est double : Le
grain
de pollen produit deux cellules germinales.
_ L’une des deux cellules germinales mâle s’associe à l'oosphère. Ceci mène à la
formation du zygote plantule, ou embryon de plante, à l'origine d'une nouvelle plante.
Ce zygote est diploïde.
_ L’autre fusionne avec les deux noyaux de la cellule centrale et constituent le zygote-
albumen, servant de réserve pour la plantule lors de la germination. Ce zygote est
triploïde.
2. 2). Fécondation artificielle : Elle permet de réunir sur un seul individu les qualités
possédées par plusieurs individus. Les soins préalables consistent à enlever, avant la
fécondation, toutes les anthères des fleurs qu'on veut féconder puis, quand le stigmate
est bien développé, à apporter sur ces fleurs castrées, du pollen d'une variété dont on
veut reproduire les caractères.L'hybride ne sera pas le fruit obtenu mais le fruit issu du
semis des graines du fruit obtenu.
3. Fécondation chez les animaux
3. 1). Fécondation naturelle : Deux types de fécondation existent chez les animaux
: la fécondation interne et la fécondation externe.
3 .1. 1) Fécondation interne : Lors d'une fécondation interne, le sperme mâle est
émis dans les voies génitales femelles, où les spermatozoïdes rencontreront les
ovocytes. Ce type de fécondation implique généralement coopération des individus et
accouplement. La fécondation, c'est-à-dire la rencontre des gamètes, peut être facilitée
par des comportements sexuels, notamment des parades nuptiales. Chez les espèces à
fécondation interne, ces comportements favorisent le rapprochement des deux
partenaires et, donc, l'accouplement. La fécondation interne est trouvée généralement
chez les espèces vivant en milieu terrestre. Elle est rencontrée principalement chez les
mammifères (y comprisaquatiques), les oiseaux, les reptiles ou les insectes. En outre,
dans le milieu aquatique, la fécondation interne existe chez les poissons cartilagineux
(sélaciens comme les requins) et les mollusques céphalopodes.
3 .1. 2) Fécondation externe : Lors d'une fécondation externe, les gamètes sont émis
dans le milieu extérieur. Il n'y a pas d'accouplement dans ce type de fécondation, et
les gamètes libérés vont se rencontrer au gré du hasard dans l'eau où ils vont s’unir.
Les gamètes sont émis en très grande quantité, ce qui optimise les probabilités de leur
rencontre. Certaines espèces à fécondation externe présentent aussi des
comportements sexuels qui facilitent la rencontre des gamètes. C'est le cas, en
particulier, de grenouilles ou de poissons dont la parade nuptiale permet la libération
simultanée des gamètes. La fécondation externe est trouvée généralement chez les
espèces vivant en milieu aquatique. Elle est rencontrée principalement chez les
batraciens, les poissons osseux ou de nombreux invertébrés aquatiques.
3. 2). Fécondation artificielle :
Observateur et expérimentateur de premier ordre, l'Abbé Spallanzani réalise, en 1777,
la première fécondation artificielle, en étudiant le mécanisme de la reproduction chez
les batraciens. Il réussit, en 1779, la première insémination artificielle d'une chienne.
En 1875, l'embryologiste Oscar Hertwig observe, lors d’une fécondation artificielle
d’oursin, la pénétration d’un spermatozoïde dans l’ovule, la fusion des noyaux mâle
et femelle et la division de l’oeuf en deux cellules.
4. Fécondation chez l'être humain : Chez les humains, comme chez la plupart des
animaux, la fécondation est une des étapes de la reproduction. Elle consiste en la
rencontre du gamète mâle, le spermatozoïde avec le gamète femelle, un ovocyte II. Le
gamète mâle doit préalablement avoir subi l'étape de capacitation dans les voies
génitales femelles et obtenir sa capacité fécondante. La fécondation se déroule en 4
phases bien distinctes:
_ Reconnaissance spécifique : le spermatozoïde et l'ovocyte se reconnaissent comme
compatibles, de la même espèce. Cette reconnaissance est effectuée entre les protéines
composant la zone pellucide (enveloppant l'ovocyte pendant sa maturation) et des
récepteurs présents sur la membrane du spermatozoïde. Le spermatozoïde ne subit pas
de phénomène de rejet comme corps étranger car il produit à sa surface des cytokines
polypeptidiques, des Transforming Growth Factor-bêta (TGFβ2 et GFβ3) qui
agissent comme éléments anti-rejet. Il se produit alors une réaction acrosomique, qui
va “dissoudre” la zone pellucide et permettre le passage du gamète mâle, jusqu'à la
membrane plasmique de l'ovocyte. Chez l'humain et autre mammifère à fécondation
interne, il n'y a à priori pas de problème de reconnaissance, deux espèces différentes
ne s’accouplant que rarement ensemble. Les expériences ont tout de même montré
qu'une fécondation entre deux espèces différentes n'était pas possible, du fait de la
différence des génomes entre les espèces. Ce mécanisme de reconnaissance spécifique
est surtout utile pour les animaux à fécondation externe, comme certains poissons ou
batraciens : la femelle pond ses oeufs dans le milieu, et le mâle vient y déposer son
sperme.
_ Fusion du spermatozoïde et de l'ovocyte : afin de garder une quantité 2n de
matériel génétique chez le zygote, un seul spermatozoïde doit féconder l'ovocyte : c'est
la monospermie. Cette monospermie est premièrement permise quasiment
immédiatement par le changement de la polarité électrique de la membrane de l'ovule
dès le premier contact avec le spermatozoïde et par la reconnaissance mutuelle de
deux protéines spécifiques, Juno et Izumo ; elle est ensuite permise grâce au réveil
ovocytaire qu'entraine la fusion des gamètes (caryogamie), qui est une réaction plus
lente (une dizaine de minutes environ). Ainsi les granules corticaux (lysosomes
synthétisés durant la croissance de l'ovocyte) sont exocytés sous le contrôle d'une
augmentation de la concentration en calcium cytosolique et leurs contenus
enzymatiques modifieront les glycoprotéines de la zone pellucide qui deviendra
“imperméable” à d'autres spermatozoïdes.
_ Reprise de la méiose pour l'ovocyte : celui-ci était bloqué en métaphase II avant
la fécondation. Il finit donc sa deuxième division de méiose et expulse son deuxième
globule polaire. Cette activation de l'ovocyte est sous le contrôle du calcium
cytosolique dont la concentration augmente grâce à une enzyme (une PhosphoLipase
C) apportée par le spermatozoïde. Une fois cette étape terminée, on trouve dans
l'ovocyte deux noyaux, appelés pronuclei : le pronucleus femelle et le pronucleus mâle
(provenant du spermatozoïde). On peut alors parler d'ovule et non plus d'ovocyte.
_ Amphimixie et déclenchement du développement embryonnaire : il s’agit de la
fusion des deux pronuclei. En réalité, les deux pronucléi ne se fusionnent pas à
proprement parler, comme on pourrait l'imaginer, mais le matériel génétique se
rassemble sur la plaque équatoriale au moment de la métaphase de la toute première
division cellulaire du nouveau zygote.
3.1 Fécondation in vitro : Jusqu’au XXe siècle, la fécondation, la fusion des
Gamètes avait nécessairement lieu dans le corps de la femme. Mais en 1978, naît
Louise Brown, le premier nouveau-né obtenu par fécondation in vitro, donc par une
fécondation hors du corps de la femme. Le principe de base est simple: un prélèvement
de sperme de l'homme et un ovocyte II de la femme sont mis en contact dans une
éprouvette, et un oeuf se forme. L'embryon obtenu est alors transféré dans l'utérus de
la femme. En fait, pour augmenter les chances d'avoir un embryon, il faut employer
plusieurs ovules. Les ovaires de la femme sont sur-stimulés pour obtenir une dizaine
d'ovules. Le sperme de l'homme est mis en contact avec tous ces ovules, ce qui permet
d'obtenir cinq ou six embryons. Deux ou trois d'entre eux sont transférés dans le corps
de la femme, alors que les autres sont congelés si la division cellulaire le permet. Ils
pourront être utilisés pour une autre tentative, si les parents le désirent, ou bien être
détruits.
Caryotype : le but des études cytogénétiques est l’établissement du caryotype.
On appelle caryotype, l’ensemble des chromosomes du noyau cellulaire et génotype,
l’ensemble des gènes sur ces chromosomes.
Les chromosomes : Un chromosome est formé de deux brins d'ADN reliés par le
centre, ce qui donne l'apparence d'un X. L'ADN sous cette forme est visible lors de la
division du noyau cellulaire.
Le nombre de chromosomes est toujours le même pour tous les individus d'une même
espèce, mais il peut varier d'une espèce à l'autre.
Espèce Nombre de paires de chromosomes
Drosophile 4
Pigeon 8
Humain 23
Chat 19
Vache 30
Plasmodium malariae 1
Grenouille 13
Ver de terre 18
Souris 20
Cheval 33
Chien 34
Papillon lysandria 190
Chimpanzé 24
Orge, Pois 7
Maïs 10
Riz 12
Tabac, Pomme de terre 24
La chromatine est la forme où les chromosomes sont enchevêtrés et repliés sur eux-
mêmes. Cette forme est présente en dehors des phases de la division du noyau. Pendant
la division cellulaire, les chromosomes prennent réellement la forme d’une paire de X
où chacune des deux branches d’un X se nomme chromatide soeur. Ils sont liés au
centre, au niveau du centromère.
La méthode utilisée : Mendel a choisi une plante à fleurs qui peut se reproduire par
autofécondation: les petits pois comestibles (Pisum sativum L.). Les petits pois
se reproduisent naturellement par autofécondation (plante autogame). Néanmoins, la
taille de la fleur permet une castration en coupant les étamines. Mendel put alors
apporter le pollen provenant d'une autre fleur afin de réaliser une fécondation croisée.
L'originalité de sa démarche est qu'il a attendu d'avoir des plantes aux caractéristiques
stables sur plusieurs générations avant de commencer ses essais de croisements. Ces
souches sont dites pures par rapport à la caractéristique considérée.
Le choix de Mendel fut dicté par plusieurs considérations. D’une part, il était aisé de
se procurer tout un éventail de variétés différant par des caractères aussi facilement
repérables que la couleur des graines, la longueur des tiges, la position des fleurs ou
la forme de la cosse. D’autre part, les pois pouvant être fécondés par pollinisation
croisée en transférant artificiellement le pollen d’un plant sur un autre plant, il était
facile de contrôler le type de croisement et éviter ainsi l’autofécondation naturelle de
la plante. Enfin, leur temps de génération étant relativement court et leur descendance
nombreuse, ils représentaient un matériel de choix pour l’expérimentation et son
traitement statistique.
Une des premières tâches de Mendel fut de s’assurer de disposer de lignées pures2,
c’est-à-dire de populations homozygotes qui engendrent toujours des descendants
identiques à eux-mêmes pour le caractère considéré, en cultivant les différentes
variétés qu’il avait choisies pendant deux ans. Il réussit ainsi à sélectionner sept paires
de lignées pures, chaque paire ne se distinguant des autres que par un seul caractère :
- la couleur de la graine jaune ou verte,
- la forme de la graine lisse ou ridée,
- la grandeur de la tige longue ou courte,
- la position des fleurs axiale ou terminale,
- la couleur des fleurs violette ou blanche,
Comme le montre le tableau suivant, en croisant deux lignées pures ne différant que
par un seul caractère (par exemple des pois à graines jaunes et des pois à graines
vertes), un des deux caractères disparaît à la génération suivante (1ère génération
filiale ou F1).
Chaque parent étant homozygote (J/J ou v/v), il ne peut en effet former qu’un seul
type de gamète : l’un porteur de l’allèle J, l’autre porteur de l’allèle v. La fécondation
réunira donc obligatoirement les deux allèles J et v mais J étant dominant, il sera le
seul à s’exprimer. Par conséquent tous les hybrides de première génération seront de
phénotype « graine jaune ».
En croisant ensuite les hybrides de première génération (F1) entre eux, on aboutit alors
aux résultats Suivants.
Cette fois, les deux caractères parentaux réapparaissent mais dans un rapport 3/1 :
75% des hybrides de deuxième génération présentent le caractère dominant et 25% le
caractère récessif.
C’est la deuxième loi de Mendel ou loi de la ségrégation : tous les hybrides de
deuxième génération issus du croisement de deux hétérozygotes pour un même
couple d’allèles ne se ressemblent pas et présentent l’un ou l’autre des caractères
de la génération parentale. Autrement dit, la deuxième loi de Mendel ou loi de la
ségrégation indépendante des versions alternatives d'un caractère lors de la
formation des gamètes dit qu’au moment de la formation des gamètes, il y a
séparation des caractères chacun ne contenant que l'un ou l'autre des "facteurs" ;
les deux catégories de gamètes sont produites en égale quantité par l'hybride et leur
combinaison est aléatoire au moment de la fécondation
En reprenant le cas où deux hybrides de F1 à graine jaune (J/v) sont croisés ensemble,
on obtient ainsi 1/4 de J/J, 1/2 de J/v et 1/4 de v/v, soit 3/4 d’individus possédant le
phénotype « graine jaune » et 1/4 le phénotype « graine verte ».
Exercice d’application : On dispose de deux lignées pures de rats qui diffèrent par
un seul caractère : l’une est constituée de rats blancs, l’autre de rats noirs.
1. Le croisement d’un rat blanc avec un rat noir donne en F1 100% de rats noirs.
Expliquez ce résultat.
2. Quels seront les résultats statistiques de la F2 résultant du croisement des rats
obtenus en F1 ?
3. Doit-on s’assurer de la pureté des rats blancs ?
4. Qu’obtiendrait-on en croisant :
a. un rat blanc de lignée pure avec un rat obtenu en F1 ?
b. un rat noir de lignée pure avec un rat obtenu en F1 ?
Solution : Si les rats de départ appartiennent à des lignées pures, ils sont
obligatoirement homozygotes pour le caractère étudié. Par conséquent, leur génotype
sera :
- Noir/Noir pour les rats noirs,
- Blanc/Blanc pour les rats blancs, et ils ne pourront chacun former qu’un seul type de
gamète.
1. Le croisement des deux lignées entre elles aboutissant à 100% de rats noirs, on peut
donc en déduire que le caractère noir est dominant (désormais symbolisé par N), que
le caractère blanc est récessif (désormais symbolisé par b) et que leur transmission est
conforme à la première loi de Mendel. Par conséquent, tous les rats obtenus en F1
seront hétérozygotes.
Génotype (N/N) x (b/b) → Génotype N/b
Phénotype N x b → Phénotype N
2. Le croisement des rats obtenus en F1 suivra la deuxième loi de Mendel et donnera
75% de rats noirs et 25% de rats blancs. On peut le vérifier à l’aide de l’échiquier de
croisement suivant.
3. Il est parfaitement inutile de s’assurer de la pureté des rats blancs dans la mesure
où le caractère blanc est récessif. Par conséquent tous les rats blancs seront
obligatoirement homozygotes b/b.
4. Toujours à l’aide d’échiquiers de croisement, on aboutira aux résultats suivants :
a. (b/b) x (N/b) → 50% de rats blancs (b/b) et 50% de rats noirs (N/b) ;
b. (N/N) x (N/b) → 100% de rats noirs (50% de N/N et 50% de N/b).
b) Monohybridisme sans dominance : Expérience et résultats statistiques : On
croise à la génération parentale "P" une fleur rouge et une fleur blanche de Mirabilis
jalapa, la Belle de nuit, on obtient en première génération "F1" des hybrides roses
tous semblables
Si l'on croise deux de ces fleurs roses F1, à la seconde génération "F2", on obtiendra
des plantes à fleurs rouges, d'autres à fleurs blanches et d'autres à fleurs roses.
Si l'expérience a été faite sur un grand nombre d'individus, on constate que ces
différents types apparaissent selon des proportions définies : 1/4 de plantes à fleurs
rouges, 1/4 de plantes à fleurs blanches et 2/4 de plantes à fleurs roses.
Interprétation : Caractère étudié : "couleur de la fleur" représenté chez les parents
par deux allèles, respectivement "rouge" et "blanc".
Dominance et récessivité : Dans cet exemple, les allèles blanc et rouge ont une
importance équivalente dans la détermination du phénotype floral: on dit qu'ils sont
codominants ou isodominants. Dans ce cas on représente chaque allèle correspondant
par de lettre majuscule B pour blanche et R pour rouge. Nos deux croisements
successifs peuvent se résumer ainsi:
Quel est le lien avec les chromosomes et l'ADN?
Les petits pois sont des plantes diploïdes: un chromosome vient du plant père (parent
paternel) et un chromosome vient du plant mère (parent maternel). Les plantes à fleurs
violettes ont un gène sur l'un des chromosomes qui code pour la synthèse de
l'anthocyane, un pigment responsable de la couleur violette des fleurs. Dans les plantes
à fleurs blanches, le gène est absent; Les fleurs n'ont donc aucune couleur particulière.
Dans les plantes à fleurs roses, le gène codant pour l'anthocyane est actif mais le
pigment est produit en plus faible quantité. Il cotoie le blanc; ce qui donne finalement
des fleurs roses.
I.2 DIHYBRIDISME : C’est le croisement de deux individus appartenant à deux
lignées ou deux races pures qui diffèrent par deux couples de facteurs opposés.
Les phénomènes décrits jusqu’à présent ne concernaient que des lignées parentales
pures se distinguant par un seul caractère. Voyant maintenant ce qu’il en est
lorsqu’elles diffèrent par deux caractères distincts et reprenons les expériences de
Mendel effectuées à partir de pois à graines jaunes / ridées et de pois à graines vertes
/ lisses.
Comme précédemment, il s’agit bien sûr de lignées homozygotes de sorte que le
croisement de pois à graines jaunes / ridées entre eux ne donne que des pois à graines
jaunes / ridées et il en est de même pour les pois à graines vertes / lisses. En revanche,
si l’on croise les deux variétés entre eux, tous les pois de F1 présentent le même
phénotype (graines jaunes et lisses) et aucun pois à graines vertes / ridées n’apparaît.
On peut donc en conclure une nouvelle fois que les caractères « graine jaune » et «
graine lisse » sont dominants alors que les caractères « graine verte » et « graine ridée
» sont récessifs. Ce qui en termes de génotype et de phénotype peut s’énoncer de la
manière suivante en utilisant l’allèle J pour jaune dominant, l’allèle L pour lisse
dominant, l’allèle v pour vert récessif et l’allèle r pour ridé récessif.
Mendel croise alors les hybrides obtenus en F1 entre eux et observe que les quatre
caractères parentaux réapparaissent en F2 mais dans un rapport 9/3/3/1. 9/16 des pois
sont à graines jaunes et lisses (J ; L), 3/16 à graines jaunes et ridées (J ; r), 3/16 à
graines vertes et lisses (v ; L) et 1/16 à graines vertes et ridées (v ; r), ce que confirme
l’échiquier de croisement suivant.
Les deux lois d’uniformité et de ségrégation sont donc à nouveau vérifiées : tous les
hybrides de première génération se ressemblent mais pas ceux de deuxième
génération. Et n’importe quelle combinaison de caractères aboutirait à des proportions
identiques : 3/4-1/4 en cas de monohybridisme, 9/16-3/16-3/16-1/16 en cas de
dihybridisme.
On peut ainsi multiplier le nombre de caractères étudiés (polyhybridisme), mais leur
observation devient vite fastidieuse. Un trihybride, par exemple, fabriquera huit types
de gamètes (23), l’échiquier de croisement comportera 64 cases (8 x 8) et il sera
possible d’obtenir 27 génotypes différents en F2 (33). Un tétrahybride 16 types de
gamètes (24) et 81 génotypes en F2 (34)… dont un n’a en réalité qu’une chance sur
256 d’apparaître dans la descendance ! Etc., etc.
Exercice d’application : à partir de trois pois à graines jaunes et lisses pris au hasard,
on effectue pour chacun d’entre eux un croisement avec un pois à graines vertes et
ridées. Les résultats, rapportés à la centaine, sont les suivants :
- croisement n°1 → 51 graines jaunes et lisses, 49 graines vertes et lisses,
- croisement n°2 → 100 graines jaunes et lisses,
- croisement n°3 → 24 graines jaunes et lisses,
26 graines jaunes et ridées,
25 graines vertes et lisses,
25 graines vertes et ridées.
1. Quels sont, de ces quatre caractères, ceux qui sont dominants et ceux qui sont
récessifs ?
2. À l’aide de symboles appropriés, établissez le génotype des quatre pois de départ et
construisez pour chaque cas l’échiquier de croisement. Comparez avec la descendance
observée.
Solution
1. Le croisement N°2 nous apprend qu’en croisant un pois à graines jaunes et lisses avec
un pois à graines vertes et ridées, ces deux derniers caractères disparaissent en F1. Nous
pouvons donc en déduire que le caractère « graine jaune » domine sur le caractère «
graine verte » et que le caractère « graine
lisse » domine sur le caractère « graine ridée».
Nous poserons donc pour la suite :
- J pour « graine jaune »,
- v pour « graine verte »,
- L pour « graine lisse »,
- r pour « graine ridée ».
2. Les caractères « graine verte » et « graine ridée » étant récessifs, le pois à graines
vertes et ridées sera obligatoirement homozygote pour les deux caractères, présentera
donc le génotype v/v ; r/r et ne pourra former qu’un seul type de gamète. En revanche,
les trois pois à graines jaunes et lisses étant de phénotypes dominants, il est impossible
de déterminer leur génotype sans étudier la descendance de chacun d’entre eux.
Le croisement N°1 faisant apparaître deux phénotypes distincts prouve que le premier
pois n’est pas homozygote pour les deux caractères. En effet, s’il était de génotype J/J
; L/L, tous les descendants présenteraient le même phénotype, conformément à la
première loi de Mendel. C’est donc qu’il est de génotype J/v ; L/L et qu’il a formé
deux types de gamètes comme le montre l’échiquier suivant.
Nous obtenons donc 50% de pois à graines jaunes et lisses et 50% de pois à graines
vertes et lisses, valeurs très proches de celles observées (51 et 49).
Par contre, le croisement N°2 aboutissant à 100% de graines jaunes et lisses, nous
pouvons en déduire que l’hybridation a concerné deux lignées pures. Le pois à graines
jaunes et lisses est donc homozygote pour les deux caractères J/J ; L/L.
Les généticiens ayant par convention décidé d’accepter une marge d’erreur de 5%, il
faut, pour que la différence entre les deux distributions ne soit pas significative, que
le χ2 soit inférieur à 3,841 lorsqu’on étudie deux caractères, 5,991 trois caractères,
7,815 quatre caractères, etc. conformément aux valeurs qui ont été établies par les
statisticiens. De sorte que, si, pour un nombre de caractères donné, on obtient une
valeur de χ2 inférieure à celle de la table, l’hypothèse est considérée comme juste. À
l’inverse, si cette valeur est supérieure, c’est que l’hypothèse doit être abandonnée.
Prenons l’exemple du croisement effectué par Mendel entre une lignée pure de pois à
graines lisses et une lignée pure de pois à graines ridées. En F1, tous les hybrides
obtenus sont de phénotype « graine lisse ». On peut donc en conclure que le caractère
« graine lisse » est dominant et que le caractère «graine ridée » est récessif. Par
conséquent, les hybrides de F2 devraient faire réapparaître les caractères parentaux
dans un rapport 3/1 : 75 % des pois présentant une graine lisse et 25 % des pois une
graine ridée.
Or sur un total de 7 324 graines, 5 474 sont lisses (O lisse) et 1 850 ridées (O ridée)
alors que la prévision attendue est de 5 493 (7 324 x 75%) graines lisses (Alisse) et de
1 831
(7 324 x 25%) graines ridées (ridée).
χ vingt-deuxième lettre de l’alphabet grec s’écrit chi mais se prononce ki.
Appliquons le test du χ2 :
Ce résultat étant très inférieur à 3,841, l’hypothèse testée est correcte : les hybrides de
deuxième génération se distribuent conformément aux lois de Mendel dans le rapport
3/1. Si tel n’avait pas été le cas, il aurait fallu élaborer une autre hypothèse.
Exercice d’application
À partir d’un couple de cobayes gris à pelage lisse, un éleveur obtient en quatre ans
128 petits : 78 gris à pelage lisse, 19 gris à pelage rude, 26 blancs à pelage lisse et 5
blancs à pelage rude.
1. Quel était le génotype des parents ?
2. En supposant que la transmission des caractères gris, blanc, lisse et rude est
conforme aux lois de Mendel, quelle aurait du être la composition de la descendance
?
3. Vérifiez si cette hypothèse est exacte en utilisant le test du chi deux.
4. Comment l’éleveur pourra-t-il obtenir une lignée pure de cobayes blancs à pelage
rude ?
5. Qu’obtiendrait-on en croisant entre eux des cobayes blancs à pelage lisse ?
Solution
1. La descendance faisant apparaître de nouveaux phénotypes prouve que les allèles
correspondants appartenaient au patrimoine génétique des parents mais qu’étant
récessifs, ils ne s’exprimaient pas. Nous pouvons donc en déduire que chaque parent
était hétérozygote pour les deux couples de caractère (G/b ; L/r) en posant G pour gris
dominant, b pour blanc récessif, L pour lisse dominant et r pour rude récessif.
2. Les parents étant tous deux hétérozygotes, ils vont former chacun quatre types de
gamètes (G ; L /G ; r / b ; L / b ; r). En réalisant un échiquier de croisement, nous
obtiendrons donc quatre phénotypes distincts.
Pois Rose
G : Pr pR
Pour les phénotypes on a : 9 P-R (noix) 3 P-rr (pois) 3 ppR- (rose) 1 pprr (simple).
Le fait que R et P doivent être simultanement présent pour donner le seul caractère en
noix constitue un cas de gènes complémentaires.
Les situations de ce genre ne sont pas rares ; ainsi le pelage des rats AARR est gris.
La Polymérie :
Est l’interaction des gènes non allèlique dont tous les allèles dominants manifestent
absolument le même effet phénotypique. C'est-à-dire le même caractère
phénotypique. La polymérie contrôle les caractères quantitatifs ; autrement, dit les
caractères qui peuvent être mésurés, pesés, dénombrés,…
Dans ce cas, on parle de la polymérie cumulative, car, chaque allèle dominant
augmente le niveau par dégré de manifestation du caractère en question.
L’augmentation du nombre d’allèles dominants entraîne l’augmentation du dégré
d’expression du caractère phénotypique.
Si un seul allèle dominant est suffisant pour la manifestation phénotypique du
caractère, il sagit de la polymérie non cumulative.
L’Epistasie :
Habituellement, on parle d’épistasie lorsque des gènes suppriment ou masquent
l’action des autres gènres, non allèles, c'est-à-dire situés à d’autres loci. Ces gènes sont
appelés « épistasique » et ceux dont l’action est supprimée sont dits «hypostatique».
Cependant, le mot épistasie est de nos jours employé pour toutes sortes d’interactions
géniques. La dominance implique une suppression intragénique, c'est-à-dire le
masquage par un allèle de l’expression d’un allèle du même locus.
L’épistasie implique aussi une suppression intergénique, c'est-à-dire le masquage
par un gène de l’expression d’un gène différent situé à un autre locus. Dans ce cas, les
proportions phénotypiques classiques 9 : 3 : 3 : 1 observées dans la descendance de
croisements dihybridiques ou bifactoriels, sont modifiées en proportions qui
représentent des groupements variés de ces différentes classes. On observe alors 6
types de proportions en F2, et, pour trois (3) d’entres elles on a trois (3) phénotypes ;
pour les trois (3) auters on en a seulement deux (2).
1- Epistasie dominante(12 : 3 :1) : Soient deux paires d’allèles : Aa Bb, avec
dominance de A et B
respectivement sur leurs allèles a et b. En présence de A, B ne s’exprime pas. On dit
que A est épistatique à B et b.
Quand l’allèle dominant d’un locus, par exemple l’allèle A est seul responsable d’un
phénotype donné, quelque soit l’allèle présent à l’autre locus on dit que le locus A est
épistasique sur le locus B. Cette épistasie est dominante puisque l’allèle dominant A
peut aussi bien s’exprimer en présence de B que de b. Les allèles du locus hypostatique
(Bet b) ne pourront s’exprimer que chez des individus homozygotes et recessif pour
le locus épistasique (a). Ainsi, les individus de génotypes A – B et A – bb aurront le
même phénotype et les individus aa B – et aabb, deux (2) autres phénotypes, la
proportion classique 9 : 3 : 3 : 1 est alors modifiée en proportion 12 : 3 : 1.
Exercice1: La couleur du poil des chiens dépend d’au moins deux (2) gènes. A un
locus, un inhébiteur dominant épistasique (I-) empêche l’expression des allèles de
coloration situé à un autre locus indépendant du premier. Ce gène I est donc
responsable de la couleur blanche. Quand il est à l’état homozygote recessif (ii) les
allèles du locus hypostatique B peuvent s’exprimer, les individus iiB- sont noirs, les
individus iibb, marron. Quand les chiens blancs, hétérozygotes pour les deux (2)
gènes, sont croisés ensemble, déterminer :
a). les proportions phénotypiques attendues dans la descendance ;
b). la probabilité d’avoir parmi les descendants blancs, un individu homozygote aux
deux (2) locis.
Exercices2 : Dans les bulbes d’oignons, un gène (I-) qui inhibe la production de
pigment manifeste une épistasie dominante sur le locus R : au génotype iiR-
correspondent des bulbes rouges et au génotype iirr des bulbes jaunes.
a). Dans un croisement entre deux sources pures, l’une blanche et l’autre rouge, tous
les descendants en F1 sont blancs et en F2 on obtient les proportions suivantes : 12
blancs, 3 rouges et 1 jaune. Quel était les génotypes des parents ?
b). Si des oignons jaunes sont croisés à une source pure blanche de génotypes
différents de celle de la question (a), quelle serront les proportions phénotypiques
attendues en F1 et en F2 ?
a) Si parmi les descendants blancs F2 de la question (a), 32 ont le génotype IiRR, quel
doit être le nombre d’individus dans chacune des trois classes phénotypiques F2 ?
2- Epistasie dominante double (15 : 1) : A et B étant dominants sur leurs allèles, chacun
des deux exercent un effet épistasique sur l’allèle recessif de l’autre :
F1: ¾ ppY-
Toute la descendance est à cœur jaune
¼ ppyy
Quelles sont les proportions phénotypiques parmi les descendants issus des
croisements suivants:
a) PpYy * PpYy ?
b) PpYy * ppyy ?
c) Ppyy * ppYY ?
5). Epistasies dominante et récessive (13 : 3): A et B dominants, avec A épistasique
à B et b épistasique à a
Quand le même phénotype est obtenu soit par la présence de d’un génotype dominant
au locus (A-), soit par celle du génotype récessif à l’autre (bb), on observe seulement
deux phénotypes en F2. Dans ce cas, les individus A- B-, A- bb et aabb ont le même
phénotype, les individus aaB- présentent un autre phénotype; et les proportions sont
alors: 13 : 3.
Exercice: Chez l’oignon, on connait plusieurs races pures dont les bulbes sont blancs.
Lorsque certaines de ces races sont croisées entre elles, on obtient en F2 selon les cas:
3 colorés pour 1 blanc ou 3 blancs pour 1 coloré. Les deux gènes impliqués sont
indépendants.
a).On croise une souche blanche homozygote pour les deux allèles dominants avec
une souche doublement récessive: Qu’obtient-on en F1 et en F2?
b).De quel type d’interaction s’agit-il?
c).Appelons I et C, les deux allèles dominants. On sait que des oignons de génotype
I-C- deviennent jaunes en présence de fumées d’ammoniaque alors que des oignons
blancs de bénotype cc ne jaunissent pas dans ces conditions. On croise une plante
blanche qui peut jaunir en fumée d’ammoniaque avec une plante blanche incapable de
changer de couleur. On obtient des descendants blancs et colorés dans les proportions
7/8 : 1/8. Quels étaient les génotypes des parents?
d).On croise une plante blanche capable de changer de couleur avec une plante
colorée: On obtient des descendants colorés et blancs dans un rapport de 3 : 5. Quels
étaient les types des parents?
III Génétique morganienne
Introduction : Les travaux de Mendel, bien qu’ignorés de son vivant, ont résisté à
l’épreuve du temps et constituent encore aujourd’hui la base de toute étude génétique
consacrée à la transmission des caractères héréditaires. Pourtant, il est des cas où la
descendance observée ne correspond pas aux prévisions attendues. On parle alors de
distribution non conforme.
Le phénomène fut observé pour la première fois au début des années 1900 par Bateson
et Punett chez le Pois de senteur. En laissant se reproduire les hybrides de F1 obtenus
après croisement de deux lignées pures (l’une à fleur pourpre et grain de pollen long,
l’autre à fleur rouge et grain de pollen rond), la F2 présentait des proportions très
éloignées du rapport 9 :3 :3 :1 attendu.
En croisant les hybrides entre eux, nous obtenons donc, conformément aux lois
de Mendel, neuf génotypes différents et quatre phénotypes apparents dans un
rapport 9 :3 :3 :1.
Supposons maintenant qu’un même chromosome porte les deux gènes (gènes
liés). Les hybrides de F1 renfermeront à nouveau les quatre allèles mais ceux-ci
seront disposés sur la même paire de chromosomes. Conséquence, ils ne
pourront former que deux types de gamètes.
Résultats :
41,50% de Drosophiles grises aux ailes longues
41,5% de Drosophiles noires aux ailes vertes
8,5% de Drosophiles grises aux ailes vertes
8,5% de Drosophiles noires aux ailes longues
C’est un Back Cross en dihybridisme réciproque du précédant c’est à dire au
croisement 2
N.B : Le linkage a seulement été réalisé en 41,5 % et n’est pas réalisé en 8,5 %.
Comme nous avons 4 chiffres dont 2 fortes proportions, à peu près égales et de 2
faibles proportions, on dit que le linkage n’est pas absolu ; .il est suivi de
CrossingOver à la fin duquel nous avons 4 sortes d’individus correspondant à 4
phénotypes différents.
Le linkage a été réalisé seulement dans 41 ,5% + 41, 5% = 83% des cas. Le linkage
n’a pas été réalisé dans 8 ,5% + 8,5% = 17% des cas.
17% est aussi appelé taux d’exception ou taux de recombinaison (où linkage n’a
pas été réalisé.) qui permet d’évaluer la distance qui sépare les deux allèles gris
et longs d’une part, et noirs et vestigiales sur le même chromosome d’autre part.
1% de recombinaison = 1 Unité Morgan (U.M)17% de recombinaison = 17
Unité Morgan
1=100%
1P =41,5ù + 41 ,5% =83%
P = taux d’exception = 17%
(1P) /2 = 83,5%/2 =41,5%
Etablissement de la carte factorielle :
C’est la détermination de la distance qui sépare les gènes alignés linéairement
sur le même chromosome. Un enjambement ou CrossingOver (C.O) ne peut
séparer 2 gènes que s’il s’effectue entre le segment qui porte les 2 gènes liés.
Un C.O a d’autant plus de chance de se faire que les 2 gènes liés sont éloignés
sur le même chromosome.
Le pourcentage de recombinaison ou taux d’exception est plus élevé si les 2
gènes sont plus éloignés sur le même chromosome.
Exemple : 23% > 17%
Tout cela nous emmène à conclure que les gènes sont alignés linéairement et
échelonnés sur toute la longueur du chromosome.
L’unité de transmission des caractères héréditaires n’est donc pas le
chromosome entier mais seulement plus ou moins par une portion de
chromosome qui porte le
gène intéressé c'estàdire le gène transmis.
Etude d’un exemple :
Chez les Drosophiles, les allèles ‘’ailes longues ‘’ et ‘’corps gris ‘’ d’une part,
les allèles ‘’corps noirs et à ‘’ailes vestigiales’’ d’autre part, sont séparés sur le
même chromosome par une distance de 17 UM. (U.M = Unité Morgan)
- les allèles corps gris et oeil blanc sont recombinés pour 23% des cas c'estàdire
séparés par une distance de 23 UM sur le même chromosome.
- Les allèles corps gris et oeil ébène sont liées pour 4% des cas c’est à dire
séparés par une distance de 4 UM sur le même chromosome.
Etablir la carte factorielle
Première possibilité :
Deuxième possibilité :
N B : Les caractères longs, gris, oeil bleu, oeil ébène, sont donc échelonnés sur le
deuxième chromosome.
Dresser les tableaux de l’échiquier de croisement dans la théorie chromosomique
du dihybridisme.
Exercices : I. Deux lignées pures de drosophiles, l’une à corps gris et soies normales,
l’autre à corps ébène et soies épaisses, sont croisées entre elles. En F1, tous les insectes
sont gris et présentent des soies normales. On effectue alors un croisement-test entre
ces hybrides de première génération et la souche pure à corps ébène et soies épaisses
qui aboutit aux résultats suivants :
- 50% des insectes possèdent un corps gris et des soies normales,
- 50% des insectes possèdent un corps ébène et des soies épaisses.
1. Identifiez les caractères dominants et les caractères récessifs.
2. Quel est le génotype des hybrides obtenus en F1 ?
3. Pourquoi n’observe-t-on que deux catégories d’insectes lors du croisement-test ?
Que pouvezvous en déduire quant à la position des gènes sur les chromosomes?
Pour s’assurer des résultats, on recommence exactement la même expérience mais
cette fois la population d’insectes obtenue se décompose comme suit :
- 42,5% possèdent un corps gris et des soies normales,
- 7,5% possèdent un corps gris et des soies épaisses,
- 7,5% possèdent un corps ébène et des soies normales,
- 42,5% possèdent un corps ébène et des soies épaisses.
4. Par quel processus a-t-on pu obtenir un résultat différent ?
5. Représentez la garniture chromosomique de chaque type d’insecte obtenu.
II. Monohybridisme :
A. Chez certaines belles-de-nuit, la couleur des fleurs est déterminée par deux allèles
codominants : l’allèle R pour la couleur rouge et l’allèle B pour la couleur blanche.
Les plantes hétérozygotes ont des fleurs de couleur rose.
1. Quel sera le résultat du croisement d’une plante à fleurs blanches avec une plante
à fleurs rouges ?
2. Donnez les résultats statistiques des croisements effectués entre :
a. une plante à fleurs rouges avec une plante à fleurs roses ;
b. une plante à fleurs blanches avec une plante à fleurs roses ;
c. deux plantes à fleurs roses.
3. Est-il possible d’obtenir des plantes à fleurs roses homozygotes ?
B. On peut distinguer trois types de radis selon la forme de leurs racines : longue,
ronde ou ovale.
Les radis à racine longue croisés entre eux ne donnent que des radis à racine longue,
les radis à racine ronde croisés entre eux ne donnent que des radis à racine ronde,
alors que le croisement d’un radis à racine longue avec un radis à racine ronde donne
un radis à racine ovale.
1. Quel est le couple d’allèles concerné ?
2. Donnez le génotype de chaque type de radis.
3. Qu’obtiendrait-on en croisant :
a. des radis à racine ovale entre eux ?
b. des radis à racine ovale avec des radis à racine longue ?
c. des radis à racine ovale avec des radis à racine ronde ?
C. Un éleveur achète quatre souris : un mâle gris (N°1), deux femelles grises (N°2 et
N°3) et un mâle noir (N°4). Il effectue alors plusieurs croisements et obtient les
résultats suivants :
- N°1 x N°2 → 100% de souris grises,
- N°1 x N°3 → 75% de souris grises et 25% de souris noires,
- N°2 x N°4 → 100% de souris grises.
1. Quel est le caractère dominant ?
2. Donnez le génotype des quatre souris.
3. A quels types de descendants et en quelles proportions peut-on s’attendre en
croisant le N°3 avec le N°4 ?
D. Un éleveur possède deux types de lapins : des lapins à poils courts et des lapins à
poils longs. Il procède alors aux croisements suivants :
a. lapins à poils courts x lapins à poils courts → 45 à poils courts et 14 à poils longs,
b. lapins à poils longs x lapins à poils longs → 60 à poils longs,
c. lapins à poils courts x lapins à poils longs → 29 à poils courts et 31 à poils longs.
1. Quel est le phénotype dominant ?
2. Expliquez les descendances obtenues à l’aide des lois de Mendel.
E. Un couple de volailles « herminées » (plumage blanc parsemé de quelques
plumes noires) a produit au cours de plusieurs cycles de reproduction un total de 48
poules dont 13 étaient noires, 12 étaient blanches et 25 herminées.
1. Quelle explication génétique pouvez-vous donner à ce résultat ?
2. Quel était le génotype du couple initial ?
3. À quel pourcentage de volailles herminées peut-on s’attendre si l’on croise des
volailles blanches ensemble ?
F. Chez certains scarabées, la couleur des élytres peut être bleue, verte ou turquoise.
Afin de déterminer le mécanisme qui en est responsable, on procède aux croisements
suivants :
a. scarabée bleu x scarabée vert → 100% bleu,
b. scarabée bleu x scarabée bleu → 75% bleu et 25% turquoise,
c. scarabée vert x scarabée ver → 75% vert et 25% turquoise,
d. scarabée bleu x scarabée turquoise → 50% bleu et 50% turquoise,
e. scarabée bleu x scarabée bleu → 75% bleu et 25% vert,
f. scarabée bleu x scarabée vert → 50% bleu et 50% vert,
g. scarabée bleu x scarabée vert → 50% bleu, 25% vert et 25% turquoise,
h. scarabée turquoise x scarabée turquoise → 100% turquoise.
1. Déterminez les rapports de dominance entre les allèles concernés.
2. Etablissez le génotype de chacun des parents et de leurs descendants.
III. Dihybridisme et Chi carré ou Khi deux
A. Une variété de lupin présente plusieurs types de graines qui peuvent différer par
l’aspect (blanc ou marbré) et par la saveur (douce ou amère). En ne prenant en
compte que le premier caractère, on réalise plusieurs croisements :
a. graines marbrées x graines blanches → graines toutes marbrées en F1,
152 marbrées et 49 blanches en F2 ;
b. graines blanches x graines marbrées → graines toutes marbrées en F1,
98 blanches et 308 marbrées en F2 ;
c. graines marbrées x graines blanches → 92 blanches et 96 marbrées en F1,
- les blanches ne donnent que des graines blanches en F2 ;
- les marbrées donnent 490 graines blanches et 1 520 graines marbrées en F2.
1. Expliquez ces résultats à l’aide des lois de Mendel.
2. Pour chaque cas, donnez le génotype des parents et celui de leurs descendants.
On croise ensuite deux lignées pures, l’une à graines marbrées et amères, l’autre à
graines blanches et douces, de manière à obtenir des hybrides qui possèdent tous le
même phénotype et qui sont à leur tour croisés entre eux. Après comptage, les
graines recueillies en F2 se répartissent de la manière suivante :
- 548 sont marbrées et amères, - 183 sont blanches et amères,
- 178 sont marbrées et douces, - 62 sont blanches et douces.
3. Quel était le génotype des hybrides de première génération ?
4. Vérifiez si le couple d’allèles concernés se transmet conformément aux lois de
Mendel en utilisant le test du khi deux.
B. On dispose de deux variétés de tomates : l’une à gros fruits et l’autre à petits
fruits. La seconde est naturellement résistante à un champignon parasite, en revanche
la première y est particulièrement sensible. Dans le but de produire des tomates à
gros fruits résistants, on croise alors les deux variétés puis les hybrides de première
génération entre eux. Les résultats sont les suivants :
- 7 304 plants présentent des petits fruits résistants,
- 2 431 plants présentent des petits fruits sensibles,
- 2 422 plants présentent des gros fruits résistants,
- 809 plants présentent des gros fruits sensibles.
1. Vérifiez si cette distribution est conforme aux lois de Mendel en utilisant le test du
khi deux.
2. Qu’obtiendrait-on en croisant les plants à gros fruits résistants entre eux?
C. Deux souches pures de drosophiles, l’une à corps gris et ailes longues, l’autre à
corps ébène et ailes vestigiales, sont croisées entre elles. En F1, tous les insectes
présentent le même phénotype : un corps gris et des ailes longues.
1. Identifiez les caractères dominants et les caractères récessifs.
2. À quels phénotypes et en quelles proportions peut-on s’attendre en croisant les
hybrides entre eux ? L’hybridation ayant été effectuée, les insectes obtenus en
deuxième génération se répartissent de la manière suivante :
- 1 795 possèdent un corps gris et des ailes longues,
- 588 possèdent un corps ébène et des ailes longues,
- 615 possèdent un corps gris et des ailes vestigiales,
- 202 possèdent un corps ébène et des ailes vestigiales.
3. Comparez cette descendance avec vos prévisions en utilisant le test du khi deux.
Un croisement-test est alors effectué entre les hybrides de première génération et la
souche pure à corps ébène et ailes vestigiales. Les nouveaux insectes se répartissent
comme suit :
- 47 possèdent un corps gris et des ailes longues,
- 54 possèdent un corps ébène et des ailes longues,
- 52 possèdent un corps gris et des ailes vestigiales,
- 47 possèdent un corps ébène et des ailes vestigiales.
4. Ces résultats confirment-ils votre hypothèse ? (vous pouvez à nouveau utiliser le
test du khi deux pour le vérifier).
IV. Autres cas
A. Une femelle hétérozygote de génotype A/a ; B/b est croisée avec un mâle
homozygote récessif pour les deux caractères. Leur descendance aboutit aux
génotypes suivants :
- 448 A/a; B/b,
- 452 a/a; b/b,
- 46 A/a; b/b,
- 54 a/a; B/b.
1. Expliquez ces résultats. Que pouvez-vous en déduire quant à la position des deux
couples de gènes ?
2. Qu’aurait-on obtenu, si les gènes se transmettaient selon une distribution
mendélienne classique ?
3. Représentez les garnitures chromosomiques des différents descendants obtenus
dans chaque cas de figure.
B. Certains papillons peuvent présenter des ailes unies ou tachetées. En croisant
deux lignées pures, un mâle aux ailes tachetées et une femelle aux ailes unies, on
observe que tous leurs descendants possèdent les ailes tachetées. Par contre, les
hybrides de première génération croisés entre eux donnent 50% de mâles aux ailes
tachetées, 25% de femelles aux ailes tachetées et 25% de femelles aux ailes unies.
1. Quel est le phénotype dominant ?
2. Sachant que chez les papillons le sexe est déterminé par les chromosomes Z et W
(les mâles étant ZZ et les femelles ZW), montrez, à l’aide de symboles appropriés,
que les caractères « ailes unies » et « ailes tachetées » sont liés au sexe.
C. Chez une race de chats domestiques, les mâles sont noirs ou oranges, les femelles
noires, oranges ou « écailles de tortue » (fourrure bicolore).
1. La couleur du pelage est-elle liée au sexe ?
2. Qu’obtiendrait-on en croisant :
a. un mâle noir et une femelle orange ?
b. un mâle noir et une femelle « écailles de tortue » ?
3. Dans une portée de chatons, on trouve un mâle noir, un mâle orange, une femelle
noire et une femelle « écailles de tortue ». Quelle était la couleur des parents ?
Hérédité liée au Sexe ou gènes portes par les Chromosomes Sexuels
Les lois de l’hérédité décrites jusqu’ici ne concernaient que les gènes portés par les
autosomes ou chromosomes non sexuels. Or la différenciation sexuée implique
l’existence d’une paire de chromosomes particuliers, dénommés gonosomes ou
hétérochromosomes, qui déterminent le sexe : XX chez la femelle et XY chez le
mâle. Au terme de la méiose, les femelles produisent donc un seul type de gamètes (n
autosomes + X), ce qui n’est pas le cas des mâles (n autosomes + X ouY).
Il faut donc s’attendre à ce que la transmission de certains caractères soit liée au
sexe, d’autant que les chromosomes sexuels présentent toujours une petite région
homologue, où les gènes sont communs aux deux sexes, et une grande région
différentielle où les gènes spécifiques au chromosome X et ceux spécifiques au
chromosome Y n’ont pas d’équivalent dans l’autre sexe.
NB Cette différentiation n’est pas universelle. Par exemple, chez les Oiseaux ou
chez les Insectes lépidoptères (papillons), le mâle est XX (en fait ZZ) et la femelle
XY (en fait ZW).
Les gènes liés au sexe sont portés par les chromosomes sexuels X et Y : (X
commun aux deux sexes et Y portant les caractères de l’un des sexes)
Pour savoir si un gène est porté par un autosome ou par un chromosome sexuel,
on pratique la méthode du croisement réciproque.
1) Croisement directe :
On croise un mâle [A] avec une femelle [B]
2) Croisement réciproque :
On croise un mâle [B] avec une femelle [A]
Résultats :
� Si les résultats de deux croisements sont identiques, le gène étudié est
autosomal c'estàdire porté par un autosome
� Si les résultats de deux croisements sont différents avec distinction de sexe, le
gène est lié au sexe c'estàdire porté par un chromosome sexuel
1Détermination du sexe :
Rappel :
Les autosomes : sont les chromosomes communs aux 2 sexes d’une même espèce
(chez l’Homme les 22 paires).
Les chromosomes X et Y sont les chromosomes sexuels appelés
‘’hétérochromosomes ‘’ou ‘’gonosomes’’ (la 23ème paire chez l’Homme) Chez
la plupart des êtres vivants :
le sexe femelle est homogamétique, il possède des chromosomes sexuels
identiques XX et donne un seul type d’ovule avec X le sexe male est
hétérogamétique, les chromosomes sexuels sont X et Y et donne 2 types de
spermatozoïdes avec X ou Y
Exemples : Pour l’espèce humaine à 2n=46
L’ovule qui est un ovocyte II bloqué en métaphase II (gamète femelle fécondable),
la formule chromosomique est de n = 22 + X
Les 2 sortes de spermatozoïde sont :
un spermatozoïde n = 22 + X
un spermatozoïde n = 22 + Y
A la fécondation :
Un spermatozoïde X + un ovocyte X donne un oeuf diploïde
(♂22 + X) + (♀22 + X) = 44 + XX: sexe femelle
Un spermatozoïde Y + ovocyte X donne un oeuf diploïde
(♂22 + Y) + (♀22 + X) = 44 + XY : sexe masculin
Pour d’autres êtres vivants comme les oiseaux et les papillons :
Le sexe ♀ est hétérogamétique, c’est à dire possède les chromosomes sexuels XY,
on donc deux sortes d’ovules à la fin de l’ovogenèse
Le sexe ♂ est homogamétique, c’est à dire possède les deux chromosomes sexuels
XX et à la spermatogenèse un seul type de gamète X.
N B : Dans les deux cas, c’est l’individu hétérogamétique qui détermine le sexe
au moment de la fécondation :
Etude d’un gène lié au sexe
Exemple 1 : Le caractère oeil blanc chez la drosophile est fréquent chez le mâle
.La transmission de ce caractère oeil blanc est récessif par rapport au caractère
oeil normal (N).
Premier croisement :
On croise un mâle de drosophile aux yeux blancs avec une femelle aux yeux
normaux, la F1 est constituée uniquement des drosophiles aux yeux normaux
Deuxième croisement :
On croise un mâle de drosophile aux yeux normaux avec une femelle aux yeux
blancs, la F1 est formée de drosophiles mâles aux yeux blancs et des drosophiles
femelles aux yeux normaux
.Interprétez ces résultats
Premier croisement
Echiquier de croisement
Echiquier de croisement
Remarque : 1/4; 1/4 ; 1/4 ; 1/4, c’est le résultat du Back Cross en dihybridisme
si les parents croisés diffèrent par 2 caractères mais 1/4 ; 1/4 ; 1/4 ; 1/4 sont les
proportions du monohybridisme lié au sexe si les parents croisés diffèrent par
un seul caractère.
Exemple 2 : cas où le sexe femelle est hétérogamétique c'estàdire c’est la femelle
qui possède les chromosomes sexuels (cas des papillons et des oiseaux, tritons)
La poule possède un seul chromosome sexuel X noté XO, tandis que le coq en a
2 XX.
Chez certaines races noires, il existe un type de coloration qui est dit ‘’barré’’,
qui est ‘’dominant ‘’(‘’B’’ sur le caractère uni) sur le noir uni récessif, ce
caractère est déterminé par un gène lié au sexe c'estàdire porté par le
chromosome X.
On croise une poule au plumage barré de stries blanches avec un coq noir uni
.La génération F1 comprend des femelles noires et unies et des mâles barrés de
stries blanches .La génération F2 issue du croisement F1xF1 comprend en
nombre égal
- des poules au plumage noir uni, des poules au plumage barré de stries
blanches
- des coqs au plumage noir uni, des coqs au plumage barré de stries blanches
IV Génétique humaine
1 Introduction : Depuis longtemps, l’hérédité humaine est fondée sur l’étude de
la transmission de la ressemblance au sein des familles (couleur des yeux, des
cheveux, ou de la peau, forme de nez, des oreilles, de menton…), actuellement
elle est centrée sur la transmission des maladies héréditaires.
Comme les chromosomes sont principalement formés d’ADN (support de
l’information génétique) gouvernant les caractères héréditaires d’un individu, la
transmission des chromosomes d’une génération à l’autre permet de comprendre
la transmission des caractères héréditaires.
Cette transmission des chromosomes d’une génération aux suivantes se fait par
l’intermédiaire des gamètes qui ne contenait que la moitié de l’équipement
chromosomique (n chromosomes) grâce à la méiose.
La rencontre des gamètes au hasard lors de la fécondation engendre un oeuf
ayant de nouveau, la totalité de l’équipement chromosomique 2n chromosomes :
ainsi
s’établit le cycle chromosomique de l’espèce humaine.
Dans la cellule oeuf, les chromosomes de même paire, bien qu’apparemment
identiques, sont différents du point de vue génétique : l’un d’origine paternelle
et
l’autre d’origine maternelle.
Les comportements des chromosomes lors de la reproduction sexuée permettent
de rendre compte des cas de la transmission des caractères héréditaires normaux
ou
pathologiques : la méiose disjoint les allèles (différentes formes présentées par un
gène) et la fécondation les réassocie au hasard: la méiose permet alors l’haploïdie
et la fécondation rétablit la diploïdie.
L’étude expérimentale est pratiquement impossible chez l’espèce humaine pour
différentes raisons :
La mentalité humaine n’accepte pas l’être humain comme matériel d’expérience
La plupart des individus sont hétérozygotes complexes résultant des multiples
croisements incontrôlés (223).
La fécondité chez l’être humain est faible et s’accommode mal du caractère que
suppose toute étude de l’hérédité.
Ainsi on se contente de faire des enquêtes sur certains cas normaux ou
pathologiques dans une famille et de traduire les résultats sousforme d’arbre
généalogique ou pedigree dans lequel figurent tous les sujets ayant faits l’objet
de l’enquête : Les individus de même génération figurent sur une même ligne
horizontale ; des symboles et une numérotation permettent de désigner chacun.
On représente les hommes par de carré et les femmes par de rond
On hachure les individus présentant les caractères étudiés
2 Hérédité des caractères normaux:
Groupes sanguins
La transmission de groupe sanguin est due à un gène, présent sur les deux
chromosomes homologues n° 9 portant l’un des facteurs A ou B ou o ; A et B
sont codominants, tous deux dominants sur o. Un individu ne possède forcément
que deux gènes : un sur chacun des deux chromosomes homologues
+ = agglutination (incompatibilité)
- = pas d’agglutination (compatibilité)
Le donneur universel (type O) n’a
pas d’antigène, le receveur (type
AB) n’a pas d’anticorps.
Système RHESUS
Introduction
En 1939, Lévine et Stetson ont décrit le cas de la mère d’un fœtus mort né qui reçut,
après la délivrance une transfusion de sang de son mari. Elle présenta une réaction
hémolytique sévère. Son sérum fut testé contre les globules rouges du mari qu’il
agglutina, puis contre les globules rouges de 104 donneurs compatibles dans le
système ABO; il agglutina 80.
L’interprétation donnée par les auteurs fut la suivante: la mère dépourvue d’un
antigène encore inconnu s’est immunisée contre le fœtus lequel portait cet antigène
transmis par le père. Ces anticorps immuns ainsi développés pendant la grossesse
réagirent lors de la transfusion de sang du mari contre le même antigène présent sur
les globules rouges injectés. Cette interprétation est révélée exacte.
En 940, Landsteiner (médecin américain d’origine Autrichienne) et Wiener (savant
américain, fondateur de la cybernétique) ont observé que le sérum de lapins et de
cobayes immunisé contre les globules rouges d’un singe Macacus rhésus, agglutinait
non seulement les érythrocytes du singe mais aussi les érythrocytes de certains
humains, très exactement 85% des individus qui furent appelés « Rhésus positif »
tandis que les 15% des sujets dont les érythrocytes n’étaient pas agglutinés furent
nommés « rhésus négatif ».
Puis Wiener et Peters montrèrent que certaines réactions d’incompatibilité post-
transfusionnelle entre sujets correctement groupés en ce qui concerne les groupes
ABO pouvaient être dues à un anticorps anti-Rhésus semblable à celui induit chez le
lapin par les globules du Racacus rhésus.
En 1941, Lévine et ses collaborateurs ont montré que l’érythroblastose fœtale, la
maladie hémolytique périnatale était le résultat d’une incompatibilité entre la mère et
l’enfant.
I- Le système rhésus
A° Définition: le système rhésus est un ensemble de groupes sanguins érythrocytaires
dont l’antigène (antigène D ou antigène Rh standard) est commun à l’homme et au
singe Macacus rhésus.
B° Facteur rhésus classique: une proportion de 80 à 90% des individus d’origine
européenne possèdent dans leurs globules rouges un antigène « le facteur rhésus »
susceptible de réagir par une réaction d’agglutination avec un anticorps spécifique. La
présence ou l’absence de cet antigène détermine l’appartenance aux groupes dits
respectivement Rhésus positif et Rhésus négatif. Elle est sous la dépendance d’un
couple d’allèles. Le gène dominant Rh (encore noté Rh+) déterminant la présence de
l’antigène, son allèle récessif rh (encore noté rh-) déterminant son absence.
C° Les allèles multiples du système rhésus: on s’et aperçu que d’autres antigènes et
anticorps interviennent à côté de ceux du facteur rhésus classique: ainsi le sérum à
anticorps anti-rhésus positif de certaines mères négatives sensibilisées par des fœtus
positifs agglutine contre toute attente, les globules rouges de certains individus jugés
précédemment rhésus négatif.
Ces individus possèdent donc un autre antigène que le « facteur rhésus classique » et
les mères négatives en question possèdent un autre anticorps que l’anti-rhésus positif.
Plus précisément, on a été amené à distinguer:
- Un antigène D, responsable du facteur classique
- Un antigène C
- Un antigène E
L’anticorps responsable de la réaction d’agglutination « classique » est dès lors appelé
anti-D. il existe aussi un anticorps anti-C et un anticorps anti-E.
Il existe aussi un anticorps anti-c qui réagit sur les cellules qui ne possèdent pas
l’antigène C et un anticorps anti-e qui réagit sur les cellules qui ne possèdent pas
l’antigène E. mais il n’existe pas d’anticorps anti-d.
De même que la présence ou l’absence de D, la présence ou l’absence de C dépend
d’une paire d’allèles, de même pour E. on notera D le gène déterminant la présence
de l’antigène D et d son allèle déterminant l’absence de l’antigène D et on emploiera
de même les symboles C et c, E et e.
Ainsi, un individu dont les globules ne sont agglutinés ni par les anticorps anti-C, ni
par les anticorps anti-D, ni par les anticorps anti-E aura pour génotype ccddee.
Dans les gamètes, on peut trouver l’une des combinaisons génétiques suivantes: CDE,
Cde, cDE, cDe, CdE, Cde, cdE, cde. L’étude de nombreuses généalogies a montré que
ces combinaisons se transmettent intactes d’une génération à l’autre.
D Interprétation
Interprétation de Fisher: il y a trois couples d’allèles et il y a linkage absolu, l’intensité
du linkage montre que les trois loci sont tassés côte à côte sur le même chromosome,
de sorte que les crossing-over susceptibles de désunir les combinaisons héritées par
l’individu sont rarissimes. Mais on les considère comme possibles. Cette
interprétation est identique à celle de Race.
Interprétation de Wiener: il y a, non pas trois couples d’allèles distincts, mais une
série d’allèles multiples à effets pléitropiques: un allèle Rz provoque la formation
d’antigène C, d’antigène D et d’antigène E (correspondant à la combinaison CDE), un
autre allèle R1 provoque la formation d’antigène C, d’antigène D, mais pas d’antigène
E (et correspond à la combinaison Cde et ainsi de suite).
Correspondance entre les deux systèmes de notation des allèles
du système rhésus (Tableau I)
Rh+ rh-
CDE……….Rz CdE……………R9
Cde…………R1 Cde…………..R’
cDE…………..R 2
cdE……………..R’’
cDe…………..R 0
cde………………..r
On na sait si la détermination de ces antigènes est le fait de trois couples de deux gènes
allèles (CcDdEe) comme le pensaient Race et Fisher, ou si l’ensemble des antigènes
révèle d’un seul gène comportant de nombreux allèles, comme le soutient Wierner
selon lequel il n’existe qu’un seul couple de loci comme pour le système ABO (au
lieu de trois fois deux loci). Il suffit d’admettre de nombreuses séries d’allèles R1, R2,
R3, etc. les divers chromosomes, associés deux à deux, définissent les diverses
possibilités de génotypes. Les réactions sérologiques ne permettent pas toujours de
préciser d’emblée le génotype exact, puisqu’on ne dispose pas de sérum anti-d
(l’existence de cet antigène érythrocytaire n’ayant jamais pu être prouvée, tableau II):
les hématies négatives au sérum anti-D sont toujours du type homozygote dd, mais
une réaction positive au sérum anti-D ne permet pas de savoir si l’individu est du type
homozygote DD ou du type hétérozygote Dd; seule une étude familiale des ascendants
ou des descendants peut permettre de connaître la génotype exact, sinon, l’étude de la
fréquence des diverses possibilités permet d’avancer le « génotype probable »
(tableau III).
Certaines associations étant réellement plus fréquentes, et chaque haplotype du
système rhésus se transmettant en bloc, de génération en génération, sans crossing-
over, le rhésus s’effectue en plusieurs étapes:
a) L’action du sérum anti-D classe les individus d’après le Rh standard, en « Rh
positif » ou « Rh négatif »; pour un receveur de sang, cette détermination peut suffire
b) S’il s’agit d’un donneur de sang, on ne peut se limiter à cette détermination que
si
la réaction est positive. Si elle est négative, il importe de savoir si le donneur est
porteur des antigènes C ou E: c’est seulement si ces dernières réactions sont
négatives (génotypes cde/cde) que le donneur peut alors être employé comme « Rh
négatif » pour des transfusions sanguines.
La transmission des caractères Rhésus est due aux gènes Rh+ et Rhsitués sur les
chromosomes homologues n°1: Rh+ dominant sur Rh3
Caractéristiques:
Les deux bactéries donatrice et réceptrice doivent appartenir à la même espèce en
raison de la spécificité d'infection du phage.
La quantité d'ADN bactérien encapsidé dépend principalement de la taille de la capside
:
le phage P22 de Salmonella Typhimurium contient habituellement de l'ordre de 1 %
du génome bactérien, le phage P1 de E.coli contient de 2 à 2.5 % du génome bactérien.
Le plus souvent la transduction ne concerne qu'un seul gène.
Dans une population de phages capables d'effectuer une transduction généralisée, il
n'y a que très peu de particules transductrices.
Ex : dans une population de phage P1 de E.coli seulement 0.1% des particules vont
encapsider de l'ADN chromosomique, les autres particules sont virulents et vont
déclencher le cycle lytique.
La transduction SPECIALISEE ou RESTREINTE.
La transduction spécialisée se produit avec certains bactériophages tempérés qui
peuvent s'intégrer en un point précis du chromosome bactérien et seulement en ce
point, il s'agit de prophage (phage tempéré).
La transduction de gènes bactériens est limitée (restreinte) aux gènes localisés en des
sites immédiatement adjacents au site spécifique d'attachement de l'ADN du prophage
et de l'ADN de la bactérie donatrice.
La transduction du gène de la bactérie donatrice à la bactérie réceptrice se fait après
lysogénisation de la bactérie réceptrice.
REM: Il ne faut pas confondre la transduction et la conversion lysogénique :
Dans certains cas, le génome du bactériophage apporte par luimême un nouveau
caractère très important pour la bactérie réceptrice, par exemple, la sécrétion de la
toxine diphtérique, la sécrétion de la toxine érythogène du streptocoque A (scarlatine)
ou la présence de certains facteurs antigéniques. On dit alors qu'il y a eu conversion
lysogénique.
La conversion et la transduction sont des phénomènes qui font tous deux intervenir un
bactériophage. Mais, dans le premier cas, c'est le génome du bactériophage qui est
responsable du nouveau caractère acquis par la bactérie; dans le second cas, le
bactériophage a seulement un rôle de vecteur et le génome transféré provient d'une
autre
bactérie.
Cours de Génétique de L’HOMME
et des Maladies Héréditaires
Université Gamal Abdel Nasser de Conakry
Faculté des Sciences
Département de Biologie
Filière Biologie Médicale
Cours en Ligne
Semestre : 6
Enseignant Chercheur Responsable: Dr Thierno Ibrahima DIALLO ;
Tél. 664 28 75 84 ;
625 21 50 20 ;
657 39 34 79 ;
625 50 78 59
e-mail :diallothiernoib@gmail.com
BP : 6006, Conakry
Disponibilité : Sur Rendez- vous
Salle : 01, LASAD : Laboratoire de Statistique et d’Analyse des Données (Bâtiment Gomba)
Contexte du Cours
C’est un cours fondamental dans le programme de formation en Biologie. Il constitue un pré requis
indispensable pour la compréhension et la maitrise des méthodes et techniques d’investigations en laboratoire,
pour la mise en évidence des anomalies chromosomiques et géniques responsables des maladies
transmissibles héréditairement.
Objectifs généraux (ou pédagogiques) :
2ème session
Méthodes pédagogiques
Exposé magistral
Travail d’équipe
(Travaux dirigés)
Travail individuel (lecture en bibliothèque)
Evaluation
o Moyens d’évaluation
- Examen intra
- Examen final
o Pondération
- Examens intra : 60%
- Examen final : 40%
o Critères d’évaluation
- Précision, justesse, clarté, rigueur et concision
- Acquisition de connaissances
- Compréhension des processus et intégration entre les notions.
Types de questions :
a) A choix multiples : « vrai » ou « faux » ;
b) Schématisation ;
c) A cout développement ;
d) D’intégration.
MEDIAGRAPHIE
Notes de cours du professeur ;
Autres références : James S.Thompson, Margarette W. Thompson : Precis de Génétique
Médicale, 1978, DION EDITEURS, Paris.
BELAISCH J. C., BENSAID F., MENDELBAUM J. “ Maladies Héréditaires et leur dépistage
Monographies CHOAY 11 – Labratoire CHOAY – Paris.
Sites Internet, notamment Google
Cours de Génétique de L’Homme et des Maladies Héréditaires
Introduction : Le mécanisme par lequel se transmettent les caractères héréditaires qu’ils soient
normaux ou pathologiques est resté longtemps inconnu. Cependant, certains observateurs à l’esprit
pénétrant avaient soupçonné des faits qui ne devaient être établis que plus tard. Ils avaient déjà
remarqué la reproduction, des malformations dans les familles et leur transmission directe des
ascendants aux descendants. Ils avaient révélé aussi qu’une tare peut quelquefois frapper des enfants
dont les parents sont indemnes, et parlé de résurgence et d’atavisme.
Au milieu du 18ème siècle, à l’époque où Buffon écrivait son histoire naturelle et où Réaumur
découvrait le monde des Insectes, Moreau de Maupertuis repoussait la théorie traditionnelle du
mélange de sangs, admettait que l’Hérédité est supportée par des particules provenant du père et de
la mère. Il avançait que des particules dont l’action est similaire s’apparient et que dans chaque paire
l’une ou l’autre peut avoir une action prépondérante.
Maupertuis soutenait aussi que l’un de ces éléments ainsi hérités permet à un caractère d’être
transmis à partir d’ancêtres lointains, en passant par des parents ne possédant pas ce caractère. Il
soupçonnait que certains de ces particules peuvent s’altérer fortuitement et donner naissance à des
caractères nouveaux, susceptibles de créer des espèces nouvelles, si le jeu de la sélection le permet.
Il concevait déjà à une époque où aucun des phénomènes de la reproduction n’était connu, le
phénomène important appelé aujourd’hui la mutation.
Dans un travail sur les hybrides du Règne végétal parût en 1863, le Biologiste Français Charles
Naudin concevait la disjonction des caractères parentaux dans les cellules de l’hybride. Mais c’est
Gregor Mendel, un moine Autrichien qui cultivait des Pois dans le Jardin du Couvant Marat, qui est
le véritable fondateur de la Science de l’Hérédité, la Génétique. Son travail, publié le 15 février
1865, n’eût aucun écho. Pendant près d’un quart de siècle les lois qu’il avait découvertes et qui
portent à juste titre son nom furent oubliées. C’est seulement en 1901, que le Néerlandais Hugo de
Vriès, l’Allemand Correns et l’Autrichien Von Tschermak découvrirent simultanément les lois de
Mendel.
A ce tournant du siècle, d’autres progrès avaient déjà été enregistrés: l’aspect particulier que prend
le noyau de la cellule au moment de sa division ; l’identification des chromosomes (leur forme de
bâtonnet, leur colorabilité particulière),… tout cela était connu. Désormais il était possible de
comprendre et d’expliquer les lois de Mendel.
En 1903-1904, Sutton et Boberi affirment que les chromosomes sont les supports de l’hérédité.
En 1908, Lucien Guénot, expérimentant sur la souris établit définitivement que les lois de Mendel
ne s’appliquent pas seulement aux végétaux et aux animaux mais aussi aux mammifères et qu’elles
sont des lois générales pour toutes les espèces vivantes.
En 1910-1928, le Zoologiste Américain Thomas Morgan effectue des travaux célèbres sur l’hérédité
qui devaient apporter une véritable révolution aux sciences Biologiques réalisés sur Drosophila
melanogoster (Drosophile = mouche de vinaigre). Ils ont démontré que les gènes responsables des
caractères héréditaires sont placés en séries linaires tout au long du chromosome ; et que par un
phénomène de crossing-over les chromosomes sont capables d’échanger des segments, donc des
gènes, puis la ségrégation des caractères mendéliens est amandée par la ségrégation des gènes.
La pathologie humaine ne devrait pas tarder à profiter de ce progrès. Au début du siècle, Francis
Galton insistait sur les rôles respectifs de la «nature», c'est-à-dire de l’hérédité et du milieu.
Peu à peu les travaux des cliniciens, des embryologistes, des biochimistes, des généticiens
s’additionnant et se complétant, les médecins en arrivent à se distinguer les affections héréditaires
de celles qui ne le sont pas et dresser un catalogue de maladies authentiquement transmissibles. Des
nouvelles techniques et méthodes permettent actuellement de préciser le nombre et la forme des
chromosomes. Désormais il est possible de les reconnaître, les distinguer les uns des autres, les
photographier, localiser les gènes qu’ils portent et établir la carte génétique de certaines paires. Il est
aujourd’hui démontré qu’un certain nombre de malformations héréditaires qui touchent les humains
sont dues non pas à des observations portant sur un ou plusieurs gènes, mais sur un chromosome
tout entier.
Toutefois, la question de l’hérédité morbide est un vaste problème qui, du reste, est loin d’être résolu.
L’objectif est ici de montrer l’importance des maladies héréditaires dans la pathologie de l’homme
et de tenter d’expliquer le mécanisme qui les commande.
1. L’Homme en tant qu’objet de Recherches en Génétique
Dans le développement de la génétique, plusieurs modèles d’objet ont joué un rôle important. Sur
eux, ont été établies les lois fondamentales de l’hérédité. Citons parmi les végétaux le petit pois et
le maïs, parmi les animaux, la drosophile ; parmi les microorganismes, certaines bactéries (E. coli),
les champignons à moisissure (N. crassa).
Maintenant commence une nouvelle ère, quand l’un des objets fondamentaux de recherches devient
l’Homme. La génétique a atteint une certaine maturité tant sur le plan de l’établissement de ses lois
fondamentales de base que sur les méthodes de recherches.
L’Homme comme objet de recherches en génétique, n’a presque aucun avantage par rapport aux
autres objets d’étude. Par contre, il présente plusieurs obstacles qui rendent difficile son étude
génétique et cela oblige à trouver de nouvelles méthodes spécifiques pour atteindre l’objectif. Parmi
ces obstacles, il ya:
1°) L’impossibilité de choisir les couples à croiser dans une expérience: chez les organismes moins
évolués, on peut procéder à des accouplements expérimentaux pour obtenir des informations ou
vérifier l’exactitude d’une hypothèse. Mais dans le cas de l’homme, c’est la nature qui entreprend
l’expérience, le chercheur ne pouvant qu’en constater les résultats.
2°) Le retard dans la maturation sexuelle: chez la souris, une génération peut s’accomplir en l’espace
de 2 mois, chez la drosophile, elle dur 2 semaines, chez les microorganismes, 20 minutes. Mais chez
l’Homme, il faut environ 20 ans pour achever une génération.
3°) Le nombre réduit de descendant dans une famille: la souris peut produire des dizaines de
descendants au cours de son existence ; la drosophile se multiplie par centaines, mais la famille
humaine compte une moyenne de trois enfants seulement.
4°) L’impossibilité de rendre les conditions de vies identiques pour toutes les générations.
5°) L’absence d’un enregistrement exact des propriétés héréditaires dans les familles et l’absence
des lignées homozygotes.
6°) Le grand nombre de chromosomes.
7°) La plus grande difficulté dans l’étude de la génétique humaine, est l’inégalité sociale qui rend à
son tour difficile l’étude des potentialités héréditaires de l’homme.
L’existence d’obstacles aussi importants amène le chercheur à se demander quels peuvent être les
avantages capables de compenser les inconvénients qui font de l’homme un animal mal adapté à la
recherche génétique. En effet, l’intérêt passionné de l’homme pour sa propre espèce a facilité les
recherches en génétique humaine. L’importance qu’on lui attribue a amené à lui consacrer un effort
plus soutenu que celui accordé à d’autres organismes, mieux adaptés aux buts de la recherche.
L’homme est beaucoup variable du point de vue génétique que d’autres organismes vivants. Malgré
la diminution du nombre d’enfants de chaque famille, l’ensemble de la population mondiale est très
important et s’accroit.
Dans la génétique humaine, on dégage souvent comme discipline indépendante, la génétique
médicale. Ce qui n’est cependant pas toujours justifié, étant donné que les maladies héréditaires et
les propriétés normales de l’organisme sont régies par les mêmes mécanismes génétiques. La
spécificité réside dans le fait que les maladies héréditaires soient liées aux aberrations
chromosomiques qui bloque le développement normal ; autrement dit, les mutations qui abaissent
la vitalité, provoquent des perturbations des processus métaboliques et de morphogénèse, ainsi que
la mort de l’organisme.
A l’heure actuelle, l’étude des maladies héréditaires dont le but est de prévenir leur apparition au
cours de l’ontogénèse est un problème de la médecine. Le problème de la génétique est de trouver
les moyens d’éliminations de l’infirmité et de prolonger la vie de l’homme à l’aide des moyens
biologiques en accord avec les conditions sociales. L’avenir sociobiologique de l’homme se trouve
dans ses mains.
2. Les particularités de la Génétique de l’Homme
Les recherches sur les lois de l’hérédité des particularités génotypiques, des mutations, des
pluriallélisme, la liaison avec le sexe, le crossing-over chez l’homme comme espèce biologique et
les méthodes de recherches constituent une des branches de la génétique spéciale de l’homme.
Le rôle principal de cette branche de la génétique est l’élaboration des méthodes de conservation, de
prolongement de la vie et de l’amélioration de la santé de l’homme ainsi que la mise en évidence de
ses capacités.
Tout homme normal est plus apte à un type d’activité que tel autre type.
Potentiellement, c’est-à-diregénétiquement l’homme est Incompara -
blement riche en différentes possibilités, mais jamais il ne les réalise entièrement au cours de sa vie.
Cela s’explique par le fait que jusqu’à présent on n’a pas pu mettre en évidence les méthodes
permettant de révéler les véritables capacités de l’homme au cours du processus de son éducation de
l’enfance à la jeunesse et parce que n’existent pas de conditions adéquates de leur développement.
Chaque homme possède sa propre biologie et ses particularités héréditaires: dans la nature, il n’existe
pas deux individus identiques tant par le phénotype que par le génotype (à l’exception des vrais
jumeaux).
Cette diversité témoigne qu’au sein de la population il se passe un processus intense de ségrégation
génétique. Les combinaisons des chromosomes non homologues seulement au cours de la méiose
peuvent être de 8.388.608.
La génétique de l’homme étudie:
1° le déterminant génétique des propriétés physiologiques, biochimiques, et morphologiques de
certains tissus et organes de l’homme, la coordination de psychisme (émotion), l’activité
intellectuelle;
2° la loi de répartition statistique de la fréquence des gènes dans les micropulations;
3° les méthodes de protection du génotype de l’homme contre l’action des divers facteurs du milieu:
agents chimiques de l’industrie, radiations ioniques, produits pharmaceutiques, …
4° les causes génétiques des maladies, leur transmission de génération en génération, leur
identification au cours de l’ontogenèse, leur répartition dans les populations, la possibilité des
consultations médico-génétiques sur la question des maladies héréditaires et leur répartition
génétique,...
5° le rôle de l’hérédité du milieu dans la formation de la personnalité;
6° les mécanismes moléculaires de la mémoire basés sur le principe du code génétique et la
transmission de l’information héréditaire;
7° le rôle du système des signaux dans l’accumulation et la transmission des caractères acquis ou
l’information au cours de l’ontogenèse…
A l’époque actuelle de la génétique de l’homme, se sont dégagées quelques branches spéciales: la
génétique du sang et l’immunogénétique, la génétique des cellules somatiques, la génétique du
système nerveux et du comportement, la radio génétique, la génétique pharmacologique, la
génétique endocrinologique,…
En général, le niveau de l’étude de la génétique humaine et ses particularités ne fait que commencer.
Le critère pour apprécier le niveau d’étude d’un organisme est l’existence des cartes génétiques,
l’établissement des groupes de liaison et la quantité des gènes qui y sont localisés. Chez l’homme,
il est décrit une grande quantité de mutations différentes, il est établit une série de pluriallélisme en
liaison ou non avec le sexe, il est découvert et étudié le phénomène de la non migration des
chromosomes et différents types d’aberrations chromosomiques.
Toutefois, les cartes génétiques des chromosomes de l’homme se trouvent encore au premier stade
de leur étude.
3. Maladies Congénitales et Maladies Héréditaires
L’homme est sur le point de remporter une victoire décisive sur son vieil ennemi, l’infection. Une
hygiène meilleure, la pratique de la vaccination préventive, l’emploi des antibiotiques, tout cela a
beaucoup réduit et réduira un jour à rien l’importance des maladies infectieuses. Mais nous avons
d’autres adversaires à combattre: la fréquence et la gravité des tares héréditaires posent aujourd’hui
de problèmes plus sérieux. De malformations, un nombre considérable qui porte sur les tissus et les
organes sont commandés par l’hérédité. Les anomalies transmissibles du squelette, du cœur, des
reins, des voies urinaires, des globules rouges, du système nerveux sont nombreuses et graves. Plus
de la moitié des sourds-muets et des aveugles doivent leur infirmité à une malformation héréditaire
de l’oreille interne, du globe oculaire ou des voies optiques. Beaucoup de psychopathies, la plupart,
sans doute sont des maladies transmises. Les erreurs héréditaires des échanges métaboliques
provoquent des troubles sérieux, parfois mortels.
Mais, qu’entendons-nous par maladies héréditaires et qu’est ce que l’hérédité?
L’hérédité: c’est une condition organique qui fait que les manières d’être corporelles et mentales
passent des ascendants aux descendants. Il résulte de cette définition à la fois précise et limitative
que tout ce qui passe d’une génération à la suivante ne relève pas nécessairement de l’hérédité.
Pendant les 9 mois qu’il passe au sein de l’organisme maternel, le futur Homo sapiens est soumis à
l’action de facteurs multiples qui peuvent être délétères. Pendant cette vie intra utérine, il est d’abord
un embryon avant de devenir un fœtus. La période d’embryogénèse s’étend de la formation de l’œuf
à la fin du 3ème mois. Cette phase particulière se caractérise par une activité très grande des cellules
qui se multiplient en un nombre considérable de fois pour construire les tissus et bâtir les viscères.
Au bout de ces 90 jours, les organes sont constitués dans leur forme définitive.
De nombreuses expériences effectuées sur les animaux ont montré qu’un certain nombre de facteurs
sont capables de s’opposer à l’édification correcte d’un tissu, à la construction harmonieuse d’un
organe, s’ils exercent leur action pendant la période initiale de la gestation. Il est prouvé qu’en
intoxicant une femelle gravide avec des substances de natures diverses, il est possible de déterminer
des monstruosités chez ses descendants.
Plusieurs hormones, les œstrogènes et les androgènes, l’insuline, les corticostéroïdes, quand elles
sont employées à forte dose, déterminent chez l’animal des effets nocifs. Les rayons X par exemple
exercent une action délétère comme le démontrent les résultats obtenus chez les petits d’une femelle
irradiée pendant la gestation. Certes, il serait tout à fait imprudent de conclure de l’animal à l’homme.
De nombreuses observations démontrent néanmoins que des embryopathies existent dans l’espèce
humaine et qu’elles peuvent être dues à des causes diverses. L’on retient le drame d’un vieux
médicament, la Thalidomide, autrefois utilisé comme sédatif destiné à calmer les vomissements de
la grossesse. Il est tout à fait inoffensif chez la personne adulte. En revanche, quand il est administré
à une femme en début de grossesse, il est capable de produire chez l’embryon qu’elle porte (futur
nouveau-né) des effets désastreux.
C’est ainsi en effet qu’on a vu naître en Grande Bretagne et en Allemagne des milliers d’enfants
atteints d’énormes malformations touchant le squelette: soit on note une absence complète des
membres, connue sous le non d’Amélie, soit il y a d’anomalies malformatives qui consistent à un
arrêt partiel du développement des membres réduits à des sortes de moignons comme ceux des
phoques. Il n’est pas exclu que d’autres médicaments soient capables eux-aussi d’exercer des actions
délétères. Si une femme en grossesse de quelques semaines reçoit par erreur des applications de
rayons X ou de radium sur l’abdomen ou sur le bassin, elle peut donner naissance à un enfant
gravement malformé, porteur d’anomalies sévères du système nerveux central, de l’oreille ou des
reins. Il est connu que lorsqu’une femme contracte la rubéole avant le 4ème mois d’une grossesse,
elle peut voir naître un enfant chez lequel on observe une cataracte, un arrêt du développement de
l’oreille interne ou une cardiopathie. D’autres virus, ceux de la poliomyélite, de la rougeole, de la
grippe, du rhume, commun de beaucoup d’autres maladies ont été soupçonnés mais sans preuves
encore. Plus tard, entre le début du 4ième et la fin du 9ième mois, l’embryon est devenu un fœtus, ses
organes déjà constitués, ne peuvent plus être l’objet d’une malformation. Mais ils peuvent être l’objet
d’agression parasitaire susceptible de provoquer des lésions. Le parasite responsable de la syphilis
par exemple détermine quelquefois chez l’enfant des altérations anatomiques dénommées
fœtopathies.
Mais, qu’il s’agisse de ces malformations que sont les embryopathies ou de ces lésions que sont les
fœtopathies, nous avons à faire à des maladies contractées après la formation de l’individu sous
forme d’œuf ou d’embryon ou fœtus; donc pendant la vie intra utérine. Ce sont alors des maladies
acquises dans le milieu de vie et non transmises génétiquement.
Les maladies héréditaires sont d’une tout autre sorte: elles sont liées soit à l’action des chromosomes,
soit à l’action des gènes chromosomiques.
4. Caryotype : le but des études cytogénétiques est l’établissement du
caryotype. On appelle caryotype, l’ensemble des chromosomes du noyau cellulaire et génotype,
l’ensemble des gènes sur ces chromosomes.
Le nombre et la morphologie des chromosomes sont spécifiques de l’espèce animale (ou végétale).
C’est ainsi que:
- Plasmodium malariae a 2 chromosomes
- La drosophile a 8 chromosomes;
- La grenouille en a 26;
- Le ver de terre en a 36;
- La souris en a 40
- Le cheval 66
- Le chien 68…
- Le papillon lysandria 380; que l’orge, le pois ont 14 chromosomes, le maïs 20, le riz 24,
le tabac et la pomme de terre 48.
Jusqu’à 1956, on considérait que le caryotype de l’homme (2n) était composé de 48 chromosomes.
Mais avec le perfectionnement des techniques cytologiques, D. Thio et A. Levans ont démontré que
chez l’espèce humaine, le noyau de chaque cellule somatique porte: 46 chromosomes repartis en 23
paires.
Chaque paire est constituée d’un chromosome paternel et d’un chromosome maternel.
Parmi ces 23 paires de chromosomes, on distingue:
22 paires qui sont identiques dans les 2 sexes. Ce sont les autosomes.
La 23ème paire est constituée par les chromosomes sexuels. Elle est représentée par:
- 2 chromosomes x chez la femme (sexe homogamétique)
- 1 chromosome x et 1 Chromosome y chez l’homme (sexe hétérogamétique)
Deux critères morphologiques essentiels sont utilisés pour identifier les chromosomes:
- D’une part, leur taille ;
- D’autre part, la position du centromère.
1°) En fonction de la taille, on distingue :
- Des grands chromosomes ;
- Des chromosomes de taille moyenne ;
- Des petits chromosomes.
2°) En se basant sur la position du centromère, on reconnait des chromosomes à centromère médian ;
(métacentrique) ;
- à centromère submédian (submétacentrique ; ras mégaux) ;
- à centromère presque terminal (accrocentrique).
Les chercheurs réunis à Denver capital du Colorado en 1960 ont adopté une classification numérale
des chromosomes qui est actuellement acceptée par tous. Chaque paire d’autosomes est désigné par
un numéro de 1 à 22.
Les chromosomes sont classés par ordre de taille décroissante la 1 ère paire qui est la plus grande,
porte le n°1 ; la dernière qui est la plus petite, porte le n°22.
Les 2 chromosomes sexuels, x et y conservent leur appellation classique.
Le chromosome X qui est un chromosome de taille moyenne à centromère submédian, est rapproché
des autosomes ayant une morphologie analogue, en l’espèce les chromosomes 6 – 12; tandis que le
chromosome Y qui est l’un des plus petits, ne trouve sa place que près des tous derniers
chromosomes 21 et 22. Il faut souligner qu’il est tout à fait difficile, ou impossible, de distinguer
les chromosomes qui sont à peu près de même grandeur et dont le centromère a une position
identique. Patau a proposé de ranger les 23 paires de chromosomes en 7 groupes distincts, désignés
par des lettres majuscules A à G:
A: 1 – 2 – 3
B: 4 – 5
C: 6 – 12 – XX Caryotype de la femme normale
D: 13 – 15
E: 16 – 18
F: 19 – 20
G: 21 – 22
A: 1 – 3
B: 4 – 5
C: 6 – 12 – X
D: 13 – 15 Caryotype de l’homme
E: 16 – 18 normal
F: 19 – 20
G: 21 – 22 – Y
L’intérêt de cette classification est que tout chromosome normal, peut être rapporté à un groupe
donné. Par contre, l’intérieur même d’un groupe, les difficultés d’identification des chromosomes
de ce groupe d’après les seuls critères morphologiques (taille et position du centromère) restent
souvent très grandes.
Cependant, en ayant recours à des critères morphologiques, seuls les chromosomes 1, 2, 3, 16 et Y
ont pu être identifiés; tandis que les autres chromosomes ne pouvaient être reconnus
individuellement et ne recevaient qu’une classification de groupe.
L’autoradiographie (à la Thymidine tritiée) permet de faire la différence entre les chromosomes 4
et 5 (groupe B); de distinguer le chromosome X des autres chromosomes du groupe C;
éventuellement de distinguer les différents chromosomes du groupe D (13, 14, 15) ou du groupe E
(16, 17, 18). Mais il est pratiquement impossible en utilisant la méthode autoradiographique, de
faire une distinction entre les chromosomes de 6 à 18 (groupe C), entre les chromosomes 19 et 20
(groupe F) ou entre les chromosomes 21 et 22 (groupe G). En outre, l’autoeadiographie pose des
problèmes techniques difficiles.
Identification des chromosomes par la nouvelle technique de coloration
Elles révèlent une succession de bandes claires et de bandes sombres caractéristique de chaque
chromosome. Elles permettent l’identification de chaque paire de chromosomes du comportement
humain.
Les méthodes:
1° une fluorescence (propriété de certains corps qui émettent de la lumière lorsqu’ils reçoivent un
rayonnement qui peut être invisible – rayons UV, Rx, rayons cathodiques) est obtenue avec les
dérivés de la quinacrine. Elle révèle une succession de bandes Q, mais la fluorescence disparaît
rapidement (3 à 4 mn) et exige un appareillage coûteux. Néanmoins elle reste la méthode de choix
pour les anomalies de l’Y.
2° la coloration des chromosomes: peut être réalisée avec une solution de Giemsa après dénaturation
alcaline ou dénaturation par la chaleur. Elle met en évidence des bandes G, qui présentent la même
disposition que lorsque l’on a recours à la fluorescence à la quinacrine… cette technique est
d’application facile.
3° la coloration de Giemsa: après digestion enzymatique par la pronase (Dutrillaux et Lejeune) ou
la trypsine (De Grouchy) aboutit à des bandes R (reverse): les zones claires correspondent
exactement aux zones sombres obtenues avec les autres méthodes et les zones sombres, aux zones
claires. Son grand avantage sur les autres méthodes est qu’elle permet d’obtenir une coloration
précise des extrémités des chromosomes et, en conséquence, une meilleure identification des
délétions et des autres modifications de structure. Toutes ces nouvelles techniques sont
complémentaires.
Les applications cliniques et biologiques
Les nouvelles techniques de coloration permettent:
a- l’identification de chaque chromosome normal et la localisation avec précision de
différentes régions sur ce chromosome;
b- l’identification du chromosome supplémentaire dans les trisomies:
exemple, le chromosome G supplémentaire reconnu comme un 21 chez les mongoliens;
c- la mise en évidence de « nouvelles trisomies », exemple: la trisomie 8 grâce à l’identification
du chromosome C supplémentaire des « trisomies C »;
d- la découverte de « nouvelles monosomies » partielles;
e- l’identification de diverses translocations par fusion centrique, D/D,
D/G et G/G (Bery, Caspersson).
D’après les types de bandes, il est désormais possible d’identifier avec précision:
- des inversions paracentriques ou péricentriques;
- des isochromosomes.
Il est à noter qu’elles ont permis de montrer que le chromosome de Philadelphie (leucémie myéloïde
chronique) est un N°22 (et non un « 21 » comme on l’avait cru jusqu’alors).
Enfin, autres avantages:
la mise en évidence, dans les cellules en interphase (frottis
buccal, racine des cheveux) du chromosome Y intensément fluorescent. Dans les expériences
d’hybridation cellulaire, l’identification précise du ou des chromosomes humains restants et dans
leurs activités enzymatiques. Exemple: activité thymidine kinase du chromosome 17 humain.
Dans le domaine des études phylogénétiques, la comparaison
des types de bandes révèle une ressemblance remarquable entre de nombreux chromosomes du
chimpanzé et de l’homme. Elles permettent d’envisager le « passage » du chimpanzé à l’homme à
la suite d’inversions et de translocations. Elles montrent l’étonnante « stabilité » du chromosome X
dont les types de bandes sont identiques dans toute la lignée des hominoïdes (ce qui n’est pas le cas
pour les autosomes).
Signification des bandes: la fixation et la répartition du colorant le long d’un chromosome donné
sont remarquablement constantes et spécifiques. Les anomalies de structure d’un chromosome, telles
que les délétions ou les translocations ne modifient pas les types de coloration soit du chromosome
remanié, soit des segments échangés. Les variations de coloration constatées le long d’un
chromosome (alternance de bandes sombres et de bandes claires) reflètent sans doute des différences
dans la composition chimique de ces différentes régions.
Les Methodes d’Etude de la Genetique de L’HOMME
A°) La méthode généalogique
Symboles utilisés
(Application : voir hérédité autosomale, hérédité liée au sexe)
B°) La méthode cytogénétique:
1° Introduction
la méthode cytogénétique est généralement appelée en génétique humaine « Analyse Cytogenetique
du Caryotype de L’HOMME » dans les normes et dans les cas de pathologie.
Il est plus commode d’appeler cette méthode cytologique au lieu de cytogénétique, étant donné que
l’analyse génétique par croisement chez l’homme est exclue, et, en règle générale, les porteurs de
chromosomes avec perturbation de la structure normale sont stériles s’ils survivent. Dans de rares
cas cependant, par rapport à certaines perturbations chromosomiques, on réussit à combiner les
méthodes cytologique et généalogique, et on établit ainsi le rapport entre l’effet phénotypique et la
détermination du type de perturbation chromosomique (les cas de syndrome, de trisomie…).
En liaison avec ces faits, on peut conserver la terminologie admise déjà dans la littérature « méthode
cytogénétique » dans l’étude génétique de l’homme. Dans les cas où les recherches ne permettent
pas d’utiliser un tel parallélisme, l’utilisation de cette terminologie est aberrante. La méthode
cytogénétique étudie différents types d’hétéroploïdies et d’aberrations chromosomiques dans les
tissus somatiques de l’Homme, provoquant différentes perturbations phénotypiques par rapport à la
norme. Le plus souvent, cette méthode est utilisée dans le cas de l’étude d’une culture de tissus. Elle
permet de tenir compte des grandes anomalies chromosomiques constatées tant eu niveau des
cellules sexuelles que des cellules somatiques.
Il est aujourd’hui établi, aussi bien chez l’Homme que chez les animaux, l’apparition fréquente des
trisomies et monosomies au niveau des différentes paires de chromosomes, à la suite de leur non
migration à la méiose. Chez l’Homme, la trisomie et la monosomie au niveau des chromosomes
sexuels ont été découvertes à la base de l’analyse de la chromatine sexuelle.
Au cours du développement individuel de l’Homme, dans les cellules des différents tissus, peuvent
s’accumuler des chromosomes anormaux (aberrations chromosomiques, changement du nombre de
chromosomes). Dans ce cas, les tissus de l’organisme représentent des populations différentes au
point de vue génétique, avec accumulation des cellules ayant des noyaux pathologiques. Ainsi, dans
de tels cas, la méthode cytogénétique permet d’étudier le vieillissement des tissus sur la base des
recherches de la structure du dynamisme des vieilles cellules et les tissus somatiques génératifs.
Etant donné que la fréquence de l’apparition des anomalies chromosomiques dépend de l’influence
sur l’organisme de différents mutagènes (ionisations, agents chimiques et variation de
température,…), la méthode cytogénétique permet aussi d’établir l’effet des facteurs mutagènes du
milieu environnant sur l’homme. Son utilisation s’est particulièrement élargie en liaison avec la
découverte d’une série de causes maladies physiques et psychiques, les maladies chromosomiques.
2° Les étapes de la cytogénétique: la cytogénétique est une discipline dont les applications en
génétique humaine sont très récentes.
C’est en 1959 que 2 types d’anomalies chromosomiques ont été identifiées (mongolisme ou trisomie
et syndrome de Klinefelter). En 1969: plus de 130 types d’anomalies chromosomiques reconnues.
En 1972: 300 types d’anomalies chromosomiques ont été dénombrés et, à l’heure actuelle, ce nombre
a considérablement augmenté.
Le point de départ de ces découvertes est une série de réalisation technique d’une très grande
importance:
- Utilisation de la culture des cellules pour l’étude des chromosomes;
- Emploi d’antibiotiques qui permet de réduire sensiblement les risques de contamination des
cultures cellulaires;
- Recours à la phytohémagglutinine pour relancer les mitoses en cultures de cellules sanguines;
- Utilisation de la colchicine pour arrêter la division cellulaire au stade de la métaphase (période de
quelques minutes où les chromosomes sont bien visibles, déjà scindés en 2 chromatides et/ou la
cellule est sur le point de se partager).
𝐸 = 1 − 𝐻 = 1 − 0,64 = 0,36
Des recherches relatives à la discordance des jumeaux selon certains caractères morphologiques ont
révélé un pourcentage plus marqué à l’intérieur de la paire des jumeaux dizygotiques par rapport
aux vrais jumeaux (voir tableau).
Tableau N°1: Comparaison de la discordance chez les vrais et faux jumeaux suivant certains
caractères morphologiques.
Fréquences de discordance en %
Caractères
Vrais jumeaux (MZ) Faux jumeaux (DZ)
Couleur des yeux 0,5 72
Couleur des cheveux 3,0 77
Couleur de la peau 0,0 55
Forme des cheveux 0,0 21
Forme des sourcils 0,0 49
Forme du nez 0,0 65 – 70
Forme des lèvres 0,0 35
Forme des oreilles 2,0 80
Les données de S. Ride relatives à la comparaison de la fréquence de la pathologie chez le second
partenaire, dans le cas où un des jumeaux en souffre, sont exprimées en pourcentage de concordance
de la maladie chez les deux types de jumeaux. Du tableau, il ressort que si un partenaire est atteint
de l’une des maladies indiquées, la probabilité que le second en souffre chez les vrais jumeaux est
plus élevée que chez les jumeaux dizygotiques (tableau N°2).
La méthode des jumeaux offre la possibilité d’éclaircir avec exactitude la situation héréditaire de
l’homme vis-à-vis des maladies. Les autres méthodes permettent difficilement ou pas de réaliser les
recherches sur les infections et les cancers des poumons, de la peau et des différents organes, ainsi
que les caractéristiques normales de l’activité du système nerveux de l’homme.
Tableau N°2: concordance (en %) pour différentes maladies chez les jumeaux mono et dizygotiques
(EFROUINON, 1964).
Marche Diabète
Jumeaux Schizophrénie Retard mental Epilepsie
déformée sucré
Monozygotes 69 97 66,6 32 65
Dizygotes 10 37 3,1 3 18
Nombre de
paires de
681 294 160 173 181
jumeaux
étudiées
Dans l’utilisation de la méthode des jumeaux, il faut tenir compte des conditions identiques ou
différentes de l’éducation des partenaires, des conditions sociales dans lesquelles ils se trouvent.
De toutes les façons, la méthode des jumeaux permet de déterminer avec exactitude le coefficient
d’héritabilité des caractères, ainsi que d’estimer l’hétérogénéité des populations des gènes étudiés et
d’attirer l’attention sur le rôle du milieu dans la détermination de la variabilité des caractères
observés.
Fréquence relative des jumeaux monozygotes et dizygotes: il existe une méthode simple pour
déterminer le nombre de naissances gémellaires dans une population qui sont MZ ou DZ. Les
jumeaux MZ sont toujours de même sexe, tandis qu’à peu près la moitié des jumeaux DZ sont
constituées d’un garçon et d’une fille. Le nombre total de paires DZ est donc égal à deux fois le
nombre de paires de jumeaux de sexe différent, et le nombre de paires de jumeaux MZ peut être
obtenu en soustrayant le nombre de paires de jumeaux de sexe différent du nombre total de paires
de jumeaux de même sexe.
𝑡𝑜𝑢𝑡𝑒𝑠 𝑙𝑒𝑠 𝑝𝑎𝑖𝑟𝑒𝑠 𝑑𝑒 𝑗𝑢𝑚𝑒𝑎𝑢𝑥 − 2 (𝑗𝑢𝑚𝑒𝑎𝑢𝑥 𝑑𝑒 𝑠𝑒𝑥𝑒 𝑑𝑖𝑓𝑓é𝑟𝑒𝑛𝑡)
= 𝑓𝑟é𝑞𝑢𝑒𝑛𝑐𝑒 𝑑𝑒𝑠 𝑀𝑍
𝑡𝑜𝑢𝑡𝑒𝑠 𝑙𝑒𝑠 𝑝𝑎𝑖𝑟𝑒𝑠 𝑑𝑒 𝑗𝑢𝑚𝑒𝑎𝑢𝑥
(J. Thomson et M. Thomson 1978).
Il, est à noter que cette méthode présente l’inconvénient de considérer que le taux de masculinité est
de 1/2; mais elle fournit néanmoins une approximation.
Weimberg et Allen indiquent d’autres méthodes de détermination de lafréquence des naissances
gémellaires ainsi que le rapport MZ/DZ. La méthode proposée par Weimberg postule que le sexe est
déterminé génétiquement, ce qui signifie à priori que les jumeaux à sexes différents sont des DZ. En
désignant par P et Q les probabilités de naissance des sexes masculin et féminin, le nombre total de
paires de jumeaux DZ sera: Nombre total de paires de jumeaux
𝒏𝒃𝒓𝒆 𝒅𝒆 𝒑𝒂𝒊𝒓𝒆𝒔 𝒅𝒆 𝒋𝒖𝒎𝒆𝒂𝒖𝒙 à 𝒔𝒆𝒙𝒆𝒔 𝒅𝒊𝒇𝒇é𝒓𝒆𝒏𝒕𝒔
DZ = 𝟐𝑷𝑸
De même: Nombre total de paires de jumeaux,
𝒏𝒃𝒓𝒆 𝒕𝒐𝒕𝒂𝒍−𝒏𝒃𝒓𝒆 𝒑𝒂𝒊𝒓𝒆𝒔 à 𝒔𝒆𝒙𝒆𝒔 𝒅𝒊𝒇𝒇é𝒓𝒆𝒏𝒕𝒔
MZ = 𝟐𝑷𝑸
La méthode proposée par Allen (1965) permet de calculer la fréquence des naissances des jumeaux
comme suit:
- Pour les jumeaux DZ,
2𝑀
Le coefficient d’apparition est: d = 𝑁 . 100
où M: nombre de paires de jumeaux à sexes différents
N: nombre total des naissances de l’échantillon.
- Pour les jumeaux MZ:
𝑳−𝟐𝑴
m= 𝑵 . 100 où L: nombre total de paires de jumeaux de l’échantillon étudié.
La comparaison du rapport des nombres de jumeaux de même sexe et de sexe différent dans les
populations avec des fréquences diverses des naissances gémellaires a montré que la proportion des
naissances MZ par rapport à toutes les naissances est sensiblement la même partout, à, peu près une
sur trois cent naissances, tandis que la proportion des naissances DZ varie avec le groupe ethnique,
l’âge et le génotype de la mère.
Des recherches ont permis à Marthinova (1970) de constater les faits suivants:
1° la tendance à la gémellité chez l’homme est héréditaire;
2° la transmission héréditaire de la capacité à faire des jumeaux s’effectue du côté maternel;
3° la capacité de former des jumeaux se transmet comme un caractère récessif lié au sexe;
La tendance héréditaire à la gémellité s’observe quand il s’agit des DZ, la capacité de former les MZ
n’est pas héréditaire.
Maladies Chromosomiques
a).Aberrations numériques des chromosomes: le développement harmonieux d’un organisme est
lié à la présence d’un nombre constant de chromosomes pour son espèce. L’absence d’un
chromosome, ou la présence d’un chromosome supplémentaire se traduit par un déséquilibre
morpho-physiologique qui entraîne des conséquences fâcheuses sur le développement. Un tel
déséquilibre connu sous le nom d’aberrations chromosomiques est bien connu chez l’homme.
En effet, chez certains sujets, le nombre total de chromosomes, au lieu d’être de 46 se trouve en
excès ou en défaut, soit de 47 ou 45 chromosomes. Cela parce qu’à la méiose, lors de la formation
des gamètes, la disjonction des chromosomes homologues (séparation des paires homologues) ne
s’opère pas correctement pour l’une des paires chez l’un des sexes. Ainsi, un spermatozoïde du père
ou plus fréquemment un ovule de la mère, possède une paire entière de chromosomes non séparés,
ou bien au contraire, ne possède aucun élément d’une certaine paire.
L’exemple typique d’aberrations chromosomiques dues à une absence de disjonction est celui qui a
été découvert en 1959 par R. Turpin, J. Lejeune et M. Gauthier, cette aberration entraîne une
anomalie constitutionnelle qui porte le nom de mongolisme.
Le mongolisme est un ensemble malformatif qui se caractérise par une petite taille, un aspect
particulier du visage, une mollesse spéciale des muscles et une arriération mentale profonde. La
maladie était bien connue des médecins depuis fort longtemps, mais ils étaient en peine d’en
expliquer les causes et le mécanisme. Aujourd’hui, il est établi que le mongoliste possède 47
chromosomes au lieu de 46. Le chromosome supplémentaire est représenté par l’un des plus petits
dans la classification internationale, la paire N° 21. D’où le nom de trisomie 21 donné actuellement
à la maladie.
D’autres anomalies malformatives, plus rares ont été décrites plus tard et qui résultent d’une
aberration portant sur les paires N° 13 et N° 18.
- La trisomie 13 – 15 découvertes par Pateau et ses collaborateurs est
caractérisée par une arriération psychique grossière, l’éclosion d’accès convulsifs, de malformations
graves portant sur la face des extrémités et aussi sur le cœur. La mort survient d’ordinaire au courant
de la 1ère année.
- La trisomie 18 mise en évidence par J. Edward et ses Collaborateurs, se révèle par des
anomalies malformatives de la face, des mains, des pieds, du thorax, du bassin et des organes
génitaux. Des malformations aussi sévères et aussi étendues provoquent la mort précoce, dès la 1ère
semaine ou 1er mois de la vie.
Ford, Polani, Penrose et leurs collaborateurs ont découvert d’autres types d’aberrations numériques
des chromosomes qui portent sur chromosomes sexuels.
Le cas est plus fréquent chez la femme. Il arrive souvent à la méiose que les 2 chromosomes XX de
la femme ne se séparent pas. Un ovule reçoit alors les 2X et l’autre ne reçoit aucun X. suivant que
l’un ou l’autre de ces ovules est fécondé par un spermatozoïde porteur de X ou de Y, on observe 4
combinaisons possibles, d’après le schéma ci-dessous.
Constatations:
1° l’absence du chromosome X dans le caryotype humain est incompatible avec la vie: cela exerce
donc un effet létal. Alors l’individu OY meurt aussitôt après sa formation.
2° les individus OX sont atteints d’un ensemble malformatif qui porte le nom de syndrome de
Turner. Ce sont des sujets qui ont des formes féminines, mais qui restent de très petite taille,
porteurs de malformations cutanées, musculaires et éventuellement viscérales diverses, mais surtout
chez lesquels les ovaires ne sont pas développés et donc sont stériles. On dit qu’ils souffrent d’une
aplasie ovarienne utérine.
3° les individus XXY sont atteints d’un syndrome de klinefelter. Ils ont l’apparence d’un sujet de
sexe masculin, ils sont habituellement de grande taille, avec des seins développés, des glandes
sexuels mâles réduites. Ils sont frappés de débilité mentale profonde et restent indéfiniment stériles.
4° les individus XXX sont dits super femelles. Ils ont un aspect féminin, sont de grande taille,
toujours détestés dans leur milieu, sont habituellement stériles et frappés d’arriération mentale.
a) Aberrations structurales des chromosomes
Les anomalies de structure des chromosomes sont de 3 types: les délétions, les inversions et les
translocations.
On parle de délétions lorsqu’il y a une perte d’un segment d’un chromosome. Si le segment perdu
est à l’une des extrémités, la délétion est dite terminale. Elle est intercalaire, si le segment éliminé
est interne.
Lorsqu’une portion du chromosome se détache et subit une rotation de 180° et se décolle dans le
même chromosome, on dit qu’il y a inversion car l’ordre des gènes est changé dans ce chromosome.
Ces dérangements ont pour conséquences fâcheuses, l’apparition des malformations multiples
suivies d’arriérations mentales souvent lourdes. Parfois, il ne s’agit pas d’une absence de disjonction
des chromosomes, mais d’un échange réciproque de fragments entre chromosomes non homologues
donc d’un phénomène qui porte le nom de translocation.
Des phénomènes de ce genre dont le 1er exemple a été observé par Turpin et Lejeune sont
responsables d’un certain nombre d’anomalies malformatives. La plus connue est celle qui porte sur
le petit chromosome 21, responsable du mongolisme. Le chromosome 21 se lie à la paire N° 15 et
reste attaché à elle. Les maladies chromosomiques entraînent soit la stérilité, soit des malformations
graves, soit des troubles intellectuels sévères, de sorte qu’elles ne se transmettent pas en général.
Les 2 chromosomes possèdent des segments homologues (b – c sur la figure) et des segments
différents (a – b pour X et d – b pour Y). Chaque chromosome porte sur son segment impair des
gènes qui n’ont pas d’allèles sur le segment impair de l’autre chromosome. Ces gènes sont appelés
gènes hémyzygotes.
Etant les longueurs respectives de X et de Y, on conçoit que le nombre de gènes présents sur le
segment impair de X est beaucoup plus élevé que celui des gènes situés sur le segment impair de Y.
D’autre part, tout caractère lié à un gène hémyzygotes s’exprime nécessairement car un tel gène n’a
pas d’allèle. Il se comporte donc, comme un gène dominant quelque soit son état. La dominance ou
la récessivité intéresse les gènes des segments homologues. Examinons successivement ce qui se
passe dans le cas d’un gène dominant ou récessif porté par X ou par Y.
1° cas d’un gène dominant responsable d’une tare héréditaire situé sur l’un des deux chromosomes
X d’une femme. Comme c’est un gène dominant, le chromosome qui le porte sera noté X; le second
porteur de l’allèle normal récessif sera noté x. le génotype de la femme sera Xx. Si elle se marie à
un homme normal, celui-ci aura le génotype xy. La femme tout comme l’homme, fera deux types
de gamètes: X ; x et x; y. les combinaisons de ces gamètes donneront une descendance composée
comme suit:
Dans chaque sexe, la moitié des descendants est normale, l’autre moitié est tarée. Dans ce cas, le
résultat est le même que celui qui aurait été observé si le gène dominant pathologique était porté non
pas par un chromosome X mais par un autosome. La moitié des descendants est affectée quelque
soit le sexe.
2° cas où le gène taré dominant est sur le chromosome X de l’homme: ici, la femme est normale
donc possède le gène récessif sur ses deux chromosomes X. Son génotype est donc xx; celui de
l’homme malade est Xy.
Dans un mariage de ce type, toutes les filles sont atteintes et ressemblent à leur père et tous les
garçons sont normaux, ressemblent à leur mère. C’est le phénomène de l’hérédité croisée.
En résumé, si une tare héréditaire liée à un gène dominant est présent sur le chromosome X, cette
tare sera exclusivement transmissible aux filles si c’est l’homme qui est atteint. Mais si c’est la
femme qui est malade, le sexe ne jouera aucun rôle. La manifestation de la maladie se fera comme
dans le cas d’un gène autosomique ordinaire. Le type de malformation qui se transmet de cette façon
le plus connu est la kératose folliculaire, qui se traduit par un épaississement remarquable de la
pomme de la main et de la plante des pieds. A ces signes, s’ajoutent la chute de la barbe, des cheveux,
des cils, des sourcils, l’épaississement de la paupière et parfois des lésions génératives de la cornée.
3° cas où le gène taré est récessif et situé sur le chromosome X chez la femme: la transmission des
gènes récessifs situés sur le chromosome X suit un schéma bien déterminé. Un caractère récessif lié
au chromosome X est exprimé chez tous les hommes qui portent le gène mais les femmes ne sont
affectées que si elles sont homozygotes. En conséquence, les défauts récessifs liés au chromosome
X sont pratiquement limités aux hommes et ne sont que rarement ou jamais observés chez la femme.
Le type de malformations héréditaires qui se transmettent de cette façon le plus connu est
l’hémophilie. Il s’agit d’une maladie qui se manifeste par l’éclosion d’hémorragies cutanées et
muqueuses provoquées par un choc sans importance ou une plaie minime et qui, très souvent, sont
coercibles. La fréquence et la gravité des hémorragies articulaires sont un des traits particuliers de
la maladie. Le trouble fondamentale consiste en une anomalie de la coagulation qui, au lieu de
survenir au bout de quelques minutes, demande plusieurs heures, voire une journée entière pour se
produire ou se compléter. En général, le phénomène de la coagulation exige la présence de 4 facteurs
fondamentaux: calcium, fibrinogène, prothrombine, thromboplastine. C’est ce dernier élément qui
manque chez l’hémophile. Chez lui, le retard de la coagulation est dû à l’absence de thromboplastine,
la globuline anti hémophilique.
Le caractère héréditaire de l’hémophilie est connu depuis très longtemps et a été rendu célèbre par
la descendance de la reine Victoria, qui était conductrice. Si une femme hétérozygote pour le gène
de l’hémophilie se marie à un homme normal, la descendance sera composée de 50% des garçons
normaux, 50% hémophiles et; 50% de filles normales parmi lesquelles 50% seront conductrices. Le
gène de l’hémophilie est noté h et l’allèle normal dominant H.
II
III
IV
Groupe sanguin
Génotypes possibles
(phénotype)
A AA, AO
B BB, BO
AB AB
O OO
+ = agglutination (incompatibilité)
- = pas d’agglutination (compatibilité)
Rh+ rh-
CDE……….Rz CdE……………R9
Cde…………R1 Cde…………..R’
cDE…………..R2 cdE……………..R’’
cDe…………..R0 cde………………..r
On na sait si la détermination de ces antigènes est le fait de trois couples de deux gènes allèles
(CcDdEe) comme le pensaient Race et Fisher, ou si l’ensemble des antigènes révèle d’un seul gène
comportant de nombreux allèles, comme le soutient Wierner selon lequel il n’existe qu’un seul
couple de loci comme pour le système ABO (au lieu de trois fois deux loci). Il suffit d’admettre de
nombreuses séries d’allèles R1, R2, R3, etc. les divers chromosomes, associés deux à deux,
définissent les diverses possibilités de génotypes. Les réactions sérologiques ne permettent pas
toujours de préciser d’emblée le génotype exact, puisqu’on ne dispose pas de sérum anti-d
(l’existence de cet antigène érythrocytaire n’ayant jamais pu être prouvée, tableau II): les hématies
négatives au sérum anti-D sont toujours du type homozygote dd, mais une réaction positive au sérum
anti-D ne permet pas de savoir si l’individu est du type homozygote DD ou du type hétérozygote
Dd; seule une étude familiale des ascendants ou des descendants peut permettre de connaître la
génotype exact, sinon, l’étude de la fréquence des diverses possibilités permet d’avancer le
« génotype probable » (tableau III).
Certaines associations étant réellement plus fréquentes, et chaque haplotype du système rhésus se
transmettant en bloc, de génération en génération, sans crossing-over, le rhésus s’effectue en
plusieurs étapes:
c) L’action du sérum anti-D classe les individus d’après le Rh
standard, en « Rh positif » ou « Rh négatif »; pour un receveur de sang, cette détermination peut
suffir
d) S’il s’agit d’un donneur de sang, on ne peut se limiter à cette
détermination que si la réaction est positive. Si elle est négative, il importe de savoir si le donneur
est porteur des antigènes C ou E: c’est seulement si ces dernières réactions sont négatives (génotypes
cde/cde) que le donneur peut alors être employé comme « Rh négatif » pour des transfusions
sanguines.
il peut s’agir:
Soit de femmes Rhésus négatif spontanément immunisées (éventuellement réactivées après la
ménopause).
Soit de donneurs de sexe masculin délibérément immunisés pour la préparation d’anticorps.
Condition d’efficacité: pour être efficace, la prévention doit être effectuée rapidement après
l’accouchement ou l’interruption de grossesse, le délai maximal étant de 72 heures. Toutefois,
aucune base expérimentale n’a jusqu’ici précisé le délai au-delà duquel la prévention était totalement
inefficace, ce délai épuisé il est quand même recommandé de faire l’injection même si son efficacité
en devient moins certaine (20g/ml d’hématies). Lorsqu’une injection de sang Rh positif a été faite
par erreur à une femme Rhésus négatif, une prévention doit être envisagée sur les mêmes bases.
Test de Coombs: chez un nouveau-né Rhésus positif, des anticorps anti-Rhésus d’origine maternelle
risquent de se fixer sur les globules rouges, si la mère est Rhésus négatif, on ajoute à ces hématies
suspectes un sérum anti gammaglobulines. Ce sérum n’agglutine pas des hématies normales, en
revanche, il provoque l’agglutination de globules rouges ayant à leur surface des anticorps anti-
Rhésus: c’est le test de Coombs direct.
Chez une femme enceinte Rhésus négatif, les anticorps anti-Rhésus éventuels sont présents dans le
sérum. Dans un premier temps, on ajoute à ce sérum des hématies O Rhésus positif sur lesquelles
vont se fixer les anticorps anti-Rhésus. Puis on ajoute le sérum anti gammaglobulines comme dans
la réaction précédente: c’est la réaction de Coombs indirect.
Le diagnostic de la maladie hémolytique est basé sur l’enquête familiale (citée plus haut) sur
l’examen hématologique, sur les caractères hémolytiques de l’ictère sur l’examen sérologique qui
permet la mise en évidence de l’antigène Rhésus positif ou D sur les hématies du père et de l’enfant,
la mise en évidence du caractère Rhésus négatif ou d de la mère; la détection chez elle des
agglutinines anti-Rhésus à un taux élevé.
IV Technique de détermination du RHESUS
La détermination du Rhésus doit toujours suivre le groupage sanguin ABO.
Matériels: lame, vaccinostyle, sérum anti-D, bain-marie à 37°c qui peut être remplacé par une
bouteille remplie d’eau tiède.
- Technique: placer la lame sur le bain-marie ou sur la bouteille tiède.
Déposer une goutte de sérum anti-D sur la lame.
Ajouter une goutte de sang à tester. Mélanger sérum et sang avec une languette de verre propre.
Lecture: une agglutination apparaît dans la minute qui suit le contact hématies porteuses de
l’antigène D et sérum anti-D.
Hématies + sérum anti-D agglutination (±) Rhésus (±)
Le respect du principe de transfusion iso-groupe dans le système Rhésus rend exceptionnels les
accidents d’incompatibilité transfusionnelle.
Importance du Facteur RHESUS dans la Reproduction Humaine
Une gestation sur 3 ou 400, présente des complications dues au facteur Rhésus. Si la mère est de
Rhésus négatif et le père Rhésus positif, ce dernier peut transmettre le facteur Rhésus à son enfant.
Au cours de la gestation, les globules rouges de l’enfant, avec le facteur Rhésus qu’ils contiennent,
peuvent passer dans le sang de la mère par de minuscules lésions des membranes séparant
normalement les deux circulations. Les mêmes lésions permettent aussi une infiltration du sang de
la mère vers celui de l’enfant. Cependant, une telle infiltration ne se produit pas toujours. Bien des
mères Rhésus négatif ont donné naissance à des enfants Rhésus positif sans accidents. Mais lorsque
le sang de la mère est envahi une seconde fois par les cellules Rhésus positif, les anticorps anti-
Rhésus que la mère avait commencé à produire au cours de la première gestation, pénètrent dans la
circulation de l’enfant et y provoquent des troubles graves. Il peut même arriver que l’enfant meurt
avant la naissance.
Lorsque les troubles sont moins graves, une transfusion au moment de la naissance peut sauver la
vie de l’enfant. On peut même aller jusqu’à remplacer presque complètement le sang de l’enfant par
du sang Rhésus négatif ne contenant pas d’anticorps. Autrement dit, le sang du donneur ne doit pas
avoir été sensibilisé au préalable par une transfusion de Rhésus positif. Actuellement, on doit
prévenir cette affection en soumettant les femmes Rhésus négatif qui risquent une immunisation
Rhésus, à l’injection d’anticorps anti-D incomplets juste après l’accouchement, c’est en effet, lors
de l’accouchement ou tout de suite avant que la femme ne reçoive le plus grand nombre de cellules
Rhésus positif et que l’immunisation se produise. Les incompatibilités dans le système Rhésus
peuvent résulter de l’absence de déterminations du groupe Rhésus, de l’absence de recherche d’une
sensibilité antérieure d’erreurs concernant la transmission ou la transcription.
Le système Rhésus/ facteur Rhésus (Rh): est un facteur qui permet de diviser les sujets en deux
groupes: les Rh+ qui portent ce facteur sur leurs hématies (85%) et les Rh- qui en sont dépourvus
(15%).
Normalement, les sujets Rh- n’ont pas d’anticorps Rh dans leur sérum. Cet anticorps peut apparaître
par immunisation, quand les sujets Rh- reçoivent des hématies Rh+. Une telle éventualité est réalisée
dans deux cas:
- Par transmission sanguine: donneur Rh+, receveur Rh-;
- Par grossesse, une mère Rh- portant un fœtus Rh+ qui joue le rôle de
véritable donneur.
Des hématies Rh+ peuvent franchir le placenta (surtout en fin de grossesse) et aller immuniser la
mère qui fera alors un anticorps anti-Rh. Cette allo-immunisation fœto-maternelle peut être à la base
d’accidents graves. Le facteur Rh est hérité comme un caractère mendélien simple dominant. Si l’on
appelle R, le gène conditionnant sa présence sur l’hématie, r le gène conditionnant son absence, avec
dominance de R sur r, on peut avoir:
Phénotype génotype
RR
Rh+
Rr
Rh- rr
COURS DE BIOSTATISTIQUE
Université Gamal Abdel Nasser de Conakry
Faculté des Sciences
Département de Biologie
Programme Biologie LMD
Cours de Biostatistique
Licence 2 Biologie
6 crédits
Contexte du Cours
BIBLIOGRAPHIE
1 Lamotte M. Initiation aux méthodes statistiques en
biologie. Paris, 5ème édition 1971.
INTRODUCTION
Le terme de caractère, employé à propos des individus d’une population indique l’aspect
particulier et commun à tous les individus, qui retient l’attention et l’on se propose d’examiner.
Selon que le caractère est mesurable ou non, on parle de caractère quantitatif et de caractère
qualitatif.
Le caractère quantitatif est par exemple, la longueur d’un organe, la taille ou le poids d’un
animal ou d’une plante, la température d’un malade, le nombre de germes d’une culture
bactérienne, le nombre d’hématies d’un mm3 de sang, c’est à dire une grandeur définie par une
mesure.
Le caractère qualitatif porte sur la couleur d’une fleur par exemple, l’efficacité ou la non
efficacité d’un traitement, la forme ou la constitution d’un organe, la proportion d’un sexe dans
une population donnée.
Qualitatif ou quantitatif, un caractère présente toujours différentes modalités qui
permettent d’opérer des classements. Ces modalités proviennent des nuances, d’intensité ou des
degrés différents dans le caractère considéré. Parler de récolte bonne, médiocre ou mauvaise, c’est
mentionner trois modalités d’un caractère qualitatif ; parler des salaires compris entre tant et tant,
c’est indiquer des modalités d’un caractère quantitatif.
En outre, le caractère qualitatif peut être ordonné ou non ordonné s’il correspond à une
certaine hiérarchie dans les comme à propos d’une récolte, non ordonner si aucun jugement de
préférence n’est porté sur les modalités; et dichotomique s’il ne comporte que deux modalités ainsi
qu’il arrive de temps à autre dans les situations alternatives: le oui ou non, le succès ou l’échec, le
fonctionnement ou la panne. Quant au caractère quantitatif, il se scinde en caractère discret et
caractère continu.
C) Observations statistiques :
La valeur du traitement statistique des informations dépend de la valeur des informations
que l’on doit traiter. Il faut donc contrôler très soigneusement la qualité des données.
10) La collecte des données: le recueil des données correctes est l’étape fondamentale de la
méthode statistique. C’en est la matière et la valeur de tous travail ultérieur en dépend
profondément, il faut ensuite définir des caractères numériques résumant au mieux toutes les
informations reçues.
La collecte des données consiste à toute une série de mesure ou de dénombrement. On ne
tire des valides conclusions avec les données bien enregistrées, bien rassemblées. La collecte est
dans ce cas un procédé de réalisation, d’observation ou d’expérimentation selon un canevas bien
élaboré en fonction de l’objectif assigné à l’étude.
20) L’organisation des données: consiste à une présentation claire, précise et exploitable des
données numériques
30) L’analyse des données: c’est le procédés d’extraction des statistiques d’une certaine
information de la quelle, une description synthétique et compréhensive des données peut être faite.
Elle consiste à condenser les données obtenues sous la forme de paramètres.
40) L’interprétation: consiste à tirer et à entendre à l’ensemble de la population des
conclusions obtenues de l’échantillon.
Chapitre2 : Présentation d’un ensemble de résultats relatifs à un caractère déterminé
L’étude d’un problème biologique, médicale ou agricole, conduit à l’examen d’un
caractère déterminé sur un certain nombre d’individus soumis à l’observation ou
l’expérimentation. Comme déjà souligné, selon que le caractère est mesurable ou non, on parlera
d’un caractère qualitatif ou d’un caractère quantitatif.
97 1,000 100,00
1° 2 5 3 4 2 6 3 3 1 7
2° 6 3 9 4 0 4 7 1 5 0
3° 3 2 3 5 3 5 6 9 3 2
4° 4 3 4 1 4 3 5 4 4 3
5° 7 2 6 0 3 2 2 5 3 1
0 0 0………………………………………………………………………………………….3
1 1 1 1………………………………………………………………………………………..4
2 2 2 2 2 2 2………………………………………………………………………………….7
3 3 3 3 3 3 3 3 3 3 3 3 3…………………………………………………………………….13
4 4 4 4 4 4 4 4 ……………………………………………………………………………….8
5 5 5 5 5 5…………………………………………………………………………………….6
6 6 6 6………………………………………………………………………………………..4
7 7 7…………………………………………………………………………………………..3
9 9…………………………………………………………………………………………….2
Dans cet exemple, il s’agit d’une distribution simple, non groupée où les valeurs varient de 0 à 9.
d°)- Classification des données de la série statistique: pour toute variation, le nombre de
classes est déterminé de la manière suivante:
- Volume de la série inférieur à 60 6 – 7 classes
- Volume de la série comprise entre 60 et 100 7 - 8 classes
-Volume de la série supérieur à 100 8 – 15 classes et plus
Effectifs des Fréquence Fréquence Fréquence Fréquence
classes (ni) relative relative en % cumulée cumulée en %
0 3 0,06 6 0.06 6
1 4 0,08 8 0.14 14
2 7 0,14 14 0.28 28
3 13 0,26 26 0.54 54
4 8 0,16 16 0.70 70
5 6 0,12 12 0.82 82
6 4 0,08 8 0.90 90
7 3 0,06 6 0.96 96
8 0 0,00 0 0.96 96
9 2 0,04 4 1.00 100
ni = 50 fi = 1 fi % = 100
Le plus souvent, et c’est le cas notamment lorsqu’il s’agit de variables contenues, qui
peuvent théoriquement toutes les valeurs possibles dans un certain intervalle, les valeurs observées
sont très nombreuses. Pour avoir une distribution de fréquences qui ne soit pas trop dispersée, il y a
lieu de grouper ensemble, dans une même classe plusieurs valeurs voisines, ou, plus précisément
toutes les mesures comprises entre certaines limites: on obtient ainsi des classes plus étendues,
mais en moindre nombre.
L’intervalle d’une classe est la différence entre sa limite supérieure et sa limite inférieure.
En principe, les différentes classes successives ont le même intervalle. Elles doivent, d’autre part,
être contiguës les unes aux autres et ne pas chevaucher. Dans tous les cas il est nécessaire de
définir exactement et sans ambiguïté le domaine des classes choisies, de telle sorte qu’une mesure
déterminée puisse être rangée dans une classe et dans une seule.
Il existe trois modes de définition d’une distribution de fréquences.
1°- le mode de définition par les limites réelles de chaque classe: c’est à dire la plus grande
et la plus petite des valeurs théoriques de la variable dans cette classe. Les limites réelles des deux
classes successives (la limite supérieure de l’une et la limite inférieure de l’autre) sont donc
identiques.
2°- le mode de définition par les mesures limites de chaque classe: c’est à dire la plus
grande et la plus petite des mesures devant appartenir à la classe, compte tenu de la précision des
mesures. Les mesures limites des deux classes successives sont donc différente.
3°- le mode de définition par le points médians ou points centraux ou centres de classes: le
limsupliminf
point médian est la demi somme des limites d’une classe = . L’écart entre deux
2
points médians successifs, est donc égal à l’intervalle de classes.
Exemple 3: établissement d’une distribution de fréquences à parti d’une série de mesures.
On a mesuré la hauteur de 120 jeunes Eucalyptes âgés d’un an. Les mesures sont exprimées en cm;
la série statistique est ordonnée.
32 40 53 54 59 65 66 72 72 75 80 80
84 85 89 93 95 95 95 100 101 104 105 105
105 105 105 106 107 107 108 108 110 111 111 111
112 113 113 114 114 115 116 117 119 119 120 122
122 122 123 124 124 124 124 125 126 127 127 127
127 127 127 127 129 129 130 130 130 130 130 130
130 131 132 135 135 138 138 139 140 141 141 141
142 142 143 143 143 143 146 147 148 150 152 152
152 153 156 156 158 158 158 158 158 158 159 160
160 160 160 166 166 168 170 176 192 192 195 196
N = 120
L’analyse des données de cette série statistique se fait de la façon suivante:
1°- Le volume de la série, N = 120 valeurs
2°- Ses valeurs supérieures et inférieures sont:
- hauteur minimale: 32 cm
- hauteur maximale: 196 cm
3°- L’intervalle de distribution ou de variation des mesures:
I .V = 196 cm – 32 cm = 164 cm.
4°- Le nombre de classes peut être de 8 à 15 parce que l’effectif est supérieur à 100.
Prenons10 classes.
5°- L’intervalle de classes est le rapport de l’intervalle de variation à l’effectif de classes:
Diagrammes de fréquences
a) Diagrammes en bâtons: ce sont des ensembles des bâtonnets élevés chacun en regard d’une
valeur et dont la longueur représente la fréquence (absolue ou relative) de la valeur considérée.
Sur l’axe des abscisses, on fait figurer les classes, et en ordonnées les longueurs
proportionnelles aux fréquences ou m^me aux effectifs de classe. Considérons les données de
l’exemple 2 (nombre de racines par hypocotyle) pour cette représentation.
14
Effectif de classes ni 12
10
8
6
4
2
0
0 1 2 3 4 5 6 7 8 9
Classes (nombre de racines par
hypocotyles) Xi
Polygone de fréquences
Données de l’exemple 2
14
Effectif de classes ni
12
10
8
6
4
2
0
0 1 2 3 4 5 6 7 8 9
Classes (nombre de racines par
hypocotyles) Xi
Ces modes de représentation assez utilisés autrefois, fournissent à l’œil une bonne idée
d’ensemble de la distribution et leur construction graphique est simple. Ils ont cependant
l’inconvénient de donner l’impression qu’une fréquence pourrait être attribuée à une valeur de la
variable comprise entre celles des points représentatifs de la distribution.
Histogrammes de fréquences
Données de l’exemple 2
14
Effectif de classes ni
12
10
8
6
4
2
0
0 1 2 3 4 5 6 7 8 9
Classes (nombre de racines par
hypocotyles) Xi
Courbes de fréquences
14
Effectif de classes ni
12
10
8
6
4
2
0
0 1 2 3 4 5 6 7 8 9
Classes (nombre de racines par
hypocotyles) Xi
N.B: on peut utiliser aussi les mêmes modes de représentation pour les fréquences cumulées.
niX'i ni(X i A)
moyenne de cette nouvelle variable est: X i = =
N N
i(X i A)
n
niX'i A
Ce qui est identique à: X = A + . De là, on a : X = X ’+ A =
N N
C’est à dire qu’il suffit de calculer la moyenne de la variable transformée X'i = Xi – A, et de lui
ajouter la moyenne provisoire A pour avoir la moyenne de X cherchée.
Exemple 3: calcul de la moyenne d’une distribution de fréquences avec changement de
variable.
On a mesuré, à deux dixièmes près de millimètre près, le diamètre de 100 coquilles d’une
certaine espèce d’Escargot (Cepaea nemoralis). Les données ont été groupées dans la distribution
où l’intervalle de classes est 1mm. Le tableau qui suit montre comment disposer les calculs pour
obtenir les valeurs de la moyenne avec un maximum de simplicité. On adapte pour moyenne
provisoire la valeur A = 23, point médian d’une classe centrale de la distribution, et l’on considère
la nouvelle variable. Dans ces conditions, les calculs deviennent:
Xi ni X’i = Xi – A NiX’i
20 2 -3 6
21 8 -2 1641
22 19 -1 19
23 27 0 0
24 31 1 31
25 12 2 2458
26 1 3 3
n = 100 i niX'i = +17
X =
n X' A =
i i 17 23 = 23,17mm
N 100
Lorsque l’intervalle de la classe est différent de 1, il est possible de simplifier davantage
les calculs, en employant comme unité la valeur de cet intervalle de classe, ce qui revient à faire le
X''i = i A = X 'i ,
X
changement de variable:
I I
Où I = intervalle de classe de la distribution. On calcule donc la moyenne de X''i , soit:
n ( X A )
X'' = iX''i =
i i
n I
N N
Chapitre 4 : Étude de quelques lois de distribution théoriques.
Les distributions établies d’après des données expérimentales présentent des formes
extrêmement variées, ainsi qu’on a pu déjà s’en apercevoir dans le premier chapitre. Il est toutefois
à noter que la loi de distributions théoriques fondamentales établie à partir des principes du calcul
des probabilités.
Trois de ces lois de distribution permettent de rendre compte de la grande majorité des
distribution du fréquences que de biologiste est amené à rencontrer au cours des ses recherches. Ce
sont la distribution binomiale, la distribution de poisson et la distribution de Gauss, ou distribution
normale. Les deux premières sont discontinues, tandis que la troisième est , au contraire une
distribution continue.
Ces distributions théoriques jouent un rôle essentiel dans les méthodes statistiques qui
permettent d’interpréter les données expérimentales, et sont à la base des divers tests employés
dans l’étude de la validité d’un résultat ou la comparaison d’un ensemble de valeurs
expérimentales. Aussi devons-nous leur consacrer quelques paragraphes avant de pousser plus
avant les méthodes d’analyse statistique.
A- Distribution binomiale
Dans beaucoup problèmes biologiques, on est amené à considérer des alternatives à considérer
des alternatives dont la probabilité est constante. On appelle probabilité d’un événement le rapport
du nombre de cas favorables à l’arrivée de cet événement au nombre total de cas possibles.
Par exemple, dans une espèce où les mâles et les femelles sont en égal, il y a la même
probabilité 1 de recueillir un mâle ou une femelle, si le choix est fait au hasard,
2
indépendamment des habitudes spéciales des deux sexes. De même, si les fleurs blanches ou
bleues d’une plante sont reparties indépendamment des conditions écologiques, et si les fleurs
bleues sont; au total, trois fois plus nombreuses que les blanches, il y a une probabilité de 3 de
4
retrouver une fleur bleue, et une probabilité de 1 d’en trouver une blanche, en récoltant les
4
fleurs au hasard.
On peut alors avoir à se demander qu’elle est la probabilité pour que, dans un échantillon
de n individus prélevés au hasard dans une population donnée, il se trouve un nombre déterminé,
soit r, d’individus présentant un des caractères.
Supposons, par exemple, que dans un sac contenant A billes vertes et B billes rouges, on tire une
bille au hasard, que l’on remet dans le sac après chaque tirage. La probabilité de tirer une bille
verte reste toujours égale à p = A , celle de tirer une bille rouge égale à q = B , avec p+q =1.
A B A B
Si nous tirons successivement n billes, par exemple n = 4, nous pouvons obtenir un certain
nombre de combinaisons de 4 billes dont le tableau qui suit donne la liste, avec les probabilités
correspondantes:
Si l’on ne tient pas compte de l’ordre de tirage des billes – par exemple en extrayant
simultanément les quatre (4) billes -, il y a donc au total une probabilité p4 de tirer quatre vertes,
une probabilité 4p3q de tirer 3 billes vertes et 1 bille rouge, une probabilité 6p2q2 de tirer 2 billes
vertes et 2 rouges, etc. La somme des probabilités, p4 + 4p3q + 6p2q2 + 4pq3 + q4 est égale à 1, ainsi
qu’il est naturel (°).
Elle est en effet le développement de (p+q)4, c’est à dire de 14, puisque p + q = 1.
La loi des probabilités de tirage des diverses proportions de 4 billes, vertes ou rouges, est dite une
distribution binomiale, parce qu’elle s’exprime par les termes du développement d’une puissance –
ici la quatrième – du « binôme » (p+q), p et q étant les probabilités respectives de tirer une bille
verte et une bille rouge.
Dans le cas général du tirage de n billes, la loi de probabilité des diverses combinaisons de
ces n billes, r rouges et n – r vertes, est représentée par le développement du binôme (p+q)n, soit :
(p+q)n = pn + C1n pn-1 q + C2n pn-2 q2 + …+ Crn pn-r qr + Cnn-1 pqn-1 + qn ,
Le terme Crn pn-r qr étant la probabilité pour que l’échantillon renferme, sur ses n billes, r billes
rouges et n-r billes vertes.
Le coefficient crn que nous rencontrons dans ces formules a pour expression :
Crn = n(n1)(n2)...(nr 1) = n! ,
1,2.3.... r r!(nr)!
La quantité n!, qui s’énonce « factorielle n », étant un symbole représentant le produit des n
premiers nombres entiers: n! = n (n-1) (n-2) …3, 2,1.
r
Le coefficient C n est le nombre des combinaisons de n objets pris r à r, ou nombre de
manières différentes de classer r lettres R et n – r lettres V, ainsi qu’il a été montré dans l’exemple
ci-dessus pour n = 4 et r successivement égale à 0, 1, 2, 3, 4.
Le calcul de Crn peut se faire directement à partir de la formule de définition. Pour les valeurs
peu élevées de n, on peut aussi utiliser le triangle de Pascal, qui donne simultanément l’ensemble
des coefficients du binôme:
(1+1) 1 1
(1+1)2 2 1 1
(1+1)3 1 3 3 1
(1+1)4 1 4 6 4 1
» 1 5 10 10 5 1
» 1 6 15 20 15 6 1
» 1 7 21 35 35 21 7 1
» 1 8 28 56 70 56 28 8 1
» 1 9 36 84 126 126 84 36 9 1
Chaque nombre d’une ligne est égal à la somme des deux nombres de la ligne supérieure qui
l’encadrent.
Exemple III, 1.- Distribution binomiale.
On admet que la probabilité de naissance d’un garçon est, comme de naissance d’une fille, égale à
1 . Quelles les probabilités, dans une famille de 6 enfants, d’avoir 0, 1, 2, 3, 4, 5, 6 garçons?
2
Ces probabilités sont données par les termes successifs du développement du binôme ( 1 + 1 )6,
2 2
soient:
( 1 )6 = 1 pour 6 garçons et 0 fille.
2 64
6 x ( 1 ) ( 1 )5 = 6 pour 5 garçons et 1 fille.
2 2 64
15 x ( 1 )2 ( 1 )4 = 15 pour 4garçons et 2filles.
2 2 64
1 3 1 3
20 x ( ) ( ) = 20 pour 3 garçons et 3 filles.
2 2 64
15 x ( 1 )4 ( 1 )2 = 15 pour 2 garçons et 4 filles.
2 2 64
6 x ( 1 )5 ( 1 ) = 6 pour 1 garçon et 5 filles.
2 2 64
( 1 )6 = 1 pour 0 garçon et 6 filles.
2 64
Les coefficients 1, 6, 15, 20, 15, 6, 1, sont les nombres de la sixième ligne du triangle de
Pascal. Si l’on dénombre le nombre des garçons dans 1920 familles de 6 enfants, on doit donc
s’attendre à trouver, conformément à loi des grands nombres:
1920 x 1 = 30 familles avec 6 garçons et 0 fille.
64
1920 x 6 = 180 familles avec 5 garçons et 1 fille.
64
1920 x 15 = 450 familles avec 4 garçons et 2 filles.
64
1920 x 20 = 600 familles avec 3 garçons et 3 filles.
64
1920 x 15 = 450 familles avec 2 garçons et 4 filles.
64
1920 x 6 = 180 familles avec 1 garçon et 5 filles.
64
1920 x 1 = 30 familles avec 0 garçons et 6 filles.
64
Le diagramme en bâtons représentant graphiquement cette distribution est donnée dans la
figure ci-dessous:
La distribution normale s’est ainsi introduite comme limite de la distribution binomiale, dont
elle constitue une approximation très suffisante et cela d’autant plus qu’il s’agit d’échantillons plus
grands, c’est à dire que la distribution binomiale devient d’un emploi plus laborieux.
Tant dans l’étude des méthodes statistiques du calcul des probabilités et de la théorie des
erreurs que dans les problèmes d’ajustement d’une distribution réelle, la distribution normale, dite
aussi distribution de Gauss, se trouve ainsi jouer un rôle fondamental.
La courbe normale, qui représente la distribution normale, ne dépend que de deux paramètres, sa
( x m)2
1
(xm)2
1 e -
Fig. 10 courbe normale de y = 2 2
2
Pour toute courbe normale, l’aire comprise entre les abscisses m - et m + est égale à 0,683
(68,3 % de la surface totale);
Des mesures faites par un expérimentateur, comme des résultats tirés de l’observation, ne
peuvent évidemment concerner qu’un nombre limité d’objets ou d’individus des échantillons, alors
que le but recherché et de formuler des lois générales, pour toute la catégorie d’individus à laquelle
appartient l’échantillon, catégorie dont l’ensemble constitue ce que nous avons appelé population.
Il revient donc à l’expérimentateur de tirer des résultats que lui a fournis l’échantillon étudié le
maximum d’informations concernant le phénomène général dont il s’occupe, et aussi de déterminer
quel est le degré de sécurité de ses conclusions.
Chapitre 5: ESTIMATION ET SECURITE D’UN PARAMETRE
A.- ESTIMATION ET INTERVALLE DE CONFIANCE D’UNE MOYENNE
Par suite de la variabilité intrinsèque des phénomènes biologiques, sur la quelle l’attention a
été attirée déjà précédemment, ce n’est pas une mesure unique que fait habituellement le biologiste,
mais une série de mesures se rapportant au même phénomène et dans des conditions identiques.
C’est ainsi que, pour connaître la taille d’une espèce, on recueille et étudie un certain nombre (aussi
grand que possible) d’individus. De même pour connaître l’effet d’une substance, par exemple le
nombre d’heures du sommeil que procure un produit soporifique, on expérimente sur plusieurs
individus, car le comportement d’un seul pourrait donner une idée très exacte du résultat cherché.
De même encore, pour savoir la teneur du sang en une substance déterminée, on fera des
prélèvements et des dosages sur tout un lot d’individus.
On est ainsi amené à considérer un ensemble de mesure, et naturellement à en déterminer la
moyenne qui en est la valeur centrale la plus représentative. Mais que peut on penser de la moyenne
ainsi obtenue à partir d’un échantillon limité ? Dans quelle mesure représente- t – elle la moyenne
de la totalité des individus que l’on pourrait considérer.
Il est évidemment logique d’adopter la moyenne de l’échantillon étudié comme valeur
estimée de la moyenne, inconnue, de l’ensemble de la population: elle en est la meilleure
estimation.
Par exemple, lorsqu’on trouve que le poids moyen d’une centaine de nourrissons de six
mois, au hasard, et de 6 kg, il est normal d’adopter cette valeur pour meilleure estimation du poids
moyen des nourrissons de cet âge dans la population d’où provient l’échantillon étudié.
Pourtant, la valeur fournie par l’échantillon n’est qu’une valeur « estimée » de ce qui est
réellement la vraie moyenne, inconnue, de l’ensemble de six mois; si un autre échantillon de 100
nourrissons du même âge est étudié, sa moyenne différera plus ou moins de la précédente, car le
poids d’un nourrisson n’est pas défini de façon rigoureuse pour son âge, et ce ne sont pas
exactement les mêmes valeurs qui sont à l’origine des deux moyennes, par suite du hasard de
l’échantillonnage.
Pour connaître la moyenne exacte d’une population, il serait nécessaire de mesurer tous les
individus qui la composent, et un échantillon n’en pourra jamais donner qu’une estimation d’autant
meilleure, naturellement, que cet échantillon sera plus nombreux. Il importe donc de savoir quelle
est la sécurité, la précision, pourrait on dire, de la moyenne que fournie un échantillon; c’est à dire
de savoir de combien il est possible qu’elle s’écarte de la vraie moyenne; en un mot de connaître
son « intervalle de confiance ».
Imaginons que nous extrayons d’une population une série d’échantillons de n individus et
que, pour chacun, nous considérons sa moyenne. Ces différentes ont pour moyenne générale,
naturellement, la moyenne de la population, soit Mp. Elles en différents, plus ou moins, et il est
possible d’établir leur distribution autour de la vraie moyenne: cette distribution des moyennes des
échantillons sera caractérisée par un certain écart-type, qu’on appelle l’ « erreur standard » de la
moyenne, pour le distinguer de l’écart-type des mesures elles – mêmes autour de la moyenne.
Un résultat théorique d’une extrême importance montre que ces moyennes des échantillons de n
individus, lorsque n est assez grand (>30), sont distribuées de façon normale autour de la vraie Mp
de la population, et avec un écart-type, une erreur standard, qui a pour valeur sm = p où p est
n
l’écart type de la distribution des mesures dans l’ensemble de la population. Dans ces conditions, il
suffira de reporter deux fois de part et d’autre de la moyenne la valeur sm de l’erreur standard de la
moyenne pour en connaître de sécurité, c’est à dire les valeurs telles qu’il y ait moins de 5% de
chance que la vraie valeur chercher de la population ne s’écarte davantage de la moyenne trouvée
pour l’échantillon.
Dans la pratique, évidemment, on ne connaît pas les vraies valeurs de Mp et de p . Mais il
est possible d’en donner des estimations, puisque l’échantillon lui même constitue déjà une image
approchée de la population. Pour la moyenne de la population, nous avons que nous prenons pour
estimation la valeur m de la moyenne de l’échantillon. Pour l’écart-type, les théories statistiques
montrent que la meilleur estimation de l’écart-type de la population est très largement supérieur à
.
n1 n1
On a donc pour l’erreur standard de la moyenne: sm = p =
n n1
On adoptera pour meilleure estimation de la moyenne du diamètre des coquilles de l’espèce Cepaea
memoralis la valeur 23,17 trouvée pour l’échantillon.
Pour déterminer l’intervalle de confiance de cette moyenne, calculons-en d’abord l’erreur
standard, soit :
sm = =
1,25
= # 0,13
n1 99
Les limites de l’intervalle cherché sont alors données par les valeurs: m 2 sm = 23,17 2 x0, 13
soit 22,91 mm… 23,51 mm, avec un coefficient de sécurité de 95% ; ou m 2,6 sm = 23,17 2,6 x
0,13, soit 22,83 mm,… 23,51 mm, avec un coefficient de sécurité de 99%.
Dans un exposé des résultats d’expérimentation, on indiquera comme moyenne de la
population 23,17 0,13, laissant ainsi au lecteur la soin de calculer les limites de sécurité
correspondant au coefficient de sécurité qu’il désire.
La quantité υ = n-1 portée sur le tableau est ce qu’on appelle le nombre de degrés de liberté. Si,
en effet, n-1 mesures d’un échantillon de moyenne donnée sont connues, la nme s’en déduit aussitôt
Nous retrouverons à plusieurs reprises cette notion de nombre de degrés de liberté, qui joue un
grand rôle dans les méthodes statistiques.
Ainsi, pour connaître les limites de l’intervalle de sécurité d’une moyenne expérimentale
obtenue à partir d’un petit nombre de mesure ou d’observations, il suffit de reporter de part et
d’autre de cette moyenne Tυ fois son erreur standard, soit Tυ sm où sm = et Tυ est la valeur
n1
donnée par le tableau C en fonction du coefficient de sécurité que l’on se fixe (le plus souvent 95%
ou 99%) et du nombre de mesures n à partir du quel a été obtenue la moyenne, en choisissant la
ligne y = n-1
Exemple v, 2: Intervalle de confiance de la moyenne d’un petit échantillon
L’examen de 11 colonies de Cepea nemoralis vivant s dans un certain biotope a conduit,
pour la moyenne des fréquences des individus sans bandes, a une valeur m = 0,34 avec une
dispersion des mesures 2 = 0,024.
Pour obtenir l’intervalle de confiance de cette moyenne, on calcule d’abord l’erreur
standard:
sm = =
0,024
= 0,049
n1 10
L’effectif de l’échantillon étant nettement inférieur à 30, nous devons ensuite utiliser la
table de t pour calculer les limites de l’intervalle de confiance. Le nombre de degrés de liberté est
ici υ = 11-1= 10 et nous trouvons dans la table de t, υ= 10, la valeur T = 2,23 pour le coefficient
de sécurité 95%.
Les limites cherchées sont dans ces conditions:
m Tsm = 0, 34 2, 23 x 0, 049,
Soit 0,23 …0,45 pour coefficient de sécurité 95%.
De la même manière on obtiendrait, pour coefficient de sécurité 99% pour lequel la table de t
donne T = 3,17 correspondant à 10 degrés de liberté, les limites:
m Tsm = 0, 34 3, 17 x 0,049; soit: 0,185 …0,495.
C- Estimation et intervalle de confiance d’un pourcentage.
On a étudié un échantillon de n individus, parmi lesquels r possède un caractère K, et n-r ne
le possède pas. La proportion, qu’on appelle souvent pourcentage, du caractère K dans
l’échantillon est donc q0 = r . Ainsi qu’il est naturel de le penser, la meilleure estimation Q que
n
l’on puisse donner de la proportion des individus à caractère K, dans l’ensemble de la population
d’où provient l’échantillon étudié, est égal à la proportion q0 = r observée dans l’échantillon:
n
Q = q0.
Recherchons maintenant l’intervalle de confiance de cette estimation, c’est à dire les
valeurs limites Q1, Q2 telles que, si le pourcentage dans la population était en dehors de ces limites,
il serait bien peu vraisemblable d’en tirer un échantillon en différant au moins autant que celui que
l’on a étudié.
La distribution des proportions q dans des échantillons de n individus provenant de la
population est distribution binomiale, donnée par le développement du binôme (p+q)n, où p = 1-q.
Mais, si n est grand, supérieur à une centaine, par exemple, et si q n’est pas voisin de 0 ou de 1,
une telle distribution binomiale se trouve, en fait, très voisine d’une distribution normale ayant
même moyenne q et même écart type qui est aussi l’erreur standard du pourcentage:
q(1q)
= .
n
Dans le cas de notre échantillon de pourcentage q0, 95% des valeurs de q seront comprises
q0(1q
0)
dans les limites q0 2 , soit q0 2 , qui sont donc les limites de sécurité cherchées
n
correspondant à ce coefficient de sécurité, c’est à dire à un coefficient de risque 5%.
Pour un coefficient de sécurité 99%, c’est à dire un risque de 1 %, il faudrait prendre les
q0(1q
0)
limites q0 2,6 , soit q0 2,6 .
n
On peut remarquer que l’étendue de l’intervalle de confiance est inversement
proportionnelle à la racine carrée de l’effectif de l’échantillon. Pour avoir une précision deux fois
plus grande de l’estimation, il est donc nécessaire de prendre un échantillon quatre fois plus
nombreux, et pour décupler de la précision, il faut un échantillon cent fois plus grand.
Exemple v,3: intervalle de confiance d’un pourcentage (cas d’un grand échantillon).
On a dénombré dans une maternité, sur 4235 nouveau-nés, 2180 garçons pour 2055 filles. Que
peut – on en conclure sur la proportion des sexes à la naissance dans la population d’où
proviennent ces enfants ?
La proportion des garçons que donne l’échantillon étudié est: q0 = 2180 # 0,5148.
4235
Cette valeur constitue la meilleure estimation Q que nous puissions donner de la proportion des
garçons à la naissance dans la population.
Quel est l’intervalle de confiance de cette estimation ? On a, pour écart type de la
distribution de l’échantillonnage des pourcentages q dans des échantillons de 4235 individus tirés
d’une population où Q = 0,5148:
0,5148(10,5148)
= = 0,00768.
4235
Dans ces conditions, les limites cherchées sont données, en adoptant un coefficient de sécurité
95%, par les valeurs:
q0 2 , soit 0,5148 0,01536 (0,4994…..0,5302).
Ou, si l’on adopte un coefficient de sécurité de 99%, par les valeurs:
q0 2,6 , soit 0,5148 0,01997 (0,4948…0,5348).
On constate qu’il n’est nullement exclu par les résultats de l’échantillon étudié que la
proportion des garçons, dans l’ensemble de la population, soit de 0,5 exactement.
6 12,59 16,81
7 14,07 18,48
8 15,51 20,09
9 16,92 21,67
10 18,31 23,21
11 19,68 24,72
12 21,03 26,22
13 22,36 27,69
14 23,68 29,14
15 25,00 30,58
16 26,30 32,00
17 27,59 33,41
18 28,87 34,80
19 30,14 36,19
20 31,41 37,57
21 32,67 38,93
22 33,92 40,29
23 35,17 41,64
24 36,41 42,98
25 37,65 44,31
26 38,88 54,64
27 40,11 46,96
28 41,34 48,28
29 42,56 49,59
30 43,77 50,89
Nombre de degrés de liberté: il est important d’attirer l’attention sur une notion déjà
rencontrée par ailleurs, et qui joue un rôle essentiel en statistique: le nombre de degrés de liberté.
Il est bien évident, on le conçoit, que deux distributions devront, pour être considérées comme
divergentes, avoir un 2 limite d’autant plus grand qu’elles comportent un nombre de termes plus
élevé, car deux distributions très peu différentes n’en ont pas moins un 2 important si elles
comportent un très grand nombre de classes.
Mais seulement, il ne faut envisager que le nombre des termes de la distribution théorique
qui sont réellement indépendantes, c’est à dire que l’on pourrait fixer arbitrairement,
indépendamment des valeurs des termes de la distribution expérimentale. Ainsi, comme on
s’astreint, pour fixer les termes de la distribution théorique, à ce que la somme de ces termes
soit égale à la somme des termes de la distribution expérimentale a , le nombre des termes
indépendants ou nombre de degrés de liberté sera υ = n-1 si on ne leur impose pas d’autres
conditions. Si, de plus, la distribution théorique est déterminée de façon qu’un autre de ses
paramètres soit égal au paramètre correspondant de la distribution expérimentale, le nombre des
degrés de liberté sera diminué encore de 1, et donc égal à υ = n-2. Si on fait en sorte que deux
paramètres de la distribution théorique, en plus de la somme soit égaux respectivement aux deux
paramètres correspondant de la distribution expérimentale, le nombre de degrés de libertés sera
υ = n-3, etc.
L’application du critère du 2 à quelques exemples de comparaisons de deux
distributions en fera facilement comprendre l’emploi.
La divergence des deux distributions, réelle et théorique, est ainsi mesurée par 2 = 12,83.
Le nombre des degrés de libertés est ici y = 8-2 = 6. En effet, sur huit classes de la distribution
théorique, il y en a seulement six dont son peut fixer indépendamment la fréquence, puisque, pour
déterminer, on s’est imposé:
1° que la fréquence totale soit égal à la fréquence totale expérimentale a = 1877.
s2m1 =
(xm1)2 et s2 = (xm2)2 .
m2
n1(n n2(n
11) 21)
Comme les effectifs n1 et n2 sont grands, on a donc sensiblement:
s2 d #
21 2 2
+ , soit sd #
21 22 .
n1 n2 n1 n2
1 et 2 étant les variances des deux échantillons comparées.
2 2
s2d est la variance standard et sd l’erreur standard de la différence des moyennes.
Dans ces conditions, si la valeur observée pour m1m2 dans les deux échantillons étudiés est
supérieure à 2 sd, elle se trouve en dehors de l’intervalle de confiance de la moyenne zéro et, avec le
coefficient de sécurité adopté (95%), on peut la considérer comme n’étant pas due au simple hasard.
On dit que la différence observée est significative.
En pratique, on forme le rapport, souvent appelé t, des deux quantités m1m2 et sd soit
m1m
2
t= , et l’on voit s’il est ou non supérieur à 2 (sécurité 95%) ou à 2,6 (sécurité 99%).
sd
Bien entendu, le calcul des expressions (x-m1)2 et (x-m2)2 se fait le plus souvent avec
avantage en utilisant la méthode de la moyenne provisoire, c’est à dire les formules:
(x-m1)2 = (x-A)2 – n1 (m1-A)2
(x-m2)2 = (x-B)2 – n2 (m2-B)2.
A et B pouvant, dans certains cas, être pris égaux à zéro:
(x-m1)2 = x2 – n1m21
(x-m2)2 = x2 – n2m22.
Exemple 1: Comparaison de deux moyennes dans le cas de grands échantillons.
On a mesuré la taille de 1078 hommes et celle de leurs fils aînés à l’âge adulte. Les résultats
observés sont les suivants:
Taille des pères (en pouces): m1 = 67,71 21 = 7,40 n1 = 1078.
Taille des fils (en pouces): m2 = 68,67 2 = 7,60
2
n2 = 1078.
La différence entre les moyennes de la taille des pères et celle des fils est-elle significative
indiquant un accroissement réel de taille d’une génération à l’autre, ou s’agit-il simplement d’une
différence due au hasard ?
L’erreur standard de la différence des moyennes est ici:
21 2 2 7,40 7,60
sd = S 2m1 S 2m2 = = = 0,12.
n1 n 2 1078 1078
Le rapport de la différence observée m1-m2 à son erreur standard est donc:
68,6767,71
t = 1m2 =
m
# 8.
sd 0,12
Cette valeur est très supérieure aux seuils correspondant aux degrés de sécurité 95% (2) et
même 99% (2,6). Elle correspond à une probabilité extrêmement faible pour que la différence
constatée soit imputable uniquement à des fluctuations fortuites: on doit admettre que cette
différence est hautement significative et qu’il y a eu réellement un accroissement de la taille
moyenne d’une génération à la suivante.
Cas où les effectifs des échantillons sont petits, où leurs fréquences voisines
de 0 (ou 1)
La méthode qui vient d’être exposée implique que la distribution des pourcentages, et par
suite de leur différence, puisse être assimilée à une distribution normale. Ce n’est évidemment plus
le cas lorsque les effectifs des échantillons sont petits ou que les fréquences à comparer sont
voisines de 0 ou de 1.
Soient donc deux échantillons d’effectifs n1 et n2 renfermant respectivement a1 et a2
individus présentant le caractère étudié.
Il s’agit toujours de rechercher, l’hypothèse d’une population unique d’origine, quelle est la
probabilité d’en extraire deux échantillons d’effectifs n1 et n2 où la différence des fréquences soit
a1 a 2
au moins égale à celle observée:
n1 n 2
et contenant ensemble le même nombre (a1+a2) d’individus présentant le caractère.
Selon la valeur obtenue pour cette probabilité, on pourra conclure que la différence des
fréquences dans les échantillons examinés est significative ou non.
On devra donc, en pratique:
1 2
1° rechercher les couples de 1 et 2 telles que 1 + 2 = a1+a2 et que:
n1 n2
a1 a 2
n1 n 2
;
Si cette somme est inférieure au coefficient de risque adopté; 0,05 ou 0,01 par exemple, on devra
a a
rejeter l’hypothèse que les deux échantillons 1 et 2 proviennent d’une même population: ils
n1 n2
sont significativement différents.
L’application de la méthode est faite dans les exemples suivants.
Exemple 7: Comparaison de deux pourcentages dans le cas de petits échantillons.
L’examen de deux échantillons de n1 et n2 Escargots (Cepaea nemoralis), dont la coloration peut
être jaune ou rose, a donné, pour le nombre a des individus roses, les résultats suivants:
a
n1 = 16 a1 = 7, soit une proportion q1 = 1 = 0,4375, n2 = 20
n1
a
a2 = 1, soit une proportion q2 = 2 = 0,05.
n2
La différence q1-q2 = 0,3875 entre ces deux fréquences est-elle significative ?
Pour les deux échantillons étudiés, on a la probabilité:
C 7 C1
p ( 7 , 1 ) = 16 8 20 8!28!16!20! # 0,00756.
16 20 C36 36!7!9!1!19!
Cette probabilité est faible, et inférieure aux seuils de sécurité habituels; mais il faut considérer
toutes les probabilités de différences supérieures à la différence observée 0,4375 – 0,05 = 0,3875
toujours dans deux échantillons d’effectifs n1 = 16 et n2 = 20, et tels que le total des individus roses
soit égal à (a1+a2) = 8. Ce sera le cas pour: 1 = 8, 2 = 0 d’une part, puisque 1 2 8 0 =
n1 n 2 16 20
1' 2' 0 8
0,5 et pour 1' = 0, 2' = 8 d’autre part, puisque: = -0,4. Pour toutes les autres
n1 n2 16 20
a1 a 2
valeurs de 1 et 2 (avec 1 + 2 = 8), la différence - est inférieure à 0,3875 en valeur
n1 n 2
C8 C 0
absolue. On a: p ( 8 , 0 ) = 16 8 20 = 8!28!16!20! = 0, 00043.
16 20 C36 36!8!8!20
C 0 C8
P ( 0 , 8 ) = 16 8 20 = 8!28!20!16! = 0,00416.
16 20 C36 36!8!12!16
Au total donc: P ( 8 , 0 ) + p ( 0 , 8 ) + p ( 7 , 1 ) = 0,00043 + 0,00416 + 0,00756 = 0,01215.
16 20 16 20 16 20
Cette probabilité reste inférieure au seuil 0,05 (5%) généralement adopté, c’est à dire que la
différence observée 0,3875 doit être considérée comme significative et non due simplement au
hasard.
Chapitre 8: Test d’homogénéité d’un ensemble d’échantillons.
On se propose de rechercher si les différences entre plusieurs échantillons peuvent être
raisonnablement attribuées à de simples fluctuations liées au hasard de l’échantillonnage, ou si, au
contraire, elles sont trop grandes pour qu’il en soit ainsi et traduisent nécessairement des
divergences réelles, significatives. On veut, par exemple, l’influence d’une série de traitements ou
l’action de doses différentes d’une substance sur plusieurs lots d’animaux ou de plantes, ou encore
déterminer si diverses variétés ou lignées d’un organisme réagissent différemment à un même
traitement.
S’il ne s’agissait que de deux échantillons, de comparer l’action de deux traitements par
exemple, on utiliserait les tests d’homogénéité exposés plus haut, qu’il s’agisse de comparer deux
pourcentages d’un caractère qualitatif ou deux moyennes d’une série de mesures d’un caractère
quantitatif. Lorsque le nombre des échantillons est supérieur à deux, on peut, certes, toujours les
confronter deux à deux, selon ces procédés, mais si l’on veut tester d’un coup d’homogénéité de
l’ensemble, c’est à dire reconnaître s’il y a ou non, au total une action du facteur étudié ou une
diversité entre les lots comparés, il devient nécessaire d’utiliser d’autres méthodes plus générales.
Analyse de la variance
A°- Cas d’un caractère quantitatif:
.
La méthode utilisée pour tester l’homogénéité d’un ensemble d’échantillons en ce qui
concerne un caractère quantitatif est l’analyse de la variance, due à R. A. fisher. Il s’agit de savoir
si le caractère quantitatif étudié réagit différemment vis-à-vis du facteur qui diffère selon
l’exemple:
Exemple 8: Comparaison de deux faibles pourcentages.
On a recueilli deux échantillons de n1 = 120 et n2 = 150 individus d’une certaine espèce et l’on y a
dénombré respectivement a1 = 3 et a2 = 0 albinos. La différence des deux pourcentages doit-elle
être considérée comme significative ?
Cette différence égale à 3 0 = 0,025 est la plus grande, en valeur absolue, qui puisse exister
120 150
entre les fréquences de deux échantillons de n1 et de n2 individus où le total des albinos est 0+3= 3.
Il suffit donc de rechercher si la probabilité de tirer d’une même population homogène deux tels
échantillons est ou non inférieure au seuil admis, soit 5%.
On a:
C8 C 0
p ( 3 , 0 ) = 1208 150 = 3!267! 120! = 0,0866.
120 150 C270 270! 3!117!
Cette valeur est supérieure au seuil de signification 0,05 c’est à dire que la différence
observée n’est pas significative et ne contredit pas l’hypothèse d’une même population d’origine.
Les échantillons par exemple, la composition intrinsèque des divers lots, ou la dose d’une
substance expérimentée, c’est à dire si l’on doit ou non rejeter l’hypothèse que ces échantillons
peuvent être considérés comme provenant d’une même population.
Admettons cette hypothèse de l’homogénéité: on peut alors estimer de deux façons
différentes et indépendantes, la variance de cette population unique d’origine: l’une des
estimations est faite de façon à éliminer les influences du facteur agissant sur les différents lots et
dont on étudie précisément l’action; l’autre estimation est telle qu’elle mettrait, au contraire, en
évidence les influences éventuelles de ce même facteur.
Si ces deux estimations, confrontées comme il a été exposé plus haut à propos de la
comparaison de deux variances, montrent une divergence significative, l’hypothèse de la même
population d’origine de l’ensemble des échantillons ne doit pas être maintenue, c’est à dire que ces
divers échantillons sont hétérogènes et traduisent une diversité réelle. Sinon, les différences
observées sont peut être simplement dues à des écarts fortuits d’échantillonnage.
Nous exposerons sur un exemple concret l’application de la méthode.
Exemple 1: Test d’homogénéité d’un ensemble d’échantillons dans le cas d’un caractère
quantitatif: analyse de la variance.
On a constitué trois lots renfermant 10, 10 et 12 poules Leghorn appartenant à trois lignées
différentes A1, A2, A3, soumises exactement aux mêmes conditions. Le nombre d’œufs pondus par
chaque poule durant une année a été noté; les résultats de l’expérience sont inscrits dans les trois
colonnes du tableau suivant.
Nombre d’œufs pondus pendant une année:
Lignée A1 Lignée A2 Lignée A3
180 199 191
177 203 194
175 200 201
170 194 193
182 195 197
181 204 195
177 206 203
180 207 199
183 202 199
185 200 201
206
197
Totaux……………. X1 = 1790 X2 = 2010 X3 = 2376
Moyennes……………
m1 =179 m2 = 201 m3 = 198
La moyenne générale annuelle des œufs pondus par l’ensemble des 32 poules est de:
M=
X = 1790 2010 2876 = 193
n1n2 n3 101012
et les moyennes relatives à chacune des trois lignées sont:
m1 =
X 1 1790 = 179.
n1 10
m2 =
X 2 2010 = 201
n2 10
m3 =
X 3 2376 = 198.
n3 12
Doit - on voir entre les moyennes de ponte ainsi observées dans les trois échantillons de
simples écarts dus au hasard de l’échantillonnage, ou existe-il aussi une différence réelle entre les
trois lignées en ce qui concerne l’aptitude à la ponte ?
La dispersion totale des résultats autour de la moyenne générale M est mesurée par:
S2t = (x-M)2 = x2-32 M2 = 3448, avec 32-1
= 31 degrés de liberté,
puisque les 32 valeurs x sont liées par une relation X = 32 M.
Cette dispersion totale est due à la fois aux fluctuations de l’échantillonnage et aux autres
de causes de diversité, en particulier une différence éventuelle d’aptitude à la ponte des trois
lignées. Elle est ainsi la somme de deux termes:
1° S2, somme des carrés, des écarts entre les moyennes des lignées et la moyenne générale, chaque
terme étant multiplié par le nombre des variables de sa série; S2f représente la dispersion
attribuable à la diversité d’une action de ces lignées, on l’appelle dispersion factorielle:
S2f = 10 (m1-M)2 + 10 (m2-M)2 + 12 (m3-M)2
= 10 m21 + 10m22 +12 m23 –32 M2 = 2900
avec 3-1 = 2 degrés de liberté, puisque les trios moyennes sont liées par une relation:
10 m1 +10 m2 +12 m3 = 32 M.
2
2° S r, somme des carrés des écarts des résultats individuels aux moyennes respectives des lignées;
c’est la différence entre S2t, dispersion totale, et S2f, dispersion factorielle; S2r est imputable
seulement aux fluctuations fortuites, on l’appelle dispersion résiduelle:
S2r = (x1-m1)2 + (x2-m2)2 + (x3-m3)2
= x2- (10 m21 + 10 m22 +12 m23) = 548
avec 32-3 = 29 degrés de liberté, puisque les 32 valeurs de x sont liées par trois relations:
x1 = 10 m1, x2 = 10 m2, x3 = 12 m3.
Dans l’hypothèse que les trois lignées sont équivalentes en ce qui concerne la ponte, c’est à
dire que les différences entre les pontes des trois lots ne sont que le résultat de causes fortuits, les
lignées ne forment en définitive qu’une même population en ce qui concerne la ponte. Nous
pouvons alors estimer de deux façons la variance de la population unique d’origine de toutes les
poules:
D’une part, à partir de la dispersion factorielle S2f:
Uf = 1 S2f = 2900 = 1450;
2 2
D’autre part, à partir de la dispersion résiduelle S2r:
Ur = 1 S2r = 548 = 18,9.
29 29
Ces deux estimations sont indépendantes, et si notre hypothèse est exacte, elles ne devraient
donc différer que dans la mesure prise par l’échantillonnage. Nous avons donc à les comparer par
Uf
la méthode de Snédécor exposé plus haut. On forme pour cela le rapport , dont la valeur est,
Ur
dans l’exemple étudié:
Uf
= 1450 = 77.
Ur 18,9
Cette valeur est très élevée, et très supérieure aux valeurs de la table de Snédécor
correspondant aux degrés de liberté y = 2 et y = 29, qui sont 3,33 pour un coefficient de sécurité de
95% et 5,42 pour un coefficient de sécurité de 99%.
Nous devons donc rejeter l’hypothèse que nous avions faites avec les différences constatées
entre les pontes des trois lots étaient simplement dues à des fluctuations fortuites, et admettre par
suite qu’il existe une différence réelle entre les trois lignées comparées, en ce qui concerne
l’aptitude à la ponte.
Il est commode, en pratique, de grouper les calculs dans un tableau tel que celui qui suit
(tableau de calculs).
Lignée A1 LignéeA2 Lignée A3
Œufs pondus carré Œufs pondus carré Œufs pondus carré
X1,1 = 180 32400 X2,1 = 199 39601 X3,1 = 191 36481
X1,2 = 177 31329 X2,2 = 203 41209 X3,2 = 194 37636
X1,3 = 175 30625 X2,3 = 200 40000 X3,3 = 201 40401
X1,4 = 170 28900 X2,4 = 194 37636 X3,4 = 193 37249
X1,5 = 182 33124 X2,5 = 195 38025 X3,5 = 197 38809
X1,6 = 181 32761 X2,6 = 204 41616 X3,6 = 195 38025
X1,7 = 177 31329 X2,7 = 206 42436 X3,7 = 203 41209
X1,8 = 180 32400 X2,8 = 207 42849 X3,8 = 199 39601
X1,9 = 183 33489 X2,9 = 202 40804 X3,9 = 199 39601
X1,10 = 185 34225 X2,10 = 200 40000 X3,10 = 201 40401
X3,11 = 206 42436
X3,12 = 197 38809
x1 = 1790 x21 = 320582 x2 = 2010 x22 = 404176 x3 = 2376 x23 =
m1 = 179 m2 = 201 m3 = 198 470658
m21 = 32041 m22 = 40401 m23 = 39204
206
Si l’on fait l’hypothèse que les échantillons proviennent d’une population unique, on est conduit
naturellement à attribuer au pourcentage du caractère dans cette population une valeur A =
N
a , obtenue en réunissant tous les échantillons observés.
n
Dans ces conditions, les fréquences des individus présentant le caractère dans les
1
différents échantillons devraient théoriquement être telles que le pourcentage du caractère ,
n1
2
… soit toujours le même et égal à A , c’est à dire: 1 = n1 A , 2 = n2 A ,… k = nk A , et
n2 N N N N
celles des individus ne le présentant pas: n1- 1 , n2- 2 ,….nk- k .
Le problème revient donc à savoir si les écarts entre les fréquences théoriques 1 , 2 ,… k ,
(n1- 1 ), (n2 - 2 ),… (nk- k ) et les fréquences réelles observées a1, a2, ak, (n1-a1), (n2-a2), …
(nk-ak) peuvent être imputés au simple hasard de l’échantillonnage. Or ce problème, qui est celui
de la comparaison d’une distribution expérimentale à une distribution théorique, a été déjà
étudié: la méthode qui permet de le résoudre est celle du 2 . La divergence entre les deux
(a11)2 (a 2 )2
distributions est mesurée par l’expression: 2 = 2
+…+
1 2
(a k k )2 [(n1a1)(n11)]2 [(nk ak )(nk k )]2
+…+
k n11 nk k
(a11)2 (a 2 2)2 (a k k )2 (a11)2 (a k k )2
= +…+ +…+…+
1 2 k n11 nk k
dont la valeur est d’autant plus élevée que les fréquences réelles a et (n-a) diffèrent davantage des
fréquences théoriques et (n- ). On a vu que des tables ont été établies, qui permettent de
reconnaître, compte tenu du nombre de degrés de liberté, si la valeur obtenu par le paramètre 2
à partir des données expérimentales est ou non supérieure au seuil de signification correspondant
à de simples fluctuations fortuites pour le coefficient de sécurité choisi.
Pour la détermination du nombre de degrés de liberté, on devra tenir compte de ce qu’on
impose, pour établir la distribution théorique, non seulement un pourcentage global au
pourcentage expérimental, mais aussi un effectif égal, pour chaque échantillon théorique, à
l’effectif de l’échantillon réel correspondant: 1 + (n1- 1 ) = a1 + (n1-a1), etc. C’est à dire que si
l’on peut fixer arbitrairement k-1 des nombres , le kme sera déterminé par la relation a ,
et les k nombres n- en résulteront. Si k est le nombre des lots étudiés, le nombre de degrés de
liberté est y = k-1 alors que le nombre des termes du 2 est 2 k.
Exemple 2: Homogénéité des pourcentages dans un ensemble d’échantillons.
On a recueilli, en des emplacements différents, quatre échantillons renfermant 150, 170, 120 et
160 exemplaires de l’espèce polymorphe Cepaea nemoralis, parmi lesquels on a dénombré
respectivement 29, 39, 35 et 56 individus à coquille rose.
207
Nombres d’individus roses Nombre d’individus non rose Totaux
a (n-a)
( ) (n- ) n
29 121 150
(39,75) (110,25)
39 131 170
(45,05) (124,95)
35 85 120
(31,80) (88,20)
56 104 160
(42,40) (117,60)
Totaux : 159 (159)
441
(441) 600
a1 29 a 2 39 a3 35 a
Les pourcentages ainsi observés , , et 4 56 traduisent-ils des
n1 150 n2 170 n3 120 n4 160
variations significatives de composition d’un emplacement à l’autre ou leurs différences peuvent-
elles raisonnablement être imputées au hasard qui a présidé au ramassage des individus dans une
population partout semblable ?
Si nous admettons l’hypothèse d’une population unique d’origine, il convient de lui attribuer une
proportion égale à:
a = 29393556 = 159 d’individus à coquille rose.
n 150170120160 600
On devrait avoir, théoriquement, dans les quatre échantillons prélevés, des fréquences
1= 150 x 159 = 39,75 ; 2= 170 x 159 = 45,05 ; 3= 120 x 159 = 31,80 et
600 600 600
4= 160 x 159 = 42,40.
600
Pour les individus roses, et par conséquent des fréquences:
n1 - 1 = 150 - 39,75 = 110,25 ; n2 - 2 = 170 - 45,05 = 124,95 ; n3- 3 = 120 - 31,80 = 88,20
et n4 - 4 = 160 - 42,40 = 117,60 ; pour les individus non roses.
Ces diverses valeurs ont été reportées entre parenthèses dans chaque case correspondante du
tableau où figuraient déjà les résultats expérimentaux. La divergence entre les eux séries de
fréquences, réelles et théoriques, est donc mesurée par le paramètre:
(2939,75)2 (3945,05)2 (3531,80)2
2=
39,75 45,05 31,80
(5642,40) (121110,25) (131124,95)2
2 2
+
42,40 110,25 124,95
(8588,20)2 (104117,60)2
+ = 11,43.
88,20 117,60
Il y a ici y = 3 degrés de liberté, puisque sur les 8 valeurs théoriques, 3 seulement peuvent être
fixés de façon arbitraire, les totaux des diverses lignes et ceux des diverses colonnes du tableau
théorique devant être égaux à ceux du tableau des données expérimentales.
208
Les tables 2 indiquent que pour 3 degrés de liberté, il n’y a qu’une probabilité inférieure à 0,05
et même à 0,01 d’obtenir une telle valeur 11,43ou une plus grande uniquement par de simples
fluctuations fortuites.
Nous devons donc rejeter l’hypothèse que les quatre échantillons étudiés ont été prélevés dans une
population homogène en ce qui concerne la couleur des coquilles et admettre que les sous-
populations dont ils proviennent ont des compositions différentes.
209
Chapitre 9: Relations entre deux caractères qualitatifs
Notion d’association et d’indépendance.
Définie quantitativement ou qualitativement, c’est une variable unique, que nous avons
considérée jusqu’ici, qu’il s’agisse du nombre des petits d’une espèce, de la taille de coquilles,
de la couleur d’une fleur ou du sexe des nouveau-nés. Or, dans maint problème biologique, ce
n’est la diversité des valeurs d’une unique grandeur que l’on est amené à étudier, mais les
variations, les relations mutuelles de deux et parfois même de plusieurs variables. Nous
considérons d’abord le cas de deux caractères qualitatifs, deux attributs.
Lorsqu’on étudie, chez un groupe d’individus, deux caractères qualitatifs ou attributs dont
chacun peut se présenter sous deux ou plusieurs états différents, il est le plus souvent essentiel,
après les avoir considérés séparément, d’analyser les relations qu’ils ont entre eux. On peut ainsi
étudier la proportion des malades guéris d’une certaine maladie, et d’un autre côté la proportion
des individus vaccinés contre cette maladie, mais il est surtout intéressant, bien évidemment, de
rechercher quelles sont les proportions relatives de malades guéris parmi les vaccinés, d’une part,
et parmi ceux qui ne l’avaient pas été d’autre part. de même, pour qui s’intéresse à la fréquence
des diverses couleurs d’yeux et des diverses teintes de cheveux, il est souhaitable de compléter
l’étude en recherchant si telle teinte de cheveux est plus souvent « associée » à telle couleurs des
yeux. Une multitude de problèmes de ce genre se posent à tout instant au biologiste, à
l’agronome, au médecin, et les caractères qualitatifs que l’on peut avoir à considérer sont
naturellement d’une infinie variété.
Si le premier attribut peut exister sous un nombre L d’états et le second sous C d’états, il
y aura au total L C catégories différentes entre lesquelles pourront se repartir les divers
individus observés, chaque caractère étant définie par un état particulier de chacun des deux
caractères. Dans le cas le plus simple, où chaque caractère peut exister sous deux formes
seulement, il y a un total de 2 2, soit quatre catégories; si l’on considère, par exemple, deux
couleurs de cheveux, blonds et bruns, et deux teintes d’yeux, clairs et foncés, les individus se
répartiront dans les quatre catégories :
blonds à yeux clairs, blonds à yeux foncés, bruns à yeux clairs, bruns à yeux foncés.
Le plus souvent, on dispose ces catégories, ou classes, en un tableau à double entrée, dit
tableau de contingence, où les différentes colonnes correspondent aux divers états de l’un des
caractères et les diverses lignes aux divers états de l’autre caractère. Le nombre des individus
rentrant dans catégorie constitue la fréquence (ou fréquence absolue) de la classe , exactement
comme dans le cas des distributions relatives à une seule variable. Les totaux des lignes et ceux
des colonnes indiquent le nombre d’individus présentant tel aspect de l’un des caractères,
indépendamment de l’état de l’autre.
Exemple 1: Présentation de résultats relatifs à deux couples de caractères qualitatifs:
Tableau de contingence.
Sur 6800 individus examinés, dans le pays de Bade, en Allemagne, 5943 sont à yeux clairs et
857 à yeux sombres; il y a, d’autre part, 2945 blonds et 3855 bruns. Les quatre cases du tableau
de contingence donnent la répartition relative des yeux clairs et des yeux foncés parmi les blonds
et parmi les bruns.
Couleur des
cheveux
blonds bruns
Couleur des Clairs 2814 3129 5943
yeux
foncés 131 726 857
2945 3855 n = 6800
210
Un tableau de contingence permet de présenter de façon simple et claire les résultats
concernant la répartition de deux caractères. Il convient ensuite de les analyser, c’est à dire de
mettre en évidence les relations qui existent entre eux.
On dit qu’il y a indépendance entre deux caractères K et K’ lorsque la proportion des
individus présentant un des états u caractère K est la même dans les diverses catégories que
définit l’état du caractère K’. Lorsque ces proportions sont différentes, on dit alors qu’il y a
association des caractères. Dans le cas du tableau donné précédemment, par exemple, il y aura
indépendance entre les caractères de couleur des yeux et de teintes des cheveux si la proportion
des blonds parmi les individus à yeux clairs est la même que chez les individus à yeux sombres,
et, par là même, que dans l’ensemble des individus. Il en résultera naturellement aussi que la
proportion des yeux clairs parmi les blonds sera égale à la proportion des yeux clairs parmi les
bruns.
Il est évident, toutefois, que même s’il y a réellement indépendance dans l’ensemble de
la population, les proportions que l’on trouvera sur un échantillon tiré d’une telle population
différeront, par suite des fluctuations dues au hasard, des proportions théoriques d’indépendance,
et que, par conséquent, elles pourront indiquer une association qui n’existe pas en réalité.
Les méthodes statistiques vont nous permettre de reconnaître si des différences observées
entre des sous-groupes d’un tableau d’association peuvent être considérées comme compatibles
avec l’hypothèse d’indépendance ans la population, ou si, au contraire, elles sont trop
importantes pour ne pas signifier une réelle association entre les deux caractères, ces conclusions
étant toujours données, bien entendu, avec un certain coefficient de sécurité.
Nous pouvons remarquer que ce problème que nous posons ici a été déjà résolu, pour une part au
moins, au cours des paragraphes précédents, car il revient à comparer des pourcentages, dont
l’on peut simplement tester la différence par la méthode de l’erreur standard. La méthode ne
s’applique toutefois qu’à la comparaison de deux pourcentages, c’est à dire au cas d’un tableau
de contingence 2 2, où chacun des caractères ne se présente que sous deux formes.
Dans le cas d’un tableau plus complexe, c’est à dire lorsque l’un des deux caractères au
moins peut se présenter sous plus de deux états, il est nécessaire d’employer une autre méthode,
plus générale, et qui est de ce fait utilisée plus fréquemment dans tous les problèmes
d’association,.même lorsqu’il s’agit de tableaux 2 2. cette méthode se rattache d’ailleurs à un
test statistique que nous avons déjà rencontré, le test du 2 .
On peut, en effet, remarquer que tester l’indépendance de deux caractères revient à
comparer deux distributions: d’une part, la série des fréquences expérimentales observées par les
diverses catégories, et, d’autre part, les fréquences théoriques que l’on devrait y observer dans le
cas d’indépendance.
La méthode consiste donc à calculer d’abord ces fréquences théoriques correspondant à
une indépendance rigoureuse des deux caractères, et à les comparer par la test du 2 aux
fréquences observées. le 2 n’est pas, dans ce cas, une véritable mesure de l’association,
puisque sa valeur dépend de l’effectif de l’échantillon et ne permet donc pas de comparer deux
associations, mais il constitue seulement un critère d’indépendance, puisque sa distribution
d’échantillonnage est alors parfaitement définie et ne dépend plus de l’effectif. Des tableaux
indiquent les limites qu’il peut atteindre, avec un coefficient de sécurité donné, par le seul jeu
des fluctuations au hasard, et pour un nombre de degrés de liberté déterminé.
Nombre de degrés de liberté: nous avons vu, en effet, que la distribution du 2 est fonction du
nombre de classes dont on peut fixer la fréquence indépendamment des autres, qui constitue le
nombre de degrés de liberté de deux distributions que l’on compare. Pour un tableau de
contingence, il ne faut pas perdre de vue que les fréquences totales des lignes et des colonnes
sont fixées.
211
Dans ces conditions, on voit que, dans un tableau de 2 2, par exemple, il n’y aura qu’un seul
degrés de liberté, puisqu’une fois déterminée une fréquence, les autres s’en déduisent
immédiatement en soustrayant cette fréquences des totaux de chaque ligne et de chaque colonne.
Plus généralement, dans un tableau de L lignes et C colonnes, il y a (L-1) (C-1) degrés de
liberté.
Pour ce qui concerne le calcul des fréquences théoriques correspondant à l’hypothèse
d’indépendance des caractères, il sera plus simple d’en exposer les modalités sur les exemples.
On évitera ainsi l’introduction de notations complexes.
On remarque que la proportion des blonds parmi les hommes aux yeux clairs, soit: 2814
5943
=0,47 est plus grande que dans l’ensemble de l’échantillon 2945 = 0,43.
6800
Il y a donc, en apparence, association positive entre la couleur blonde de la chevelure et
la couleur claire des yeux, et corrélativement, association négative, entre la couleur blonde de la
chevelure et la couleur sombre des yeux. Mais cette association est-elle significative et ne
résulte-t-elle pas de fluctuations dues à l’échantillonnage ?
S’il y avait indépendance entre les deux caractères, la proportion des blonds parmi les
individus à yeux clairs serait par définition la même que dans l’ensemble de l’échantillon, soit
2945 ; il y aura donc 5943 2945 = 2574 blonds à yeux clairs, et 857 2945 = 371 blonds à
6800 6800 6800
yeux sombres.
En même temps, la proportion des bruns serait la même parmi les hommes à yeux clairs
que parmi ceux à yeux sombres, soit 3855 ; c’est à dire qu’il y aurait 5943 3855 = 3369 bruns
6800 6800
à yeux clairs et 857 3855 = 486bruns à yeux sombres.
6800
Ces fréquences théoriques sont inscrites, en italique et entre parenthèses, dans le bas et à
droite de chaque case du tableau.
Comparons donc les deux distributions que constituent les fréquences observées, d’une part, et
les fréquences théoriques d’indépendance, d’autre part.
Leur divergence est mesurée par:
(28142574)2 (31293369)2 (131371)2 (726486)2
2= # 313.
2574 3369 371 486
Le nombre de degrés de liberté est ici de 1, puisqu’une fois de rien la fréquence de l’une des
classes des autres s’en déduisent aussitôt, les totaux de chaque ligne et de chaque colonne étant
fixé.
212
Dans ces conditions, le tableau du 2 indique que la valeur limite correspondant à un coefficient
de sécurité de 95% est de 2 = 3,84.
La valeur trouvée dans l’exemple est très supérieure, c’est à dire que la divergence des
fréquences exposées avec les fréquences théoriques d’indépendance ne peut être imputé au
simple hasard de l’échantillonnage et qu’il y a donc une réelle association entre les caractères
étudiés de teinte des cheveux et de couleur des yeux, les yeux clairs étant, nous l’avons vu,
associé positivement à une teinte claire des cheveux.
Exemple 3: Test de la réalité d’une association de caractères.
Couleur des yeux et des cheveux de 6800 hommes du pays de Bade.
Si la couleur des cheveux n’avait aucune relation avec la couleur des yeux, on devrait
s’attendre à ce que, sur 2829 aux hommes cheveux blonds, il y en ait 2811 = 41,34% avec les
6800
yeux bleus, 3132 = 46,06% avec des yeux gris ou verts et 857 = 12,60% avec des yeux bruns.
6800 6800
Or, en réalité, les proportions sont respectivement de 1768 = 62,50%, 946 =33,44%,
2829 2829
et 115 = 4,06%.
2829
On constate donc que la couleur blonde des cheveux des Badois est associée positivement
à la couleur bleue de leurs yeux.
Pour la couleur rousse des cheveux, on constate qu’il y en a 47 = 40,52% aux yeux bleus, 53
116 116
= 45,69% aux yeux gris ou verts et 16 = 13,79% aux yeux bruns. Les Badois roux ont donc en
116
grande majorité les yeux clairs; la proportion des individus aux yeux bruns est cependant
sensiblement la même que celle de l’ensemble de la population recensée.
Les fréquences théoriques correspondant à l’indépendance des caractères inscrites entre
parenthèses dans les cases du tableau, sont:
2829 2811 = 1169 pour les blonds aux yeux bleus,
6800
2811
2632 6800 = 1088 pour aux yeux bleus,
2811
2829 6800 = 1303 pour les blonds aux yeux gris ou verts, etc.
Si l’on compare l’ensemble des fréquences observées à des fréquences théoriques, on trouve:
(17681169)2 (8071088)2 (1614)2
2= .... = 1075.
1169 1088 14
213
Il y a ici (L-1) (C-1) = 3 2 = 6 degrés de liberté et le seuil de 2 est alors 2 = 12,6.
La valeur considérablement plus élevée que l’on trouve signifie qu’il y a au total une association
réelle très nette entre les caractères de teinte des cheveux et de couleur des yeux.
On peut remarquer que dans le cas d’un tableau de contingence 2 2, dont l’expression générale
est:
a1 b1 a1 + b1
a2 b2 a2 + b2
a1 + a2 b1 + b2 n
Il existe une manière plus simple de calculer la contingence quadratique 2 , sans passer par
les valeurs des fréquences théoriques. On peut démontrer, en effet, que l’expression classique du
2 peut s’écrire également:
n(a1b2 a2b1)2
2= .
(a1b1)(a2 b2)(a1 a2)(b1b2)
Ainsi, dans l’exemple 2, on a:
6800(28147261313129)2
2= = 313.
594385729453855
214
Chapitre 10: Relations entre deux caractères quantitatifs:
Notions de corrélation et de régression.
Dans les domaines non biologiques, il est habituel de présenter les variations d’une
grandeur en fonction de l’autre par un diagramme où l’une des variables est portée en abscisse et
l’autre en ordonnée: le phénomène étudié est ainsi représenter dans son ensemble par une courbe
liant les points expérimentaux. Ainsi, le physicien étudiera la distance parcourue par un corps en
fonction du temps écoulé, ou la dilatation d’une barre en fonction de la température. Mais on
conçoit que, dans le cas d’êtres vivants, la variabilité même de toute grandeur biologique dans
des conditions par ailleurs pourtant identiques, variabilité qui se manifeste, ainsi qu’on vient de
le voir dans les chapitres précédents, par l’existence non d’une valeur unique, mais d’une
distribution plus ou moins étalée, se trouve compliquer considérablement le problème.
Des procédés particuliers de présentation et d’interprétation s’imposent donc pour des
données de ce genre; nous en esquisserons les grands traits dans les paragraphes qui suivent.
x 20 21 22 23 24 25 26
y
14 1 2 1
13 8 17 5
12 2 9 13 13 5
11 4 10 6
10 1 2
9 1
216
B°- Notion de corrélation: Coefficient de corrélation.
Reportons-nous à un digramme de dispersion, où les points ont pour coordonnées les
couples de valeurs des deux variables dont on étudie les relations, chaque point représentant
donc un couple de mesures. Les points, surtout groupés dans la région centrale, en général,
forment un nuage dont le contour a la forme d’une bande plus ou moins elliptique. Si cette bande
est inclinée obliquement sur les axes, c’est qu’aux plus grandes valeurs de x correspondent les
plus grandes, ou les plus petites, valeurs de y, selon le sens suivant lequel est inclinée la bande. Il
y a donc alors une certaine dépendance entre les deux séries de variables, on dit une certaine
corrélation entre elles. Au contraire, ai l’axe central du groupe des points du diagramme de
dispersion est parallèle à l’axe des abscisses, c’est que les valeurs des ordonnées des points ne
sont pas liées aux valeurs des abscisses; mais la forme plus ou moins aplatie dépend évidemment
des échelles adoptées pour représenter les deux variables x et y.
Nous nous proposons de définir un aussi simple que possible indiquant dans quelle
mesure les variations des deux grandeurs étudiées sont liées entre elles.
Considérons le point central du diagramme, c’est à dire le point M dont les coordonnées sont la
moyenne des x et la moyenne des y, et divisons le plan du diagramme en quatre quadrants par
deux droites rectangulaires passant par le point central M et parallèles aux axes de coordonnées.
Pour les points situés dans les quadrants opposés 1 et 2 dont les coordonnées x et y sont toutes
deux à la fois supérieures ou inférieures aux moyennes X et Y , le produit
(X- X ) (Y- Y ) est positif. Pour les points situés dans les quadrants 2 et 4, au contraire, le produit
(X- X ) (Y- Y ) est négatif.
Selon que dans ce diagramme, il y aura prépondérance de points dans les quadrants 1 et 3 ou,
au contraire, dans les quadrants 2 et 4, la somme des produits (X- X ) (Y- Y ) relative à
l’ensemble des points, notons la: (X- X ) (Y- Y ) sera positive ou négative.
Si, au contraire, les points sont répartis à peu près également dans tous les quadrants, les termes
positifs et les termes négatifs de la somme des produits se compenseront à peu près.
Plus précisément, on a été ainsi amené à définir deux paramètres importants qui font intervenir la
valeur de cette somme de produits.
- la covariance p =
(x x)(y y)
n
où n est le nombre des couples d’observations:
- le coefficient de corrélation r =
(x x)(y y) p
n x y x y
qui représente la covariance lorsque les deux séries de variables sont rapportées à leurs écarts-
types respectifs (abscisses et ordonnées réduites).
Tel qu’il est défini, le coefficient de corrélation r ne peut prendre qu’une valeur comprise entre –
1 et +1.
217
Lorsqu’il est nul (r = 0), la covariance p est alors également nulle, il n’y a pas de corrélation
entre les deux variables, c’est à dire qu’à une valeur d’une des variables peut correspondre une
valeur quelconque de l’autre.
Lorsque r = -1 ou r = +1, on a, pour tous les points du diagramme, une relation stricte
y =
y , c’est à dire que tous ces points sont alignés. On dit qu’il y a corrélation parfaite,
x
positive ou négative entre les deux grandeurs.
Lorsque la valeur absolue de r est comprise entre 0 et 1, il y a une certaine corrélation entre les
deux séries de variables, plus ou moins forte, selon que r est plus ou moins voisin de 1. si r
0, la corrélation est positive, c’est à dire que les plus grandes valeurs de y correspondent aux plus
grandes valeurs de x.
Si r 0, la corrélation est négative; aux plus grandes valeurs de x correspondent les plus petites
valeurs de y .
Diagramme de dispersion
Correspondant à différents
coefficients:
r = 0, r = +1, r = +0,8 ;
r = -0,5.
Bien entendu, lorsque les résultats expérimentaux ont été groupés et que
l’on a établi un tableau de corrélation, l’expression de la covariance et du coefficient de
corrélation devient, en appelant X et Y les points médians des classes des deux variables et fxy
les fréquences correspondantes des cases du tableau:
p
n x y
p = 1 f xy(X X )(Y Y ) et r = = 1 f xy(X X )(Y Y ) .
n x y
Méthode pratique du calcul de la covariance et du coefficient de corrélation:
emploi de moyennes provisoires.
Pour calculer les divers paramètres qui interviennent dans la détermination du coefficient de
corrélation, écarts-types et covariance notamment, on a grand avantage à employer la méthode
de la moyenne provisoire ou moyenne de travail.
Si A et B sont des moyennes provisoires choisies pour chacun des deux groupes de mesures, on
sait que la méthode revient à considérer les nouvelles variables X’ = X-A et Y’ = Y-B, ou
encore, si ix et iy sont les intervalles des classes:
X’’ = X A et Y’’ = Y B .
ix iy
Les formules relatives aux calculs des moyennes et des variables ont été données et expliquées
plus haut. Pour la covariance p, on peut facilement montrer qu’on a:
ixiy f xy (X A) (Y B) (X A)(Y B)
n
p=
ix iy
n
ixiy f xy X''Y''(X A)(Y B)
= .
Si l’on adopte pour moyenne provisoire des deux variables la valeur 0, l’expression devient:
218
p = 1 f xy XY X Y ; ou, si les variables ne sont pas groupées en classes:
n
p
p = 1 X kYk X Y . Il suffit ensuite de calculer: r = .
n x y
Exemple 2: Calcul d’un coefficient de corrélation à partir d’un tableau de corrélation.
Reprenons les résultats de l’exemple 1, qui nous ont servi à montrer comment établir un tableau
de corrélation, et qui donnent, pour 100 coquilles d’une espèce d’Escargot la hauteur et le plus
grand diamètre.
On est conduit, pour calculer les divers éléments qui entrent dans l’expression de la covariance et
du coefficient de la corrélation, à ajouter au tableau de corrélation des colonnes supplémentaires
suivantes:
- une colonne contenant, pour chaque ligne, la somme fy des fréquences fxy de la ligne;
ainsi, pour la première ligne fy = 1+2+1 = 4;
- une colonne contenant, avec leur signe, les valeurs de Y-B;
- c’est à dire Y-12, pour chaque ligne; B étant la moyenne de travail choisie pour les Y;
ainsi pour la première ligne, on a ainsi Y-B = 14-12 = +2;
- une colonne contenant avec leur signe, les produits fy (Y-B), soit fy (Y-12), pour chaque
ligne, pour la première ligne, on a ainsi fy (Y-12) = 4 x 2 = +8,
- une colonne contenant les produits fy (Y-B)2, soit fy (Y-12)2, pour chaque ligne, pour la
première ligne, on a: fy (Y-12)2 = 4 (2)2 = 16.E
- En bas, d’autre Part, nous bordons également le tableau par les lignes supplémentaires
suivantes:
- Une ligne contenant pour chaque colonne, la fréquence fx somme des fréquences fxy
inscrites dans la colonne;
- Une ligne contenant, avec leur signe, les valeurs de X-A, soit X-23, différences des
valeurs médianes X et de la moyenne de travail A = 23;
- Une ligne contenant, avec leur signe, les produits fx (X-A), soit fx (X-23);
- Une ligne contenant les produits fx (X-A)2), soit fx (X-23)2;
- Enfin, une ligne contenant, avec son signe, la somme algébrique des produits fxy (X-A)
(Y-B), éléments du calcul de la covariance. Pour faciliter le calcul des sommes partielles
correspondant à chaque colonne, il est conseillé d’inscrire dans l’angle inférieur droit de chaque
case du tableau de corrélation ( où la fréquence n’est pas nulle) le produit, avec son signe (X-A)
(Y-B), soit ici (X-23) (Y-12).
- Si nous considérons, par exemple, dans le tableau, la deuxième colonne, nous avons: fxy
(X-A) (Y-B) = 2 x (-2) x 0 + 4 x (-2) x (-1) + 2 x (-2) x (-2) = 2 x [0] + 4 x [2] + 2 [4]=16
-
219
Tableau de corrélation
Diamètre
des
coquilles
X y 20 21 22 23 24 25 26 fy Y-B Fy (Y-B) Fy (Y-
B)2
xy
14 1 2 1 4 +2 +8 16
+2 +4
+6
13 8 17 5 30 +1 +30 30
0 +1 +2
12 2 9 13 13 5 42 0 0 0
0 0 0 0 0
11 4 10 6 20 -1 -20 20
0
+2 +1
10 1 2 3 -2 -6 12
coquille
Hauteur
+6
des
+4
s
9 1 +6 1 -3 -3 9
+9
fx 2 8 19 27 31 12 1 100 +9 87
X-A -3 -2 -1 0 +1 +2 +3
fx (X- -6 -16 -19 0 +31 +24 +3 +17
A)
Fx (X- 18 32 19 0 31 48 9 157
A)2
fxy 15 16 10 0 19 18 6 84
(X-A)
(Y-B)
fournissent tous les éléments nécessaires au calcul des divers paramètres cherchés: X , Y , 2x,
2y, p et r. on a, en prenant bien garde aux signes:
220
X= 1
n f (X-A) + A = 17 + 23 = 23,17.
100
Y = 1
n f (Y-B) +B = 9 + 12 = 12,09.
100
2x = 1
n f (X-A)2 – ( X - A)2 = 157 - (0,17)2 = 1,541.
100
2y = 1
n f (Y-B)2 – ( Y -B)2 = 87 - (0,09)2 = 0,862.
100
Élève…………………… O P Q R S T U V W X Y
Mathématiques 5 12 13 11 18 14 9 7 12 7 9
Français ………………. 7 11 3 9 5 11 11 15 13 5 17
Peut-on dire qu’il y a corrélation entre les notes de Français et celles de Mathématiques, c’est à
dire qu’un élève plus fort dans une des matières est également plus fort, en moyenne, dans
l’autre?
Appelons x la note de Mathématiques et y celle de Français.
Nous avons alors:
x= 1
n x = 280 = 11,2.
25
2x = 1
n (x- x )2 = 1
n x2- x 2 = 3498 - (11,2)2 = 14,48.
25
y =1
n y = 265 = 10,6.
25
2y = 1
n (y- y )2 = 1
n y2- y 2 = 3281 - (10,6)2 = 18,88.
25
p= 1
n (x- x ) (y- y ) = 1
n xy - x y
221
= 3130 -11,2 x 10,6 = +6,48.
25
p 6,48
r= = +0,39.
x y 14,48 18,88
La valeur 0,39 trouvée pour le coefficient de corrélation permet de conclure que, dans
l’ensemble, les élèves ayant les meilleures notes en Mathématiques ont également las meilleures
notes en Français.
Dans cet exemple, où les données sont peu nombreuses, on voit qu’il n’est pas nécessaire de
procéder à l’établissement préalable d’un tableau de corrélation. Les calculs s’effectuent
directement à partir des données, en calculant pour chaque individu x2, y2, xy et sommant ces
quantités pour obtenir x2, y2 et xy, la moyenne provisoire la plus avantageuse est en
effet, ici, zéro, pour les x comme pour les y.
C°- Notion de ligne de régression
Dans un tableau de corrélation, chaque colonne, qui correspond à une valeur déterminée de la
variable X, contient toute une distribution de la variable Y et non pas une valeur unique, comme
ce serait le cas s’il s’agissait de grandeurs rigoureusement déterminées. Les distributions de Y
correspondant aux valeurs successives de X apparaissent, par ailleurs, décalées les unes par
rapport aux autres et présentent des valeurs qui, dans l’ensemble, varient avec les valeurs de X.
C’est cette variation de Y en fonction de X qu’il importe de mettre en évidence et de préciser.
222
Construction des points
d’une ligne de régression de
Y en X.
Recherchons dans ce but quelle est la valeur moyenne des Y, soit Y k, qui correspond à chaque
valeur de X et considérons les points ainsi déterminés par les coordonnées X, Y k .En joignant
entre eux ces points, on obtient une ligne brisée appelée ligne de régression de Y en X, qui
représente la loi moyenne expérimentale de variation de la variable Y en fonction de la variable
X.
De la même manière, on peut déterminer la valeur moyenne de X soit X k correspondant à
chaque valeur de Y et construire ainsi la ligne de régression de X en Y, loi expérimentale de la
variation moyenne de la variable X en fonction de la variable Y.
Exemple 4: Établissement d’une ligne de régression.
Reportons-nous aux données relatives à la hauteur des 100 coquilles d’Escargot en fonction de
leur grand diamètre. Nous avons vu qu’il existe une nette corrélation positive entre ces deux
grandeurs, c’est à dire que les coquilles les plus hautes sont aussi, dans l’ensemble, parmi les
plus larges. Nous nous proposons de préciser la valeur moyenne de la hauteur des coquilles en
fonction de leur diamètre, c’est à dire la ligne de régression correspondante. Nous établissons,
pour la déterminer, une ligne supplémentaire en dessous du tableau de corrélation, contenant les
moyennes Y k de chaque colonne. Ainsi, pour la première colonne à gauche du tableau:
223
Diamètre des coquilles.
x 20 21 22 23 24 25 26 fy X k
y
14 1 2 1 4 25
13 8 17 5 30 23,90
12 2 9 13 13 5 42 23,24
11 4 10 6 20 22,10
10 1 2 3 20,67
9 1 1 20
fx 2 8 19 27 31 12 1 100
il suffit de joindre, entre eux, sur un graphique, les points X1Y1, X2Y2, X3Y3… pour avoir la
ligne de régression cherchée, loi moyenne de variation de Y en fonction de X.
la colonne supplémentaire à droite du tableau, donnant les moyennes X k de chaque ligne,
permet de la même façon, de construire la ligne de régression de X en Y.
la loi que représente la ligne brisée de régression n’est évidemment basée que sur l’échantillon
étudié et dépend donc des fluctuations dues au hasard de l’échantillonnage. C’est à celles-ci que
l’on doit imputer, le plus souvent, son aspect brisé, irrégulier. Aussi est-il naturel de chercher à
ajuster à cette ligne brisée expérimentale une ligne théorique plus régulière, de forme choisie et
précise et qui, sous réserve de vérification, sera censée être la représentation des rapports des
deux grandeurs étudiées dans l’ensemble de la population.
224
Représentation graphique des lignes de régression de Y en X (trait fort)
Et de X en Y (trait tireté).
Le cas le plus simple est évidemment celui où est fondé à admettre que la loi cherchée est une loi
linéaire représentée par une droite.
Cette droite peut être tracée à l’œil sur le diagramme de dispersion, tout au moins lorsque les points
du diagramme ne sont pas trop dispersés. On peut aussi la construire en partageant l’ensemble des
points du diagramme de dispersion de deux groupes, dont on détermine les points moyens
respectifs M1 et M2, et en traçant la droite qui passe par ces deux points.
Il est toutefois préférable, en général, de procéder de façon plus rigoureuse et de rechercher
l’équation même de la droite qui représente, au mieux, l’ensemble des carrés des distances des
points du diagramme à la droite soit minimum, les distances étant mesurées parallèlement à l’axe
des ordonnés. Cette condition implique en même temps que la droite passe par le point moyen du
diagramme (qui a pour coordonnées) et que la somme des distances des points situés d’un côté soit
égal à la somme des distances des points situés de l’autre côté.
Si les n couples de l’échantillon sont désignés par (xk, yk).
225