Vous êtes sur la page 1sur 91

Chargée de cours: A.

Bouakkaz

Biostatistique

2ème année Ecologie et Environnemen


Environnement

2023/2024
TABLE DES MATIÈRES

1 Généralités 6
1.1 Vocabulaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.2 Caractère . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.3 Tableau statistique . . . . . . . . . . . . . . . . . . . . . . . . 11

2 Caractère qualitatif 13
2.1 Tableau statistique . . . . . . . . . . . . . . . . . . . . . . . . 14
2.2 Représentation graphique . . . . . . . . . . . . . . . . . . . . 15

3 Caractère quantitatif discret 19


3.1 Tableau statistique . . . . . . . . . . . . . . . . . . . . . . . . 20
3.2 Représentation graphique . . . . . . . . . . . . . . . . . . . . 21
3.3 Paramètres de position ou de tendance centrale . . . . . . . . 23
3.4 Paramètres de dispersion . . . . . . . . . . . . . . . . . . . . . 31

4 Caractère quantitatif continu 36


4.1 Tableau statistique . . . . . . . . . . . . . . . . . . . . . . . . 37
4.2 Représentation graphique . . . . . . . . . . . . . . . . . . . . 38

i
Table des matières

4.3 Paramètres de position ou de tendance centrale . . . . . . . . 40


4.4 Paramètres de dispersion . . . . . . . . . . . . . . . . . . . . . 44

5 Les distributions statistiques à deux caractères 47


5.1 Classement des données et tableaux à double entrée . . . . . . 48
5.2 Représentation graphique . . . . . . . . . . . . . . . . . . . . 52
5.3 Distributions marginales . . . . . . . . . . . . . . . . . . . . . 53
5.4 Distributions conditionnelles . . . . . . . . . . . . . . . . 59
5.5 Covariance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
5.6 Coe¢ cient de corrélation linéaire . . . . . . . . . . . . . . . . 64
5.7 Ajustement linéaire . . . . . . . . . . . . . . . . . . . . . . . . 66

Ahlème Bouakkaz ii Université 20 Août 1955 -Skikda


CHAPITRE 1

Généralités

Sommaire
1.1 Vocabulaire . . . . . . . . . . . . . . . . . . . . . . 7

1.2 Caractère . . . . . . . . . . . . . . . . . . . . . . . 8

1.3 Tableau statistique . . . . . . . . . . . . . . . . . . 11

6
Chapitre 1. Généralités

1.1 Vocabulaire

L es statistiques sont rencontrées dans de très nombreux domaines, no-


tamment en sciences de la vie, sciences humaines et sociales, ciences
physiques, sciences de l’ingénieur,...
Le mot statistique possède deux signi…cations distinctes :
Les statistiques (au pluriel) : ce terme désigne tout ensemble cohérent de
données numériques (moyennes, pourcentages, indices de toute sorte) rela-
tives à un groupe d’individus.

Exemple 1.1 Les statistiques démographiques en Algérie (natalité, morta-


lité...) pour une période donnée.

La statistique (au singulier) : c’est la discipline (une partie des mathé-


matiques) qui a pour objet l’ensemble des méthodes qui permettent de ras-
sembler et d’analyser des données numériques. Elle traite la technique de
collecte, d’analyse et d’interprétation des données et permet de formuler les
conclusions à partir d’observations des données.

Collecter, analyser, interpréter les résultats =) tirer des conclusions:

Donc le but essentiel de la statistique est d’arriver à prendre une décision


dans l’incertitude (aléatoire).

Dé…nition 1.1 On appelle population, population totale, population parent,


univers ou ensemble statistique, l’ensemble …ni ou in…ni des individus (unité
statistique, unité d’échantillonage ou unité de base) sur lequel porte l’étude
statistique.

Ahlème Bouakkaz 7 Université 20 Août 1955 -Skikda


Chapitre 1. Généralités

Remarque 1.1 La taille de la population qui est le cardinal de l’ensemble


sur lequel porte l’étude (son nombre d’éléments) s’appelle "e¤ectif total".

Remarque 1.2 Tout sous-ensemble d’une population donnée est lui même
une population. Ce sous-ensemble s’appelle échantillon ou sous-population
et l’échantillonnage est utilisé lorsqu’il est impossible de prendre en considé-
ration l’ensemble entier de la population.

Remarque 1.3 Lorsque toute les unités de la population considérée sont


e¤ectivement observées individuellement, l’enquête est dite complète ou ex-
haustive elle est alors appelée aussi recensement. Lorsqu’au contraire pour
réduire l’importance du travail de collecte des données, une partie seulement
des individus est réelement observée, l’enquête est dite partielle , par échan-
tillonnage ou par sondage.

Une étude statistique comprend plusieurs étapes

(1) L’échantillonnage (choix de


9 l’échantillon).
(2) Rassembler les données. =
représente la statistique descriptive .
(3) L’étude des données. ;
9
(4) Faire une hypothèse. =
représente la statistique inférentielle .
(5) Prise de décision: ;

1.2 Caractère
Caractère : L’étude statistique porte généralement sur un caractère, pré-
senté par chacun des éléments d’un ensemble donné et ce caractère peut
présenter plusieurs modalités.

Ahlème Bouakkaz 8 Université 20 Août 1955 -Skikda


Chapitre 1. Généralités

Exemple 1.2 Une enquête sur la production de pommes d’une région.

- La population est formée par l’ensemble des pommes .


- Les caractères qu’on peut étudier sont : poid, variétés, taille...
- L’individu est formé par une pomme.
- Les variétés : présentent plusieurs modalités (golden, rouge, api, rei-
nette, gala, fuji...).
- La taille : présente trois modalités (grosse, moyenne, petite).
- Le poid : n’a qu’une seule modalité.
Remarque : Les valeurs données peuvent être rangées par ordre de gran-
deur par exemple croissante et dans ce cas on obtient une série statistique
ordonnée.

Types de caractères : On distingue trois types principaux de caractères :

Caractère qualitatif : quand il n’est pas mesurable par des nombres et on


peut distinguer.
Echelle nominale : Lorsque les observations ne peuvent pas être hiérar-
chisées, on dit que ce sont des modalités nominales où chaque modalité est
exprimée par un nom ou un code. Dans ce cas les di¤érentes modalités ne sont
pas ordonnables par exemple : sexe, profession, couleurs des yeux, variétés....

Exemple 1.3 La couleur des yeux des étudiants.

La population : Les étudiants.


Le caractère : La couleur de leurs yeux. (c’est un caractère qualitatif)
Les modalités : yeux bruns foncés, yeux marrons, yeux bleus, yeux verts,...
Echelle ordinale : chaque modalité est explicitement signi…cative du rang
pris par chaque individu pour le caractère considéré par exemple si on a n
éléments, les modalités seront 1er , 2eme , 3eme , ...neme c-à-d on possède juste
l’ordre des individus et on ne sait rien de l’intervalle des valeurs.

Ahlème Bouakkaz 9 Université 20 Août 1955 -Skikda


Chapitre 1. Généralités

Exemple 1.4 Une échelle d’appréciation d’une prestation qui comprend les
modalités "Mauvaise, "Passable", "Moyenne" , "Bonne" et "Très bonne".

Exemple 1.5 Un récent sondage de la Sofres, sur le thème "Les français et


l’économie" posait la question suivante : "Vous-même, diriez-vous qu’en ce
qui concerne l’économie, vous vous y intéressez de manière générale". Les
résultats suivants ont été obtenus :
Pourcentage
Beaucoup 26
Assez 42
Peu 23
Pas du tout 9
Caractère semi quantitatif : il est dé…nit par une relation d’ordre, il s’agit
essentiellement des observations qui sont e¤ectuées an moyen d’echelles.
Exemple : Echelle de Richter lors de tronblement de terre, les degrés de
brulures.
Caractère quantitatif : quand il est mesurable par des nombres autrement
dit si ses modalités s’expriment par des nombres. On peut distinguer les ca-
ractères quantitatifs discrets et les caractères quantitatifs continus selon que
leurs modalités sont dé…nies sur un intervalle continu ou selon qu’elles corres-
pondent à un ensemble …ni et dénombrable de valeurs numériques ponctuelles
(entières ou réelles).
Caractères quantitatifs discrets : sont des caractères dont les modalités
sont des nombres isolés.
Ex : poid, le nombre de caries chez les enfants, le nombre d’enfants dans une
famille.
Caractères quantitatifs continus : sont des caractères dont les modalités
sont dé…nies sur un intervalle réel donné.

Ahlème Bouakkaz 10 Université 20 Août 1955 -Skikda


Chapitre 1. Généralités

Ex : taux de glucose, taille, poids, diamètre des tiges des plantes,...


Remarque : Lorsque le caractère est quantitatif on l’appelle variable statis-
tique.

1.3 Tableau statistique


E¤ectif : L’e¤ectif correspond au nombre de fois que la valeur, ou la moda-
lité, est représentée dans la série statistique. Autrement dit, lorsque la valeur
xi ou la modalité du caractère se rencontre un nombre i de fois dans la série
statistique, on dit que i est la répétition de la valeur, xi ou de la modalité
(l’e¤ectif partiel ou encore la fréquence absolue ).

Remarque : La somme de tous les e¤ectifs est égale à l’e¤ectif total (le
nombre d’élements ou d’individus de la population).

P
k
i = N;
i=1

où k est le nombre des valeurs xi non répétées.


i
Fréquence relative : La quantité fi = , rapport de l’e¤ectif à l’e¤ectif
N
total est la fréquence relative de de la valeur, xi ou de la modalité. La somme
des fréquences relatives est égale à 1.

P
k
i
P
k P
k
i i=1 N
fi = = = = 1:
i=1 i=1 N N N

Exemple 1.6 La répartition de 200 capsules de pavots suivant le nombre de

Ahlème Bouakkaz 11 Université 20 Août 1955 -Skikda


Chapitre 1. Généralités

rayons stigmatiques a donné le tableau suivant :.

Nombre de rayons E¤ectif i Fréquence relative fi


5
8 5 = 0:025
200
11
9 11 = 0:055
200
16
10 16 = 0:080
200
26
11 26 = 0:130
200
34
12 34 = 0:170
200
36
13 36 = 0:180
200
30
14 30 = 0:150
200
22
15 22 = 0:110
200
12
16 12 = 0:060
200
8
17 8 = 0:040
200
Total 200 1
Total 200
=1
N 200

Ahlème Bouakkaz 12 Université 20 Août 1955 -Skikda


CHAPITRE 2

Caractère qualitatif

Sommaire
2.1 Tableau statistique . . . . . . . . . . . . . . . . . . 14

2.2 Représentation graphique . . . . . . . . . . . . . 15

13
Chapitre 2. Caractère qualitatif

L orsque les modalités d’un caractère ne peuvent être désignées que par
leurs qualités, nous disons que la nature du caractère est qualitative (c-
à-d il ne peut pas être quanti…é). Par contre, la réciproque est possible, un
caractère quantitatif peut être transformé en un caractère qualitatif, comme
le montre l’exemple suivant.

Exemple 2.1
Dans le but de déterminer le Les résultats de l’expérience ont été reportés
temps de réaction des gens par dans le tableau suivant :
rapport au son, l’expérience Temps de réaction Nombre d’individus
suivante a été entreprise. ]0:45; 0:51] 2
50 personnes ont été réunies ]0:51; 0:57] 8
et pour chacune d’elles on a ]0:57; 0:63] 18
enregistré le temps mis pour réagir ]0:63; 0:69] 16
après avoir entendu un signal ]0:69; 0:75] 4
sonore. ]0:75; 0:81] 2
On remarque que le caractère est quantitatif mais si on remplace les inter-
valles du tableau par les dénominations suivantes :

[0:45; 0:51[ ! Très vif [0:63; 0:69[ ! Assez lent


[0:51; 0:57[ ! Vif [0:69; 0:75[ ! lent
[0:57; 0:63[ ! Assez vif [0:75; 0:81[ ! Très lent,

on obtient un caractère qualitatif.

2.1 Tableau statistique


Les cas hospitalisés et noti…és relevant des maladies à déclaration obligatoire
ont été répartis dans le tableau suivant : (C.H.U. de Constantine année 1993).

Ahlème Bouakkaz 14 Université 20 Août 1955 -Skikda


Chapitre 2. Caractère qualitatif

xi i fi fi % i i =2

1 Tuberculose 229 0:249 24:9% 90° 45°


2 Méningites 224 0:244 24:4% 88° 44°
3 Kyste hydatique 198 0:215 21:5% 78° 39°
4 Fièvre typhoïde 152 0:165 16:5% 59:5° 29:75°
5 Amibiase 46 0:050 5% 18° 9°
6 Brucellose 19 0:020 2% 7:5° 3:75°
7 Hépatites virales 18 0:019 1:9% 7° 3:5°
8 Tétanos 6 0:006 0:6% 2° 1°
9 Rage 3 0:003 0:3% 1° 0:5°
10 Paludisme 1 0:001 0:1% 0:5° 0:25°
11 Autres 22 0:023 2:3% 8:5° 4:25°
Total 918 0:995 ' 1 99:5 ' 100% 360° 180°
T otal
1
N

2.2 Représentation graphique


Il existe un grand nombre de représentations graphiques qui aboutissent
au même résultats et dans le cas d’un caractère qualitatif, on peut uti-
liser les tuyaux d’orgue (diagramme à bandes), les secteurs angulaires, les
semi-secteurs angulaires (circulaires), les secteurs éclatés et les radars. Mais
les plus célèbres et les plus utilisées sont les tuyaux d’orgue et les secteurs
angulaires.

Tuyaux d’orgue : A chaque modalité correspond un rectangle dont la hau-


teur est égale à la fréquence absolue ou relative associée à cette modalité et
les rectangles ont des largeurs égales et sont séparés les uns des autres par des
distances égales où l’ordre n’est pas important. C’est en fait une visualisation

Ahlème Bouakkaz 15 Université 20 Août 1955 -Skikda


Chapitre 2. Caractère qualitatif

de la colonne des e¤ectifs ou des fréquences relatives.

Tuyaux d’orgue des fi

Secteurs angulaires (Camembert) :


On peut avoir une autre représentation en répartissant la surface d’un cercle
en secteurs et en attribuant à chaque modalité xi un angle i proportionnel
i
à son importance où i = 360 = fi 360:
N

Cas des maladies à déclaration obligatoire

Ahlème Bouakkaz 16 Université 20 Août 1955 -Skikda


Chapitre 2. Caractère qualitatif

Exemple d’application :
Tableau statistique

Catégories socioprofessionnelles i fi fi % i

1 Agriculteurs exploitants 990841 0:045 4:5% 16°


2 Artisans, commerçants, chefs d’entreprise 1755988 0:079 7:9% 28:5°
3 Cadre professions intellectuelles supérieures 2604002 0:117 11:7% 42°
4 Professions intermédiaires 4452156 0:200 20% 72°
5 Employés 5898090 0:265 26:5% 95:5°
6 Ouvriers 6531897 0:294 29:4% 106°
Total 22232974 1 100% 360°
T otal
1
N

Représentation graphique

Secteurs angulaires des catégories socioprofessionnelles

Ahlème Bouakkaz 17 Université 20 Août 1955 -Skikda


Chapitre 2. Caractère qualitatif

Radar des catégories


socioprofessionnelles (fi)

Secteurs éclatés des catégories socioprofessionnelles

Ahlème Bouakkaz 18 Université 20 Août 1955 -Skikda


CHAPITRE 3

Caractère quantitatif discret

Sommaire
3.1 Tableau statistique . . . . . . . . . . . . . . . . . . 20

3.2 Représentation graphique . . . . . . . . . . . . . 21

3.3 Paramètres de position ou de tendance centrale 23

3.4 Paramètres de dispersion . . . . . . . . . . . . . . 31

19
Chapitre 3. Caractère quantitatif discret

D ans le cas quantitatif discret (discontinu), le caractère qui ne peut


prendre qu’un nombre …ni ou dénombrable de valeurs, peut être appelé
"variable statistique".

3.1 Tableau statistique


Dans le cas d’une variable statistique discrète, les modalités sont les di¤é-
rentes valeurs de la variable. On les classe par ordre croissant dans la première
colonne du tableau. Dans la deuxième colonne et en face de chaque valeur, on
rapporte l’e¤ectif correspondant. On a ainsi (avec x1 < x2 < ::: < xi < xk )

Valeurs de la variable xi E¤ectif correspondant au 6= valeurs i

x1 1

x2 2

::::::::::::: ........................
xk k

Total N

Exemple 3.1 On a relevé le nombre d’enfants dans 850 ménages ayant au


moins un enfant. On a obtenu la série statistique à valeurs isolées suivante :

Nombre d’enfants 1 2 3 4 5 6 Total


E¤ectifs 282 273 148 70 35 42 850

Donc la population étudiée est 850 ménages et le caractère est le nombre


d’enfants qui est un caractère quantitatif discret.

Ahlème Bouakkaz 20 Université 20 Août 1955 -Skikda


Chapitre 3. Caractère quantitatif discret

c% c&
xi i fi i i fi c% i xi fi xi 2
i xi fi x2i
x1 = 1 282 0:331 282 850 0:331 282 0:331 282 0:331
x2 = 2 273 0:321 555 568 0:652 546 0:642 1092 1:284
x3 = 3 148 0:174 703 295 0:826 444 0:522 1332 1:566
x4 = 4 70 0:082 773 147 0:908 280 0:328 1120 1:312
x5 = 5 35 0:041 808 77 0:949 175 0:205 875 1:025
x6 = 6 42 0:049 850 42 0:998 252 0:294 1512 1:764
T otal 850 0:998 1979 2:322 6213 7:282
T otal
1 2:328 7:309
N

3.2 Représentation graphique


a) Diagramme di¤érentiel
On représente la colonne des e¤ectifs i ou des fréquences relatives fi par un
diagramme di¤érentiel appelé "diagramme en bâtons" . C’est une collection
de bâtons (d’où son nom) ayant pour abscisses les valeurs x1 ; x2 ; :::; xk du ca-
ractère et on associe à chaque valeur xi un segment de droite dont la longueur
égale à l’e¤ectifs i correspondant ou la fréquence relative fi correspondante:

Diagramme en bâtons et polygone des fi

Ahlème Bouakkaz 21 Université 20 Août 1955 -Skikda


Chapitre 3. Caractère quantitatif discret

Remarque 3.1 Un e¤ectif en soi n’amène aucune information c’est pour-


quoi nous portons en général notre attention sur les fréquences relatives fi :

Remarque 3.2 Si on joint par une ligne brisée les sommets des "bâtons",
on obtient "le polygone des fréquences relatives". Un simple changement de
l’echelle des ordonnées peut transformer ce dernier en un polygone des e¤ec-
tifs.

b) Diagramme intégral
Dé…nition : On appelle e¤ectif cumulé croissant de la valeur xj du caractère,
la somme 1 + 2 + 3 + :::: + j des e¤ectifs obtenus pour j premières valeurs
du caractère.
c% P
j
j = i
i=1

De même la fréquence relative cumulée croissante jusqu’à la j eme valeur xj


est par dé…nition la somme f1 + f2 + f3 + :::: + fj
P
j
fj c% = fi
i=1

La représentation graphique intégrale (courbe cumulative ou en escalier) né-


cessité l’introduction d’une fonction appelée "fonction cumulative".

Ahlème Bouakkaz 22 Université 20 Août 1955 -Skikda


Chapitre 3. Caractère quantitatif discret

3.3 Paramètres de position ou de tendance


centrale
Ils sont au nombre de cinq : le mode, la médiane, les quartiles et la moyenne
arithmétique.
Le mode : (noté M o) Le mode est la valeur la plus fréquente de la variable
statistique c-à-d celle qui a le plus grand e¤ectif. Ainsi pour identi…er le
mode il faut rechercher la variable qui correspond à l’e¤ectif maximal ou la
fréquence maximale.
Détermination graphique de M o
Graphiquement, le mode correspond au « bâton » le plus élevé. Sa valeur
est donnée par l’axe des abscisses.
Dans l’exemple 3:1; M o = 1 ( max = 1 = 282 et donc M o = x1 = 1):

Remarque 3.3 Une série statistique n’ayant qu’un seul mode est appelée
"série unimodale" et si elle a deux modes, elle est appelée "série bimodale"
et ainsi de suite.

La moyenne arithmétique (notée x)


D’une manière générale, quand on dispose d’une série de N mesures x1 ; x2 ; x3 ; ::::; xN ,
la moyenne arithmétique x est dé…nie par :
P
N
xi
x1 + x2 + x3 + :::: + xN i=1
x= = ;
N N

ainsi par exemple la moyenne arithmétique des valeurs 8; 5; 3; 6; 2 est

8+5+3+6+2 24
x= = = 4:8:
5 5

Lorsque les valeurs x1 ; x2 ; x3 ; ::::; xN se répètent respectivement 1, 2,:::,n fois,


on obtient la moyenne arithmétique en comptant chaque valeur xi autant de

Ahlème Bouakkaz 23 Université 20 Août 1955 -Skikda


Chapitre 3. Caractère quantitatif discret

fois qu’elle se présente, ceci revient à multiplier la valeur xi par l’e¤ectif i

qui lui correspond. On aura

P
k
i xi
i=1
x= ;
N

où N est l’e¤ectif total et le nombre d’éléments de la population et k le


nombre des xi non répétées.
Ex : Dans l’exemple 3:1, on a

P
6
i xi
i=1 1 x1 + 2 x2 + 3 x3 + 4 x4 + 5 x5 + 6 x6 1979
x= = = = 2:328 enfant.
850 850 850

La moyenne harmonique (notée H)


La moyenne harmonique simple (notée H) d’un ensemble x1 ; x2 ; x3 ; :::; xN
prise par la variable X est dé…nie comme étant l’inverse de la moyenne arith-
métique des inverses des valeurs.
La moyenne harmonique simple :

N N
H = = N :
1 1 1 1 P1
+ + + ::: +
x1 x2 x3 xN i=1 xi

Ex : Un automobiliste parcours un trajet à la vitesse 100 Km=heure à l’aller


et à une vitesse de 50 Km=heure au retour. La vitesse moyenne est

2 2 2 2
H= = = = = 66:66 Km=h:
1 1 P
2 1 1 1 0:01 + 0:05
+ +
x1 x2 i=1 xi 100 50

Il serait faut de calculer la moyenne arithmétique.


La moyenne harmonique pondérée :

Ahlème Bouakkaz 24 Université 20 Août 1955 -Skikda


Chapitre 3. Caractère quantitatif discret

N N
H = n1 n2 n3 nk = Pk n
;
+ + + ::: + i
x1 x2 x3 xk
i=1 xi
où N est l’e¤ectif total et le nombre d’éléments de la population et k est le
nombre des xi non répétées.
Ex : Dans l’exemple 3:1, on a
N 850
H= = = 1:702
P6 n
i 499:333
i=1 xi

La moyenne géométrique (notée G)


La moyenne géométrique est dé…nie comme étant la racine nieme du pro-
duit des valeurs positives non nulles x1 ; x2 ; x3 ; :::; xN prises par la variable
statistique X:
On distingue deux types de moyennes géométriques :
La moyenne géométrique simple : Lorsque les valeurs de la variable statis-
tique X ne sont pas répétitives.
v ! N1
uN
p uY Y
N
G = N x1 x2 x3 :::xN = t
N
xi = xi :
i=1 i=1

Exemple : Calculer la moyenne géométrique des valeurs suivantes de la va-


riable X : f2; 4; 5; 6g :
p p
4
p
4
G= 4
x1 x2 x3 x4 = 2456= 240 = 3:935:

La moyenne géométrique pondérée : Lorsque les valeurs de la variable sta-

tistique X sont répétitives. C’est à dire que ces valeurs ont des e¤ectifs, la
moyenne géométrique est égale alors à :
v ! N1
q u k
uY Y
k Y
k
G= N
x1 x2 x3 :::xk = t
n1 n2 n3 nk N
xni i = xni i = xfi i ;
i=1 i=1 i=1

Ahlème Bouakkaz 25 Université 20 Août 1955 -Skikda


Chapitre 3. Caractère quantitatif discret

où N est l’e¤ectif total et le nombre d’éléments de la population et k est le


nombre des xi non répétées.
Si on emploit les logarithmes, la moyenne géométrique pondérée peut s’écrire
de la manière suivante :
!
1 X
k X
k
log G = ni log (xi ) = fi log (xi ) :
N i=1 i=1

Exemple : Soient les valeurs suivantes de la variable statistique X : f3; 4; 3; 5; 4; 5; 4g :

xi ni
3 2
4 3
5 2
Total 7
total
N
1
1ere méthode : La valeur de la moyenne géométrique pondérée est

p p
7
p
xn1 1 xn2 2 xn3 3 = 32 43 52 = 14400 = 3:926:
N 7
G =

2eme méthode : On peut égalemant déterminer la moyenne géométrique


pondérée en utilisant les logarithmes décimaux ou népériens :
a) Logarithme décimal :

! !
1 X
k
1 X
3
1
log G = ni log (xi ) = ni log (xi ) = (2 log (3) + 3 log (4) + 2 log (5))
N i=1
7 i=1
7
1 1
= (0:954 + 1:806 + 1:398) = (4:158) = 0:594 =) G = 3:926:
7 7

Ahlème Bouakkaz 26 Université 20 Août 1955 -Skikda


Chapitre 3. Caractère quantitatif discret

b) Logarithme népérien :

! !
1 X
k
1 X
3
1
ln G = ni log (xi ) = ni ln (xi ) = (2 ln (3) + 3 ln (4) + 2 ln (5))
N i=1
7 i=1
7
1 1
= (2:197 + 4:159 + 3:219) = (9:573) = 1:368 =) G = 3:923:
7 7
Les résultats donnés par les deux types de logarithmes sont identiques. Les
logarithmes présentent un aventage car ils simpli…ent et facilitent les calculs.

Remarque 3.4 La moyenne géométrique est utilisée dans le calcul de taux


d’accroissement moyen ou de moyennes de coe¢ cients multiplicateurs.

La moyenne quadratique (notée Q)


La moyenne quadratique est dé…nie comme étant la racine carré de la moyenne
arithmétique des carrés des valeurs prises par la variable statistique X:
On distingue deux types de moyenne quadratique :
La moyenne quadratique simple :
Lorsque les valeurs de la variable statistique X ne sont pas répétitives, la
formule correspondante est alors la suivante :
v 1
uN 0 1
uP 2 P
N
2
u xi 2
t i=1 B i=1xi C
Q= =B
@ N A :
C
N

Exemple : Calculer la moyenne quadratique des valeurs suivantes de la va-


riable X : f2; 4; 6g :

v 1
uN 0 1
uP 2 P
3
2
u xi 2 r
t i=1 B i=1xi C 4 + 16 + 36 p
Q= =B
@ 3 A
C = = 18:666 = 4:320:
N 3

Ahlème Bouakkaz 27 Université 20 Août 1955 -Skikda


Chapitre 3. Caractère quantitatif discret

La moyenne quadratique pondérée :


Lorsque les valeurs de la variable statistique X sont répétitives. C’est à dire
que ces valeurs ont des e¤ectifs
v
u k 0 11
uP Pk 2 s
u 2 2
t i=1 i xi B
B
i xi C
C Pk
Q= = B i=1 C = fi x2i :
N @ N A i=1

Remarque 3.5 La moyenne quadratique est utilisée pour éviter les valeurs
négatives dans les calculs car les observations xi sont élevées au carré, il
est particulièrement très utilisée en physique et surtout quand il s’agit des
moyennes d’écarts à une valeur centrale. En agronomie, la moyenne intervient
notamment en matière forestière dans la détermination du diamètre de l’arbre
de section ou de surface terrière moyenne.

La moyenne d’ordre R (notée MR )


On peut généraliser la notion de moyenne à partir de la formule de la moyenne
arithmétique. Cette moyenne d’ordre "R" a pour expression générale :
v
u k 0 11
uP Pk R s
u R R
t i=1 i xi B i xi C
R
B C Pk
MR = = B i=1 C =
R
fi xR
i :
N @ N A i=1

Selon la valeur R, on peut retrouver les formules des di¤érentes moyennes


vues précédemment.

Valeur de R
R=2 Moyenne quadratique
R=1 Moyenne arithmétique
R= 1 Moyenne harmonique
R = " avec " ! 0 Moyenne géométrique

Ahlème Bouakkaz 28 Université 20 Août 1955 -Skikda


Chapitre 3. Caractère quantitatif discret

Remarque 3.6 (1)


H<G<x<Q

(2) L’application de tel ou tel type de moyennes dépend de la nature du


phénomène étudié en liaison avec les propriétés de chacune.

La médiane : (notée M e)
Si nous ordonnons les valeurs du caractère d’une série statistique par ordre de
grandeurs croissantes où décroissantes, la médiane est la valeur qui se situe
au centre de la série ainsi ordonnée et qui partage l’e¤ectif total en deux
parties égales.
Détermination de la valeur de la médiane par le calcul
Si la série comporte un nombre impair de valeurs c-à-d N = (2p + 1) valeurs,
la médiane sera le (p + 1)-ième valeur

Si N = 2p + 1 ) M e = xp+1 :

Si la série comporte un nombre pair de valeurs c-à-d N = 2p valeurs, alors


M e sera la demi somme de peme valeur et de la (p + 1)eme valeur
xp + xp+1
Si N = 2p ) M e = ;
2
où p et (p + 1) sont les position des variables statistiques dans une série
ordonnée par ordre de grandeurs croissantes.

Ex : Si on a : 3; 3; 4; 4; 4; 5; 6 ; 7; 7; 8; 9; 9; 10; alors

N = 13 = 2 (6) + 1 ) p = 6 ) M e = x7 = 6 c-à-d la 6eme valeur.

Et si on a 3; 3; 4; 4; 4; 5; 6 ; 7; 7; 8; 9; 9; alors
x6 + x7 5+6
N = 12 = 2 (6) ) p = 6 ) M e = = = 5:5
2 2
Détermination de M e à l’aide de la colonne des e¤ectifs cumulés

Ahlème Bouakkaz 29 Université 20 Août 1955 -Skikda


Chapitre 3. Caractère quantitatif discret

On peut déterminer xp directement en utilisant la colonne des e¤ectifs cumu-


c%
lés où xp est la valeur de la variable qui correspond à le premier i dans la
c% c%
colonne des e¤ectifs cumulés supérieur ou égal à p, c-à-d i p et i 1 <p
Ex : Dans l’exemple 3:1, on a

x425 + x426 2+2


N = 850 = 2 (425) ) p = 425 ) M e = = = 2:
2 2

Détermination graphique de M e

La médiane partage la série en deux groupes de même e¤ectif et sa déter-


mination graphique est immédiate car la médiane est l’abscisse du point
1 N
d’ordonnée sur le diagramme intégral des fj c% et sur le diagramme
2 2
intégral des c%
j .

Les quartiles : (notés Q1 , Q2 , Q3 )


Comme on a dé…nit la médiane pour répartir la population en moitié, on
peut dé…nir des paramètres qui la répartissent en quarts, c’est paramètres
sont appelés les quartiles.
N
Le premier quartile : Pour déterminer Q1 , il su¢ t de situer où se trouve
4
c% c% N c% N
sur la colonne des i i et i 1 < ou 0:25 sur la colonne des
4 4
fi c% :
Le deuxième quartile : Q2 = M e:
3N
Le troisième quartile : Pour déterminer Q3 , il su¢ t de situer où se trouve
4
c% c% 3N c% 3N
sur la colonne des i i et i 1 < ou 0:75 sur la colonne des
4 4
fi c% :
N 850 c%
Ex : Dans l’exemple 3:1, on a : = = 212:5 ) Q1 = 1 (car 1 = 282;
4 4
f1c% = 0:331)
Q2 = M e = 2:
3N 850 c%
=3 = 637:5 ) Q3 = 3 (car 3 = 703; f1c% = 0:826)
4 4

Ahlème Bouakkaz 30 Université 20 Août 1955 -Skikda


Chapitre 3. Caractère quantitatif discret

Remarque 3.7 De la même manière qu’on a dé…nit les quartiles, on peut


dé…nir les déciles (qui divisent la population en dixièmes) ou les centiles
(qui divisent la population en centièmes) et tous ces paramètres s’appellent
quantiles.

3.4 Paramètres de dispersion


L’étendue : (noté E ou R)
C’est la di¤érence entre la plus grande et la plus petite valeur du caractère
c-à-d
E = xmax xmin :

Ex : Dans l’exemple 3:1, on a E = xmax xmin = 6 1 = 5:


L’écart interquartile (noté EQ):

EQ = Q3 Q1

Ex : Dans l’exemple 3:1, on a EQ = Q3 Q1 = 3 1=2


L’intervalle semi-interquartile (noté IQ):
EQ
IQ =
2
EQ 2
Ex : Dans l’exemple 3:1, on a IQ = = =1
2 2
La variance (notée V ar (x) ou 2x ): La variance est la moyenne des carrés
des écarts à la moyenne arithmétique
Pk
i (xi x)2
i=1
V ar (x) =
N
en dévloppant cette formule, on obtient
Pk
2
i xi
i=1 Pk
V ar (x) = (x)2 = fi x2i (x)2 :
N i=1

Ahlème Bouakkaz 31 Université 20 Août 1955 -Skikda


Chapitre 3. Caractère quantitatif discret

Ex : Dans l’exemple 3:1, on a

P
6
i x2i
i=1 6213
V ar (x) = (x)2 = (2:328)2 = 7:309 5:419 = 1:890
N 850

L’écart-type ou écart quadratique moyen (noté x ): C’est la racine-


carrée de la variance.
p
x = V ar (x)
p p
Ex : Dans l’exemple 3:1, on a x = V ar (x) = 1:890 = 1:374
Coe¢ cient de variation (noté C:V ): C’est une mesure de dispertion re-
lative permettant de comparer deux séries.

100 x
C:V = %
x

Ex : Dans l’exemple 3:1, on a

100 x 100 (1:374)


C:V = = ' 59%:
x 2:328

Exercice d’application
Les notes obtenues par 202 étudiants à l’épreuve de statistique sont données
par le tableau suivant :

Notes 8 9 10 11 12 13 14 15 16 Total
E¤ectifs 8 14 28 36 52 28 20 12 4 202
Calculer les paramètres de position et de dispersion.

Ahlème Bouakkaz 32 Université 20 Août 1955 -Skikda


Chapitre 3. Caractère quantitatif discret

Solution

Le tableau statistique :
c%
xi i fi i fic% i xi fi xi 2
i xi fi x2i
8 8 0:039 8 0:039 64 0:312 512 2:494
9 14 0:069 22 0:108 126 0:621 1134 5:589
10 28 0:138 50 0:246 280 1:38 2800 13:8
11 36 0:178 86 0:424 396 1:958 4356 21:538
12 52 0:257 138 0:681 624 3:084 7488 37:008
13 28 0:138 166 0:820 364 1:794 4732 23:322
14 20 0:099 186 0:919 280 1:386 3920 19:404
15 12 0:059 198 0:978 180 0:885 2700 13:275
16 4 0:019 202 0:997 64 0:304 1024 4:864
T otal 202 0:997 2378 11:724 28666 141:294
T otal
1 11:772 141:910
202
Paramètres de position ou de tendance centrale
Le mode :

M o = 12 ( max = 5 = 52 et donc M o = x5 = 12):

M o = 12:

La moyenne arithmétique :

P
9
i xi
i=1 2378
x= = = 11:772:
202 202

x = 11:772:

La médiane :

Ahlème Bouakkaz 33 Université 20 Août 1955 -Skikda


Chapitre 3. Caractère quantitatif discret

12 + 12
N = 202 = 2 (101) ) p = 101 ) M e = = 12:
2

M e = 12:

Les quartiles : (notés Q1 , Q2 , Q3 )


Le premier quartile :

N 202 c% c%
= = 50:5 ) Q1 = x4 = 11 (car 3 = 50 et 4 = 86)
4 4

Q1 = 11:

Le deuxième quartile :
Q2 = M e = 12:

Q2 = 12:

Le troisième quartile :

3N 202 c% c%
=3 = 151:5 ) Q3 = x6 = 13 (car 5 = 138 et 6 = 166):
4 4

Q3 = 13:

Paramètres de dispersion
L’étendue :
E = xmax xmin = 16 8 = 8:

E = 8:

L’écart interquartile:

EQ = Q3 Q1 = 13 11 = 2:

Ahlème Bouakkaz 34 Université 20 Août 1955 -Skikda


Chapitre 3. Caractère quantitatif discret

EQ = 2:

L’intervalle semi-interquartile:

EQ 2
IQ = = = 1:
2 2

IQ = 1:

La variance:

P
k
i x2i
i=1 P
k
V ar (x) = (x)2 = fi x2i (x)2 :
N i=1

P
9
i x2i
i=1 28666
V ar (x) = (x)2 = (11:772)2 = 141:910 138:579 = 3:331
N 202

V ar (x) = 3:331:

L’écart-type ou écart quadratique moyen:


p p
x = V ar (x) = 3:331 = 1:825

x = 1:825:

Coe¢ cient de variation:

100 x 100 (1:825)


C:V = = ' 15:502%:
x 11:772

C:V = 15:502%:

Ahlème Bouakkaz 35 Université 20 Août 1955 -Skikda


CHAPITRE 4

Caractère quantitatif continu

Sommaire
4.1 Tableau statistique . . . . . . . . . . . . . . . . . . 37

4.2 Représentation graphique . . . . . . . . . . . . . 38

4.3 Paramètres de position ou de tendance centrale 40

4.4 Paramètres de dispersion . . . . . . . . . . . . . . 44

36
Chapitre 4. Caractère quantitatif continu

4.1 Tableau statistique


Répartition de l’étendue en classes
On subdivise l’étendue parcourue par la variable statistique en intervalles
disjoints (classes) de la forme [bi ; bi+1 [ ; ]bi ; bi+1 ] ou bi bi+1 qui le recouvrent
en entier.
Le nombre de classes
Pour trouver le nombre de classes, on peut utiliser plusieurs formules comme :
] Formule de Sturge : N C1 = 1 + (3:3 log N )
p
] Formule de Yule : N C2 = 2:5 4 N
p
] Formule de la racine carrée : N C3 = N
Amplitude de chaque classe
On choisira toujours la même amplitude Ai pour toutes les classes où

E xmax xmin
Ai = = :
NC NC

Exemple 4.1 La détermination du taux de cholestérol du sang pour 40 su-


jets humains adults a donné les valeurs suivantes, exprimées en cg/l de sang.

150 163 170 174 178 182 189 196 152 165 175 171 180 183
191 197 158 165 171 175 180 183 191 199 161 168 172 175
181 185 193 172 175 185 205 161 170 181 194 206

N C1 = 1 + (3:3 log N ) = 1 + (3:3 log 40) ' 6:28


p
4
p4
N C2 = 2:5 N = 2:5 40 ' 6:28 ' 6 classes
206 150 56
Ai = ' ' 9:34:
6 6

Centre de chaque classe


Le centre de la classe [bi ; bi+1 [ ; ]bi ; bi+1 ] ou bi bi+1 est la demi somme des

Ahlème Bouakkaz 37 Université 20 Août 1955 -Skikda


Chapitre 4. Caractère quantitatif continu

extrémités de la classe c-à-d

bi + bi+1
ci = :
2

Tableau statistique
c%
Classes i ci fi i i ci fi ci i c2i fi c2i
[150; 159:34[ 3 154:67 0:075 3 464:01 11:6 71768:426 1794:172
[159:34; 168:68[ 6 164:01 0:150 9 984:06 24:601 161395:680 4034:810
[168:68; 178:02[ 12 173:35 0:300 21 2080:2 52:005 360602:67 9015:066
[178:02; 187:36[ 9 182:69 0:225 30 1644:21 41:105 300380:724 7509:472
[187:36; 196:7[ 6 192:03 0:150 36 1152:18 28:804 221253:125 5531:232
[196:7; 206:04[ 4 201:37 0:100 40 805:48 20:137 162199:507 4054:987
Total 40 1 7130:14 178:252 1277600:132 31939:739
T otal
1 178:253 31940:003
40

4.2 Représentation graphique


Diagramme di¤érentiel
Dans le cas d’une variable continue le diagramme di¤érentiel s’appelle "His-
togramme" , il est formé par des rectangles ayant pour largeurs les classes et
pour hauteur une longueur proportionnelle à l’e¤ectif i correspondant (ou
fréquence relative correspondante).

Remarque 4.1 Lorsque les amplitudes des classes sont inégaux, il faut cor-
riger les e¤ectifs avant de tracer l’histogramme

0 i
i = ;
Ai
0
où i est l’e¤ectif corrigé de la classe d’e¤ectif i et d’amplitude Ai .

Ahlème Bouakkaz 38 Université 20 Août 1955 -Skikda


Chapitre 4. Caractère quantitatif continu

Histogramme des fi

Polygône des e¤ectifs ou des fréquences relatives : Le polygône des e¤ectifs


(ou des fréquences relatives) est une ligne brisée joignant les milieux des
sommets des di¤érents rectangles adjacents c-à-d on joint dans l’ordre les
points (ci ; i ) (ou (ci ; fi )) et on ajoute deux classes …ctives (une première et
une dernière) de même amplitude que les autres et dont les e¤ectifs (ou les
fréquences relatives) sont nuls.
Diagramme intégral
Dans le cas d’une variable quantitative continue le diagramme intégral s’ap-
pelle "Courbe cumulative" (appelée parfois sigmoïde) et pour tracer la
Courbe cumulative croissante, il su¢ t de tracer des segments de droites joi-
gnants des points dont l’abscisse de chaque point est la borne supérieure
de la classe et l’ordonnée est l’e¤ectif cumulé croissant correspondant (ou la

Ahlème Bouakkaz 39 Université 20 Août 1955 -Skikda


Chapitre 4. Caractère quantitatif continu

fréquence relative cumulée croissante correspondante).

Courbe cumulative croissante des e¤ectifs cumulés croissants

4.3 Paramètres de position ou de tendance


centrale
La classe modale : Pour une série classée, la dé…nition précedente du mode
n’est plus valable, on dé…nit cependant la classe modale [xm ; xm+1 [ :

Classes d’amplitudes égales : La classe modale est la classe qui a le plus grand
e¤ectif ou la fréquence relative la plus importante.

Classes d’amplitudes inégales : La classe modale est la classe qui correspond


à l’e¤ectif recti…é le plus élevé ou la fréquence relative recti…ée la plus im-
portante.

Ahlème Bouakkaz 40 Université 20 Août 1955 -Skikda


Chapitre 4. Caractère quantitatif continu

Le mode : 0 1
=A
z }|m { d1
M o = xm + @xm+1 xm A ;
d1 + d2

où xm est la borne inférieure, Am est l’amplitude de la classe modale, d1 est


l’e¤ectif de la classe modale-l’e¤ectif de la classe précédente et d2 est l’e¤ectif
de la classe modale-l’e¤ectif de la classe suivante.
Ex : Dans l’exemple 4:1, les classes sont d’amplitudes égales, alors la classe
modale est [168:68; 178:02[

(12 6)
M o = 168:68 + 9:34 = 174:906 cg=l:
(12 6) + (12 9)

La moyenne arithmétique (notée x)


Le calcul de la moyenne arithmétique est le même pour les séries à caractères
discrets, le seul problème qui se pose est celui de la valeur xi . On prend en
général le milieu de la classe.

P
k
i ci
i=1 P
k
x= = fi ci , où ci est le centre de la classe.
N i=1

Ex : Dans l’exemple 4:1, on a

P
6
i ci
i=1 1 c1 + 2 c2 + 3 c3 + 4 c4 + 5 c5 + 6 c6 7130:14
x= = = = 178:253 cg=l
40 40 40

La médiane (notée M e)
On détermine d’abord la classe médiane [xm ; xm+1 [. On se sert de la colonne
des e¤ectifs cumulés croissants ou des fréquences relatives croissantes où
8 8
>
< c% N < f c% 0:5
m m
2 où
> N :
c%
: m 1< fmc%1 < 0:5
2

Ahlème Bouakkaz 41 Université 20 Août 1955 -Skikda


Chapitre 4. Caractère quantitatif continu

Une fois que la classe médiane [xm ; xm+1 [ est déterminée, on peut calculer la
médiane M e par interpolation linéaire

(xm+1 xm ) N c%
M e = xm + m 1
m 2
(xm+1 xm )
M e = xm + 0:5 fmc%1 ;
fm

où xm et xm+1 sont les éxtrémités de la classe médiane, N est l’e¤ectif total,


c%
m est l’e¤ectif de la classe médiane et m 1 est l’e¤ectif cumulé qui précède
l’e¤ectif cumulé de la classe médiane et fm est la fréquence relative de la
classe médiane et fmc%1 , la fréquence relative cumulée qui précède la fréquence
relative cumulée de la classe médiane
Détermination graphique de M e
La médiane partage la série en deux groupes de même e¤ectif et sa détermina-
tion graphique est immédiate, on peut lire la valeur médiane sur le diagramme
intégral des e¤ectifs cumulés croissants (ou fréquences relatives cumulées croissantes)
N
en cherchant l’antécédant de des c%i ou 0:5 des fi c% ou bien elle est
2
l’abscisse du point d’intersection des deux courbes cumulatives croissantes et
décroissantes.
N
Ex : Dans l’exemple 4:1, on a = 20, donc [xm ; xm+1 [ = [168:68; 178:02[
2
(xm+1 xm ) N c% 9:34
M e = xm + m 1 = 168:68+ (20 9) = 177:241 cg=l
m 2 12

Les quartiles (notés Qj ) j = 1 3


On trouve d’abord la classe [xm ; xm+1 [ qui contient Qj par la même procédure
que pour la médiane et de calculer en suite Qj par interpolation linéaire.
Le 1ier quartile (noté Q1 )
Q1 cumule le quart de la population, alors il se trouve dans la classe [xm ; xm+1 [

Ahlème Bouakkaz 42 Université 20 Août 1955 -Skikda


Chapitre 4. Caractère quantitatif continu

qui véri…e une de ces deux conditions


8 8
>
< c% N < f c% 0:25
m m
4 où
> N : f c% < 0:25
: c%m 1 < m 1
4

(xm+1 xm ) N c%
Q1 = xm + m 1
nm 4
Le 2eme quartile (noté Q2 )

Q2 = M e:

Le 3eme quartile (noté Q3 )


Q3 cumule le trois quarts de la population et donc la classe [xm ; xm+1 [ qui
contient Q3 est celle qui véri…e une de ces deux conditions
8 8
>
< c% 3N < f c% 0:75
m m
4 où
> 3N :
: m 1<c%
fmc%1 < 0:75
4
(xm+1 xm ) 3N c%
Q3 = xm + m 1
nm 4
Ex : Dans l’exemple 4:1, on a

N
Q1 : = 10 =) Q1 2 [168:68; 178:02[
4
9:34
Q1 = 168:68 + (10 9) = 169:458 cg=l
12
Q2 = Me
3N
Q3 : = 30 =) Q3 2 [178:02; 187:36[
4
9:34
Q3 = 178:02 + (30 21) = 187:36 cg=l
9

Ahlème Bouakkaz 43 Université 20 Août 1955 -Skikda


Chapitre 4. Caractère quantitatif continu

4.4 Paramètres de dispersion


L’étendue (noté E ou R)
C’est la di¤érence entre la plus grande et la plus petite valeur du caractère
c-à-d
E = xmax xmin :

Ex : Dans l’exemple 4:1, on a

E = xmax xmin = 206 150 = 56 cg=l:

L’écart interquartile (noté EQ)

EQ = Q3 Q1

Ex : Dans l’exemple 4:1, on a

EQ = Q3 Q1 = 187:36 169:458 = 17:902 cg=l

L’intervalle semi-interquartile (noté IQ)

EQ
IQ = :
2

Ex : Dans l’exemple 4:1, on a

EQ 17:902
IQ = = = 8:951 cg=l
2 2
2
La variance (notée V ar (x) ou x)

La même remarque que la moyenne, on utilise les centres ci au lieu de xi

P
k
i c2i
i=1 P
k
V ar (x) = (x)2 = fi c2i (x)2
N i=1

Ahlème Bouakkaz 44 Université 20 Août 1955 -Skikda


Chapitre 4. Caractère quantitatif continu

Ex : Dans l’exemple 4:1, on a


P
6
i c2i
i=1
V ar (x) = (x)2 = 31940:003 31774:132 = 165:871 (cg=l)2
N

L’écart-type ou écart quadratique moyen (noté x ou (x))


C’est la racine-carrée de la variance.
p
(x) = V ar (x):

Ex : Dans l’exemple 4:1, on a


p p
(x) = V ar (x) = 165:871 = 12:879 cg=l:

Coe¢ cient de variation (noté C:V )


C’est une mesure de dispertion relative permettant de comparer deux séries
statistiques.
100 (x)
C:V = %
x
Ex : Dans l’exemple 4:1, on a

100 (x)
C:V = = 7:225%
x

Exemple 4.2 Les pesées de 50 nouveaux-nés dans une maternité ont permis
d’établir le tableau suivant :

Poids (Kg) E¤ectif


[2:0; 2:4[ 6
[2:4; 2:8[ 10
[2:8; 3:2[ 19
[3:2; 3:6[ 11
[3:6; 4:0[ 4
Total 50

Ahlème Bouakkaz 45 Université 20 Août 1955 -Skikda


Chapitre 4. Caractère quantitatif continu

Déterminer le mode, la médiane, la moyenne arithmétique et la variance.

Solution

Classes i ci fi fic% c%
i i ci i c2i
[2; 2:4[ 6 2:2 0:12 0:12 6 13:2 29:04
[2:4; 2:8[ 10 2:6 0:2 0:32 16 26 67:6
[2:8; 3:2[ 19 3 0:38 0:7 35 57 171
[3:2; 3:6[ 11 3:4 0:22 0:92 46 37:4 127:16
[3:6; 4[ 4 3:8 0:08 1 50 15:2 57:76
P
50 148:8 452:56
P
=50 1 2:976 9:051
Le mode : M o 2 [2:8; 3:2[ et

d1 9
M o = x m + Am = 2:8 + (0:4) = 3:011 Kg
d1 + d2 8+9

N
La médiane : = 25 =) M e 2 [2:8; 3:2[
2
(xm+1 xm ) N 0:4
M e = xm + nc%
m 1 = 2:8 + (25 16) = 2:989 Kg
nm 2 19

La moyenne arithmétique :

P
5
ni ci
i=1
x= = 2:976 Kg
N

La variance :

P
5
ni c2i
i=1 148:8
V ar(x) = (x)2 = (2:976)2 = 9:051 8:856 = 0:195 (Kg)2 :
N 50

Ahlème Bouakkaz 46 Université 20 Août 1955 -Skikda


CHAPITRE 5

Les distributions statistiques à deux caractères

Sommaire
5.1 Classement des données et tableaux à double en-
trée . . . . . . . . . . . . . . . . . . . . . . . . . . . 48

5.2 Représentation graphique . . . . . . . . . . . . . 52

5.3 Distributions marginales . . . . . . . . . . . . . . 53

5.4 Distributions conditionnelles . . . . . . . 59

5.5 Covariance . . . . . . . . . . . . . . . . . . . . . . 62

5.6 Coe¢ cient de corrélation linéaire . . . . . . . . . 64

5.7 Ajustement linéaire . . . . . . . . . . . . . . . . . 66

47
Chapitre 5. Les distributions statistiques à deux caractères

Le but essentiel de la statistique à deux variables est de lire et interpréter


des tableaux et des graphiques pour comparer des séries statistiques à une
variable c-à-d déterminer s’il existe une liaison ou une "corrélation" entre les
grandeurs xi et yj de ces caractères pour un même individu.

5.1 Classement des données et tableaux à double


entrée
En statistique appliquée, il arrive fréquemment d’observer des phénomènes
où il y a lieu de soupçonner qu’il existe une liaison entre deux variables par
exemple, la taille et le poid sont deux caractères dépendants statistiquement
ou une caractéristique morphologique d’un individu et son age.
Il existe donc six types généraux de distributions à deux caractères.

L’un des deux caractères L’autre caractère


caractère qualitatif caractère qualitatif
caractère qualitatif caractère quantitatif discret
caractère qualitatif caractère quantitatif continu
caractère quantitatif discret caractère quantitatif discret
caractère quantitatif discret caractère quantitatif continu
caractère quantitatif continu caractère quantitatif continu

Considérons une population de N éléments décrits simultanément suivant

deux caractères quantitatifs discrets X et Y (le traitement est le même pour

Ahlème Bouakkaz 48 Université 20 Août 1955 -Skikda


Chapitre 5. Les distributions statistiques à deux caractères

les autres cas). Donc on obtient le tableau (forme générale) suivant :

XnY y1 y2 ....... yj ....... yp Total


x1 11 12 ....... 1j ....... 1p 1

x2 21 22 ....... 2j ....... 2p 2

: : : : : :
: : : ....... : ...... : :
: : : : : :
xi i1 i2 ....... ij ....... ip i

: : : : : :
: : : ....... : ...... : :
: : : : : :
xk k1 k2 ....... kj ....... kp k

Total 1 2 ....... j ....... p N=

où i est le total des e¤ectifs ij suivant j, j = 1; p et j est le total des


e¤ectifs ij suivant i, i = 1; k:
Exemple 01 : A…n d’étudier la relation existante entre le nombre de
feuilles et le nombre de fruits d’une certaine variété de fraises 150 arbris-
seaux ont été sélectionné dans un champ. On a dénombré les feuilles et les
fruits de chaque arbrisseau et le tableau suivant a été obtenu

Ahlème Bouakkaz 49 Université 20 Août 1955 -Skikda


Chapitre 5. Les distributions statistiques à deux caractères

X représente le nombre de fruits.


Y représente le nombre de feuilles.
Nous avons 7 valeurs di¤érentes P
XnY 6 11 14 16 18
pour la variable X, (k = 7)
8 8 2 1 1 0 12
Nous avons 5 valeurs di¤érentes
10 4 16 2 0 1 23
pour la variable Y , ( p = 5)
16 3 10 15 8 5 41
1 = 12 : le total des 1j des
20 2 4 14 3 1 24
arbrisseaux ayant 8 fruits (2eme ligne)
24 4 5 6 5 2 22
5 = 22 : le total des 5j des
32 3 1 2 8 2 16
arbrisseaux ayant 24 fruits (6eme ligne)
42 0 0 6 4 2 12
1 = 24 : le total des i1 des arbrisseaux P
24 38 46 29 13 150
ayant 6 feuilles (2eme colonne)

4 = 29 : le total des i4 des arbrisseaux


ayant 16 feuilles (5eme colonne)

Tableau particulier
xi yi
x1 y1
x2 y2
Si les valeurs des variables X et Y sont appariées deux à deux : :
alors il est préférable de dresser un tableau à deux colonnes : :
seulement dans le style de celui qui suit : xi yi
: :
: :
xN yN

Exemple 02 : Nous disposons d’un groupe de 10 personnes sur chacune


desquelles nous avons mesuré la taille X et le poids Y . Les mesures ont été
les suivantes :

Ahlème Bouakkaz 50 Université 20 Août 1955 -Skikda


Chapitre 5. Les distributions statistiques à deux caractères

(1:55; 58:2) (1:60; 58:1) (1:62; 61:3) (1:64; 65:3) (1:65; 69:5) (1:70; 69:7) (1:72; 70:3)
(1:73; 75:4) (1:76; 74:2) (1:78; 82:0) :
Le tableau statistique à double entrée (forme générale)

XnY 58:1 58:2 61:3 65:3 69:5 69:7 70:3 74:2 75:4 82:0
1:55 0 1 0 0 0 0 0 0 0 0
1:60 1 0 0 0 0 0 0 0 0 0
1:62 0 0 1 0 0 0 0 0 0 0
1:64 0 0 0 1 0 0 0 0 0 0
1:65 0 0 0 0 1 0 0 0 0 0
1:70 0 0 0 0 0 1 0 0 0 0
1:72 0 0 0 0 0 0 1 0 0 0
1:73 0 0 0 0 0 0 0 0 1 0
1:76 0 0 0 0 0 0 0 1 0 0
1:78 0 0 0 0 0 0 0 0 0 1

Taille (en mètres) Poids (en Kg)


xi yi
1:55 58:2
On remarque que les e¤ectifs 1:60 58:1
ne sont égaux qu’à zéro 1:62 61:3
ou à un (une seule fois par 1:64 65:3
ligne ou par colonne) c’est pour 1:65 69:5
ça on va dresser un tableau à 1:70 69:7
deux colonnes suivant : 1:72 70:3
1:73 75:4
1:76 74:2
1:78 82:0

Ahlème Bouakkaz 51 Université 20 Août 1955 -Skikda


Chapitre 5. Les distributions statistiques à deux caractères

Distributions marginales et conditionnelles


Du tableau des e¤ectifs (ou des fréquences relatives) par rapport à l’e¤ectif
total, on peut extraire les séries statistiques à une variable suivantes :
La série des e¤ectifs marginaux (ou des fréquences relatives marginales) du
caractère X et la série des e¤ectifs marginaux (ou des fréquences relatives
marginales) du caractère Y:
Du tableau des e¤ectifs (ou des fréquences relatives) par rapport aux lignes,
on peut en extraire les séries statistiques à une variable suivantes :
Les k séries des fréquences (absolues ou relatives) conditionnelles de Y selon
X:
Du tableau des e¤ectifs (ou des fréquences relatives) par rapport aux co-
lonnes, on peut en extraire les séries statistiques à une variable suivantes :
Les p séries des fréquences (absolues ou relatives) conditionnelles de X selon
Y:

5.2 Représentation graphique


Cas d’une population à e¤ectif fort
Dans un repère orthogonal, on porte en abscisses les valeurs du caractère X
et on porte en ordonnées les valeurs du caractère Y: Si le réel ij n’est pas
nul, on désigne par Mi j le point de coordonnées (xi ; yj ) et on a¤ecte ce point
du coe¢ cient i j. L’ensemble de ces N points constitue un nuage de points.
Exemple 01 :

Ahlème Bouakkaz 52 Université 20 Août 1955 -Skikda


Chapitre 5. Les distributions statistiques à deux caractères

Cas d’une population à faible e¤ectif


On convient de représenter cette série statistique double par un ensemble de
point dans un repère orthogonal.
Sur l’axe horisontal, on porte en ordre croissant, les valeurs du caractère X
et on porte en ordre croissant, les valeurs du caractère Y: On désigne par
Mi j le point de coordonnées (xi ; yj ).
Par exemple la famille (x1 ; y2 ) ; (x2 ; y1 ) ; (x3 ; y3 ) ; ::::,(xi ; yj ) qui est représen-
tée par la famille de N points M1 ; M2 ; M3 ; :::,MN constitue un nuage de points.
Exemple 02 :

5.3 Distributions marginales


La distribution marginale est une distribution à un seul caractère et si on
considére la dernière colonne du tableau, les e¤ectifs i sont appelés les e¤ectifs marginaux
de X.
La fréquence relative marginale de X est notée fi ; c’est le rapport de l’ef-

Ahlème Bouakkaz 53 Université 20 Août 1955 -Skikda


Chapitre 5. Les distributions statistiques à deux caractères

fectif marginal j à l’e¤ectif total N:

i
fi =
N

Si on considére la dernière ligne du tableau, les e¤ectifs j sont appelés


les e¤ectifs marginaux de Y .
La fréquence relative marginale de Y est notée f j ; c’est le rapport de l’ef-
fectif marginal j à l’e¤ectif total N:

j
f j =
N

Remarque : La somme des e¤ectifs marginaux est égale à l’e¤ectif total de


la population.
p
X
k X
i = j =N
i=1 j=1

Exemple 01 : On a
Distribution marginale de X Distribution marginale de Y
(nombre de fruits) (nombre de feuilles)
Fréquences relatives Fréquences relatives
X E¤ectifs Y E¤ectifs
marginales marginales
8 12 0:08 6 24 0:16
10 23 0:153 11 38 0:253
16 41 0:273 14 46 0:306
20 24 0:16 16 29 0:193
24 22 0:146 18 13 0:086
32 16 0:106 Total 150 1
42 12 0:08
Total 150 1

Ahlème Bouakkaz 54 Université 20 Août 1955 -Skikda


Chapitre 5. Les distributions statistiques à deux caractères

Distributions conditionnelles

Dé…nitions : Le tableau statistique formé de la 1ere et la j eme colonnes dé…ni


une distribution conditionnelle de la variable X liée à la valeur yj (il y a p
distributions selon la variable X)
De même le tableau statistique formé de la 1ere et la ieme lignes dé…ni une
distribution conditionnelle de la variable Y liée à la valeur xi (il y a k distri-
butions conditionnelles selon la variable Y )

XnY yj
x1 1j

x2 2j

: :
: :
: : XnY y1 y2 ....... yj ....... yp Total
xi ij xi i1 i2 ....... ij ....... ip i

: :
: :
: :
xk kj

Total j

Fréquence conditionnelle :
La fréquence conditionnelle de la variable xi liée à la valeur yj s’écrit :

ij
fi j =
j

La fréquence conditionnelle de la variable yj liée à la valeur xi s’écrit :

ij
fj i =
i

Ahlème Bouakkaz 55 Université 20 Août 1955 -Skikda


Chapitre 5. Les distributions statistiques à deux caractères

Lorsque yj = 14, la distribution conditionnelle est

X E ectifs Fréquence conditionnelle fi j


8 1 0.021
10 2 0.043
16 15 0.326
20 14 0.304
24 6 0.130
32 2 0.043
42 6 0.130
P
46 0.997' 1

Lorsque xj = 20, la distribution conditionnelle est

Y E ectifs Fréquence conditionnelle fj i


6 2 0:083
11 4 0:166
14 14 0:583
16 3 0:125
18 1 0:041
P
24 0:998 ' 1

Ahlème Bouakkaz 56 Université 20 Août 1955 -Skikda


Chapitre 5. Les distributions statistiques à deux caractères

Caractéristiques marginales
Cas d’une population à e¤ectif fort
- La moyenne arithmétique marginale de la variable X est donnée par

P
k
i xi X
k
i=1
xM = = fi xi
N i=1

- La variance marginale de la variable X est donnée par

P
k
i x2i X
k
i=1
V arM (X) = (xM )2 = fi x2i (xM )2
N i=1

- L’écart type marginal de la variable X est donné par


p
M
(X) = V arM (X)

xi i i xi i x2i
8 12 96 768
P
7
i xi
i=1 3006 10 23 230 2300
xM = == 20:04 fruit
150 150 16 41 656 10496
P7
2
i xi
i=1 20 24 480 9600
V arM (X) = (xM )2
150 24 22 528 12672
= 489:253 401:601 = 87:652 (fruit)2
p p 32 16 512 16384
M
(X) = V arM (X) = 87:652
42 12 504 21168
= 9:362 fruit P
150 3006 73388
P
=150 1 20:04 489:253
- La moyenne arithmétique marginale de la variable Y est donnée par
P
p
yj p
j=1
j X
yM = = f j yj
N j=1

Ahlème Bouakkaz 57 Université 20 Août 1955 -Skikda


Chapitre 5. Les distributions statistiques à deux caractères

- La variance marginale de la variable Y est donnée par


P
p
yj2 p
j=1
j
2
X 2
V arM (Y ) = yM = f j yj2 yM
N j=1

- L’écart-type marginal de la variable X est donné par


p
M
(Y ) = V arM (Y )

P
5 yj j j yj j yj2
j yj
j=1 1904 6 24 144 864
yM = = = 12:693 feuille
150 150 11 38 418 4598
P
5
2
j yj
j=1 2 14 46 644 9016
V arM (Y ) = y M (feuille)2
N 16 29 464 7424
= 174:093 161:112 = 12:981
p p 18 13 234 4212
M
(Y ) = V arM (Y ) = 12:981 P
150 1904 26114
= 3:602 feuille P
=150 1 12:693 174:093
Cas d’une population à faible e¤ectif

P
N P
N
xi yi
i=1 i=1
x= y=
N N
P
N P
N
x2i yi2
V ar (X) = i=1 (x)2 V ar (Y ) = i=1 (y)2
p N p N
(X) = V ar (X) (Y ) = V ar (Y )

Ahlème Bouakkaz 58 Université 20 Août 1955 -Skikda


Chapitre 5. Les distributions statistiques à deux caractères

xi yi x2i yi2 xi yi
1:55 58:2 2:402 3387:24 90:21
x = 1:675 m
1:60 58:1 2:56 3375:61 92:96
y = 68:4 kg
1:62 61:3 2:624 3757:69 99:306
V ar (X) = 2:810 (1:675)2
1:64 65:3 2:689 4264:09 107:092
= 2:810 2:805
1:65 69:5 2:722 4830:25 114:675
= 0:005 m2
1:70 69:7 2:89 4858:09 118:49
V ar (Y ) = 4732:986 (68:4)2
1:72 70:3 2:958 4942:09 120:916
= 4732:986 4678:56
1:73 75:4 2:992 5685:16 130:442
= 54:426 kg 2
p 1:76 74:2 3:097 5505:64 130:592
(X) = 0:005 = 0:07 m
p 1:78 82:0 3:168 6724 145:96
(Y ) = 54:426 = 7:377 kg P
16:75 684 28:102 47329:86 1150:643
P
=10 1:675 68:4 2:810 4732:986 115:064

5.4 Distributions conditionnelles

Caractéristiques conditionnelles du caractère X


La moyenne conditionnelle de X selon y1 est

P
k
i1 xi X
k
i=1
x1 = = fi 1 xi
1 i=1

La moyenne conditionnelle de X selon y2 est

P
k
i2 xi X
k
i=1
x2 = = fi 2 xi
2 i=1

.
.

Ahlème Bouakkaz 59 Université 20 Août 1955 -Skikda


Chapitre 5. Les distributions statistiques à deux caractères

La moyenne conditionnelle de X selon yp est

P
k
ip xi X
k
i=1
xp = = fi p xi
p i=1

Donc d’une façon générale, la moyenne conditionnelle de X selon yj est

P
k

i=1
i j xi P
k
xj = = fi j xi ; j=1 p
j
i=1

La variance conditionnelle de X selon y1 est

P
k
i1 x2i X
k
i=1 2
V ar1 (X) = (x1 ) = fi 1 x2i (x1 )2
1 i=1

La variance conditionnelle de X selon y2 est

P
k
i2 x2i X
k
i=1
V ar2 (X) = (x2 )2 = fi 2 x2i (x2 )2
2 i=1

La variance conditionnelle de X selon yp est

P
k
ip x2i X
k
i=1 2
V arp (X) = (xp ) = fi p x2i (xp )2
p i=1

Donc d’une façon générale, variance conditionnelle de X selon yj est

P
k
i j x2i P
k
V arj (X) = i=1
(xj )2 = fi j x2i (xj )2 ; j=1 p
j
i=1

De plus, l’écart type conditionnel de X selon yj est


p
j (X)= V arj (X), j=1 p

Ahlème Bouakkaz 60 Université 20 Août 1955 -Skikda


Chapitre 5. Les distributions statistiques à deux caractères

Les caractéristiques conditionnelles de X selon y3 = 14


xi i3 i3 xi i3 x2i

P
7 8 1 8 64
i3 xi
i=1 1008 10 2 20 200
x3 = = = 21:913
3 46
P
7 16 15 240 3840
2
i 3 xi
i=1 20 14 280 5600
V ar3 (X) = (x3 )2
3 24 6 144 3456
= 560:695 480:179 = 80:516
p p 32 2 64 2048
3 (X) = V ar3 (X) = 80:516
42 6 252 10584
= 8:973 P
46 1008 25792
P
=150 1 21:913 560:695

Caractéristiques conditionnelles du caractère Y


De même, on arrive à
La moyenne arithmétique conditionnelle de Y selon xi est
p
P
yj
j=1
i j P
p
yi = = fi j yj ; i=1 k
i
j=1

La variance conditionnelle de Y selon xi est


p
P
yj2
i j P
p
V ari (Y ) = j=1
(yi )2 = fi j yj2 (yi )2 ; i=1 k
i
j=1

L’écart type conditionnel de Y selon xi est


p
i (Y ) = V ari (Y ); i=1 k

Les caractéristiques conditionnelles de Y selon x4 = 20

Ahlème Bouakkaz 61 Université 20 Août 1955 -Skikda


Chapitre 5. Les distributions statistiques à deux caractères

P
5 yj 4j 4j yj 4j yj2
4j yj
j=1 318 6 2 12 72
y4 = = = 13:25
4 24
P
5 11 4 44 484
4j yj2
j=1 2 14 14 196 2744
V ar4 (Y ) = y4
4 16 3 48 768
= 183:25 175:562 = 7:688
p p 18 1 18 324
4 (Y ) = V ar4 (Y ) = 7:688 P
24 318 4395
= 2:772 P
=150 1 13:25 183:125

5.5 Covariance
On appelle "covariance" entre deux variables statistiques marginales X et
Y d’une série double d’e¤ectif total N , le réel noté Cov (X; Y ) ou X Y qui
mesure la dispersion entre les deux variables.
Cas d’une population à e¤ectif fort

P
k P
p
ij xi yj
i=1j=1
Cov (X; Y ) = (xM y M )
N

Cas d’une population à faible e¤ectif

Dans le cas où tous les points d’un nuage se démarquent les uns des autres,
c-à-d où tous les e¤ectifs ne sont égaux qu’à 1 ou à 0, la covariance est donnée
par
P
N
xi yi
i=1
Cov (X; Y ) = (x y)
N
Remarques
] La covariance de X avec elle même est la variance de X:

Ahlème Bouakkaz 62 Université 20 Août 1955 -Skikda


Chapitre 5. Les distributions statistiques à deux caractères

] La covariance ne peut pas être plus grande que le produit des écarts types
c-à-d
jCov (X; Y )j (X) (Y )

Ainsi si (X) et (Y ) sont déja calculés, il su¢ t de les multiplier l’un par
l’autre et de véri…er que leur produit est supérieur à la covariance.
Exemple 01 : Dans chaque case du tableau, on trouve deux nombres l’un
en petits (l’e¤ectif i j) et l’autre en gras (le produit ij xi yj ).
Par exemple x1 = 8; y1 = 6, 11 = 8 (en petits) et 11 x1 y1 = 8 8 6 = 384
(en gras)
P
XnY 6 11 14 16 18
8 8 2 1 1 0 800
384 176 112 128 0
10 4 16 2 0 1 2460
240 1760 280 0 180
16 3 10 15 8 5 8896
288 1760 3360 2048 1440
20 2 4 14 3 1 6360
240 880 3920 960 360
24 4 5 6 5 2 6696
576 1320 2016 1920 864
32 3 1 2 8 2 7072
576 352 896 4096 1152
42 0 0 6 4 2 7728
0 0 3528 2688 1512
P
2304 6248 14112 11840 5508 40012

Ahlème Bouakkaz 63 Université 20 Août 1955 -Skikda


Chapitre 5. Les distributions statistiques à deux caractères

P
7 P
5
ij xi yj
i=1j=1
Cov (X; Y ) = (xM y M )
N
40012
= (20:04) (12:693) = 12:379 fruit feuille
150
Exemple 02 :
P
N
xi yi
i=1
Cov (X; Y ) = (x y) = 115:064 (1:675) (68:4) = 0:494 m kg
N

5.6 Coe¢ cient de corrélation linéaire


Le coe¢ cient de corrélation linéaire (noté ) sert à mesurer l’intensité de la
relation (quand elle existe) entre deux séries de données pour voir la corré-
lation ou l’indépendance des variables.
Cas d’une population à e¤ectif fort
Cov (X; Y )
=
M (X) M (Y )

Cas d’une population à faible e¤ectif

Cov (X; Y )
=
(X) (Y )
Remarque. On a 1 +1, de plus
Si = 0 : il n’y a pas de relation entre les variables X et Y (indépendance)

n’est pas linéaire

Ahlème Bouakkaz 64 Université 20 Août 1955 -Skikda


Chapitre 5. Les distributions statistiques à deux caractères

Si = 1 : il y a une relation forte et positive ( X et Y varient dans le


même sens)

linéaire

- Si ' 1 : il y a une relation forte et positive mais n’est pas linéaire.

n’est pas linéaire

- Si = 1 : il y a une relation forte et négative ( X et Y varient dans le


sens contraire)

linéaire

Ahlème Bouakkaz 65 Université 20 Août 1955 -Skikda


Chapitre 5. Les distributions statistiques à deux caractères

Exemple 01 :

Cov (X; Y ) 12:379


= = = 0:367:
M (X) M (Y ) (9:36) (3:60)
Nous déduisons de ce résultat que, pour les fraisiers, il n’ya pas de corrélation
linéaire entre le nombre de leurs feuilles et le nombre de leurs fruits.

5.7 Ajustement linéaire


Type d’ajustements
On peut penser à beaucoup d’ajustements :
Ajustement linéaire
Ajustement non linéaire (exponentiel, logarithmique, polynomial,...)
Ajustement ou régression à l’aide d’une droite
La nature de l’ajustement dépend de la forme du nuage de points. Essentiel-
lement, on étudiera ici les ajustements linéaires (ou ceux qui s’y raménent).
On approchera donc le nuage par une droite...
La droite d’ajustement par la méthode des moindres carrés de la variable Y
en X a pour équation
Y = aX + b;


Cas d’une population à e¤ectif fort
8
< a = Cov (X; Y )
>
V arM (X)
>
: b=y
M
a x M

Cas d’une population à faible e¤ectif


8
< a = Cov (X; Y )
>
V ar (X)
>
: b=y a x

Ahlème Bouakkaz 66 Université 20 Août 1955 -Skikda


Chapitre 5. Les distributions statistiques à deux caractères

La droite d’ajustement par la méthode des moindres carrés de la variable X


en Y a pour équation
X = aY + b;


Cas d’une population à e¤ectif fort
8
< a = Cov (X; Y )
>
V arM (Y )
>
: b=x
M
a y M

Cas d’une population à faible e¤ectif


8
< a = Cov (X; Y )
>
V ar (Y )
>
: b=x a y

Ahlème Bouakkaz 67 Université 20 Août 1955 -Skikda


2eme année Écologie et Environnement Année universitaire 2023 2024

Biostatistique

Serie1

Exercice 01 :
Déterminer la population étudiée, l’individu, le caractère et donner sa nature parmi les données suivantes:
1) La durée de vie des tubes de télévision fabriqués par une usine.
2) Les salaires annuels des enseignants d’une école.
3) La longueur de 200 boulons produits par une usine.
4) Le poids des chenilles.
5) La couleur des cartables des élèves d’une classe.
6) Le sport pratiqué par chacun des élèves d’une école.
7) Le volume des boites de conserve fabriquées par une usine.
8) Le nombre d’habitants par commune.
9) Le nombre de travailleurs d’une usine selon la quali…cation.
10) Le nombre de véhicules en circulation dans un pays selon la marque.
11) Classi…cation des régions d’un pays selon la pluviométrie annuelle.
12) Classi…cation des partis politiques selon leur nombre de voix aux élections.
13) Classi…cation des étudiants selon le lieu de résidence.
14) Classi…cation des lycées d’un pays selon le taux de succès au bac.

Exercice 02 :
La decendance en deuxième génération d’un croisement entre Mu‡iers "ivoire" et "rouge" a donné les résultats suivants:
P
Phénotype Rouge Rose pâle Ivoire
Nombre observé 22 52 23 97

Représenter graphiquement cette série statistique par le radar, secteur circulaire et les tyaux d’orgue des fréquences absolues.

Exercice 03 : Le tableau ci-dessus a donné la situation du personnel médical et paramédical en Algérie selon la nationalité au
1er Janvier 1979 dans le secteur public.

Quali…cation Nationalité Total


Algériens Etrangers
Personnel médical 2813 1774 4587
Techniciens para-médicaux 1713 39 1752
Agents para-médicaux spécialisés 314 17 331
Agents para-médicaux 9989 143 10132
Aides para-médicaux 9653 20 9673
Total 24482 1993 26475

1/ Dé…nir l’unité statistique et le caractère.


2/ Calculer les fréquences relatives, puis interpréter les résultats obtenus. Source: O.N.S.-Alger 1980.

Exercice 04 : On a dénombré chez un individu 1000 leucocytes, et on s’est interressé à leur catégorie.

Catégorie des leucocytes Neutrophiles Eosinophiles Basophiles Lymphocytes Monocytes


e¤ectifs 600 20 10 110 260

1/ Déterminer la population statistique. Quel est le caractère étudié? préciser sa nature.


2/ Représenter graphiquement cette série statistique.
Exercices supplémentaires

Exercice 01 :
Le recensement de 1987 de la population étrangère résidente en Algérie a permis de déterminer les nationalités suivantes:
Marocaine, Tunisienne, Française, Allemande, Italienne, Palestinienne et autres.
Déterminer la population étudiée, l’individu, le nombre de modalités, le caractère et donner sa nature.

Exercice 02 : La représentation des élèves du lycée en fonction de la langue vivante étudiée est donnée par:

Langues Anglais Allemand Espagnol Italien Divers Total


E¤ectifs 934 351 205 69 41 1600

Faire une représentation graphique des données.

Exercice 03 :
L’analyse du sang de 100 individus à donné les résultats suivants:

Groupe sanguin O A B AB
E¤ ectif 40 43 12 5

1/ Dé…nir la population étudiée, le caractère et donner sa nature.


2/ Représenter graphiquement cette série statistique par les tuyaux d’Orgue des fréquences relatives, les secteurs angulaires et
les secteurs éclatés.

Exercice 04 : Après dénombrement, la répartition des travailleurs d’une entreprise selon la quali…cation a été comme suit: 10
ingénieurs, 30 employés, 140 ouvriers et 20 techniciens.
1/ Dé…nir la population étudiée, les modalités, le caractère et donner sa nature.
2/ Dresser le tableau statistique et représenter cette série par des secteurs angulaires, des secteurs éclatés et par les tuyaux
d’Orgue des fréquences relatives.
2eme année Écologie et Environnement Année universitaire 2023 2024

Corrige type de la serie 1

Exercice 01 :

Population Individu Caractère Nature du caractère


1 Les tubes de télévision Le tube La durée de vie des tubes Quantitatif continu
2 Les enseignants L’enseignant Les salaires annuels Quantitatif continu
3 Les 200 boulons Le boulon La longueur Quantitatif continu
4 Les chenilles La chenille Le poids Quantitatif continu
5 Les cartables Le cartable La couleur Qualitatif
6 Les élèves L’élève Le sport pratiqué Qualitatif
7 Les boites de conserve La boite Le volume Quantitatif continu
8 Les communes La commune Le nombre d’habitants Quantitatif discret
9 Les travailleurs Le travailleur La quali…cation Qualitatif
10 Les véhicules Le véhicule La marque. Qualitatif
11 Les régions La région La pluviométrie annuelle en mm Quantitatif continu
12 Les partis politiques Le parti Le nombre de voix Quantitatif discret
13 Les étudiants L’étudiant Le lieu de résidence Qualitatif
14 Les lycées Le lycée Le taux de succés au bac Quantitatif discret

Exercice 02 :
i
Modalité ni i
2
Rouge 22 81:5 40:75
Rose pâle 52 193 96:5
Ivoire
P 23 85:5 42:75
P 97 360 180
=N 1

Radar des e ectifs

Secteurs circulaires
Semi secteurs circulaires

Tyaux d’Orgue

Exercice 02 :
1/ L’unité statistique est le travailleur médical qui est décrit selon deux caractères: la quali…cation et la nationalité.
2/ En calculant les fréquences relatives, le tableau statistique deviendrait alors:
Distribution des travailleurs médicaux de la Santé Publique selon la quali…cation et la nationalité.
Quali…cation Nationalité Total
Algériens Etrangers
fi fi
Personnel médical 0:114 61:3% 0:890 38:7% 0:173 100%
Techniciens para-médicaux 0:069 97:7% 0:019 2:3% 0:066 100%
Agents para-médicaux spécialisés 0:012 94:86% 0:008 5:14% 0:012 100%
Agents para-médicaux 0:408 98:59% 0:071 1:41% 0:382 100%
Aides para-médicaux 0:394 99:79% 0:01 0:21% 0:365 100%
Total 0:997 ' 1 92:47% 0:998 ' 1 7:53% 0:998 ' 1

Interprétation des résultats:


L’ensemble des travailleurs du secteur médical de la Santé Publique sont en grande majorité algériens soit 92:5%
Le personnel médical (médecins...) étranger est important au regard des autres quali…cations et représente 38:7% de l’ensemble.
Le personnel de faible quali…cation comme les agents para-médicaux et les aides para-médicaux est constitué presque exclusive-
ment d’algériens et représente respectivement 98:59% et 99:79 de l’ensemble. Il représente également la majorité des travailleurs
du secteur sanitaire, soit près de 75%:

Exercice 04 :
Le type du caractère: le caractère est qualitatif

Catégorie des leucocytes i


i i
(modalités) 2
Neutrophiles 600 216 108
Eosinophiles 20 7:2 ' 7:5 3:75
Basophiles 10 3:6 ' 3:5 1:75
Lymphocytes 110 39:6 ' 39:5 19:75
Monocytes
P 260 93:6 ' 93:5 46:75
P 1000 360 180
=1000 1
Aneaux des catégories des leucocytes
Diagramme à bande des i

Radar des e¤ectifs


Exercices supplémentaires
Exercice 01 :
La population étudiée: les étrangers résidants en Algérie.
L’individu: l’étranger.
Le nombre de modalités: 7 modalités.
Le caractère: la nationalité.
La nature du caractère: qualitative.

Exercice 02 :
Langues E¤ectifs Fréquences relatives fi fi % i
Anglais 934 0; 584 58:4% 210; 150
Allemand 351 0; 219 21:9% 78; 975
Espagnol 205 0; 128 12:8% 46; 125
Italien 69 0; 043 04:3% 15; 525
Divers 41 0; 026 02:6% 9; 225
Total 1600 1; 000 100% 360
Total/1600 1
Exercice 03 :
Groupe Sanguin i fi i
O 40 0:4 144
A 43 0:43 155 La population étudiée: 100 individus.
B 12 0:12 43 Le caractère: le groupe sanguin.
AB 5 0:05 18 La nature du caractère: qualitative.
P
P 100 1 360
=100 1

Exercice 04 : La population étudiée: 200 travailleurs.


Les modalités: il y a 4 modalités, ingénieurs, employés, ouvriers et techniciens:
Le caractère: la quali…cation.
La nature du caractère: qualitative.

Modalités i fi i
Ingénieurs 10 0:05 18
Employés 30 0:15 54
Ouvriers 140 0:7 252
Techniciens
P 20 0:1 36
P 200 1 360
=200 1
Tuyaux d’orgue des frquences relatives.
2eme année Écologie et Environnement Année universitaire 2023 2024
Biostatistique

Serie2

Exercice 01 : L’étude du nombre d’enfants dans chaque famille d’une trentaine de familles habitant le même immeuble, a donné
les résultats suivants:
xi 0 1 2 3 4 5 7
i 6 4 7 9 2 1 1
1) Dé…nir la population étudiée, le caractère et donner son type.
2) Construire le diagramme di¤érentiel des fréquences relatives, le polygone des e¤ectifs et le diagramme intégral des fréquences
relatives cumulées.

Exercice 02 : Dans l’étude du parasitisme des chataignes par les balanins, on s’intéresse au nombre de parasites présents dans
un fruit et on a obtenu les résultats ci-après
Nombre de parasites 0 1 2 3 4 5 6 7
E¤ectif partiel 82 55 30 16 9 5 2 1
1/ Quelle est la nature du caractère étudié.
2/ Tracer le diagramme di¤érentiel des fréquences absolues et le polygône des e¤ectifs.
3/ Tracer le diagramme intégral des fréquences relatives.

Exercice 03 : La répartition de 200 capsules de pavots suivant le nombre de rayons stigmatiques a donné le tableau suivant:
Nombre de rayons 8 9 10 11 12 13 14 15 16 17 T otal
Fréquence absolue 5 11 16 26 34 36 30 22 12 8 200
1/ Constriure le diagramme di¤érentiel des fréquences relatives et le polygône des e¤ectifs.
2/ Calculer le mode et la moyenne arithmétique.

Exercice 04 : On a noté de 0 à 5 une section de 100 étudiants. On a obtenu le tableau suivant:


Notes 0 1 2 3 4 5
c
i % 5 20 50 85 95 100
1. Quelle est la nature du caractère étudié.
2. Déterminer le mode, la médiane, les quartiles et l’écart-type.

Exercice 05 : On a mesuré la tension artérielle de 20 patients dans les même conditions et on a trouvé les résultats suivants:
xi 7 8 9 10 11 12 13 14 15 17
i 1 2 3 4 2 3 2 1 1 1
1/ Dé…nir la population, le caractère et donner sa nature.
2/ Déterminer le mode, la médiane, les quartiles et la moyenne arithmétique.
3/ Déterminer l’écart-type et le coe¢ cient de variation.

Exercice 06 : L’étude de la répartition du nombre de petits dans une portée de souris a donné le tableau suivant:
Nombre de petits P
1 2 3 4 5 6 7 8 9
d’une portée
Nombre de
7 11 16 17 26 31 11 1 1 121
portées observées
1/ Dé…nir la population étudiée et le caractère.
2/ Construire le diagramme di¤érentiel des e¤ectifs de cette série.
3/ Déterminer le mode et la médiane.
4/ Calculer la moyenne arithmétique et la variance.
2eme année Écologie et Environnement Année universitaire 2023 2024

Corrige type de la serie 2

Exercice 01 :
1) La population étudiée est l’ensemble de trente familles.
Le caractère est le nombre d’enfants dans chaque famille.
Le type est quantitatif discret.
2) Le tableau statistique:
xi i fi fic %
0 6 0:2 0:2
1 4 0:133 0:333
2 7 0:233 0:566
3 9 0:3 0:866
4 2 0:066 0:932
5 1 0:033 0:965
P7 1 0:033 0:998
P 30 0:998
=30 1
Comme le caractère est quantitatif discret, alors le diagramme di¤érentiel est le "diagramme en bâtons" et le diagramme intégral
est la "courbe en escalier".
Diagramme di¤érentiel:

Diagramme intégral:

Courbe en escalier des fréquences relatives cumulées croissantes


Exercice 02 :
1/ La nature du caractère est quantitative discrète.
2/ Le tableau statistique:
xi i fi fic %
0 82 0:41 0:41
1 55 0:275 0:685
2 30 0:15 0:835
3 16 0:08 0:915
4 9 0:045 0:96
5 5 0:025 0:985
6 2 0:01 0:995
7
P 1 0:005 1
P 200 1
=200 1
Comme le caractère est quantitatif discret, alors le diagramme di¤érentiel est le "diagramme en bâtons" et le diagramme intégral
est la "courbe en escalier".
Diagramme di¤érentiel:

Diagramme en bâtons des i

Diagramme intégral:

Courbe en escaliers des fréquences relatives cumulées croissantes


Exercice 03 : Répartition de 200 capsules de pavots suivant le nombre de rayons stigmatiques.

Nombre de rayons xi E¤ectif i Fréquence relative fi i xi fi xi


5
8 5 = 0:025 40 0:2
200
11
9 11 = 0:055 99 0:495
200
16
10 16 = 0:080 160 0:8
200
26
11 26 = 0:130 286 1:43
200
34
12 34 = 0:170 408 2:04
200
36
13 36 = 0:180 468 2:34
200
30
14 30 = 0:150 420 2:1
200
22
15 22 = 0:110 330 1:65
200
12
16 12 = 0:060 192 0:96
200
8
17 8 = 0:040 136 0:68
200
Total 200 1 2539 12:695
Total 200
=1 12:695
200 200
1/ Comme le caractère est quantitatif discret, alors le diagramme di¤érentiel est le "diagramme en bâtons"

Polygône des i

2/ Le mode: Comme nmax = n6 = 36; alors

M o = 13 rayons:
La moyenne arithmétique pondérée:

P
10
ni xi
i=1 2539
x = = = 12:695 rayons
N 200
10
X
= fi xi = 12:695 rayons:
i=1

Exercice 04 :
Tableau statistique
c%
xi i i i xi i x2i
0 5 5 0 0
1 15 20 15 15
2 30 50 60 120
3 35 85 105 315
4 10 95 40 160
5
P 5 100 25 125
100 245 735
P
=100 1 2:45 7:35
1. La nature est quantitative discrète.
2. Le mode: Comme nmax = n1 = 35; alors M o = 3:
x50 + x51 2+3
La mediane: Comme N = 2p = 2 (50) alors M e = = = 2:5
2 2
Les quartiles
N 100
= = 25 =) Q1 = x25 = 2
4 4
Q2 = M e = 2:5
3N 3 (25)
= = 75 =) Q3 = x75 = 3
4 4
L’écart-type:

La moyenne arithmétique La variance L’écart-type:


P
6 P6
ni xi ni x2i
i=1 i=1 2
p
x= = 2:45 V ar(x) = (x) = 1:35 (x) = V ar(x) = 1:16
N N
Exercice 05 :
c%
xi i i i xi i x2i
7 1 1 7 49
8 2 3 16 128
9 3 6 27 243
1) La population est constituée de l’ensemble 10 4 10 40 400
de 20 patients. 11 2 12 22 242
Le caractère est les mesures de la tension 12 3 15 36 432
artérielle. 13 2 17 26 338
Sa nature est quantitatif discret. 14 1 18 14 196
15 1 19 15 225
17
P 1 20 17 289
P 20 220 2542
=20 1 11 127:1
2) M0 = 10 u.m puisque max =4
x10 + x11 10 + 11
Comme N = 2p = 2 (10) alors M e = = = 10:5 u.m:
2 2
Les quartiles
N 20
= = 5 =) Q1 = 9 u.m
4 4
Q2 = M e = 10:5 u.m
3N 3 (20)
= = 15 =) Q3 = 12 u.m
4 4
La moyenne arithmétique La variance
P
10
ni xi P
10
ni x2i
i=1 220 i=1 2 2
x= = = 11 u:m V ar(x) = N (x) = 127:1 121 = 6:1 (u:m)
N 20
3)
LՎcart-type: Le cϢ cient variation:
p p 100 (x) 100 2:469
(x) = V ar(x) = 6:1 = 2:469 u:m C:V = = = 22:445 % ' 22:5 %
x 11
Exercice 06 :
1: La population étudiée est 121 portées.
Le caractère est le nombre de petits d’une portée.
c%
xi i i i xi i x2i
1 7 7 7 7
2 11 18 22 44
3 16 34 48 144
4 17 51 68 272
5 26 77 130 650
6 31 108 186 1116
7 11 119 77 539
8 1 120 8 64
9
P 1 121 9 81
P 121 555 2917
=121 1 4:586 24:107

2. Le diagramme di¤érentiel

3.
Le mode: C’est la valeur de la variable statistique qui a le plus grand e¤ectif ce qui implique que M0 = 6 petits (puisque
i = 31):
La mediane: Comme N = 2p + 1 = 2 (60) + 1 alors M e = x61 = 5 petits.
4. La moyenne arithmétique
P9
ni xi
i=1 555
x= = = 4:586 petits.
N 121
La variance
P9
ni x2i
i=1 2 2
V ar(x) = (x) = 24:107 21:031 = 3:076 (petits)
N
2eme année Écologie et Environnement Année universitaire 2023 2024

Biostatistique

Serie 3

Exercice 01 : A…n d’étudier la structure de la population de gélinottes huppées (Bonasa umbellus) abattues par les chasseurs
canadiens, une étude du dimorphisme sexuel de cette espèce a été entreprise. Parmi les caractères mesurés …gure la longueur de
la rectrice centrale (plume de la queue). Les résultats observés exprimés en millimètres sur un échantillon de 50 mâles juvéniles
sont notés dans la série suivante:
140 148 150 150 150 151 153 153 154 154 163 167 167
154 155 155 155 155 155 155 156 156 156 164 164 170
157 157 157 156 176 178 158 159 160 160 170 169 174
160 161 161 161 161 161 163 163 163 163 164

1) Dé…nir la population étudiée et le caractère. Quelle est la nature du caractère étudié.


2) Regrouper les données de la série statistique en classes de même amplitude puis construire le diagramme di¤érentiel des
e¤ectifs.
3) Calculer le mode, la moyenne arithmétique, la médiane et les quartiles.
4) Calculer la variance, l’écart type et le coe¢ cient de variation.

Exercice 02: Le taux de glucose sanguin (glycémie) déterminé chez 32 sujets est donné ci-dessous en g=l.

0:85 0:97 1:01 1:14 0:93 1:03 1:13 0:99


0:90 1:08 0:98 1:04 1:19 0:94 1:07 1:15
1:10 1:14 0:87 1:20 0:94 1:10 1:00 1:03
1:03 0:97 1:17 1:06 0:98 1:14 0:95 1:11

1) Dé…nir la population étudiée et le caractère puis donner son type. Quel est l’étendue de cette série?.
2) Regrouper les données de la série statistique dans des classes de même amplitude.
3) Représenter graphiquement cette série (tracer le diagramme di¤érentiel des e¤ectifs) et tracer la courbe cumulée croissante
des e¤ectifs cumulés croissants.
4) Calculer la moyenne, la médiane et l’écart-type.

Exercice 03 : L’étude de la répartition de 40 exploitations agricoles selon leur super…cie en hectares a donné le tableau suivant:

Surface en ha [10; 20[ [20; 30[ [30; 40[ [40; 50[ [50; 60[ [60; 70[ [70; 80[
E¤ectif i 10 5 18 3 1 2 1

1) Tracer le diagramme di¤érentiel des fréquences relatives et le diagramme intégral des e¤ectifs:
2) Déterminer et interpréter les indicateurs suivants: le mode, la médiane, la moyenne arithmétique et l’ecart-type.

Exercice 04: Un lac naturel a été exploité pour l’élevage de poissons. Deux ans après y avoir introduit les premiers spécimen,
on a procédé à un prélèvement aléatoire d’un échantillon de 200 poissons. Chaque poisson capturé est pesé, marqué et ensuite
relaché dans le lac. De cette manière un poisson ne peut être pris et pesé plus d’une fois. Les pesées ont été rapportées dans le
tableau suivant:
Poids (en Kg) [0:1; 0:3[ [0:3; 0:5[ [0:5; 0:7[ [0:7; 0:9[ [0:9; 1:5[
Nombre de poissons 8 82 24 80 6
1) Dé…nir la population et le caractère puis donner sa nature.
2) Déterminer le mode, la médiane, les quartiles et la moyenne arithmétique des mesures faites.
3) Déterminer l’écart-type et le coe¢ cient de variation.
Exercices supplementaires

Exercice 01 : On a mesuré sur 200 consultants d’un service hospitalier le taux de fer sérique en g=100 ml: On a obtenu la
série statistique suivante, présentée sous la forme d’une série à valeurs classées:

Classes [60; 80[ [80; 100[ [100; 110[ [110; 120[ [120; 130[ [130; 140[ [140; 150[ [150; 170[ [170; 190[
E¤ectifs 6 12 24 30 52 36 20 16 4

1) Déterminer la ou les classes modales et le taux de fer sérique médian de cet échantillon.
2) Déterminer la moyenne et la variance du taux de fer sérique de cet échantillon.

Exercice 02 : L’étude du poids de 50 personnes a donné les résultats suivants:


Classes (en kg) i
1) Dé…nir la population étudiée, le caractère et
[37; 46[ 2
donner sa nature:
[46; 55[ 4
2) Tracer le diagramme di¤érentiel des i
[55; 64[ 8
et le diagramme intégral des c%i [64; 73[ 14
3) Calculer le mode, la médiane, les quartiles
[73; 82[ 11
et la moyenne arithmétique:
[82; 91[ 7
4) Calculer le coe¢ cient de variation.
[91; 100[ 4

Exercice 03 : Soit la distribution des travailleurs d’une entreprise selon la durée en jours du congé de maladie pendant une
année.
2 2 2 2 2 2 2 2 3 3 3 3 3 3 3
3 3 3 4 4 4 4 4 4 4 4 4 5 5 5
5 5 6 6 6 6 6 6 6 7 7 7 7 8 8
8 8 9 9 10 10 10 10 11 11 12 12 13 14 15
1) Regrouper les données de la série statistique en classes de même amplitude.
2) Calculer le mode, la moyenne arithmétique, la médiane et les quartiles.
3) Calculer la variance et le coe¢ cient de variation.

Exercice 04 : Soit le tableau statistique ci-dessous, où représente un chi¤re manquant

Classes [0; 5[ [5; 10[ [10; 15[ [15; 20[


E¤ectif 2 6 7

Sachant que x = 12:5, trouver , le chi¤re manquant du tableau.

Exercice 05: Les valeurs de la longueur totale de 50 individus de l’espèce de crevette "Aristeus antennatus" exprimées en mm
et rangées dans l’ordre croissant sont:

122 124 127 130 131 133 133 135 136 136
140 141 141 141 142 142 144 145 148 148
150 150 150 150 150 151 151 152 153 153
154 155 156 156 158 158 158 159 160 160
162 163 163 166 167 167 168 172 175 177

1) Dé…nir la population étudiée et le caractère puis donner sa nature.


2) Regrouper les données de la série statistique en classes de même amplitude.
3) Tracer le diagramme di¤érentiel des fréquences relatives et le diagramme intégral des e¤ectifs.
4) Déterminer le mode, la médiane, les quartiles et la moyenne arithmétique.
5) Calculer l’écart-type et le coe¢ cient de variation.
2eme année Écologie et Environnement Biostatistique Année universitaire 2021 2022
Corrige type de la serie 3

Exercice 01 :
140 148 150 150 150 151 153 153 154 154
154 155 155 155 155 155 155 156 156 156
156 157 157 157 158 159 160 160 160 161
161 161 161 161 163 163 163 163 163 164
164 164 167 167 169 170 170 174 176 178
1) La population est 50 mâles juvéniles.
Le caractère est la longueur de la rectrice centrale.
Le type: le caractère est quantitatif continu.
2) Le nombre de classes:
Formule 1 : N C1 = 1 + (3:3
p log N ) =p 1 + (3:3 log 50) = 6:606 ' 7 classes
Formule 2 : N C2 = p2:5 4p N = 2:5 4 50 = 6:647 ' 7 classes
Formule 3 : N C3 = N = 50 = 7:071 ' 7 classes
] L’amplitude de chaque classe:
E 178 140 38
A= = = = 5:42'5:5 mm.
NC NC 7
c%
Classes i ci i i ci c2i
i
[140; 145:5[ 1 142:75 1 142:75 20377:562
[145:5; 151[ 4 148:25 5 593 87912:25
[151; 156:5[ 16 153:75 21 2460 378225
[156:5; 162[ 13 159:25 34 2070:25 329687:312
[162; 167:5[ 10 164:75 44 1647:5 271425:625
[167:5; 173[ 3 170:25 47 510:75 86955:187
[173;
P 178:5[ 3 175:75 50 527:25 92664:187
P 50 7951:5 1267247:123
=50 1 159:03 25344:942
Comme le caractère est quantitatif continu, alors le diagramme di¤érentiel est l’histogramme.

Histogramme des ni

3) Le mode:

La classe modale : c’est la classe qui a le plus grand e¤ectif (ou fréquence) c-à-d M o 2 [151; 156:5[ (nmax = 16):
d1 16 4
M o = xm + Am = 151 + 5:5
d1 + d2 (16 4) + (16 13)
12
= 151 + 5:5 = 155:4 mm 2 [151; 156:5[ .
15
M o = 155:4 mm.

N
La médiane: = 25 =) M e 2 [156:5; 162[
2
(xm+1 xm ) N 5:5
M e = xm + nc%
m 1 = 156:5 + (25 21)
nm 2 13
M e = 158:192 mm

Les quartiles:

N
= 12:5 =) Q1 2 [151; 156:5[
4
(xm+1 xm ) N 5:5
Q1 = xm + nc%
m 1 = 151 + (12:5 5)
nm 4 16
Q1 = 153:578 mm
Q2 = M e = 158:192 mm
3N
= 37:5 =) Q3 2 [162; 167:5[
4
(xm+1 xm ) 3N 5:5
Q3 = xm + nc%
m 1 = 162 + (37:5 34)
nm 4 10
Q3 = 163:925 mm

La moyenne arithmétique:
P
7
ni ci
i=1 7951:5
x= = = 159:03 mm
N 50
x = 159:03 mm
4) La variance:

P
7
ni c2i
2 i=1 2
V ar(x) = (x) = (x) = 25344:942 25290:540
N
2
= 54:402 (mm)

L’écart-type: On a
p p
(x) = V ar(x) = 54:402 = 7:375 mm
Le cϢ cient de variation: On a
100 (x) 100 7:375
C:V = = = 4:637 %
x 159:03
Exercice 02:
1) La population est l’ensemble de 32 sujets, le caractère est le taux de glucose sanguin et l’étendue est donnée par

E = xmax xmin = 1:20 0:85 = 0:35 g=l

2) Le nombre de classes:
Formule 1 : N C1 = 1 + (3:3
p log 32) = 5:966 ' 6 classes
Formule 2 : N C2 = 2:5 4 32 = 5:946 ' 6 classes
] L’amplitude de chaque classe:
E 1:20 0:85 0:35
A= = = = 0:058'0:06 g=l.
NC NC 6
0:85 0:87 0:90 0:93 0:94 0:94 0:95 0:97
0:97 0:98 0:98 0:99 1:00 1:01 1:03 1:03
1:03 1:04 1:06 1:07 1:08 1:10 1:10 1:11
1:13 1:14 1:14 1:14 1:15 1:17 1:19 1:20
c%
Classes i fi i ci i ci i c2i
[0:85; 0:91[ 3 0:0937 3 0:88 2:64 2:323
[0:91; 0:97[ 4 0:125 7 0:94 3:76 3:534
[0:97; 1:03[ 7 0:2187 14 1 7 7
[1:03; 1:09[ 7 0:2187 21 1:06 7:42 7:865
[1:09; 1:15[ 7 0:2187 28 1:12 7:84 8:780
[1:15;
P 1:21[ 4 0:125 32 1:18 4:72 5:569
P 50 1 33:38 35:071
=32 1 1:0431 1:095
3)

4) La moyenne arithmétique:
P
6
ni ci
i=1 33:38
x= = = 1:0431 g=l
N 32
N
La médiane: = 16 =) M e 2 [1:03; 1:09[
2
(xm+1 xm ) N 0:06
M e = xm + nc%
m 1 = 1:03 + (16 14) = 1:0471 g=l
nm 2 7
L’écart-type:
p
(x) = V ar(x)

P
6
ni c2i
2 i=1 2 2
V ar(x) = (x) = (x) = 1:095 1:088 = 0:007 (g=l)
32
Par conséquent p
(x) = 0:007 = 0:083 g=l
Exercice 3 :
Le tableau statistique
c%
Classes i i ci ici i c2i fi
[10; 20[ 10 10 15 150 2250 0:25
[20; 30[ 5 15 25 125 3125 0:125
[30; 40[ 18 33 35 630 22050 0:45
[40; 50[ 3 36 45 135 6075 0:075
[50; 60[ 1 37 55 55 3025 0:025
[60; 70[ 2 39 65 130 8450 0:05
[70;
P80[ 1 40 75 75 5625 0:025
P 40 1300 50600 1
=40 1 32:5 1265
1) La representation graphique: Comme le caractère est quantitatif continu, alors le diagramme intégrale est l’histogramme
et le diagramme intégral est la courbe cumulative (sigmoïde).

2)
a/ Le mode: On détermine d’abord la classe modale (la classe qui a le plus grand e¤ectif ou fréquence) c-à-d M o 2 [30; 40[
d1 18 5 13
M o = xm + Am = 30 + 10 = 30 + 10 = 34:642 ha
d1 + d2 (18 5) + (18 3) 28
Interprétation: La majorité des exploitations enquêtées ont une super…cie de 34:642 ha:
N
b/ La médiane: On détermine d’abord la classe médiane. On a = 20, alors M e 2 [30; 40[ :
2
Am N c% 10
M e = xm + m 1 = 30 + (20 15) = 32:777 ha
m 2 18
Interprétation: La moitié des exploitations ont une super…cie supérieure à 32:777 ha tandis que l’autre moitié ont une super…cie
inférieure à 32:777 ha.
c/ La moyenne arithmétique:
P7
ni ci
1300
x = i=1 = = 32:5 ha
N 40
Interprétation: les exploitations ont une super…cie moyenne de 32:5 ha.
d/ La variance:
P
7
ni c2i
2 i=1 2 14260 2 2
V ar(X) = (X) = (x) = (32:5) = 1265 1056:25 = 208:75 (ha kg)
N 40
L’écart-type:
p p
(X) = V ar(x) = 208:75 = 14:448 ha
Interprétation: les exploitations varient par rapport à la valeur moyenne de 14:448 ha de plus ou de moins.

Exercice 04 :
1) La population est 200 poissons.
Le caractère est le poids.
Sa nature est quantitative continue.
Tableau statistique
0 i
Classes i fi fic % Ai i = ci c
i % i ci i c2i
Ai
[0:1; 0:3[ 8 0:04 0:04 0:2 40 0:2 8 1:6 0:32
[0:3; 0:5[ 82 0:41 0:45 0:2 410 0:4 90 32:8 13:12
[0:5; 0:7[ 24 0:12 0:57 0:2 120 0:6 114 14:4 8:64
[0:7; 0:9[ 80 0:4 0:97 0:2 400 0:8 194 64 51:2
[0:9;
P 1:5[ 6 0:03 1 0:6 10 1:2 200 7:2 8:64
P 200 1 120 81:92
=N 1 0:6 0:409
0 0
2) La classe modale : M o 2 [0:3; 0:5[ puisque nmax = n2 = 410:
0 =Am
1
z }| { d1 370
M o = xm + @xm+1 xm A = 0:3 + 0:2 = 0:412 kg
d1 + d2 (370) + (290)

M o = 0:412 kg
La médiane (notée) M e:
c% N
On détermine d’abord la classe médiane [xm ; xm+1 [ ( la première classe telle que m = 100). M e 2 [0:5; 0:7[
2
(xm+1 xm ) N c% 0:2
M e = xm + m 1 = 0:5 + (100 90) = 0:583 kg
m 2 24

M e = 0:583 kg
Les quartiles:
c% N
On trouve d’abord la classe [xm ; xm+1 [ qui contient Q1 ( la première classe telle que m = 50): Q1 2 [0:3; 0:5[
4
(xm+1 xm ) N c% 0:2
Q1 = xm + m 1 = 0:3 + (50 8) = 0:402 kg
m 4 82
Q2 = M e = 0:583 kg

c% 3N
La classe [xm ; xm+1 [ qui contient Q3 ( la première classe telle que m = 150): Q3 2 [0:7; 0:9[
4
(xm+1 xm ) 3N c% 0:2
Q3 = xm + m 1 = 0:7 + (150 114) = 0:79 kg
m 4 80

Q1 = 0:402 kg
Q2 = 0:583 kg
Q3 = 0:79 kg

La moyenne arithmétique:
P
5
ni ci
i=1 120
x= = = 0:6 kg
N 200
x = 0:6 kg
3) La variance:
P
5
ni c2i
2 i=1 2 2
V ar(x) = x = (x) = 0:409 0:36 = 0:049 (kg)
N
2
V ar(x) = 0:049 (kg)
L’écart type:
p p
(X) = V ar(x) = 0:049 = 0:221 kg

(X) = 0:221 kg

Le cœ¢ cient variation (noté) C:V :

100 (X) 100 0:221


C:V = = = 36:833%
x 0:6

C:V = 36:833% ' 37%


Exercices supplementaires
Exercice 01 :
0 c%
Classes i ai i i ci ici ic2i
[60; 80[ 6 20 0:3 6 70 420 29400
[80; 100[ 12 20 0:6 18 90 1080 97200
[100; 110[ 24 10 2:4 42 105 2520 264600
[110; 120[ 30 10 3 72 115 3450 396750
[120; 130[ 52 10 5:2 124 125 6500 812500
[130; 140[ 36 10 3:6 160 135 4860 656100
[140; 150[ 20 10 2 180 145 2900 420500
[150; 170[ 16 20 0:8 196 160 2560 409600
[170;
P 190[ 4 20 0:2 200 180 720 129600
P 200 25010 3216250
=200 1 125:05 16081:25
1) La classe modale : c’est la classe qui a le plus grand e¤ectif corrigé (ou fréquence corrigée) c-à-d M o 2 [120; 130[ :
La médiane (notée) M e:
N
On détermine d’abord la classe médiane [xm ; xm+1 [ ( la première classe telle que c%
m = 100).M e 2 [120; 130[
2
(xm+1 xm ) N c% 10
M e = xm + m 1 = 120 + (100 72) = 125:38 g=100ml
m 2 52

Donc le taux de fer sérique médian de cet échantillon est 125:38 g=100ml:
2) La moyenne arithmétique:
P9
ni ci X9
i=1
x= = fi ci = 125:05 g=100ml
200 i=1

Donc le taux moyen de fer sérique de cet échantillon est 125:05 g=100ml:
La variance:

P
9
ni c2i 9
X
2 i=1 2 2 2
V ar(x) = x = (x) = fi c2i (x) = 16081:25 15637:50 = 443:75 ( g=100ml) :
200 i=1

2
La variance du taux moyen de fer sérique de cet échantillon est 443:75 ( g=100ml) :
Exercice 02 :
1) La population est 50 personnes, le caractère est le poids.
Sa nature est quantitative continue.
Tableau statistique
c%
Classes i i ci i ci ic2i
[37; 46[ 2 2 41:5 83 3444:5
[46; 55[ 4 6 50:5 202 10201
[55; 64[ 8 14 59:5 476 28322
[64; 73[ 14 28 68:5 959 65691:5
[73; 82[ 11 39 77:5 852:5 66068:75
[82; 91[ 7 46 86:5 605:5 52375:75
[91;
P 100[ 4 50 95:5 382 36481
P 50 3560 262584:5
=50 1 71:2 5251:69
2) Representation graphique: Comme le caractère est quantitatif continu, alors le diagramme di¤érentiel s’appelle "His-
togramme" et le diagramme intégral est la courbe cumulative (sigmoïde).

3) La classe modale : c’est la classe qui a le plus grand e¤ectif (ou fréquence) c-à-d M o 2 [64; 73[
0 =Am
1
z }| { d1 14 8 6
M o = xm + @xm+1 xm A = 64 + 9 = 64 + 9 = 70 kg
d1 + d2 (14 8) + (14 11) 9

M o = 70 kg
La médiane:
c% N
On détermine d’abord la classe médiane [xm ; xm+1 [ ( la première classe telle que m = 25).M e 2 [64; 73[
2
(xm+1 xm ) N c% 9
M e = xm + m 1 = 64 + (25 14) = 71:071 kg
m 2 14

M e = 71:071 kg

c% N
Les quartiles: On trouve d’abord la classe [xm ; xm+1 [ qui contient Q1 ( la première classe telle que m = 12:5):
4
Q1 2 [55; 64[
(xm+1 xm ) N c% 9
Q1 = xm + m 1 = 55 + (12:5 6) = 62:312 kg
m 4 8
Q2 = M e = 71:07 kg

c% 3N
La classe [xm ; xm+1 [ qui contient Q3 ( la première classe telle que m = 37:5): Q3 2 [73; 82[
4
(xm+1 xm ) 3N c% 9
Q3 = xm + m 1 = 73 + (37:5 28) = 80:772 kg
m 4 11

Q1 = 62:312 kg
Q2 = 71:071 kg
Q3 = 80:772 kg
La moyenne arithmétique:
P
7
ni ci 7
X
i=1
x= = fi ci = 71:2 kg
50 i=1

x = 71:2 kg
4) La variance:
P
7
ni c2i 7
X
2 i=1 2 2 2
V ar(x) = x = (x) = fi c2i (x) = 5251:69 5069:44 = 182:25 (kg)
50 i=1

2
V ar(x) = 182:25 (kg)
L’écart type:
p p
(X) = V ar(x) = 182:25 = 13:5 kg
(X) = 13:5 kg
Le cϢ cient variation:
100 (X) 100 13:5
C:V = = = 18:96%
x 71:2
C:V = 18:96%
Exercice 03 :
1) Le nombre de classes:
Formule 1 : N C1 = 1 + (3:3
p log 60) = 6:867 ' 7 classes
Formule 1 : N C2 = 2:5 4 60 = 6:957 ' 7 classes
] L’amplitude de chaque classe:
E 15 2 13
A= = = = 1:857'2 jours/ans.
NC NC 7
Tableau statistique
c%
Classes i i ci i ci i c2i
[2; 4[ 18 18 3 54 162
[4; 6[ 14 32 5 70 350
[6; 8[ 11 43 7 77 539
[8; 10[ 6 49 9 54 486
[10; 12[ 6 55 11 66 726
[12; 14[ 3 58 13 39 507
P 16[
[14; 2 60 15 30 450
P 60 390 3220
=60 1 6:5 53:666
2) La classe modale : c’est la classe qui a le plus grand e¤ectif (ou fréquence) c-à-d M o 2 [2; 4[ :
d1 18 0 18
M o = xm + Am =2+2 =2+2 = 3:636 jours/ans M o 2 [2; 4[ .
d1 + d2 (18 0) + (18 14) 22

M o = 3:636 jours/ans.
La moyenne arithmétique (notée) x :
P
7
ni ci
i=1
x= = 6:5 jours/ans.
60
x = 6:5 jours/ans.
La médiane:
c% N
On détermine d’abord la classe médiane [xm ; xm+1 [ ( la première classe telle que m = 30). M e 2 [4; 6[
2
Am N c% 2
M e = xm + m 1 =4+ (30 18) = 5:714 jours/ans 2 [4; 6[ .
m 2 14
M e = 5:714 jours/ans
Les quartiles:
c% N
On trouve d’abord la classe [xm ; xm+1 [ qui contient Q1 ( la première classe telle que m = 15): Q1 2 [2; 4[
4
(xm+1 N xm ) c% 2
Q1 = xm + m 1 =2+ (15 0) = 3:666 jours/ans 2 [2; 4[
m 4 18
Q2 = M e = 5:714 jours/ans.

c% 3N
La classe [xm ; xm+1 [ qui contient Q3 ( la première classe telle que m = 45): Q3 2 [8; 10[
4
(xm+1 xm ) 3N c% 2
Q3 = xm + m 1 =8+ (45 43) = 8:666 jours/ans 2 [8; 10[
m 4 6

Q1 = 3:666 jours/ans

Q2 = 5:714 jours/ans.

Q3 = 8:666 jours/ans

3) La variance:
P
7
ni c2i
2 i=1 2 2
V ar(x) = x = (x) = 53:666 42:25 = 11:416 (jours/ans)
50
2
V ar(x) = 11:416 (jours/ans)
L’écart type:
p p
(X) = V ar(x) = 11:416 = 3:378 jours/ans

(X) = 3:378 jours/ans


Le cϢ cient de variation:
100 (X) 100 3:378
C:V = = = 51:969%
x 6:5
C:V = 51:969%

Exercice 04 : On a
Classes i ci i ci
[0; 5[ 2 2:5 5
[5; 10[ 7:5 (7:5)
[10; 15[ 6 12:5 75
[15;
P20[ 7 17:5 122:5
15 + 202:5 + (7:5)
P
4
i ci
i=1 202:5 + (7:5)
x= = = 12:5;
N 15 +
et par conséquent
202:5 + (7:5) = (12:5) (15 + ) ;
et partant
202:5 + (7:5) = 187:5 + (12:5) ;
ce qui donne
15 = 5 ;
En…n
= 3:
Exercice 05:
1) La population étudiée est 50 individus de l’espèce de crevette "Aristeus antennatus" et le caractère est la longueur des
crevettes.
2) Le nombre de classes:
Formule 1 : N C1 = 1 + (3:3
p log 50) = 6:606 ' 7 classes
Formule 1 : N C2 = 2:5 4 50 = 6:647 ' 7 classes
] L’amplitude de chaque classe:
E 177 122 55
A= = = = 7:857'8 mm.
NC NC 7

Le tableau statistique
c%
Classes i fi i ci ici c2i
i
[122; 130[ 3 0:06 3 126 378 47628
[130; 138[ 7 0:14 10 134 938 125692
[138; 146[ 8 0:16 18 142 1136 161312
[146; 154[ 12 0:24 30 150 1800 270000
[154; 162[ 10 0:2 40 158 1580 249640
[162; 170[ 7 0:14 47 166 1162 192892
[170;
P 178[ 3 0:06 50 174 522 90828
P 50 1 7516 1137992
=50 1 150:32 22759:84
Comme le caractère est quantitatif continu, alors le diagramme di¤érentiel des fréquences relatives est "l’histogramme des fi "
et le diagramme intégral est la courbe cumulative des c%i (sigmoïde).

4) Le mode: M o 2 [146; 154[ et


d1 (12 8)
M o = xm + Am = 146 + 8 = 151:333 mm
d1 + d2 (12 8) + (12 10)
N
La médiane: = 25 =) M e 2 [146; 154[
2
(xm+1 xm ) N 8
M e = xm + nc%
m 1 = 146 + (25 18) = 150:666 mm
nm 2 12
Les quartiles:

N
= 12:5 =) Q1 2 [138; 146[
4
(xm+1 xm ) N 8
Q1 = xm + nc%
m 1 = 138 + (12:5 10) = 140:5 mm
nm 4 8
Q2 = Me
3N
= 37:5 =) Q3 2 [154; 162[
4
(xm+1 xm ) 3N 8
Q3 = xm + nc%
m 1 = 154 + (37:5 30) = 160 mm
nm 4 10

La moyenne arithmétique:
P
7
ni ci
i=1 7516
x= = = 150:32 mm
N 50
5) L’écart type:
p
(x) = V ar(x)

P
7
ni c2i
2 i=1 2
V ar(x) = (x) = (x) = 22759:84 22596:102
N
2
= 163:738 (mm)

par conséquent p
(x) = 163:738 = 12:796 mm
Le cϢ cient de variation:
100 (x) 100 12:796
C:V = = = 8:512 %
x 150:32

Vous aimerez peut-être aussi