Cours Proba-Stat-M5-GI

Probabilités et Statistiques
Filière: Génie Informatique

Semestre 1
Pr. M. Iguernane
Email: mohamed.iguernane@gmail.com
m.iguernane@uiz.ac.ma
Année Universitaire : 2020-2021
Université Ibn Zohr

Faculté Polydisciplinaire - Taroudant
1/168
Pr. M. Iguernane
Sommaire
Statistique descriptive :
Généralités : Population, Echantillon, Variables, Types de
variables.
Séries statistiques unidimensionnelle : Tableau des distri-
butions, graphiques, paramètres de position, paramètres de
dispersion.
Séries statistiques bi-variées : séries appariées, séries non
appariées, table de contingence, covariance, corrélation, ajus-
tement linéaire par la méthode des moindres carrées.
Eléments de probabilité :
Analyse combinatoire : dénombrement
Calcul des probabilités : événements, équiprobabilité, pro-
babilité conditionnelle, indépendance, Théorème de Bayes.
Variables aléatoires réelles discrètes : Principales loi de pro-
babilité, fonction de répartition, espérance mathématique,
variance, écart-type
2/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
PARTIE I :
Statistique descriptive
3/168
Pr. M. Iguernane
Chapitre 1 :
Vocabulaire de la
statistique descriptive
4/168
Pr. M. Iguernane
1-1 Introduction
Le mot statistique a été créé au 18ème siècle par le Professeur

allemand GOTTERIED ACHENWAL. Mais la statistique était uti-
lisée bien avant l’invention du terme. En effet, les dénombrements
de population humaine et de terre été réalisés depuis la plus
haute antiquité pour des besoins de la guerre et de l’impôt. Au
19ème siècle, il y a eu l’apparition du calcul des probabilités
qui est étroitement lié aux jeux de hasard. Ceci a donné nais-
sance à une discipline appelée statistique mathématique. Du-
rant cette période, le belge ADOLPHE QUETELET transposa le
calcul des probabilités à l’économie et à la démographie. L’essor
de la statistique a eu lieu au cours du 20ème siècle, et ce grâce
à la naissance et au développement de l’informatique qui a
provoqué une extension considérable des possibilités d’utilisa-
tion des méthodes statistiques et du champ d’application de ces
méthodes. 5/168
Pr. M. Iguernane
La statistique joue un rôle de plus en plus important dans tous

les domaines de l’activité humaine. Elle intervient aujourd’hui
dans l’agriculture, la biologie, les affaires, la chimie, les commu-
nications, l’économie, l’éducation, l’électronique, la médecine, la
pharmacie, la physique, les sciences politiques, la psychologie,
la sociologie, et dans d’autre branche encore de la science et
de la technologie.
On désigne par exemple par économétrie, l’application de la
statistique à l’économie, par sociométrie, psychométrie et bio-
métrie l’application de la statistique respectivement à la socio-
logie, à la psychologie et à la biologie.
6/168
Pr. M. Iguernane
1-2 Définition du champ de la statistique

On divise généralement l’étude de la statistique générale en
deux parties :
La statistique descriptive, qui est l’ensemble des méthodes à
partir desquelles on recueille, ordonne, réduit, et condense les
données.
La statistique mathématique, dont l’objet est de formuler des
lois à partir de l’observation d’échantillons, c’est-à-dire de tirages
limités effectués au sein d’une population.
7/168
Pr. M. Iguernane
1-3 Terminologie
Population et unités statistiques :

En statistique, la population désigne un ensemble d’unités sta-
tistiques. Les unités statistiques sont les entités abstraites qui
représentent des personnes, des populations d’animaux ou des
objets. ”Individu” est parfois employé comme synonyme du
terme ”unité statistique”.
La statistique sert à décrire l’ensemble des unités statistiques
qui composent la population. On commence par compter ces
unités. La première information statistique que l’on tire d’une po-
pulation est en effet le nombre de ses unités.
Echantillons :
On parle d’échantillon d’une population statistique pour désigner
le prélèvement, au hasard ou selon une méthode qui permet
d’assurer la représentativité par rapport à la population totale,
d’un petit nombre d’unités statistiques au sein de la population. 8/168
Pr. M. Iguernane
Critères de classification :
On distingue deux sortes de critères :
1 Les critères quantitatifs.
2 Les critères qualitatifs.
9/168
Pr. M. Iguernane
♣ Les critères quantitatifs sont les critères qui sont représentés

par des nombres et sur lesquels les opérations arithmétiques de
base ont un sens. Les critères quantitatifs sont souvent appelés
variables.On distingue deux sortes de variables quantitatives :
Variable statistique discrète : L’ensemble de ses moda-
lités est fini ou dénombrable.
Exemples : nombre d’enfant par ménage, nombre de pièces
par appartement,...
Variable statistique continue : Elle peut prendre n’importe
quelle valeur dans un intervalle donné. Autrement dit, si
l’ensemble de ses modalités n’est pas dénombrable.
Exemples : L’âge, la taille, le poids d’un individu,...
♣ Les critères qualitatifs sont tous les critères qui ne sont pas
représentés par des nombres. Pour les distinguer des critères
quantitatifs , on les appelle des caractères, (parfois va-
riables ).
10/168
Pr. M. Iguernane
Un caractère qualitatif peut être :

Ordinal : si ses modalités peuvent être naturellement ordonnées.
Exemple : satisfaction plus ou moins grande après l’achat d’un
produit.
Nominal : si ses modalités ne peuvent être naturellement or-
données.
Exemples : état matrimoniale, couleur des yeux,...
11/168
Pr. M. Iguernane
Modes de regroupement des unités statistiques :
Les unités statistiques d’une population peuvent être représent-

ées sous forme d’une série simple ou regroupées. Lorsqu’elles
sont regroupées on les appelle des distributions. Les unités
d’une population peuvent être distribuées par valeurs (lorsque le
critère de regroupement est numérique) ou distribuées par mo-
dalités (lorsque le critère de regroupement n’est pas numérique).
On peut aussi effectuer des regroupements par catégories (ou
classes) de valeurs ou par catégories (ou classes) de moda-
lités. Lorsqu’on effectue une distribution par catégories ou classes
de valeurs, on peut choisir des classes d’égales amplitudes ou
des classes d’inégales amplitudes. L’amplitude de classe est la
différence entre la valeur supérieure et la valeur inférieure de la
classe. Le centre de classe est égal à la somme de la valeur
inférieure et de la valeur supérieure, divisée par deux.
12/168
Pr. M. Iguernane
Chapitre 2 :
Réduction des données
13/168
Pr. M. Iguernane
2-1 Les tableaux et les graphiques
Dans ce paragraphe on va détailler comment résumer l’informa-

tion contenue dans une série de données soit par des tableaux
ou par des graphiques.
Cas de variables qualitatives
On va considérer deux exemples où on a des variables quali-
tatives observées sur un échantillon et suivre le traitement pos-
sible de ces données.
Exemple 1 : On a pris un échantillon de 50 achats de boissons
non-alcoolisées achetées dans une grande surface, en notant
par :
CC=Coca-Cola ; S=Sprite ; CL=Coke-Light ; P=Perrier ; PC=Pepsi-Cola.
On a obtenu les résultats suivants :
CC S PC CL CC CC PC CL CC CL CC CC CC
CL PC CC CC P P S CC CL PC CL P PC
CC PC PC CC PC CC CC PC P PC PC S CC
CC CC S P CL PC CC PC S CC CL
14/168
Pr. M. Iguernane
Alors ici la variable est X = Boisson non-alcoolisée, qui est une

variable qualitative nominale.
Pour présenter ces données sous forme de tableau, on dresse
un tableau, dans la première colonne on énumère les cinq mo-
dalités de la variable, dans la seconde colonne on donne la
fréquence absolue ou l’effectif de chacune des modalités (c’est-
à-dire le nombre de fois que cette modalité se répète dans l’écha-
ntillon) et dans la troisième colonne, on donne la fréquence re-
lative de chacune des modalités.
La fréquence relative d’une modalité étant égale à sa

fréquence absolue divisée par la taille de l’échantillon.
Ce qui donne :
15/168
Pr. M. Iguernane
Remarque 2.1
Pour une présentation complète des tableaux et graphiques, on
doit mettre le titre en haut et la source des données en bas.
En ce qui concerne la représentation graphique, on va donner 16/168
Pr. M. Iguernane
deux graphiques qui résument la même information contenue

dans le tableau des fréquences.
Le diagramme à barres (horizontales ou verticales). Où on
met sur un axe les modalités de la variable et sur l’autre axe
les fréquences absolues ou les fréquences relatives.
Remarque 2.2
Les largeurs des barres doivent être les mêmes pour une belle
esthétique du graphique, ainsi que la distance entre les bandes. On
peut aussi ajouter les fréquences relatives au dessus des bandes.
17/168
Pr. M. Iguernane
Le deuxième graphique qu’on peut faire est le diagramme

à secteurs (ou circulaire) qui est une sorte de tarte où
chaque modalité occupe une partie qui reflète sa fréquence
relative.
18/168
Pr. M. Iguernane
Exemple 2 : Lors d’une enquête de satisfaction de la clientèle,

une compagnie de courtage a demandé à un échantillon de
60 clients d’indiquer leur degré de satisfaction vis-à-vis de leur
conseiller financier, sur une échelle de 1 à 7, le 1 correspondant
à ”pas du tout satisfait” et le 7 correspondant à ”extrêmement
satisfait”. On a obtenu les résultats suivants :
5 7 6 6 7 5 5 7 3 6 7 7 6 6 6
5 5 6 7 7 6 6 4 4 7 6 7 6 7 6
5 7 5 7 6 4 7 5 7 6 5 3 7 7 6
6 6 6 6 5 5 6 6 7 7 5 6 6 6 6
Ici la variable, “degré de satisfaction“ est une variable qualitative

ordinale.
19/168
Pr. M. Iguernane
On peut résumer l’information contenue dans ces données

sous forme d’un tableau de fréquences ce qui donne :
20/168
Pr. M. Iguernane
En ce qui concerne la représentation graphique, les mêmes gra-

phiques qu’on a utilisés pour une variable qualitative nominale
font l’affaire. Par exemple pour le diagramme à barres horizon-
tales :
21/168
Pr. M. Iguernane
Cas de variables quantitatives

Le traitement des variables quantitatives discrètes étant différent
de celui des variables quantitatives continues :
♣ Cas des variables quantitatives discrètes.
Soit X une variable quantitative discrète dont le nombre de mo-
dalités n’est pas trop grand. Alors on peut dresser un tableau
des fréquences comme celui utilisé pour les variables qualita-
tives auquel on peut ajouter une colonne supplémentaire où on
met les fréquences relatives cumulées au fur et à mesure
qu’on ajoute une modalité de la variable.
En ce qui concerne la représentation graphique, un seul gra-
phique s’associe avec les variables quantitatives discrètes : le
diagramme à bâtons.
Exemple 3 : Un inspecteur en contrôle de qualité a extrait de sa
base de données, un échantillon de 40 semaines où il a noté X ,
22/168
Pr. M. Iguernane
le nombre d’accidents de travail enregistrés par semaine. Il a

obtenu les résultats suivants :
2 0 4 2 2 1 3 2 0 5 4 3 2 4
5 6 6 4 2 0 3 4 4 2 6 2 4 3
0 4 3 4 3 3 5 5 4 2 2 1
On peut donc dresser le tableau des fréquences suivant.
23/168
Pr. M. Iguernane
Quant au diagramme à bâtons, on obtient quelque chose comme :
Remarque 2.3
Les bâtons ne doivent pas avoir d’épaisseur, car la variable
prend exactement les valeurs 0, 1, 2,... On peut ajouter les
effectifs ou les fréquences relatives sur les bâtons
24/168
Pr. M. Iguernane
♣ Cas des variables quantitatives continues.

Considérons maintenant un échantillon de données provenant
d’une variable quantitative continue ou discrète avec un grand
nombre de modalités. Il est donc inconcevable de dresser un
tableau où on énumère les modalités d’une telle variable, il serait
non analysable. Il faut donc grouper ces données en classes de
valeurs. Deux questions se posent alors :
Combien de classes faut-il former ?
Quelles seront les largeurs de chacune des classes ?
La réponse à la première question, dépend de la taille n de
l’échantillon, le nombre de classe à former est donné par la for-
mule de Sturges suivante :
10
Le nombre de classes : K = 1 + log(n)
3
25/168
Pr. M. Iguernane
Ainsi, par exemple, si n = 150, il faut former
10
K =1+ log(150) = 8, 25362 ∼
=9
3
(on arrondit à l’entier immédiatement supérieur).
Une fois qu’on sait combien de classes à former. On essaie de
former des classes de même amplitude (largeur) et cette ampli-
tude sera égale à
la plus grande observation -la plus petite observation Xmax − Xmin
A= = .
K K
On arrondit cette amplitude selon les données pour avoir des
bornes de classes faciles à manipuler.
Exemple 4 : Soit X , les recettes quotidiennes (en dirhams) d’un
petit magasin. On a sélectionné un échantillon de taille n = 40
jours au hasard qui ont donné les résultats suivants :
26/168
Pr. M. Iguernane
016, 00 058, 50 068, 20 078, 00 079, 45 142, 20 145, 30

186, 70 209, 05 216, 75 219, 70 247, 75 249, 10 256, 00
257, 15 262, 35 268, 60 269, 60 270, 15 284, 00 319, 00
332, 00 343, 29 350, 75 354, 90 372, 60 383, 20 389, 20
404, 55 420, 20 428, 50 432, 40 444, 60 446, 80 456, 10
458, 10 493, 95 511, 95 521, 05 621, 35
Le nombre de classe à former est

10
K =1+ log(40) = 6.34 = 7
3
classes d’amplitude chacune égale à
621.35 − 16
A= = 86.48 ∼
= 90.
7
Cette amplitude est arrondie à 90. 27/168
Pr. M. Iguernane
Ce qui donne le tableau des fréquences suivant, où les classes

sont des intervalles fermés à gauche et ouverts à droite sauf le
dernier qui est un intervalle fermé des deux côtés.
Quand aux graphiques, on va ici privilégier trois graphiques pour

les variables quantitatives continues. 28/168
Pr. M. Iguernane
♣ L’histogramme, qui est une suite de rectangles juxtaposés

les uns aux autres dressés au-dessus de chacune des classes,
dont la largeur est égale à l’amplitude de la classe (prise comme
unité de mesure) et dont la surface reflète la fréquence relative
de la classe qu’il représente.
29/168
Pr. M. Iguernane
♣ Le polygone des fréquences, qui consiste à joindre le mi-

lieux des sommets des rectangles d’un histogramme par une
ligne en zig-zag et cette ligne se ferme en ajoutant aux deux
extrémités deux classes fictives de même amplitude que les
autres, comme ça la surface délimitée par l’histogramme est
identique à celle délimitée par le polygone des fréquences.
30/168
Pr. M. Iguernane
♣ La courbe des fréquences cumulées (Ogive).

Comme son nom l’indique, elle consiste à tracer le graphique
des fréquences cumulées, en mettant les limites des classes
sur l’axe horizontal et les fréquences cumulées sur l’axe vertical,
ces dernières se cumulant à la fin de chacune des classes. Ce
graphique aura l’allure d’une courbe croissante variant entre 0
et 1.
31/168
Pr. M. Iguernane
2-2 Les mesures de tendance centrale
On appelle mesures de tendance centrale, des valeurs de la

variable susceptibles de nous donner une idée sur la donnée
qui occupe le centre d’une série statistique. On va décrire dans
ce paragraphe, les trois plus importantes mesures de tendance
centrale que sont le mode, la moyenne et la médiane.
♣ Le mode
On appelle le mode d’une variable X, la valeur de la variable qui
a la plus grande fréquence et on le note Mo(X ). Le mode est
une importante mesure de tendance centrale pour les variables
qualitatives nominales.
Remarque 2.4
Une distribution peut avoir un seul mode et on dit qu’elle est uni-
modale, ou plusieurs modes et on dit qu’elle est multimodale.
32/168
Pr. M. Iguernane
Exemple 5 : Si on reprend l’exemple des boissons non-alcoolisées,

on avait le tableau des fréquences suivant :
Alors, le mode de cette variable est Mo(X ) = Coca − Cola(CC),

cela signifie que dans cet échantillon, la boisson la plus fréquem-
ment achetée est Coca-Cola.
33/168
Pr. M. Iguernane
Exemple 6 : En reprenant l’exemple des recettes quotidiennes

d’un petit magasin, on avait le tableau des fréquences suivant :
Ici, on voit qu’il y a deux classes qui ont les plus hautes fréquences,
on les appelle des classes modales. Alors on est en présence
d’une distribution de données bimodale, et les deux modes sont
les milieux des deux classes modales, à savoir Mo(X ) = 235 et
Mo(X ) = 415. 34/168
Pr. M. Iguernane
♣ La moyenne
La moyenne arithmétique ou simplement la moyenne est la
mesure de tendance centrale la plus connue. Elle ne s’applique
qu’aux variables quantitatives. On va décrire la méthode pour
calculer la moyenne d’une variable quantitative selon que les
données sont en vrac, groupées par valeurs ou groupées par
classes.
I Les données en vrac.
Soit X une variable quantitative dont les valeurs observées sur
un échantillon forment une série en vrac x1 , x2 , ..., xn alors la
moyenne de cet échantillon est
Pn
x1 + x2 + ... + xn xi
X = = i=1 .
n n
Exemple 7 : Un commerçant a l’habitude de noter dans son re-
gistre le nombre de clients qui se présentent quotidiennement à
son magasin. On a pris un échantillon de taille 10 de ce registre
et on trouvé les valeurs suivantes : 35/168
Pr. M. Iguernane
120 105 90 201 196 65 88 163 103 116

Alors dans cet échantillon le nombre moyen des clients qui se
présentent à ce magasin par jour est donné par la formule
suivante :
Pn
x1 + x2 + ... + Xn xi 120 + 105 + ... + 116
X = = i=1
= = 124.7 ∼
= 125.
n n 10
36/168
Pr. M. Iguernane
I Les données groupées par valeurs.

Soit X une variable quantitative discrète dont les données se
présentent sous forme d’un tableau où elles sont classées par
valeurs, supposons que la taille de l’échantillon est n et qu’il y a
k valeurs différentes pour cette variable. Alors la moyenne d’un
tel échantillon de données est :
P Pk
[(valeur ) ? (sa fréquence absolue)] x i fi
X = = i=1
taille de l’échantillon n
Exemple 8 : Reprenons les données de l’exemple 3, où X est le
nombre d’accidents de travail par semaine. On avait le tableau
de données suivant :
37/168
Pr. M. Iguernane
38/168
Pr. M. Iguernane
I Les données groupées par classes.

Supposons qu’on est devant un tableau où les données prove-
nant d’un échantillon sont groupées par classes. Alors pour cal-
culer la moyenne de cet échantillon, on va utiliser une formule
approximative, où chaque classe est assimilée à son centre et
on utilise la même formule que pour le cas où les données sont
groupées par valeurs. Si on note par mi , le milieu de la ième
classe et qu’on suppose que la taille de l’échantillon est n et
qu’il y a k classes, alors la moyenne de l’échantillon est :
Pk
i=1 mi fi
X = .
n
Exemple 9 : En reprenant l’exemple 4, où X est la recette quoti-
dienne d’un petit magasin, on avait le tableau suivant auquel on
a ajouté une colonne à gauche contenant le milieu des classes :
39/168
Pr. M. Iguernane
40/168
Pr. M. Iguernane
I Les propriétés d’une moyenne échantillonnale.

Soit X une variable quantitative dont la moyenne échantillonnale
est x et soit Y une autre variable quantitative transformée linéaire
de X , c’est-à-dire que
Y =a+b∗X
où a et b sont des constantes réelles. Alors la moyenne échantill-
onnale de Y sera égale à
y =a+b∗x
On dit que la moyenne conserve la transformation linéaire entre
les variables.
Exemple 10 : Soit X , le nombre d’heures qu’un étudiant travaille
à temps partiel par semaine. Supposons qu’à partir d’un échantillon
d’étudiants, on a pu trouver qu’en moyenne le nombre d’heures tra-
vaillées par ces étudiants est égale à x = 14.5 heures/semaine. Si le
salaire horaire est de 10 DH et que les patrons de ces étudiants leur
offrent 30 DH par semaine pour leurs déplacements, quel est le gain
net moyen hebdomadaire de ces étudiants ? 41/168
Pr. M. Iguernane
Posons Y le gain net hebdomadaire de ces étudiants alors

Y = 30 + 10 ∗ X ,
donc le gain moyen hebdomadaire de cet échantillon d’étudiants
est égal à
y = 30 + 10 ∗ x = 30 + 10 ∗ 14.5 = 175 DH
♣ La médiane
La médiane est la valeur de la variable qui divise l’échantillon
en deux groupes d’égal effectif. Il y a 50% des données qui sont
inférieures ou égales à la médiane et 50% des données qui sont
supérieures ou égales à la médiane.
La médiane se calcule pour des variables qualitatives ordinales
et pour des variables quantitatives. On note la médiane d’une
variable X par Med(x) ou par X e . Dans ce qui suit on va décrire
les façons de calculer une médiane dans les différents cas pos-
sibles. 42/168
Pr. M. Iguernane
I Cas d’une variable qualitative ordinale.

Puisque les modalités d’une telle variable sont déjà ordonnées
par nature, alors pour déterminer la médiane, on calcule
n
l = (50%) ∗ n =
2
et donc
 x +x
l l+1
 si l est un entier
2

Med(X ) =

x[l]+1 si l n’est pas un entier.

Où x[l]+1 signifie, l’observation occupant le rang immédiatement

supérieur à l.
43/168
Pr. M. Iguernane
Exemple 11 : Reprenons les données de l’exemple 2, où X est

le degré de satisfaction de la clientèle, on avait le tableau sui-
vant :
n
Ici, n = 60 et l = = 30 est un entier, alors
2
x30 + x31 6+6
Med(X ) = = = 6.
2 2
44/168
Pr. M. Iguernane
I Cas de données quantitatives en vrac ou groupées par

valeurs.
On doit d’abord ordonner les données par ordre croissant avant
d’appliquer la même procédure que pour les variables qualita-
tives ordinales. Ci-après nous donnerons un exemple pour cha-
cun de ces deux cas.
Exemple 12 : Reprenons les données de l’exemple 2, où la va-
riable est le nombre de clients qui se présentent quotidienne-
ment au magasin. On avait des données en vrac :
120 105 90 201 196 65 88 163 103 116
En les ordonnant, on aura :
65 88 90 103 105 116 120 163 196 201.
n
Ici, n = 10 et l = = 5 est un entier, alors
2
x5 + x6 105 + 116
Med(X ) = = = 110, 5.
2 2 45/168
Pr. M. Iguernane
Exemple 13 : Reprenons les données de l’exemple 3, où X est

le nombre d’accidents de travail par semaine. On avait le ta-
bleau de données où les modalités de la variable sont groupées
par valeurs, qu’on va changer un peu en ajoutant une donnée
supplémentaire :
n
Ici, n = 41 et l = = 20.5 n’est pas un entier, alors
2
Med(X ) = x[20.5]+1 = x21 = 3.
46/168
Pr. M. Iguernane
I Cas de données groupées par classes.

Dans le cas où on dispose d’un tableau de fréquences complet
(incluant les fréquences cumulées) des données groupées par
classes. Il faut d’abord déterminer la classe médiane, qui est la
classe où les fréquences cumulées dépassent pour la première
fois 50%. Cette classe aura la forme : Cm = [binf , bsups [, alors on
obtient la médiane par la formule suivante :

0.5 − F(m−1)
Med(X ) = binf + ∗ Am
fr ,m
où
binf est la borne inférieure de la classe médiane.
F(m−1) est la fréquence cumulée avant la classe médiane.
fr ,m est la fréquence relative de la classe médiane.
Am est l’amplitude de la classe médiane.
47/168
Pr. M. Iguernane
Exemple 14 : En reprenant les données où X donne la re-

cette quodienne d’un petit magasin, on retrouve le tableau des
fréquences suivant :
Alors ici, la classe médiane est Cm = [binf , bsup [= [280, 370[.

binf = 280 F(m−1) = 0.475 fr ,m = 0.150 Am = 90
ce qui donne une médiane égale à : 48/168
Pr. M. Iguernane
0.5 − F(m−1) 0.5 − 0.475

Med(X ) = binf + ∗Am = 280+ ∗90 = 295.
fr ,m 0.150
Ce qui veut dire qu’en se basant sur cet échantillon de données,
50% des recettes quotidiennes de ce petit magasin sont inférieures
ou égales à 295 DH et les autres 50% sont supérieures ou
égales à 295 DH.
Remarque 2.5
I Le calcul de la médiane est basé sur l’ordre des observations et
non sur leur valeur. Contrairement à la moyenne, la médiane est in-
sensible aux données extrêmes. Dans le cas où les données sont très
différentes, la médiane est une meilleure mesure de tendance cen-
trale.
I Si pour une variable X quantitative les 3 mesures de tendance cen-
trale sont presque égales, on dit alors que la variable est symétrique
et alors n’importe laquelle de ces mesures peut être utilisée comme
mesure de cette tendance centrale. S’il y a un grand écart entre ces
mesures alors c’est la médiane qu’on doit privilégier.
49/168
Pr. M. Iguernane
2-3 Les mesures de position
On a déjà parlé de la médiane comme mesure de tendance

centrale, mais elle est aussi une mesure de position car elle per-
met de diviser une série d’observations en deux groupes chacun
contenant 50% de données. On va définir d’autres mesures de
position qui permettent d’autres découpages d’une série d’ob-
servations.
♣ Les quartiles.
Lorsqu’on veut diviser les données en quatre groupes, chacun
contenant 25% des observations, on utilise des mesures ap-
pelées quartiles.
Q1 = le 1er quartile, à sa gauche il y a 25% des
observations.
Q2 = le 2ème quartile, coincide avec la médiane.
Q3 = le 3ème quartile, à sa gauche il y a 75% des
observations. 50/168
Pr. M. Iguernane
On va décrire la façon de les calculer, dans les 3 cas possibles

pour une variable quantitative.
On suit les étapes suivantes.
1 Étape 1 : On ordonne les données par ordre croissant.
2 Étape 2 : On calcule l’indice l = (i%)?n où i est le pourcen-
tage correspondant à la mesure voulue et n est le nombre
d’observations.
3 Étape 3 :
Si l n’est pas un entier, alors le ième quartile est égal à l’ob-
servation occupant la position immédiatement supérieure à
l.
Si l est un entier, alors le ième quartile est la moyenne des
observations occupant les positions l et (l + 1).
51/168
Pr. M. Iguernane
Exemple 15 :
n = 12 et les observations sont :
−2 − 3 10 12 120 11 4 8 6 13 130 200.
Étape 1 :
−3 − 2 4 6 8 10 11 12 13 120 130 200.
Étape 2 :
Si on veut déterminer Q1 , on calcule l1 = (25%) ∗ n = 3.
Étape 3 :
Puisque l1 = 3 est un entier alors
la 3ème observation+la 4ème observation 4+6
Q1 = = = 5.
2 2
52/168
Pr. M. Iguernane

la 6ème observation+la 7ème observation 10 + 11
Q2 = = = 10.5
2 2

Q3 = = = 66.5
2 2
Exemple 16 :
n = 10 et les observations sont :
3 10 12 8 6 100 15 6 3 14.
Étape 1 :
3 3 6 6 8 10 12 14 15 100
53/168
Pr. M. Iguernane
Étape 2 :
Si on veut déterminer Q1 , on calcule l1 = (25%) ∗ n = 2.5
Si on veut déterminer Q3 , on calcule l3 = (75%) ∗ n = 7.5.
Étape 3 :
Puisque l1 = 2.5 n’est pas un entier alors
Q1 = la 3ème observation = 6.

Q2 = = = 9.
2 2
54/168
Pr. M. Iguernane
Remarque 2.6
La procédure décrite pour trouver les quartiles est une convention
parmi d’autres. Il n’y a pas d’accord général sur la méthode à utiliser
pour déterminer les quartiles.

On suit la même démarche que dans le cas des données en
vrac, sauf l’étape 1 qui devient inutile, puisque les données sont
en général déjà ordonnées par ordre croissant.
Exemple 17 : En reprenant le tableau de l’exemple 3, déterminer
les 3 quartiles de la variable X=le nombre d’accidents par se-
maine.
Étape 2 :
55/168
Pr. M. Iguernane
Étape 3 :
Q1 = la 11ème observation = 2
Q2 = la 21ème observation = 3
56/168
Pr. M. Iguernane

On suit la même démarche utilisée pour calculer la médiane
quand les données sont groupées par classes. On détermine
la classe où on a dépassé le pourcentage relatif à chaque quar-
tile et on fait une interpolation à l’intérieur de cette classe. On
aboutit à la même formule que celle de la médiane où seul le
pourcentage est à adapter.
Exemple 18 : En reprenant les données de l’exemple 4 sur
les recettes quotidiennes, déterminer les 3 quartiles de la va-
riable X, soit les recettes quotidiennes d’un petit dépanneur, et
interpréter ces mesures.
• Pour déterminer le premier quartile, les fréquences relatives
cumulées ont dépassé 25% pour la première fois au niveau de
la classe [190 ; 280[, donc
(0.25 − 0.20)
Q1 = 190 + ∗ 90 = 206.36DH
0.275
57/168
Pr. M. Iguernane
Ce qui signifie que dans cet échantillon de données, 25% des

journées, les recettes quotidiennes de ce petit magasin ont été
de 206,36 DH ou moins.
• Pour déterminer le deuxième quartile (on refait ce qu’on a déjà
fait pour calculer la médiane), les fréquences relatives cumulées
ont dépassé 50% pour la première fois au niveau de la classe
[280 ; 370[, donc 58/168
Pr. M. Iguernane
(0.5 − 0.475)
Q2 = 280 + ∗ 90 = 295DH
0.150
de 295 DH ou moins.
• Pour déterminer le troisième quartile, les fréquences relatives
cumulées ont dépassé 75% pour la première fois au niveau de
la classe [370 ; 460[, donc
(0.75 − 0.625)
Q3 = 370 + ∗ 90 = 410.91DH
0.275
de 410,91 DH ou moins.
59/168
Pr. M. Iguernane
♣ Les autres mesures de position

Quelques fois, on doit découper une série d’observations en
cinq, en dix ou en cents groupes contenant chacun le même
pourcentage d’observations.
• Dans le cas de cinq groupes, on parle alors des quintiles
V1 , V2 , V3 et V4 . Entre deux quintiles consécutifs, il y a 20%
d’observations.
• Dans le cas de dix groupes, on parle des déciles D1 , D2 , ...,D9
et entre deux déciles consécutifs, il y a 10% d’observations.
• Dans le cas de cent groupes, on parle des centiles C1 , C2 ,
...,C99 et entre deux centiles consécutifs, il y a 1% des observa-
tions.
Le calcul de ces différentes mesures de position est identique à
ce qu’on a fait pour déterminer les quartiles, il n’y a que le pour-
centage de la mesure à adapter à chaque fois. On va donner un
exemple dans le cas où les données sont groupées par classes.
60/168
Pr. M. Iguernane
Exemple 19 : En reprenant les données de l’exemple 18, déterminer

le deuxième quintile, le septième décile et le quatre vingt quinzième
centile de la variable X, les recettes quotidiennes d’un petit dépanneur
et interprétez chacune de ces mesures.
• Les fréquences cumulées dépassent pour la première fois 40% au

niveau de la classe [190 ; 280[ ainsi le deuxième quintile est égal à
(0.40 − 0.20)
V2 = 190 + ∗ 90 = 255.45DH
0.275 61/168
Pr. M. Iguernane
Ceci signifie que dans cet échantillon de données, 40% des journées,
les recettes quotidiennes de ce petit magasin ont été de 255,45 DH
ou moins.
• Les fréquences relatives cumulées dépassent pour la première fois
70% au niveau de la classe [370 ; 460[, ainsi le septième décile est
égal à
(0.70 − 0.625)
D7 = 370 + ∗ 90 = 394.55DH
0.275
Ce qui signifie que dans cet échantillon de données, 70% des journées,
les recettes quotidiennes de ce petit magasin ont été de 394,55 DH ou
moins.
• Les fréquences relatives cumulées dépassent pour la première fois
95% au niveau de la classe [460 ; 550[, ainsi le quatre vingt quinzième
centile est égal à
(0.95 − 0.90)
C95 = 460 + ∗ 90 = 520DH
0.075
Ce qui signifie que dans cet échantillon de données, 95% des journées,
les recettes quotidiennes de ce petit magasin ont été de 520 DH ou
moins. 62/168
Pr. M. Iguernane
2-4 Les mesures de dispersion
Rappelons qu’on travaille sur des données issues d’un échantillon

et que le choix de cet échantillon est fait au hasard mais sensé
refléter ce qui se passe dans la population. Ce qui fait que le
comportement d’une variable diffère d’un échantillon à l’autre
mais on espère qu’il correspond au profil de cette variable dans
la population. Ce qui fait que lorsqu’on manipule une variable
mesurable et qu’on se base seulement sur ses mesures de ten-
dance centrale, on perd de vue la variabilité des données autour
de ces mesures centrales. D’où l’utilité des mesures de disper-
sion qui, jumelées avec les mesures de tendance centrale, vont
nous donner une idée plus exacte sur l’ensemble de ce qu’on
a observé dans une série échantillonnale. Dans ce paragraphe,
on va décrire quelques unes de ces mesures de dispersion.
63/168
Pr. M. Iguernane
♣ L’étendue.
C’est la mesure de dispersion la plus simple à calculer. Lors-
qu’on a une variable quantitative X, mesurée sur un échantillon
de taille n. Alors l’étendue est égale à
E = la plus grande donnée-la plus petite donnée = Xmax − Xmin
Puisque l’étendue est basée seulement sur les deux observa-

tions extrêmes, alors elle est très peu utilisée dans les applica-
tions.
♣ La variance.
La variance d’une variable mesurée sur un échantillon est égale
à la moyenne des carrés des écarts qui séparent chaque obser-
vation de la moyenne échantillonnale, son calcul diffère selon la
nature des données.
64/168
Pr. M. Iguernane

Soit X une variable quantitative mesurée sur un échantillon de
taille n, et dont les valeurs sont : x1 , x2 , ..., xn alors la variance
de l’échantillon est
n
1 X
SX2 = (xi − x)2 .
n−1
i=1
Exemple 20 : Soit X une variable quantitative mesurée sur un

échantillon de taille n=6 et les valeurs suivantes ont été obte-
nues : −1 6 11 8 9 9. Alors x = 7 et la variance de cet
échantillon sera égale à
(−1 − 7)2 + (6 − 7)2 + (11 − 7)2 + (8 − 7)2 + (9 − 7)2 + (9 − 7)2
SX2 = = 18.
6−1
65/168
Pr. M. Iguernane

Soit X une variable quantitative mesurée sur un échantillon de
taille n, et dont les k valeurs sont : x1 , x2 , ..., xk avec des fréquences
absolues respectivement égales à f1 , f2 , ..., fk . Alors la variance
de X dans cet échantillon est égale à
k
1 X
SX2 = (xi − x)2 fi .
n−1
i=1
Exemple 21 : En reprenant le tableau de l’exemple 3 (nombre

d’accidents) précédent, déterminer la variance de la variable
X=le nombre d’accidents par semaine.
On avait trouvé que la moyenne de cette variable est x = 3.025
donc sa variance sera égale à :
66/168
Pr. M. Iguernane
(0 − 3.025)2 ∗ 4 + (1 − 3.025)2 ∗ 2 + ... + (6 − 3.025)2 ∗ 3

SX2 = = 2.74.
40 − 1
67/168
Pr. M. Iguernane

Soit maintenant X, une variable quantitative mesurée sur un
échantillon de taille n, et dont les observations sont groupées en
k classes avec des fréquences absolues respectivement égales
à f1 , f2 , ..., fk et dont les milieux des classes sont respective-
ment égaux à m1 , m2 , ..., mk . Alors la variance de X dans cet
échantillon est égale à
k
1 X
SX2 = (mi − x)2 fi .
n−1
i=1
Exemple 22 : En reprenant les données de l’exemple 4(recettes

quotidiennes) précèdent, déterminer la variance de la variable
X, les recettes quotidiennes d’un petit dépanneur.
On avait trouvé que la moyenne de cette variable est x = 298
DH donc sa variance sera égale à :
68/168
Pr. M. Iguernane
(55 − 298)2 ∗ 5 + (145 − 298)2 ∗ 3 + ... + (595 − 298)2 ∗ 1

SX2 = = 20021.54
40 − 1
69/168
Pr. M. Iguernane
♣ L’écart type.
L’écart type d’une variable quantitative mesurée sur un échanti-
llon est égal à la racine carrée de sa variance. Son unité de
mesure étant la même que celle de la variable, l’écart type se
prête alors aisément à l’interprétation et est considéré comme
la mesure de dispersion par excellence. La variance n’est donc
qu’une étape de calcul pour déterminer l’écart type, quand on
faisait les calculs à la main.
Exemple 23 : L’écart type échantillonnal pour les 3 précédents
exemples où on a calculé les variances échantillonnales est res-
pectivement
√ égal à :
• SX = 18 = 4.24. Pour les données de l’exemple 20 où les
données√sont en vrac.
• SX = 2.74 = 1.655. Pour les données de l’exemple 21 où
les donn√ ées sont groupées par valeurs.
• SX = 20021.54 = 141.497. Pour les données de l’exemple
22 où les données sont groupées par classes. 70/168
Pr. M. Iguernane
Une propriété de l’écart type échantiollonnal.

Soit X une variable quantitative dont l’écart type échantillonnal
est SX et soit Y une autre variable quantitative telle que
Y =a+b∗X
où a et b sont des constantes réelles.
Alors l’écart type échantillonnal de Y sera égal à
SY = |b|SX .
Exemple 24 : Reprenons le contexte de l’exemple précédent, où
X est le nombre d’heures qu’un étudiant travaille à temps partiel
par semaine. Supposons qu’à partir d’un échantillon d’étudiants,
on ait pu trouvé que l’écart type du nombre d’heures travaillées
par ces étudiants est égal àSX = 3.2 heures/semaine. Si le sa-
laire horaire est de 10 DH et que les patrons de ces étudiants
leur offrent 30 DH par semaine pour leurs déplacements, quel
est l’écart type du gain net hebdomadaire de ces étudiants ? 71/168
Pr. M. Iguernane
Posons Y, le gain net hebdomadaire de ces étudiants alors
Y = 30 + 10 ∗ X ,
donc l’écart type du gain net de cet échantillon d’étudiants sera

égal à
SY = |10|SX = 32 DH/semaine.
♣ Le coefficient de variation.
On avait dit que l’unité de l’écart type d’une variable est la même
que celles des données et qu’alors il s’interprète mieux que la
variance. Mais si on veut comparer la dispersion de deux va-
riables ou plus ayant des unités différentes mesurées sur le
même échantillon ou sur des échantillons différents, il nous faut
une mesure de dispersion sans unité. Cette mesure est le coef-
ficient de variation.
72/168
Pr. M. Iguernane
Pour un échantillon de données dont la moyenne est non négative,

on définit le coefficient de variation d’une variable X par :
SX
CVX = 100 %.
X
• Si on a un seul échantillon de données, alors si le coefficient
de variation de X est inférieur à 15%, on dit que la variable est
homogène, sinon elle est dite hétérogène.
• Si on a deux échantillons (sur une ou deux variables) ou plus,
alors celui (ou celle) qui a le plus petit coefficient de variation est
le (ou la) plus homogène.
Exemple 25 : On a pris un échantillon de taille n=50 d’hommes
d’âge adultes, on a mesuré leur poids et leur taille. Les résultats
sont résumés dans le tableau suivant :
73/168
Pr. M. Iguernane
Pour comparer l’homogénéité de ces deux variables, on utilise

leur coefficient de variation.
7.86
CVX = 100 % = 4.53 %.
173.59
11.98
CVY =
100 % = 15.28 %.
78.42
Donc la taille des hommes adultes est plus homogène que leur
poids. Ce qui correspond à l’intuition. Par exemple il est très
rare de voir deux hommes adultes dont l’un serait deux fois
plus grand que l’autre, alors qu’il est fréquent de voir un homme
adulte dont le poids est le double d’un autre. 74/168
Pr. M. Iguernane
♣ La variance et l’écart type dans le cas d’une population.

I Variance de la population : σ 2 = V .
√
I Ecart-type de la population : σ = V.
75/168
Pr. M. Iguernane
Chapitre 3 :
Série statistique à deux

variables
76/168
Pr. M. Iguernane
3-1 Introduction
Dans le chapitre précédent, nous avons présenté les méthodes

qui permettent de résumer et représenter les informations rela-
tives à une variable. Un même individu peut être étudié à l’aide
de plusieurs caractères (ou variables). Par exemple, les salaries
en regardant leur ancienneté et leur niveau d’étude, la crois-
sance d’un enfant en regardant son poids et sa taille. Dans la
suite de ce chapitre, nous introduisons l’étude globale des rela-
tions entre deux variables.
Soit Ω une population et
Z : Ω → R2 ,
ω 7→ Z (ω) = (X (ω), Y (ω)),
ou directement
(X , Y ) : Ω → R2 ,
ω 7→ (X (ω), Y (ω)),
77/168
Pr. M. Iguernane
Dans ce cas, Z est dite variable statistique à deux dimensions

avec Card (Ω) = N est un entier fini. Le couple (X , Y ) est appelé
le couple de la variable statistique.
Exemple 1 :
On observe simultanément sur un échantillon de 200 foyers,
le nombre d’enfants X et le nombre de chambre Y .
On observe sur un échantillon de 20 foyers, le revenu men-
suel X en Dh et les dépenses mensuelles Y .
Au près des étudiants pris au hasard parmi une section de
génie informatique 1, on observe les notes d’analyse X et
de statistique Y .
Une entreprise mène une étude sur la liaison entre les dépe-
nses mensuelles en publicité X et le volume des ventes Y
qu’elle réalise.
78/168
Pr. M. Iguernane
3-2 Représentation des séries statistiques à deux

variables
Les séries statistiques à deux variables peuvent être présentées

de deux façons.
Présentation 1 : A chaque ωi , on associé (xi , yi ), c’est à dire,
ωi → (xi , yi ).
On rassemblera les données comme dans le tableau suivant
ωi ω1 ω2 ... ωN
Variable X X (ω1 ) X (ω2 ) ... X (ωN )
Variable Y Y (ω1 ) Y (ω2 ) ... Y (ωN )
Cette représentation on la notera ”présentation 1”. Nous allons
utiliser toujours les notations suivantes :
xi := X (ωi ) et yi := Y (ωi ).
79/168
Pr. M. Iguernane
Exemple 2 : Soit Ω l’ensemble de 8 étudiants. Nous avons le

tableau suivant
ωi ω1 ω2 ω3 ω4 ω5 ω6 ω7 ω8
X (ω) 8 2 6 6 11 10 7 2
Y (ω) 9 10 11 7 14 16 12 5
avec X représente le nombre d’heures passées à préparer l’exa-

men de statistique par étudiant et Y représente la note sur 20
obtenue à l’examen par l’étudiant.
Lors de cette représentation, nous pouvons traduire le tableau

associe dans une figure appelée ”le nuage de points” ou ”diagr-
amme de dispersion” (voir Figure ci-dessous). Cette représent-
ation est obtenue en mettant dans un repère cartésien chaque
couple d’observation (xi , yi ) par un point.
80/168
Pr. M. Iguernane
81/168
Pr. M. Iguernane
Présentation 2 :
Soit la variable statistique Z donnée par le couple (X , Y ). Soient

x1 , ..., xk et y1 , ..., yl les valeurs prises respectivement par X et
Y . Dans ce cas, nous définissons les valeurs de Z comme suite,
pour i allant de 1 à k et pour j allant de 1 à l,
zij := (xi , yj ).
La variable statistique Z prend k ×l valeurs. Lors de cette étude,

nous avons le tableau à double entrée (ou tableau de contin-
gence) suivant (discrète ou continue).
82/168
Pr. M. Iguernane
X \Y C10 = [L01 , L02 [ ... Cl0 = [L0l , L0l+1 ] Marginale

ou y1 ... ou yl % à X
C1 = [L1 , L2 [ ou x1 n11 ou f11 ... n1l ou f1l n1• ou f1•
.. .. .. .. ..
. . . . .
Ck = [Lk , Lk+1 ] ou xk nk1 ou fk1 ... nkl ou fkl nk• ou fk•
Marginale % à Y n•1 ou f•1 ... n•l ou f•l N
Cette représentation on l’a notera ”présentation 2”. A chaque couple

(xi , yj ), on a nij est l’effectif qui représente le nombre d’individus qui
prennent en même temps la valeur xi et yj , c’est à dire,
nij := Card{ω ∈ Ω : Z (ω) = zij }.
Nous notons par fij la fréquence du coulpe (xi , yj ). Cette fréquence est
donnée par
nij
fij := ,
N
83/168
Pr. M. Iguernane
avec
k X
X l l X
X k
N := Card(Ω) = nij = nij .
i=1 j=1 j=1 i=1
Remarque 3.1
Nous avons la propriété suivante,
k X
X l
fij = 1.
i=1 j=1
Lois marginales :
Sur la marge du tableau de contingence, on peut extraire les
données seulement par rapport à X et seulement par rapport à
Y (voir le tableau de contingence établi auparavant).
84/168
Pr. M. Iguernane
• Effectifs et fréquences marginale par rapport à Y : nous

avons, pour j = 1...l,
k k
X n•j X
n•j := nij , f•j := = fij .
N
i=1 i=1
• Effectifs et fréquences marginale par rapport à X : nous

avons, pour i = 1...k,
l l
X ni• X
ni• := nij , fi• := = fij .
N
j=1 j=1
Remarque 3.2
Nous avons les propriétés suivantes :
k
X l
X k
X l
X
ni• = n•j = N et fi• = f•j = 1.
i=1 j=1 i=1 j=1
85/168
Pr. M. Iguernane
Exemple 3 : Nous considérons 10 salariés qui sont observés

à l’aide de deux variables ”âge” et ”salaire”. Les informations
brutes (pas encore traitées ou façonnées) sont données dans le
tableau suivant,
Salaire 6000 7400 7500 8200 8207
Age 15 26 20 43 47
Salaire 8900 9100 9900 9950 10750
Age 37 52 34 50 44
1. Déterminer le tableau de contingence (X : âge, Y : salaire).

Pour l’âge et pour le salaire, former respectivement des classes
de pas de 10 ans et de 1000 Dh.
2. Calculer f21 , f12 , f45 et f33 .
3. Déterminer les effectifs marginaux de X et de Y . Tracer le
nuages de points.
4. Déterminer le tableau statistique des deux séries marginales
X et Y . 86/168
Pr. M. Iguernane
Solution : En utilisant les hypothèses, nous considérons les

classes suivantes,
[15, 25[, [25, 35[, [35, 45[, [45, 55],
pour l’âge et
[6, 7[, [7, 8[, [8, 9[, [9, 10[, [10, 11],
pour le salaire (×1000). De plus, nous avons
xmax − xmin 52 − 15
Nombre de classe = = = 3.7 ' 4 classes,
amplitude âge 10
pour l’âge et
ymax − ymin 10750 − 6000
Nombre de classe = = = 4.75 ' 5 classes,
amplitude salaire 1000
pour le salaire.
87/168
Pr. M. Iguernane
Cette série statistique est représentée par le tableau suivant,
Age \ Salaire [6, 7[ [7, 8[ [8, 9[ [9, 10[ [10, 11] ni• fi•
[15, 25[ 1 1 0 0 0 2 0.2
[25, 35[ 0 1 0 1 0 2 0.2
[35, 45[ 0 0 2 0 1 3 0.3
[45, 55] 0 0 1 2 0 3 0.3
n•j 1 2 3 3 1 10 1
f•j 0.1 0.2 0.3 0.3 0.1 1 Φ
De ce fait, nous avons

n12 1 n21 0
f12 = = = 0.1, f21 = = =0
N 10 N 10
et
n45 0 n33 2
f45 = = = 0, f33 = = = 0.2.
N 10 N 10
88/168
Pr. M. Iguernane
Le nuage de points est tracé, à partir des données brutes, dans

la figure suivante :
89/168
Pr. M. Iguernane
Enfin, les deux tableaux statistiques de X et de Y sont donnés,

respectivement, par
X ni• fi• xi le centre

[15, 25[ 2 0.2 20
[25, 35[ 2 0.2 30
[35, 45[ 3 0.3 40
[45, 55] 3 0.3 50
Y n•j f•j yj le centre

[6, 7[ 1 0.1 6.5
[7, 8[ 2 0.2 7.5
[8, 9[ 3 0.3 8.5
[9, 10[ 3 0.3 9.5
[10, 11] 1 0.1 10.5
90/168
Pr. M. Iguernane
3-3 Marginales,Conditionnelle, Covariance

3-3-1 Caractéristique des séries marginales
Dans le cas d’une variable statistique à deux dimensions X et
Y , les moyennes sont données respectivement par
k k
1X X
x := ni• xi = fi• xi (moyenne de X),
N
i=1 i=1
et
l l
1X X
y := n•j yj = f•j yj (moyenne de Y).
N
j=1 j=1
Remarque 3.3
Dans le cas continu, xi et yj représentent respectivement le centre des
classes de X et Y, c’est à dire,
Li+1 + Li L0j+1 + L0j

xi = et yj =
2 2 91/168
Pr. M. Iguernane
Exemple 4 :
Nous calculons x et y pour l’exercice traité précédemment.
La moyenne d’âge
1
x= (40 + 60 + 120 + 150) = 37 ans.
10
La moyenne du salaire
1
y= (6.5 + 15 + 25.5 + 28.5 + 10.5) × 1000 = 8600 Dh.
10
Nous définissions maintenant la variance de X et la variance de
Y comme suit,
Var (X ) := x 2 − (x)2 et Var (Y ) := y 2 − (y)2 .
Les écarts-type de X et de Y sont donnés, respectivement, par

p p
σX = Var (X ) et σY = Var (Y ).
92/168
Pr. M. Iguernane
3-3-2 Série conditionnelle

La notion de série conditionnelle est essentielle pour comprendre
l’analyse de la régression. Un tableau de contingence se com-
pose en autant de séries conditionnelles suivant chaque ligne et
chaque colonnes.
Série conditionnelle par rapport à X

Elle est notée par X /yj (ou Xj ) et on dit que c’est la série condi-
tionnelle de X sachant que Y = yj . Nous calculons dans ce cas
la fréquence conditionnelle fi/j (fi sachant j), pour i = 1, ..., k ,
par
nij fij
fi/j := = .
n•j f•j
Nous avons aussi la moyenne conditionnelle xj , c’est à dire la
moyenne des valeurs de X sous la condition yj , elle est définie
par
93/168
Pr. M. Iguernane
k k
X 1 X
x j := fi/j xi = nij xi .
n•j
i=1 i=1
p
Pour l’écart-type conditionnel, nous avons σXj := Var (Xj )
avec
k
X
Var (Xj ) := fi/j (xi − x j )2 = x 2 j − (x j )2 .
i=1
Série conditionnelle par rapport à Y

Elle est notée par Y /xi (ou Yi ) et on dit que c’est la série condi-
tionnelle de Y sachant que x = xi . Nous calculons dans ce cas
la fréquence conditionnelle fj/i (fj sachant i), pour j = 1, ..., l,
par
nij fij
fj/i := = .
ni• fi•
94/168
Pr. M. Iguernane
Nous avons aussi la moyenne conditionnelle yi , c’est à dire la

moyenne des valeurs de Y sous la condition xi , elle est définie
par
l l
X 1 X
y i := fj/i yj = nij yj .
ni•
j=1 j=1
p
Pour l’écart-type conditionnel, nous avons σYi := Var (Yi ) avec
l
X
Var (Yi ) := fj/i (yj − y i )2 = y 2 i − (y i )2 .
j=1
3-3-3 Notion de covariance

Nous notons par Cov (X , Y ) la covariance entre les variables X
et Y. La covariance est un paramètre qui donne la variabilité de
X par rapport à Y (voir figure ci-dessous) :
95/168
Pr. M. Iguernane
La covariance se calcule par l’expression suivante

k l
1 XX
Cov (X , Y ) = xy − x y = nij xi yj − x y.
N
i=1 j=1
96/168
Pr. M. Iguernane
Nous avons aussi cette formule

k l
1 XX
Cov (X , Y ) = nij (xi − x)(yj − y).
N
i=1 j=1
Remarque 3.4
• Dans le cas où nous avons un tableau des données brutes
”representation 1” (nous n’avons pas d’effectifs), nous avons les
formules suivantes
n n n
1X 1X 1X
x= xi , y= yi , xy = xi yi .
N N N
i=1 i=1 i=1
• La covariance est une notion qui généralise la variance
Cov (X , X ) = Var (X ).
97/168
Pr. M. Iguernane
Définition 3.5
On dit que deux variables statistiques X et Y sont
indépendantes si et seulement si, pour tout i et j,
fij = fi• × f•j .
De manière équivalente, pour tout i et j,
N × nij = ni• × n•j .
Dans ce cas, si X et Y sont indépendantes alors Cov (X , Y ) = 0

(réciproque est fausse).
Il suffit que cette égalité ne soit pas vérifiée dans une seule cel-
lule pour que les deux variables ne soient pas indépendantes.
98/168
Pr. M. Iguernane
3-4 Ajustement linéaire
I Est-il possible de trouver une fonction numérique f telle que

y = f (x) ?
I Si une telle fonction existe, on dit que f est un modèle du
phénomène étudié.
99/168
Pr. M. Iguernane
I On désire trouver la droite qui passe ” au mieux ” à l’intérieur

du nuage de points.
100/168
Pr. M. Iguernane
3-4-1 La méthode des moindres carrés :
101/168
Pr. M. Iguernane
Régression linéaire de Y en X :
La droite de régression linéaire de y en x, notée Dy/x , minimise

S = ni=1 ei2 = ni=1 (yi − axi − b)2 . La droite Dy /x passe par
P P
le point moyen (x, y ).
Pn
(x − x)(yi − y) Cov(x, y)
a = i=1 Pn i 2
= , b = y − ax.
i=1 (xi − x) V(x)
102/168
Pr. M. Iguernane
103/168
Pr. M. Iguernane
Régression linéaire de X en Y :
La droite de régression linéaire de x en y , notée Dx/y , minimise

S 0 = ni=1 ei 0 2 = ni=1 (xi − a0 yi − b0 )2 . La droite Dx/y passe par
P P
le point moyen (y, x).
Pn
(x − x)(yi − y) Cov(x, y)
0
a = i=1 Pn i 2
= , b0 = x − a0 y.
(y
i=1 i − y) V(y)
104/168
Pr. M. Iguernane
Liens entre corrélation et droites de régression :

Le coefficient de corrélation linéaire entre X et Y est :
σx σy
ρ=a = a0
σy σx
et on a
ρ2 = aa0 .
105/168
Pr. M. Iguernane
3-4-2 Ajustement à une fonction exponentielle :

xi 2.8 4.3 2.7 4.2 4.1 ... 4.0
yi 0.8 1.2 1.5 1.9 2.3 ... 3.1
106/168
Pr. M. Iguernane
y = bax Forme exponentielle générale.

Alors
ln y = ln b + x ln a.
Changement de variable : Y = AX + B avec :
Y = ln y , X = x, A = ln a, B = ln b.
L’ajustement affine de Y en fonction de X donne A et B, d’où
a = eA , b = eB et le modèle y = bax . 107/168
Pr. M. Iguernane
Le modèle exponentiel est mieux adapté que le modèle affine.

108/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois
PARTIE II :
Eléments de probabilité
109/168
Pr. M. Iguernane
Chapitre 4 :
Analyse combinatoire :
dénombrement
110/168
Pr. M. Iguernane
4-1 Introduction
L’analyse combinatoire est une branche des mathématiques

qui étudie comment compter les objets. Elle fournit des méthodes
de dénombrements particulièrement utiles en théorie des proba-
bilités. Les probabilités dites combinatoires utilisent constam-
ment les formules de l’analyse combinatoire développées dans
ce chapitre. Un exemple des applications intéressantes de cette
dernière est la démonstration du développement du binôme de
Newton utilisé dans le calcul des probabilités d’une loi bino-
miale.
111/168
Pr. M. Iguernane
4-2 Arrangements
Définition 4.1
I Etant donné un ensemble E de n objets, on appelle arrange-
ments de p objets toutes suites ordonnées de p objets pris
parmi les n objets.
I Le nombre d’arrangements de p objets pris parmi n est noté :
Apn .
Remarque 4.2
On a nécessairement 1 ≤ p ≤ n et n, p ∈ N∗ .
Si n < p, alors Apn = 0.
Deux arrangements de p objets sont donc distincts s’ils
diffèrent par la nature des objets qui les composent ou par
leur ordre dans la suite.
112/168
Pr. M. Iguernane
Exemple 1 :
• Une séquence d’ADN est constituée d’un enchaı̂nement de 4 nucléo-
tides [A (Adénine), C (Cytosine), G (Guanine) et T (Thymine)]. Il
existe différents arrangements possibles de deux nucléotides ou di-
nucléotides avec p=2 et n=4.
• Le nombre de mots de 5 lettres (avec ou sans signification) formés
avec les 26 lettres de l’alphabet correspond au nombre d’arrange-
ments possibles avec p=5 et n=26.
• Le tiercé dans l’ordre lors d’une course de 20 chevaux constitue un
des arrangements possibles avec p=3 et n=20.
Dans les exemples précédents, l’ordre des éléments dans la suite est
essentiel. Ainsi pour le deuxième exemple, le mot NICHE est différent
du mot CHIEN. Mais dans les deux premiers exemples, une base ou
une lettre de l’alphabet peut se retrouver plusieurs fois alors que
dans le troisième exemple, les trois chevaux à l’arrivée sont forcément
différents. Il faut donc distinguer le nombre d’arrangements avec rép-
étition et le nombre d’arrangements sans répétition (arrangements
au sens strict). 113/168
Pr. M. Iguernane
4-2-1 Arrangements avec répétitions.

Propriété 4.3
Lorsqu’un objet peut être observé plusieurs fois dans un arran-
gement, le nombre d’arrangement avec répétition de p objets
pris parmi n, est alors :
Apn = np avec 1 ≤ p ≤ n.
Preuve :
Pour le premier objet tiré, il existe n manières de ranger l’objet
parmi n. Pour le second objet tiré, il existe également n possi-
bilités d’arrangements car le premier objet fait de nouveau parti
des n objets. On parle de tirage avec remise. Ainsi pour les p
objets tirés, il y aura n × n × n × .... × n (p fois) arrangements
possibles, soit
Apn = n × n × n × .... × n = np .
114/168
Pr. M. Iguernane
Exemple 2 :
Concernant l’exemple de la séquence d’ADN, le nombre de di-
nucléotides attendus si l’on fait l’hypothèse qu’une base peut
être observée plusieurs fois dans la séquence (ce qui corres-
pond effectivement à la réalité) est donc :
A24 = 42 = 16
dinucléotides possibles.
Les 16 dinucléotides identifiables dans une séquence d’ADN

sont :
AA AC AG AT CA CC CG CT
GA GC GG GT TA TC TG TT
115/168
Pr. M. Iguernane
4-2-2 Arrangements sans répétitions.

Propriété 4.4
Lorsque chaque objet ne peut être observé qu’une seule
fois dans un arrangement, le nombre d’arrangements sans
répétition de p objets pris parmi n est alors :
n!
Apn = avec 1 ≤ p ≤ n.
(n − p)!
Preuve :
Pour le premier objet tiré, il y a n manières de ranger l’objet
parmi n. Pour le second objet tiré, il n’existe plus que n-1 manières
de ranger l’objet car le premier objet ne peut plus être pris en
compte. On parle de tirage sans remise. Ainsi pour les p ob-
jets tirés parmi n, si 1 ≤ p ≤ n, il y aura :
n!
Apn = n(n − 1)(n − 2)....(n − p + 1) = .
(n − p)!
116/168
Pr. M. Iguernane
Exemple 3 :
Concernant l’exemple de la séquence d’ADN, le nombre de di-
nucléotides attendu dans une séquence si l’on fait l’hypothèse
qu’une base n’est observée qu’une seule fois est donc :
4!
A24 = = 12
(4 − 2)!
dinucléotides possibles.
Sous cette contrainte, les 12 dinucléotides possibles sont :
AA
AC AG AT CA
CC
CG CT
GA GC
GG
GT TA TC TG
TT
.
Ceci correspond aux 16 arrangements possibles avec répétition

(Apn = np ) auxquels sont soustraits les 4 dinucléotides (n) résultant
de l’association d’une même base.
117/168
Pr. M. Iguernane
4-3 Permutations
4-3-1 Permutations sans répétition
Définition 4.5
I Etant donné un ensemble E de n objets, on appelle permuta-
tions de n objets distincts toutes suites ordonnées de n objets
ou tout arrangement n à n de ces objets.
I Le nombre de permutations de n objets est noté : Pn = n!.
La permutation de n objets constitue un cas particulier d’arran-

gement sans répétition de p objets pris parmi n lorsque p = n.
Ainsi le nombre de permutations de n objets est :
n!
Ann = = n!
(n − n)!
Exemple 4 :
Le nombre de manières de placer 8 convives autour d’une table
est : P8 = 8! = 40320 possibilités. 118/168
Pr. M. Iguernane
4-3-2 Permutations avec répétition

Définition 4.6
I Dans le cas où il existerait plusieurs répétitions k d’un même
objet parmi les n objets, le nombre de permutations possibles
des n objets doit être rapporté aux nombres de permutations
des k objets identiques.
n!
I Le nombre de permutations de n objets est alors : Pn = .
k!
En effet, les permutations de k objets identiques sont toutes
identiques et ne comptent que pour une seule permutation.
Exemple 5 :
Considérons le mot CELLULE . Le nombre de mots pos-
sibles (avec ou sans signification) que l’on peut écrire en per-
7!
mutant ces 7 lettres est : P7 = 2!3! = 420 mots possibles en
considérant deux groupes de lettres identiques : L (3 fois) et E
(2 fois). 119/168
Pr. M. Iguernane
4-4 Combinaisons
Si l’on reprend l’exemple de la séquence d’ADN, à la différence

des arrangements où les dinucléotides AC et CA formaient deux
arrangements distincts, ces derniers ne formeront qu’une seule
combinaison. Pour les combinaisons, on ne parle plus de suite ni
de série puisque la notion d’ordre des objets n’est plus prise
en compte. On parle alors de tirages avec ou sans remise.
4-4-1 Combinaisons sans remise

Définition 4.7
I Etant donné un ensemble E de n objets, on appelle combi-
naisons de p objets tout ensemble de p objets pris parmi les n
objets sans remise.
I Le nombre de combinaisons de p objets pris parmi n est noté :
Cnp .
120/168
Pr. M. Iguernane
Exemples 6 :
• Le tirage au hasard de 5 cartes dans un jeu de 32 (main de
poker) est une combinaison avec p=5 et n=32.
• La formation d’une délégation de 5 personnes parmi un groupe
de 50 constitue une combinaison avec p=5 et n=50.
Pour ces deux exemples, les objets tirés sont clairement dis-
tincts.
Propriété 4.8
Le nombre de combinaisons de p objets pris parmi n et sans
remise est :

p n! n
Cn = notée avec 1 ≤ p ≤ n.
p!(n − p)! p
121/168
Pr. M. Iguernane
Exemples 7 :
Dans le cadre de l’exemple de la séquence d’ADN, le nombre de
dinucléotides attendus sans tenir compte de l’ordre des bases
dans la séquence (hypothèse justifiée dans le cas de l’ADN non
codant) est donc :

2 4 4!
C4 = = = 6 dinucléotides.
2 2!(4 − 2)!
Les 6 dinucléotides possibles sous cette hypothèse sont :
AC AG AT CG CT GT
CA GA TA GC TC TG
122/168
Pr. M. Iguernane
4-4-2 Combinaisons avec remise

Propriété 4.9
Le nombre de combinaisons de p objet parmi n avec remise
est :
p (n + p − 1)!
Cn+p−1 = .
p!(n − 1)!
4-4-3 Propriétés des combinaisons :

z La symétrie :
Cnp = Cnn−p .
z Combinaisons composées ou Formule de Pascal :
Cnp = Cn−1
p−1 p
+ Cn−1 .
Les termes du triangle de Pascal résultent de l’application di-

recte de cette relation.
123/168
Pr. M. Iguernane
... p-1 p ...

...
p−1 p
n-1 Cn−1 Cn−1
n Cnp
Pour établir le triangle de Pascal, il suffit de porter les valeurs
prises par p en colonne et celles prises par n en ligne (voir ta-
bleau ci-dessus). La valeur attribuée à chaque case, Cnp , est ob-
tenue en faisant la somme de la valeur de la case située juste
p
au–dessus, Cn−1 et la valeur de la case située au-dessus et à
p−1
gauche Cn−1 .
Le triangle de Pascal permet d’obtenir par récurrence les coeffi-
cients numériques ou coefficient binomiaux du binôme de New-
ton. 124/168
Pr. M. Iguernane
4-4-4 Formule du binôme de Newton

Propriété 4.10
∀(a, b) ∈ R2 , n ∈ N :
n
Cnp an−p bp .
X
n
(a + b) =
p=0
Les coefficients binomiaux Cnp qui sont les coefficients de la for-

mule du binôme de Newton figurent dans de nombreuses for-
mules mathématiques, notamment pour le calcul des probabi-
lités de la loi binomiale. Ces coefficients peuvent être obtenus
facilement à l’aide du triangle de Pascal.
125/168
Pr. M. Iguernane
Exemple 8 :
Le développement de (a + b)6 donne :
6
C6p a6−p bp
X
(a + b)6 =
p=0

6 6 6 5 6
= a + a b+ a4 b 2 +
0 1 2

6 6 6 6
a3 b 3 + 2 4
a b + 5
ab + b6
3 4 5 6
L’application du triangle de Pascal (7ème ligne) donne

directement les valeurs des coefficients binomiaux :
(a + b)6 = a6 + 6a5 b + 15a4 b2 + 20a3 b3 + 15a2 b4 + 6ab5 + b6 .
126/168
Pr. M. Iguernane
Remarque 4.11
Si l’on pose a = b = 1, on obtient alors, d’après la formule du
binôme de Newton
n
Cnp .
X
2n =
p=0
Or Cnp étant le nombre

P de parties à p éléments de l’ensemble E
contenant n objets, np=0 Cnp représente le nombre de parties
ou partitions de l’ensemble E que l’on note :
Si card E = n alors card P(E) = 2n .
Le cardinal d’un ensemble (card) correspond au nombre d’élé-

ments constituant cet ensemble.
127/168
Pr. M. Iguernane
Chapitre 5 :
Probabilités : Définitions
élémentaires
128/168
Pr. M. Iguernane
5-1 Expériences aléatoires

Définition 5.1
On appelle expérience aléatoire une expérience dont les
issues (les résultats) ne sont pas déterminés à l’avance.
L’ensemble, souvent noté Ω, de toutes les issues pos-
sibles est appelé univers ou espace d’échantillonnage
de l’expérience.
Exemple 1 :
I On jette un dé à six faces, il y a six issues possibles :
Ω = {1, 2, 3, 4, 5, 6}.
I Un fabricant contrôle les produits sortis de ses chaı̂nes : il y a
deux issues possibles, ou bien le produit est sans défaut et peut
être vendu, ou bien le produit présente des défauts et va être
jeté :
Ω = { conforme , non conforme}. 129/168
Pr. M. Iguernane
Exemple 2 :
I On choisit un nombre entier positif :
Ω = N.
A la différence de l’exemple précédent, l’univers Ω est ici in-

fini. On parle là d’infini discret (les valeurs possibles sont toutes
isolées).
I On choisit un point dans le plan. Là,
Ω = R2 ,
et l’univers est aussi infini, mais cette fois-ci on parle d’infini

continu.
130/168
Pr. M. Iguernane
5-2 Événements
Définition 5.2
Un sous-ensemble, ou partie, de Ω est appelé un
événement. L’ensemble des événements est donc l’en-
semble noté P(Ω) des parties de Ω.
En particulier Ω et ∅ sont appelés événement certain et
événement impossible respectivement.
Un ensemble qui ne contient qu’une seule issue est un
événement élémentaire.
Exemple 3 :
dans l’expérience du dé, on obtient 1 est un événement
élémentaire, on obtient un nombre impair ou on obtient
un nombre inférieur ou égal à 4 sont deux événements (non
élémentaires).
131/168
Pr. M. Iguernane
5-3 Opérations sur les événements
Définition 5.3
A et B sont deux événements. Alors :
L’événement contraire de A est son complémentaire dans
Ω, noté A ou Ω − A, et se comprend A n’est pas réalisé .
La réunion de A et B est A ∪ B et se comprend A ou B (ou
les deux) sont réalisés .
L’intersection de A et B est A ∩ B et se comprend A et B
sont réalisés simultanément .
Exemple 4 :
Dans l’expérience du dé, si
A = {1, 3, 5} = on obtient un nombre impair ,
132/168
Pr. M. Iguernane
B = {1, 2, 3, 4} = on obtient un nombre inférieur ou égal à 4 ,

alors
A = {2, 4, 6} = on obtient un nombre pair ,
B = {5, 6} = on obtient un nombre strictement supérieur à 4 ,
A ∪ B = {1, 2, 3, 4, 5} = on obtient un nombre impair ou
un nombre inférieur ou égal à 4 ,
A ∩ B = {1, 3} = on obtient un nombre impair
inférieur ou égal à 4 .
Définition 5.4
Deux événements sont incompatibles s’ils ne peuvent se pro-
duire simultanément, i.e si leur intersection est vide : A ∩ B = ∅.
Bien sûr, un événement et son contraire sont toujours incompa-
tibles 133/168
Pr. M. Iguernane
5-4 Loi de probabilité

Définition 5.5
I Une probabilité est une application p de P(Ω) dans [0 ; 1]
telle que :
p(Ω) = 1.
Si A et B sont deux événements incompatibles,
p(A ∪ B) = p(A) + p(B).
I Le couple (Ω, p) est dite un espace probabilisé.
Propriétés 5.6
0 ≤ p(A) ≤ 1 pour tout événement A.
p(∅) = 0, p(Ω) = 1.
p(A) = 1 − p(A) pour tout événement A.
p(A ∪ B) + p(A ∩ B) = p(A) + p(B) pour tous événements
A,B.
134/168
Pr. M. Iguernane
5-5 Le cas particulier des univers finis

Pour étudier un phénomène à l’aide des probabilités, on a be-
soin de connaı̂tre la loi de probabilité p, qui est une fonction de
P(Ω) dans [0 ; 1], donc a priori on a besoin de connaı̂tre sa va-
leur sur chaque sous-ensemble de Ω. Mais en fait, quand Ω est
fini, la connaissance de p sur chaque événement élémentaire
suffit : si A ⊂ Ω est un événement quelconque, A est fini et on
peut écrire A = {a1 , a2 , ..., ak }, donc
p(A) = p(a1 ) + p(a2 ) + ... + p(ak ).
Un cas encore plus particulier mais fondamental est le cas de

l’équiprobabilité :
Définition 5.7
Sur un univers fini, on dit que la loi est équiprobable si tous les
événements élémentaires ont la même probabilité.
135/168
Pr. M. Iguernane
Propriété 5.8
Si la loi p est équiprobable, alors :
La probabilité de chaque événement élémentaire est
1/card(Ω).
La probabilité d’un événement A est :
card(A) nombre d’éléments de A

p(A) = = .
card(Ω) nombre d’éléments de Ω
Exemple 5 :
Dans des expérience de tirage au sort (pile ou face, dé, ...), sans
précisions supplémentaires on supposera que le jeu n’est pas
truqué, ce qui revient à dire que la loi est équiprobable : tous les
événements élémentaires ont la même probabilité (une chance
sur deux de faire pile, une chance sur deux de faire face ; une
chance sur six de tirer 1, une chance sur six de tirer 2, etc... ).
136/168
Pr. M. Iguernane
5-6 Le cas particulier des probabilités infinies

discrètes
Ω infini est dit discret si on peut énumérer ses éléments, i.e si
on peut écrire
Ω = {x1 , x2 , ...}.
Typiquement, cela correspond à des expériences dont le résultat
est un entier naturel. Comme dans le cas précédent, on ob-
tient la probabilité d’un événement quelconque comme somme
(éventuellement infinie) des événements élémentaires qui le com-
posent.
Exemple 6 :
On considère la probabilité de désintégration des atomes d’un
composé radioactif durant un intervalle de temps de longueur t
fixé. Ici, Ω = N, et
Λn t n −Λt
pn = e .
n!
137/168
Pr. M. Iguernane
5-7 Le cas particulier des probabilités continues
Pour étudier les probabilités sur des univers continus infinis, par
exemple :
Choix d’un nombre au hasard dans [0 ; 1] ;
Durée de vie d’une voiture dans [0; +∞[, ...
On va comme dans le cas fini partir d’événements de base qui
permettent de reconstituer tous les événements, donc de calcu-
ler toutes les propriétés. Mais ici le problème est un peu plus
délicat. En effet, en général, avec un univers continu la pro-
babilité de chaque événement élémentaire est nulle, et cette
information ne permet pas de déterminer la valeur de p(A) pour
tout événement A.
Pour ce qui suit on prend pour un intervalle de R (par exemple,

[0 ; 1], ou [0; +∞[, ou R lui-même...).
138/168
Pr. M. Iguernane
Ces événements de base vont ici être les segments [a, b]. Dans
la plupart des cas, les événements qui nous intéressent pourront
être décrits comme réunion, intersection, complémentaires, ...
de segments et on pourra donc déduire ainsi leur probabilité
de celles de ces segments grâce aux règles de calcul sur les
probabilités.
Dans le cas des probabilités continues on associe à chaque pro-
babilité une densité de probabilité :
Définition 5.9
I Une densité deR probabilité est une fonction f intégrable et
positive, telle que Ω f = 1.
I La probabilité p est caractérisée par le fait que pour tout
événement A, Z
p(A) = f.
A
Rb
I En particulier, p([a; b]) = a f pour tout segment [a ; b].
139/168
Pr. M. Iguernane
Exemple 7 :
Le cas le plus simple est celui de la probabilité uniforme sur
[0 ; 1], qui correspond à l’expérience
on choisit au hasard un nombre compris entre 0 et 1, sans
privilégier aucune valeur .
Alors la densité correspondante est f = 1, et la probabilité d’ob-

tenir un nombre entre a et b (pour 0 ≤ a ≤ b ≤ 1) est égale
à Z b
p([a, b]) = 1 = b − a.
a
Ainsi, avec a = 0 et b = 1, la probabilité est 1 : le choix d’un
nombre entre 0 et 1 donne à coup sûr un nombre entre 0 et 1 !
Au contraire, si a = b, on constate que la probabilité de choisir
un nombre (a) donné à l’avance est nulle. Si a = 0, 25 et b =
0, 75 : on a une chance sur deux que le nombre choisi soit dans
l’intervalle [a ; b] de longueur 1/2.
140/168
Pr. M. Iguernane
5-8 Probabilités conditionnelles
Définition 5.10
Soit (Ω, p) un espace probabilisé, et A un événement de proba-
bilité non nulle.
On appelle probabilité que B soit réalisé sachant que A
l’est , ou plus simplement probabilité de B sachant A ,
la quantité
p(A ∩ B)
p(B|A) = .
p(A)
Exemple 8 :
On lance deux dés bien équilibrés.
Quelle est la probabilité que la somme des résultats soit stricte-
ment supérieure à 8 sachant que l’un des dés a donné 6.
141/168
Pr. M. Iguernane
A = ”l’un des dés donne 6”, alors
A = {(6, 1); (6, 2); (6, 3), (6, 4); (6, 5); (6, 6),
(1, 6); (2, 6); (3, 6), (4, 6); (5, 6)}
est de cardinal 11.

B = ”somme > 8”, alors
B = {(3, 6); (4, 5); (4, 6); (5, 5); (5, 6); (6, 6); (6, 5); (6, 4); (5, 4); (6, 3)}.
est de cardinal 10.

L’intersection
A ∩ B = {(3, 6); (4, 6); (5, 6); (6, 6); (6, 5); (6, 4); (6, 3)}
est de cardinal 7, donc la probabilité est

p(A ∩ B) 7
p(B|A) = = .
p(A) 11
142/168
Pr. M. Iguernane
Connaissant p(A|B), on aimerait parfois connaı̂tre p(B|A).

C’est souvent possible en écrivant de deux manières différentes
p(A ∩ B) à l’aide des définitions de p(A|B) et de p(B|A) :
Propriété 5.11
p(A ∩ B) = p(A)p(B|A) = p(B)p(A|B).
La formule ci-dessus peut s’exprimer sous la forme plus direc-

tement utilisable suivante :
Propriété 5.12
p(B|A) × p(A)
p(A|B) = .
p(B)
Dans les cas un peu plus compliqués, on peut avoir besoin de

la formule de Bayes.
143/168
Pr. M. Iguernane
5-9 Formule de Bayes
Considérons des événements incompatibles A1 , A2 , ..., An , et un

événement B qui ne peut se produire que si l’un des Ai se pro-
duit, les p(B|Ai ) étant connus. On cherche la probabilité pour
que, B s’étant produit, Ak en soit la cause. Commençons par
remarquer que p(B) = p(A1 ∩ B) + ... + p(An ∩ B) ; comme
p(Ak ∩ B) = p(Ak )p(B|Ak ), on obtient la formule des proba-
bilités totales :
Propriété 5.13
p(B) = p(B|A1 )p(A1 ) + p(B|A2 )p(A2 ) + ... + p(B|An )p(An ).
Alors en écrivant p(Ak |B) = p(Ak ∩B)/p(B) = p(B|Ak )p(Ak )/p(B),

et en remplaçant p(B) par la formule précédente, on obtient la
formule de Bayes :
144/168
Pr. M. Iguernane
Propriété 5.14
p(A )p(B|Ak )
p(Ak |B) = Pn k .
i=1 p(Ai )p(B|Ai )
Exemple 9 :
Un test de dépistage d’une maladie rare touchant une personne
sur 10000 semble efficace : il détecte 99% des personnes in-
fectées, avec seulement 0, 5% de faux positifs . Quelle est
la probabilité qu’une personne dont le test est positif (P) soit ef-
fectivement malade (M) ?
p(M)p(P|M)
p(M|P) = ' 1.94%.
p(M)p(P|M) + p(M)p(P|M)
145/168
Pr. M. Iguernane
5-10 Événements indépendants
On dit que deux événements A et B sont indépendants quand

l’un des deux est de probabilité nulle, ou bien, quand les deux
sont de probabilité non nulle, si le fait de savoir que l’un est
réalisé n’influe pas sur la probabilité que l’autre le soit. Autre-
ment dit :
Définition 5.15
Deux événements A et B de probabilité non nulle sont
indépendants quand
p(B|A) = p(B)
ou de manière équivalente quand
p(A|B) = p(A).
146/168
Pr. M. Iguernane
p(A ∩ B)
Comme p(B|A) = , cela équivaut à la
p(A)
Proposition 5.16
Deux événements A et B sont indépendants si et seulement si
p(A ∩ B) = p(A)p(B).
Remarque 5.17
Ne pas confondre les deux notions d’événements indépendants
et d’événements incompatibles ! Deux événements incompa-
tibles ne sont jamais indépendants (sauf si les deux sont de pro-
babilités nulle). En effet, si A et B sont incompatibles et que l’on
sait que A est réalisé, justement, B ne peut pas se produire...il
n’y a donc pas indépendance.
147/168
Pr. M. Iguernane
Chapitre 6 :
Variables aléatoires
réelles discrètes - Lois
usuelles
148/168
Pr. M. Iguernane
6-1 Introduction
Définition 6.1
Étant donné un ensemble Ω, on appelle algèbre d’événements
(ou tribu) toute famille A de parties de Ω telle que :
1 Ω ∈ A.
2 A ∈ A ⇒ A ∈ A.
S
3 Ai ∈ A, i ∈ N ⇒ i∈N Ai ∈ A.
(Ω, A) est dite espace probabilisable.
Dans la plupart des phénomènes aléatoires, le résultat d’une

épreuve peut se traduire par une grandeur mathématique,
très souvent représentée par un nombre entier ou un nombre
réel. La notion mathématique qui représente efficacement ce
genre de situation concrète est celle de variable aléatoire (notée
également v.a.).
149/168
Pr. M. Iguernane
Définition 6.2
Soit (Ω, A) un espace probabilisable. On appelle variable
aléatoire sur cet espace, toute application X : Ω → R telle que
pour tout intervalle I de R on a X −1 (I) ∈ A.
Exemple 1 :
Si l’on considère la constitution d’une fratrie de deux enfants,
l’univers est constitué des évènements élémentaires suivant :
Ω = {GG, GF , FG, FF }.
Les valeurs possibles prises par la variable aléatoire X, nombres

de fille dans la famille sont :
X (Ω) = {0, 1, 2}.
150/168
Pr. M. Iguernane
6-2 Définition
Définition 6.3
Une variable aléatoire est dite discrète si elle ne prend que
des valeurs discontinues dans un intervalle donné (borné
ou non borné).
L’ensemble des nombres entiers est discret.
En règle générale, toutes les variables qui résultent d’un
dénombrement ou d’une numération sont de type discrètes.
Exemple 2 :
Les variables aléatoires,
I le nombre de petits par porté pour une espèce animale donnée
(chat, marmotte, etc),
I le nombre de bactéries dans 100 ml de préparation,
I le nombre de mutations dans une séquence d’ADN de 10 kb, etc ...
sont des variables aléatoires discrètes.
151/168
Pr. M. Iguernane
6-3 Loi de probabilité

Définition 6.4
La loi de probabilité (ou distribution de probabilité) d’une
variable aléatoire discrète est entièrement déterminée par les
probabilités pi des évènements {X = xi }, xi parcourant l’univers
image X (Ω). La loi de probabilité est donnée par les (xi , pi )i .
Remarque 6.5
Afin de simplifier l’écriture, nous noterons pour la suite du cours :
P({X = xi }) équivalent à P(X = xi ) ou pi .
Exemple 3 :
Dans le cas de la constitution d’une fratrie de deux enfants, si
l’on fait l’hypothèse que la probabilité d’avoir un garçon est égale
à celle d’avoir une fille (1/2), alors la distribution de probabilité
ou loi de probabilité du nombre de filles dans une fratrie de deux
enfants est : 152/168
Pr. M. Iguernane
Ensemble des Valeurs de la Probabilités associées

évènements possibles variable aléatoire à la variable X
de Ω X P(X = xi ) ou pi
G et G 0 1/4
F et G ou G et F 1 1/2
F et F 2 1/4
Propriété 6.6
Une loi de probabilité n’est établie que si
X
pi = 1,
i
la somme étant étendue à tous les indices i.
153/168
Pr. M. Iguernane
6-4 Fonction de répartition
Définition 6.7
On appelle fonction de répartition d’une variable aléatoire X,
la fonction FX telle que :
FX : R → R
t 7→ FX (t) = P(X ≤ t).
Concrètement la fonction de répartition correspond à la distri-

bution des probabilités cumulées.
L’importance pratique de la fonction de répartition est qu’elle

permet de calculer la probabilité de tout intervalle dans R.
154/168
Pr. M. Iguernane
Les propriétés associées à la fonction de répartition sont les

suivantes :
Propriétés 6.8
Soit FX la fonction de répartition d’une variable aléatoire discrète
X alors :
1 ∀t ∈ R, 0 ≤ FX (t) ≤ 1.
2 FX est croissante sur R.
3 limt→−∞ FX (t) = 0 et limt→∞ FX (t) = 1.
4 Si a ≤ b, P(a < X ≤ b) = FX (b) − FX (a).
Dans le cas d’une variable aléatoire discrète, on utilise un dia-

gramme en bâtons pour visualiser la distribution de probabilités
et une fonction en escalier pour la fonction de répartition.
Exemple 4 :
On considère l’évènement ω lancer de 3 pièces . On introduit
une variable aléatoire X définie par X (ω) nombre de piles de 155/168
Pr. M. Iguernane
l’évènement ω . La loi de probabilité de X est :

Nombre de piles P(X = xi ) FX
0 1/8 1/8
1 3/8 4/8
2 3/8 7/8
3 1/8 1
156/168
Pr. M. Iguernane
6-5 Espérance mathématique

L’espérance d’une variable aléatoire X correspond à la moyenne des
valeurs possibles de X pondérées par les probabilités associées à ces
valeurs. C’est l’équivalent de la moyenne arithmétique X .
Définition 6.9
Si X est une variable aléatoire discrète définie sur un univers
probabilisé Ω, on appelle espérance de X, le réel défini par :
X
E(X ) = X (ω)P(ω).
ω∈Ω
Théorème 6.10
Si X est une variable aléatoire discrète de loi de probabilité (xi , pi )i
définit sur un nombre fini (n) d’évènements élémentaires alors :
n
X
E(X ) = xi pi .
i
157/168
Pr. M. Iguernane
Exemple 5 :
Si l’on reprend l’exemple d’une fratrie de deux enfants, l’espérance
de la variable aléatoire nombre de filles est :
E(X ) = 0 ∗ 1/4 + 1 ∗ 1/2 + 2 ∗ 1/4 = 1,
d’où E(X ) = 1.
Si l’on observe un nombre suffisant de fratries de 2 enfants, on
attend en moyenne une fille par fratrie.
Propriétés 6.11
Si X et Y sont deux variables aléatoires définies sur un même
univers Ω, admettant une espérance, alors :
1 E(X+Y)=E(X)+E(Y).
2 E(aX ) = aE(X ) ∀a ∈ R.
3 Si X ≥ 0 alors E(X ) ≥ 0.
4 Si X est un caractère constant tel que : ∀ω ∈ Ω X (ω) = k
alors E(X ) = k.
158/168
Pr. M. Iguernane
6-6 Variance
La variance d’une variable aléatoire V(X) est l’espérance mathématique
du carré de l’écart à l’espérance mathématique.
Définition 6.12
• Si X est une variable aléatoire ayant une espérance E(X), on
appelle variance de X le réel :
V (X ) = E([X − E(X )]2 ).
• Si X est une variable aléatoire ayant une variance V(X), on

appelle écart-type de X, le réel :
p
σ(X ) = V (X ).
Propriété 6.13
V (X ) = E(X 2 ) − [E(X )]2

159/168
Pr. M. Iguernane
Définition 6.14
Si X est une variable aléatoire discrète de loi de proba-
bilité (xi , pi )i définie sur un nombre fini (n) d’évènements
élémentaires alors la variance est égale à :
n
X n
X
V (X ) = (xi − E(X ))2 pi = x i pi − (E(X ))2 .
i=1 i=1
Exemple 6 :
Si l’on reprend l’exemple d’une fratrie de deux enfants, la va-
riance de la variable aléatoire nombre de filles est :
V (X ) = 1/4(0 − 1)2 + 1/2(1 − 1)2 + 1/4(2 − 1)2 = 1/2
V (X ) = 1/2 et σ(X ) = 0, 7.
160/168
Pr. M. Iguernane
6-7 Loi discrète uniforme

Définition 6.15
Une distribution de probabilité suit une loi discrète uniforme
lorsque toutes les valeurs prises par la variable aléatoire sont
équiprobables. Si n est le nombre de valeurs différentes prises
par la variable aléatoire,
1
∀i, P(X = xi ) = .
n
Exemple 7 :
La distribution des chiffres obtenus au lancer de dé (si ce dernier
est non truqué) suit une loi uniforme dont la loi de probabilité est
la suivante :
X 1 2 3 4 5 6
P(X = xi ) 1/6 1/6 1/6 1/6 1/6 1/6
avec pour espérance : 161/168
Pr. M. Iguernane
6
1X
E(X ) = i = 3, 5
6
i=1
et pour variance
6
1X 2
V (X ) = i − (E(X ))2 = 2, 92
6
i=1
où les valeurs xi correspondent au rang i de la variable X dans

la série.
Propriétés 6.16
Dans le cas particulier d’une loi discrète uniforme où les
valeurs de la variable aléatoire X correspondent au rang
xi = i (∀i ∈ [1, n])
n+1 n2 − 1
E(X ) = et V (X ) = .
2 12
162/168
Pr. M. Iguernane
6-8 Loi de Bernoulli

Soit un univers Ω constitué de deux éventualités, S pour succès
et E pour échec
Ω = {E, S}
sur lequel on construit une variable aléatoire discrète, nombre
de succès telle que au cours d’une épreuve,
si S est réalisé, X = 1
si E est réalisé, X = 0.
Définition 6.17
On appelle variable de Bernoulli ou variable indicatrice, la va-
riable aléatoire X telle que : X : Ω → R et
X (Ω) = {0; 1}.

163/168
Pr. M. Iguernane
Définition 6.18
La loi de probabilité associée à la variable de Bernoulli X telle
que,
P(X = 1) = p
P(X = 0) = q
avec p+q = 1, est appelée loi de Bernoulli notée B(1, p).
Propriétés 6.19
L’espérance de la variable de Bernoulli est
E(X ) = p.
La variance de la variable de Bernoulli est
V (X ) = pq.
164/168
Pr. M. Iguernane
6-9 Loi binomiale
Définition 6.20
On exécute n épreuves indépendantes, chacune ayant une pro-
babilité p de succès. La variable aléatoire X qui compte le
nombre de succès sur l’ensemble des n épreuves est dite va-
riable aléatoire binomiale de paramètres (n, p), notée B(n, p).
Proposition 6.21
La loi de probabilité d’une v.a. binomiale de paramètres (n, p)
est donnée par :
P(X = i) = p(i) = Cni pi q n−i , avec q = 1 − p.
Exemple 8 :
On jette 5 pièces équilibrées. Les résultats sont supposés indépe-
ndants. Soit X la v.a. qui compte le nombre de piles obtenus.
165/168
Pr. M. Iguernane
X 0 1 2 3 4 5 Somme
P(X = i) 1/32 5/32 10/32 10/32 5/32 1/32 1
iP(X = i) 0 5/32 20/32 30/32 20/32 5/32 80/32
Ainsi l’espérance de X est :
E(X ) = 80/32.
Propriétés 6.22
Soit X une variable aléatoire binomiale de paramètres (n, p).
L’espérance de X est :
E(X ) = np.
La variance de X est :
V (X ) = npq.
166/168
Pr. M. Iguernane
6-10 Loi de Poisson
Définition 6.23
Si la v.a. X est à valeurs dans N, on dit que X suit la loi de
Poisson de paramètre λ > 0 si :
λn −λ
P(X = n) = e .
n!
Propriétés 6.24
Soit X une variable aléatoire poissonnienne de paramètre λ.
L’espérance de X est :
E(X ) = λ.
La variance de X est :
V (X ) = λ.
167/168
Pr. M. Iguernane
Proposition 6.25
[Approximation poissonnienne d’une loi binomiale]

Soit X une v.a. binomiale de paramètres n, p. Si n est grand et
p petit, la loi de Poisson de paramètre λ = np est une bonne
approximation de X.
Exemple 9 :
On suppose que le nombre d’erreurs par page dans un livre
suit une loi de Poisson de paramètre λ = 1/2. Quelle est la
probabilité qu’il y ait au moins une erreur sur la page 41 ?
Soit X le nombre d’erreurs sur la page 41.
P(X ≥ 1) = 1 − P(X = 0) = 1 − e1/2 ' 0, 393.
MERCI POUR VOTRE ATTENTION

FIN DU COURS
168/168
Pr. M. Iguernane

Cours Proba-Stat-M5-GI

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Cours Proba-Stat-M5-GI

Transféré par

Droits d'auteur :

Formats disponibles

Probabilités et Statistiques

Filière: Génie Informatique

Année Universitaire : 2020-2021

Université Ibn Zohr

Le mot statistique a été créé au 18ème siècle par le Professeur

La statistique joue un rôle de plus en plus important dans tous

1-2 Définition du champ de la statistique

Population et unités statistiques :

♣ Les critères quantitatifs sont les critères qui sont représentés

Un caractère qualitatif peut être :

Modes de regroupement des unités statistiques :

Les unités statistiques d’une population peuvent être représent-

Réduction des données

2-1 Les tableaux et les graphiques

Dans ce paragraphe on va détailler comment résumer l’informa-

Alors ici la variable est X = Boisson non-alcoolisée, qui est une

La fréquence relative d’une modalité étant égale à sa

deux graphiques qui résument la même information contenue

Le deuxième graphique qu’on peut faire est le diagramme

Exemple 2 : Lors d’une enquête de satisfaction de la clientèle,

Ici la variable, “degré de satisfaction“ est une variable qualitative

On peut résumer l’information contenue dans ces données

En ce qui concerne la représentation graphique, les mêmes gra-

Cas de variables quantitatives

le nombre d’accidents de travail enregistrés par semaine. Il a

Quant au diagramme à bâtons, on obtient quelque chose comme :

♣ Cas des variables quantitatives continues.

Ainsi, par exemple, si n = 150, il faut former

016, 00 058, 50 068, 20 078, 00 079, 45 142, 20 145, 30

Le nombre de classe à former est

Ce qui donne le tableau des fréquences suivant, où les classes

Quand aux graphiques, on va ici privilégier trois graphiques pour

♣ L’histogramme, qui est une suite de rectangles juxtaposés

♣ Le polygone des fréquences, qui consiste à joindre le mi-

♣ La courbe des fréquences cumulées (Ogive).

2-2 Les mesures de tendance centrale

On appelle mesures de tendance centrale, des valeurs de la

Exemple 5 : Si on reprend l’exemple des boissons non-alcoolisées,

Alors, le mode de cette variable est Mo(X ) = Coca − Cola(CC),

Exemple 6 : En reprenant l’exemple des recettes quotidiennes

120 105 90 201 196 65 88 163 103 116

I Les données groupées par valeurs.

I Les données groupées par classes.

I Les propriétés d’une moyenne échantillonnale.

Posons Y le gain net hebdomadaire de ces étudiants alors

I Cas d’une variable qualitative ordinale.

Où x[l]+1 signifie, l’observation occupant le rang immédiatement

Exemple 11 : Reprenons les données de l’exemple 2, où X est

I Cas de données quantitatives en vrac ou groupées par

Exemple 13 : Reprenons les données de l’exemple 3, où X est

I Cas de données groupées par classes.

Exemple 14 : En reprenant les données où X donne la re-

Alors ici, la classe médiane est Cm = [binf , bsup [= [280, 370[.

0.5 − F(m−1) 0.5 − 0.475

2-3 Les mesures de position

On a déjà parlé de la médiane comme mesure de tendance

On va décrire la façon de les calculer, dans les 3 cas possibles

−2 − 3 10 12 120 11 4 8 6 13 130 200.

−3 − 2 4 6 8 10 11 12 13 120 130 200.

Puisque l2 = 6 est un entier alors

la 9ème observation+la 10ème observation 13 + 120

Puisque l2 = 5 est un entier alors

la 5ème observation+la 6ème observation 8 + 10

I Les données groupées par valeurs.