Vous êtes sur la page 1sur 168

Probabilités et Statistiques

Filière: Génie Informatique


Semestre 1

Pr. M. Iguernane

Email: mohamed.iguernane@gmail.com
m.iguernane@uiz.ac.ma

Année Universitaire : 2020-2021

Université Ibn Zohr


Faculté Polydisciplinaire - Taroudant

1/168
Pr. M. Iguernane
Sommaire
Statistique descriptive :
Généralités : Population, Echantillon, Variables, Types de
variables.
Séries statistiques unidimensionnelle : Tableau des distri-
butions, graphiques, paramètres de position, paramètres de
dispersion.
Séries statistiques bi-variées : séries appariées, séries non
appariées, table de contingence, covariance, corrélation, ajus-
tement linéaire par la méthode des moindres carrées.

Eléments de probabilité :
Analyse combinatoire : dénombrement
Calcul des probabilités : événements, équiprobabilité, pro-
babilité conditionnelle, indépendance, Théorème de Bayes.
Variables aléatoires réelles discrètes : Principales loi de pro-
babilité, fonction de répartition, espérance mathématique,
variance, écart-type
2/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

PARTIE I :

Statistique descriptive

3/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

Chapitre 1 :

Vocabulaire de la
statistique descriptive

4/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

1-1 Introduction

Le mot statistique a été créé au 18ème siècle par le Professeur


allemand GOTTERIED ACHENWAL. Mais la statistique était uti-
lisée bien avant l’invention du terme. En effet, les dénombrements
de population humaine et de terre été réalisés depuis la plus
haute antiquité pour des besoins de la guerre et de l’impôt. Au
19ème siècle, il y a eu l’apparition du calcul des probabilités
qui est étroitement lié aux jeux de hasard. Ceci a donné nais-
sance à une discipline appelée statistique mathématique. Du-
rant cette période, le belge ADOLPHE QUETELET transposa le
calcul des probabilités à l’économie et à la démographie. L’essor
de la statistique a eu lieu au cours du 20ème siècle, et ce grâce
à la naissance et au développement de l’informatique qui a
provoqué une extension considérable des possibilités d’utilisa-
tion des méthodes statistiques et du champ d’application de ces
méthodes. 5/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

La statistique joue un rôle de plus en plus important dans tous


les domaines de l’activité humaine. Elle intervient aujourd’hui
dans l’agriculture, la biologie, les affaires, la chimie, les commu-
nications, l’économie, l’éducation, l’électronique, la médecine, la
pharmacie, la physique, les sciences politiques, la psychologie,
la sociologie, et dans d’autre branche encore de la science et
de la technologie.
On désigne par exemple par économétrie, l’application de la
statistique à l’économie, par sociométrie, psychométrie et bio-
métrie l’application de la statistique respectivement à la socio-
logie, à la psychologie et à la biologie.

6/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

1-2 Définition du champ de la statistique


On divise généralement l’étude de la statistique générale en
deux parties :
La statistique descriptive, qui est l’ensemble des méthodes à
partir desquelles on recueille, ordonne, réduit, et condense les
données.
La statistique mathématique, dont l’objet est de formuler des
lois à partir de l’observation d’échantillons, c’est-à-dire de tirages
limités effectués au sein d’une population.

7/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

1-3 Terminologie

Population et unités statistiques :


En statistique, la population désigne un ensemble d’unités sta-
tistiques. Les unités statistiques sont les entités abstraites qui
représentent des personnes, des populations d’animaux ou des
objets. ”Individu” est parfois employé comme synonyme du
terme ”unité statistique”.
La statistique sert à décrire l’ensemble des unités statistiques
qui composent la population. On commence par compter ces
unités. La première information statistique que l’on tire d’une po-
pulation est en effet le nombre de ses unités.
Echantillons :
On parle d’échantillon d’une population statistique pour désigner
le prélèvement, au hasard ou selon une méthode qui permet
d’assurer la représentativité par rapport à la population totale,
d’un petit nombre d’unités statistiques au sein de la population. 8/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

Critères de classification :
On distingue deux sortes de critères :
1 Les critères quantitatifs.
2 Les critères qualitatifs.

9/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

♣ Les critères quantitatifs sont les critères qui sont représentés


par des nombres et sur lesquels les opérations arithmétiques de
base ont un sens. Les critères quantitatifs sont souvent appelés
variables.On distingue deux sortes de variables quantitatives :
Variable statistique discrète : L’ensemble de ses moda-
lités est fini ou dénombrable.
Exemples : nombre d’enfant par ménage, nombre de pièces
par appartement,...
Variable statistique continue : Elle peut prendre n’importe
quelle valeur dans un intervalle donné. Autrement dit, si
l’ensemble de ses modalités n’est pas dénombrable.
Exemples : L’âge, la taille, le poids d’un individu,...
♣ Les critères qualitatifs sont tous les critères qui ne sont pas
représentés par des nombres. Pour les distinguer des critères
quantitatifs , on les appelle des caractères, (parfois  va-
riables ).
10/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

Un caractère qualitatif peut être :


Ordinal : si ses modalités peuvent être naturellement ordonnées.
Exemple : satisfaction plus ou moins grande après l’achat d’un
produit.
Nominal : si ses modalités ne peuvent être naturellement or-
données.
Exemples : état matrimoniale, couleur des yeux,...

11/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

Modes de regroupement des unités statistiques :

Les unités statistiques d’une population peuvent être représent-


ées sous forme d’une série simple ou regroupées. Lorsqu’elles
sont regroupées on les appelle des distributions. Les unités
d’une population peuvent être distribuées par valeurs (lorsque le
critère de regroupement est numérique) ou distribuées par mo-
dalités (lorsque le critère de regroupement n’est pas numérique).
On peut aussi effectuer des regroupements par catégories (ou
classes) de valeurs ou par catégories (ou classes) de moda-
lités. Lorsqu’on effectue une distribution par catégories ou classes
de valeurs, on peut choisir des classes d’égales amplitudes ou
des classes d’inégales amplitudes. L’amplitude de classe est la
différence entre la valeur supérieure et la valeur inférieure de la
classe. Le centre de classe est égal à la somme de la valeur
inférieure et de la valeur supérieure, divisée par deux.
12/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

Chapitre 2 :

Réduction des données

13/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

2-1 Les tableaux et les graphiques

Dans ce paragraphe on va détailler comment résumer l’informa-


tion contenue dans une série de données soit par des tableaux
ou par des graphiques.
Cas de variables qualitatives
On va considérer deux exemples où on a des variables quali-
tatives observées sur un échantillon et suivre le traitement pos-
sible de ces données.
Exemple 1 : On a pris un échantillon de 50 achats de boissons
non-alcoolisées achetées dans une grande surface, en notant
par :
CC=Coca-Cola ; S=Sprite ; CL=Coke-Light ; P=Perrier ; PC=Pepsi-Cola.
On a obtenu les résultats suivants :
CC S PC CL CC CC PC CL CC CL CC CC CC
CL PC CC CC P P S CC CL PC CL P PC
CC PC PC CC PC CC CC PC P PC PC S CC
CC CC S P CL PC CC PC S CC CL
14/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

Alors ici la variable est X = Boisson non-alcoolisée, qui est une


variable qualitative nominale.
Pour présenter ces données sous forme de tableau, on dresse
un tableau, dans la première colonne on énumère les cinq mo-
dalités de la variable, dans la seconde colonne on donne la
fréquence absolue ou l’effectif de chacune des modalités (c’est-
à-dire le nombre de fois que cette modalité se répète dans l’écha-
ntillon) et dans la troisième colonne, on donne la fréquence re-
lative de chacune des modalités.

La fréquence relative d’une modalité étant égale à sa


fréquence absolue divisée par la taille de l’échantillon.

Ce qui donne :

15/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

Remarque 2.1
Pour une présentation complète des tableaux et graphiques, on
doit mettre le titre en haut et la source des données en bas.
En ce qui concerne la représentation graphique, on va donner 16/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

deux graphiques qui résument la même information contenue


dans le tableau des fréquences.
Le diagramme à barres (horizontales ou verticales). Où on
met sur un axe les modalités de la variable et sur l’autre axe
les fréquences absolues ou les fréquences relatives.

Remarque 2.2
Les largeurs des barres doivent être les mêmes pour une belle
esthétique du graphique, ainsi que la distance entre les bandes. On
peut aussi ajouter les fréquences relatives au dessus des bandes.
17/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

Le deuxième graphique qu’on peut faire est le diagramme


à secteurs (ou circulaire) qui est une sorte de tarte où
chaque modalité occupe une partie qui reflète sa fréquence
relative.

18/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

Exemple 2 : Lors d’une enquête de satisfaction de la clientèle,


une compagnie de courtage a demandé à un échantillon de
60 clients d’indiquer leur degré de satisfaction vis-à-vis de leur
conseiller financier, sur une échelle de 1 à 7, le 1 correspondant
à ”pas du tout satisfait” et le 7 correspondant à ”extrêmement
satisfait”. On a obtenu les résultats suivants :
5 7 6 6 7 5 5 7 3 6 7 7 6 6 6
5 5 6 7 7 6 6 4 4 7 6 7 6 7 6
5 7 5 7 6 4 7 5 7 6 5 3 7 7 6
6 6 6 6 5 5 6 6 7 7 5 6 6 6 6

Ici la variable, “degré de satisfaction“ est une variable qualitative


ordinale.

19/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

On peut résumer l’information contenue dans ces données


sous forme d’un tableau de fréquences ce qui donne :

20/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

En ce qui concerne la représentation graphique, les mêmes gra-


phiques qu’on a utilisés pour une variable qualitative nominale
font l’affaire. Par exemple pour le diagramme à barres horizon-
tales :

21/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

Cas de variables quantitatives


Le traitement des variables quantitatives discrètes étant différent
de celui des variables quantitatives continues :
♣ Cas des variables quantitatives discrètes.
Soit X une variable quantitative discrète dont le nombre de mo-
dalités n’est pas trop grand. Alors on peut dresser un tableau
des fréquences comme celui utilisé pour les variables qualita-
tives auquel on peut ajouter une colonne supplémentaire où on
met les fréquences relatives cumulées au fur et à mesure
qu’on ajoute une modalité de la variable.
En ce qui concerne la représentation graphique, un seul gra-
phique s’associe avec les variables quantitatives discrètes : le
diagramme à bâtons.
Exemple 3 : Un inspecteur en contrôle de qualité a extrait de sa
base de données, un échantillon de 40 semaines où il a noté X ,
22/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

le nombre d’accidents de travail enregistrés par semaine. Il a


obtenu les résultats suivants :
2 0 4 2 2 1 3 2 0 5 4 3 2 4
5 6 6 4 2 0 3 4 4 2 6 2 4 3
0 4 3 4 3 3 5 5 4 2 2 1
On peut donc dresser le tableau des fréquences suivant.

23/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

Quant au diagramme à bâtons, on obtient quelque chose comme :

Remarque 2.3
Les bâtons ne doivent pas avoir d’épaisseur, car la variable
prend exactement les valeurs 0, 1, 2,... On peut ajouter les
effectifs ou les fréquences relatives sur les bâtons
24/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

♣ Cas des variables quantitatives continues.


Considérons maintenant un échantillon de données provenant
d’une variable quantitative continue ou discrète avec un grand
nombre de modalités. Il est donc inconcevable de dresser un
tableau où on énumère les modalités d’une telle variable, il serait
non analysable. Il faut donc grouper ces données en classes de
valeurs. Deux questions se posent alors :
Combien de classes faut-il former ?
Quelles seront les largeurs de chacune des classes ?
La réponse à la première question, dépend de la taille n de
l’échantillon, le nombre de classe à former est donné par la for-
mule de Sturges suivante :

10
Le nombre de classes : K = 1 + log(n)
3
25/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

Ainsi, par exemple, si n = 150, il faut former

10
K =1+ log(150) = 8, 25362 ∼
=9
3
(on arrondit à l’entier immédiatement supérieur).
Une fois qu’on sait combien de classes à former. On essaie de
former des classes de même amplitude (largeur) et cette ampli-
tude sera égale à
la plus grande observation -la plus petite observation Xmax − Xmin
A= = .
K K
On arrondit cette amplitude selon les données pour avoir des
bornes de classes faciles à manipuler.
Exemple 4 : Soit X , les recettes quotidiennes (en dirhams) d’un
petit magasin. On a sélectionné un échantillon de taille n = 40
jours au hasard qui ont donné les résultats suivants :
26/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

016, 00 058, 50 068, 20 078, 00 079, 45 142, 20 145, 30


186, 70 209, 05 216, 75 219, 70 247, 75 249, 10 256, 00
257, 15 262, 35 268, 60 269, 60 270, 15 284, 00 319, 00
332, 00 343, 29 350, 75 354, 90 372, 60 383, 20 389, 20
404, 55 420, 20 428, 50 432, 40 444, 60 446, 80 456, 10
458, 10 493, 95 511, 95 521, 05 621, 35

Le nombre de classe à former est


10
K =1+ log(40) = 6.34 = 7
3
classes d’amplitude chacune égale à

621.35 − 16
A= = 86.48 ∼
= 90.
7
Cette amplitude est arrondie à 90. 27/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

Ce qui donne le tableau des fréquences suivant, où les classes


sont des intervalles fermés à gauche et ouverts à droite sauf le
dernier qui est un intervalle fermé des deux côtés.

Quand aux graphiques, on va ici privilégier trois graphiques pour


les variables quantitatives continues. 28/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

♣ L’histogramme, qui est une suite de rectangles juxtaposés


les uns aux autres dressés au-dessus de chacune des classes,
dont la largeur est égale à l’amplitude de la classe (prise comme
unité de mesure) et dont la surface reflète la fréquence relative
de la classe qu’il représente.

29/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

♣ Le polygone des fréquences, qui consiste à joindre le mi-


lieux des sommets des rectangles d’un histogramme par une
ligne en zig-zag et cette ligne se ferme en ajoutant aux deux
extrémités deux classes fictives de même amplitude que les
autres, comme ça la surface délimitée par l’histogramme est
identique à celle délimitée par le polygone des fréquences.

30/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

♣ La courbe des fréquences cumulées (Ogive).


Comme son nom l’indique, elle consiste à tracer le graphique
des fréquences cumulées, en mettant les limites des classes
sur l’axe horizontal et les fréquences cumulées sur l’axe vertical,
ces dernières se cumulant à la fin de chacune des classes. Ce
graphique aura l’allure d’une courbe croissante variant entre 0
et 1.

31/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

2-2 Les mesures de tendance centrale

On appelle mesures de tendance centrale, des valeurs de la


variable susceptibles de nous donner une idée sur la donnée
qui occupe le centre d’une série statistique. On va décrire dans
ce paragraphe, les trois plus importantes mesures de tendance
centrale que sont le mode, la moyenne et la médiane.
♣ Le mode
On appelle le mode d’une variable X, la valeur de la variable qui
a la plus grande fréquence et on le note Mo(X ). Le mode est
une importante mesure de tendance centrale pour les variables
qualitatives nominales.
Remarque 2.4
Une distribution peut avoir un seul mode et on dit qu’elle est uni-
modale, ou plusieurs modes et on dit qu’elle est multimodale.
32/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

Exemple 5 : Si on reprend l’exemple des boissons non-alcoolisées,


on avait le tableau des fréquences suivant :

Alors, le mode de cette variable est Mo(X ) = Coca − Cola(CC),


cela signifie que dans cet échantillon, la boisson la plus fréquem-
ment achetée est Coca-Cola.
33/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

Exemple 6 : En reprenant l’exemple des recettes quotidiennes


d’un petit magasin, on avait le tableau des fréquences suivant :

Ici, on voit qu’il y a deux classes qui ont les plus hautes fréquences,
on les appelle des classes modales. Alors on est en présence
d’une distribution de données bimodale, et les deux modes sont
les milieux des deux classes modales, à savoir Mo(X ) = 235 et
Mo(X ) = 415. 34/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

♣ La moyenne
La moyenne arithmétique ou simplement la moyenne est la
mesure de tendance centrale la plus connue. Elle ne s’applique
qu’aux variables quantitatives. On va décrire la méthode pour
calculer la moyenne d’une variable quantitative selon que les
données sont en vrac, groupées par valeurs ou groupées par
classes.
I Les données en vrac.
Soit X une variable quantitative dont les valeurs observées sur
un échantillon forment une série en vrac x1 , x2 , ..., xn alors la
moyenne de cet échantillon est
Pn
x1 + x2 + ... + xn xi
X = = i=1 .
n n
Exemple 7 : Un commerçant a l’habitude de noter dans son re-
gistre le nombre de clients qui se présentent quotidiennement à
son magasin. On a pris un échantillon de taille 10 de ce registre
et on trouvé les valeurs suivantes : 35/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

120 105 90 201 196 65 88 163 103 116


Alors dans cet échantillon le nombre moyen des clients qui se
présentent à ce magasin par jour est donné par la formule
suivante :
Pn
x1 + x2 + ... + Xn xi 120 + 105 + ... + 116
X = = i=1
= = 124.7 ∼
= 125.
n n 10

36/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

I Les données groupées par valeurs.


Soit X une variable quantitative discrète dont les données se
présentent sous forme d’un tableau où elles sont classées par
valeurs, supposons que la taille de l’échantillon est n et qu’il y a
k valeurs différentes pour cette variable. Alors la moyenne d’un
tel échantillon de données est :
P Pk
[(valeur ) ? (sa fréquence absolue)] x i fi
X = = i=1
taille de l’échantillon n
Exemple 8 : Reprenons les données de l’exemple 3, où X est le
nombre d’accidents de travail par semaine. On avait le tableau
de données suivant :

37/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

38/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

I Les données groupées par classes.


Supposons qu’on est devant un tableau où les données prove-
nant d’un échantillon sont groupées par classes. Alors pour cal-
culer la moyenne de cet échantillon, on va utiliser une formule
approximative, où chaque classe est assimilée à son centre et
on utilise la même formule que pour le cas où les données sont
groupées par valeurs. Si on note par mi , le milieu de la ième
classe et qu’on suppose que la taille de l’échantillon est n et
qu’il y a k classes, alors la moyenne de l’échantillon est :
Pk
i=1 mi fi
X = .
n
Exemple 9 : En reprenant l’exemple 4, où X est la recette quoti-
dienne d’un petit magasin, on avait le tableau suivant auquel on
a ajouté une colonne à gauche contenant le milieu des classes :
39/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

40/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

I Les propriétés d’une moyenne échantillonnale.


Soit X une variable quantitative dont la moyenne échantillonnale
est x et soit Y une autre variable quantitative transformée linéaire
de X , c’est-à-dire que
Y =a+b∗X
où a et b sont des constantes réelles. Alors la moyenne échantill-
onnale de Y sera égale à
y =a+b∗x
On dit que la moyenne conserve la transformation linéaire entre
les variables.
Exemple 10 : Soit X , le nombre d’heures qu’un étudiant travaille
à temps partiel par semaine. Supposons qu’à partir d’un échantillon
d’étudiants, on a pu trouver qu’en moyenne le nombre d’heures tra-
vaillées par ces étudiants est égale à x = 14.5 heures/semaine. Si le
salaire horaire est de 10 DH et que les patrons de ces étudiants leur
offrent 30 DH par semaine pour leurs déplacements, quel est le gain
net moyen hebdomadaire de ces étudiants ? 41/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

Posons Y le gain net hebdomadaire de ces étudiants alors


Y = 30 + 10 ∗ X ,
donc le gain moyen hebdomadaire de cet échantillon d’étudiants
est égal à
y = 30 + 10 ∗ x = 30 + 10 ∗ 14.5 = 175 DH

♣ La médiane
La médiane est la valeur de la variable qui divise l’échantillon
en deux groupes d’égal effectif. Il y a 50% des données qui sont
inférieures ou égales à la médiane et 50% des données qui sont
supérieures ou égales à la médiane.
La médiane se calcule pour des variables qualitatives ordinales
et pour des variables quantitatives. On note la médiane d’une
variable X par Med(x) ou par X e . Dans ce qui suit on va décrire
les façons de calculer une médiane dans les différents cas pos-
sibles. 42/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

I Cas d’une variable qualitative ordinale.


Puisque les modalités d’une telle variable sont déjà ordonnées
par nature, alors pour déterminer la médiane, on calcule
n
l = (50%) ∗ n =
2
et donc
 x +x
l l+1
 si l est un entier
2

Med(X ) =

x[l]+1 si l n’est pas un entier.

Où x[l]+1 signifie, l’observation occupant le rang immédiatement


supérieur à l.

43/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

Exemple 11 : Reprenons les données de l’exemple 2, où X est


le degré de satisfaction de la clientèle, on avait le tableau sui-
vant :

n
Ici, n = 60 et l = = 30 est un entier, alors
2
x30 + x31 6+6
Med(X ) = = = 6.
2 2
44/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

I Cas de données quantitatives en vrac ou groupées par


valeurs.
On doit d’abord ordonner les données par ordre croissant avant
d’appliquer la même procédure que pour les variables qualita-
tives ordinales. Ci-après nous donnerons un exemple pour cha-
cun de ces deux cas.
Exemple 12 : Reprenons les données de l’exemple 2, où la va-
riable est le nombre de clients qui se présentent quotidienne-
ment au magasin. On avait des données en vrac :
120 105 90 201 196 65 88 163 103 116
En les ordonnant, on aura :
65 88 90 103 105 116 120 163 196 201.
n
Ici, n = 10 et l = = 5 est un entier, alors
2
x5 + x6 105 + 116
Med(X ) = = = 110, 5.
2 2 45/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

Exemple 13 : Reprenons les données de l’exemple 3, où X est


le nombre d’accidents de travail par semaine. On avait le ta-
bleau de données où les modalités de la variable sont groupées
par valeurs, qu’on va changer un peu en ajoutant une donnée
supplémentaire :

n
Ici, n = 41 et l = = 20.5 n’est pas un entier, alors
2
Med(X ) = x[20.5]+1 = x21 = 3.
46/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

I Cas de données groupées par classes.


Dans le cas où on dispose d’un tableau de fréquences complet
(incluant les fréquences cumulées) des données groupées par
classes. Il faut d’abord déterminer la classe médiane, qui est la
classe où les fréquences cumulées dépassent pour la première
fois 50%. Cette classe aura la forme : Cm = [binf , bsups [, alors on
obtient la médiane par la formule suivante :

0.5 − F(m−1)
Med(X ) = binf + ∗ Am
fr ,m

où
binf est la borne inférieure de la classe médiane.
F(m−1) est la fréquence cumulée avant la classe médiane.
fr ,m est la fréquence relative de la classe médiane.
Am est l’amplitude de la classe médiane.
47/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

Exemple 14 : En reprenant les données où X donne la re-


cette quodienne d’un petit magasin, on retrouve le tableau des
fréquences suivant :

Alors ici, la classe médiane est Cm = [binf , bsup [= [280, 370[.


binf = 280 F(m−1) = 0.475 fr ,m = 0.150 Am = 90
ce qui donne une médiane égale à : 48/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

0.5 − F(m−1) 0.5 − 0.475


Med(X ) = binf + ∗Am = 280+ ∗90 = 295.
fr ,m 0.150
Ce qui veut dire qu’en se basant sur cet échantillon de données,
50% des recettes quotidiennes de ce petit magasin sont inférieures
ou égales à 295 DH et les autres 50% sont supérieures ou
égales à 295 DH.
Remarque 2.5
I Le calcul de la médiane est basé sur l’ordre des observations et
non sur leur valeur. Contrairement à la moyenne, la médiane est in-
sensible aux données extrêmes. Dans le cas où les données sont très
différentes, la médiane est une meilleure mesure de tendance cen-
trale.
I Si pour une variable X quantitative les 3 mesures de tendance cen-
trale sont presque égales, on dit alors que la variable est symétrique
et alors n’importe laquelle de ces mesures peut être utilisée comme
mesure de cette tendance centrale. S’il y a un grand écart entre ces
mesures alors c’est la médiane qu’on doit privilégier.
49/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

2-3 Les mesures de position

On a déjà parlé de la médiane comme mesure de tendance


centrale, mais elle est aussi une mesure de position car elle per-
met de diviser une série d’observations en deux groupes chacun
contenant 50% de données. On va définir d’autres mesures de
position qui permettent d’autres découpages d’une série d’ob-
servations.
♣ Les quartiles.
Lorsqu’on veut diviser les données en quatre groupes, chacun
contenant 25% des observations, on utilise des mesures ap-
pelées quartiles.
Q1 = le 1er quartile, à sa gauche il y a 25% des
observations.
Q2 = le 2ème quartile, coincide avec la médiane.
Q3 = le 3ème quartile, à sa gauche il y a 75% des
observations. 50/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

On va décrire la façon de les calculer, dans les 3 cas possibles


pour une variable quantitative.
I Les données en vrac.
On suit les étapes suivantes.
1 Étape 1 : On ordonne les données par ordre croissant.
2 Étape 2 : On calcule l’indice l = (i%)?n où i est le pourcen-
tage correspondant à la mesure voulue et n est le nombre
d’observations.
3 Étape 3 :
Si l n’est pas un entier, alors le ième quartile est égal à l’ob-
servation occupant la position immédiatement supérieure à
l.
Si l est un entier, alors le ième quartile est la moyenne des
observations occupant les positions l et (l + 1).

51/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

Exemple 15 :
n = 12 et les observations sont :

−2 − 3 10 12 120 11 4 8 6 13 130 200.

Étape 1 :

−3 − 2 4 6 8 10 11 12 13 120 130 200.

Étape 2 :
Si on veut déterminer Q1 , on calcule l1 = (25%) ∗ n = 3.
Si on veut déterminer Q2 , on calcule l2 = (50%) ∗ n = 6.
Si on veut déterminer Q3 , on calcule l3 = (75%) ∗ n = 9.
Étape 3 :
Puisque l1 = 3 est un entier alors
la 3ème observation+la 4ème observation 4+6
Q1 = = = 5.
2 2
52/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

Puisque l2 = 6 est un entier alors


la 6ème observation+la 7ème observation 10 + 11
Q2 = = = 10.5
2 2
Puisque l3 = 9 est un entier alors

la 9ème observation+la 10ème observation 13 + 120


Q3 = = = 66.5
2 2

Exemple 16 :
n = 10 et les observations sont :

3 10 12 8 6 100 15 6 3 14.

Étape 1 :
3 3 6 6 8 10 12 14 15 100

53/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

Étape 2 :
Si on veut déterminer Q1 , on calcule l1 = (25%) ∗ n = 2.5
Si on veut déterminer Q2 , on calcule l2 = (50%) ∗ n = 5.
Si on veut déterminer Q3 , on calcule l3 = (75%) ∗ n = 7.5.
Étape 3 :
Puisque l1 = 2.5 n’est pas un entier alors
Q1 = la 3ème observation = 6.

Puisque l2 = 5 est un entier alors

la 5ème observation+la 6ème observation 8 + 10


Q2 = = = 9.
2 2
Puisque l3 = 7.5 n’est pas un entier alors
Q3 = la 8ème observation = 14.

54/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

Remarque 2.6
La procédure décrite pour trouver les quartiles est une convention
parmi d’autres. Il n’y a pas d’accord général sur la méthode à utiliser
pour déterminer les quartiles.

I Les données groupées par valeurs.


On suit la même démarche que dans le cas des données en
vrac, sauf l’étape 1 qui devient inutile, puisque les données sont
en général déjà ordonnées par ordre croissant.
Exemple 17 : En reprenant le tableau de l’exemple 3, déterminer
les 3 quartiles de la variable X=le nombre d’accidents par se-
maine.
Étape 2 :
Si on veut déterminer Q1 , on calcule l1 = (25%) ∗ n = 10.25
Si on veut déterminer Q2 , on calcule l2 = (50%) ∗ n = 20.5
Si on veut déterminer Q3 , on calcule l3 = (75%) ∗ n = 30.75
55/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

Étape 3 :
Puisque l1 = 10.25 n’est pas un entier alors
Q1 = la 11ème observation = 2
Puisque l2 = 20.5 n’est pas un entier alors
Q2 = la 21ème observation = 3
Puisque l3 = 7.5 n’est pas un entier alors
Q3 = la 31ème observation = 4.
56/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

I Les données groupées par classes.


On suit la même démarche utilisée pour calculer la médiane
quand les données sont groupées par classes. On détermine
la classe où on a dépassé le pourcentage relatif à chaque quar-
tile et on fait une interpolation à l’intérieur de cette classe. On
aboutit à la même formule que celle de la médiane où seul le
pourcentage est à adapter.
Exemple 18 : En reprenant les données de l’exemple 4 sur
les recettes quotidiennes, déterminer les 3 quartiles de la va-
riable X, soit les recettes quotidiennes d’un petit dépanneur, et
interpréter ces mesures.
• Pour déterminer le premier quartile, les fréquences relatives
cumulées ont dépassé 25% pour la première fois au niveau de
la classe [190 ; 280[, donc
(0.25 − 0.20)
Q1 = 190 + ∗ 90 = 206.36DH
0.275
57/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

Ce qui signifie que dans cet échantillon de données, 25% des


journées, les recettes quotidiennes de ce petit magasin ont été
de 206,36 DH ou moins.
• Pour déterminer le deuxième quartile (on refait ce qu’on a déjà
fait pour calculer la médiane), les fréquences relatives cumulées
ont dépassé 50% pour la première fois au niveau de la classe
[280 ; 370[, donc 58/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

(0.5 − 0.475)
Q2 = 280 + ∗ 90 = 295DH
0.150
Ce qui signifie que dans cet échantillon de données, 50% des
journées, les recettes quotidiennes de ce petit magasin ont été
de 295 DH ou moins.
• Pour déterminer le troisième quartile, les fréquences relatives
cumulées ont dépassé 75% pour la première fois au niveau de
la classe [370 ; 460[, donc

(0.75 − 0.625)
Q3 = 370 + ∗ 90 = 410.91DH
0.275
Ce qui signifie que dans cet échantillon de données, 75% des
journées, les recettes quotidiennes de ce petit magasin ont été
de 410,91 DH ou moins.
59/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

♣ Les autres mesures de position


Quelques fois, on doit découper une série d’observations en
cinq, en dix ou en cents groupes contenant chacun le même
pourcentage d’observations.
• Dans le cas de cinq groupes, on parle alors des quintiles
V1 , V2 , V3 et V4 . Entre deux quintiles consécutifs, il y a 20%
d’observations.
• Dans le cas de dix groupes, on parle des déciles D1 , D2 , ...,D9
et entre deux déciles consécutifs, il y a 10% d’observations.
• Dans le cas de cent groupes, on parle des centiles C1 , C2 ,
...,C99 et entre deux centiles consécutifs, il y a 1% des observa-
tions.
Le calcul de ces différentes mesures de position est identique à
ce qu’on a fait pour déterminer les quartiles, il n’y a que le pour-
centage de la mesure à adapter à chaque fois. On va donner un
exemple dans le cas où les données sont groupées par classes.
60/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

Exemple 19 : En reprenant les données de l’exemple 18, déterminer


le deuxième quintile, le septième décile et le quatre vingt quinzième
centile de la variable X, les recettes quotidiennes d’un petit dépanneur
et interprétez chacune de ces mesures.

• Les fréquences cumulées dépassent pour la première fois 40% au


niveau de la classe [190 ; 280[ ainsi le deuxième quintile est égal à
(0.40 − 0.20)
V2 = 190 + ∗ 90 = 255.45DH
0.275 61/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

Ceci signifie que dans cet échantillon de données, 40% des journées,
les recettes quotidiennes de ce petit magasin ont été de 255,45 DH
ou moins.
• Les fréquences relatives cumulées dépassent pour la première fois
70% au niveau de la classe [370 ; 460[, ainsi le septième décile est
égal à
(0.70 − 0.625)
D7 = 370 + ∗ 90 = 394.55DH
0.275
Ce qui signifie que dans cet échantillon de données, 70% des journées,
les recettes quotidiennes de ce petit magasin ont été de 394,55 DH ou
moins.
• Les fréquences relatives cumulées dépassent pour la première fois
95% au niveau de la classe [460 ; 550[, ainsi le quatre vingt quinzième
centile est égal à
(0.95 − 0.90)
C95 = 460 + ∗ 90 = 520DH
0.075
Ce qui signifie que dans cet échantillon de données, 95% des journées,
les recettes quotidiennes de ce petit magasin ont été de 520 DH ou
moins. 62/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

2-4 Les mesures de dispersion

Rappelons qu’on travaille sur des données issues d’un échantillon


et que le choix de cet échantillon est fait au hasard mais sensé
refléter ce qui se passe dans la population. Ce qui fait que le
comportement d’une variable diffère d’un échantillon à l’autre
mais on espère qu’il correspond au profil de cette variable dans
la population. Ce qui fait que lorsqu’on manipule une variable
mesurable et qu’on se base seulement sur ses mesures de ten-
dance centrale, on perd de vue la variabilité des données autour
de ces mesures centrales. D’où l’utilité des mesures de disper-
sion qui, jumelées avec les mesures de tendance centrale, vont
nous donner une idée plus exacte sur l’ensemble de ce qu’on
a observé dans une série échantillonnale. Dans ce paragraphe,
on va décrire quelques unes de ces mesures de dispersion.

63/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

♣ L’étendue.
C’est la mesure de dispersion la plus simple à calculer. Lors-
qu’on a une variable quantitative X, mesurée sur un échantillon
de taille n. Alors l’étendue est égale à

E = la plus grande donnée-la plus petite donnée = Xmax − Xmin

Puisque l’étendue est basée seulement sur les deux observa-


tions extrêmes, alors elle est très peu utilisée dans les applica-
tions.
♣ La variance.
La variance d’une variable mesurée sur un échantillon est égale
à la moyenne des carrés des écarts qui séparent chaque obser-
vation de la moyenne échantillonnale, son calcul diffère selon la
nature des données.
64/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

I Les données en vrac.


Soit X une variable quantitative mesurée sur un échantillon de
taille n, et dont les valeurs sont : x1 , x2 , ..., xn alors la variance
de l’échantillon est
n
1 X
SX2 = (xi − x)2 .
n−1
i=1

Exemple 20 : Soit X une variable quantitative mesurée sur un


échantillon de taille n=6 et les valeurs suivantes ont été obte-
nues : −1 6 11 8 9 9. Alors x = 7 et la variance de cet
échantillon sera égale à
(−1 − 7)2 + (6 − 7)2 + (11 − 7)2 + (8 − 7)2 + (9 − 7)2 + (9 − 7)2
SX2 = = 18.
6−1

65/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

I Les données groupées par valeurs.


Soit X une variable quantitative mesurée sur un échantillon de
taille n, et dont les k valeurs sont : x1 , x2 , ..., xk avec des fréquences
absolues respectivement égales à f1 , f2 , ..., fk . Alors la variance
de X dans cet échantillon est égale à
k
1 X
SX2 = (xi − x)2 fi .
n−1
i=1

Exemple 21 : En reprenant le tableau de l’exemple 3 (nombre


d’accidents) précédent, déterminer la variance de la variable
X=le nombre d’accidents par semaine.
On avait trouvé que la moyenne de cette variable est x = 3.025
donc sa variance sera égale à :

66/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

(0 − 3.025)2 ∗ 4 + (1 − 3.025)2 ∗ 2 + ... + (6 − 3.025)2 ∗ 3


SX2 = = 2.74.
40 − 1

67/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

I Les données groupées par classes.


Soit maintenant X, une variable quantitative mesurée sur un
échantillon de taille n, et dont les observations sont groupées en
k classes avec des fréquences absolues respectivement égales
à f1 , f2 , ..., fk et dont les milieux des classes sont respective-
ment égaux à m1 , m2 , ..., mk . Alors la variance de X dans cet
échantillon est égale à
k
1 X
SX2 = (mi − x)2 fi .
n−1
i=1

Exemple 22 : En reprenant les données de l’exemple 4(recettes


quotidiennes) précèdent, déterminer la variance de la variable
X, les recettes quotidiennes d’un petit dépanneur.
On avait trouvé que la moyenne de cette variable est x = 298
DH donc sa variance sera égale à :
68/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

(55 − 298)2 ∗ 5 + (145 − 298)2 ∗ 3 + ... + (595 − 298)2 ∗ 1


SX2 = = 20021.54
40 − 1

69/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

♣ L’écart type.
L’écart type d’une variable quantitative mesurée sur un échanti-
llon est égal à la racine carrée de sa variance. Son unité de
mesure étant la même que celle de la variable, l’écart type se
prête alors aisément à l’interprétation et est considéré comme
la mesure de dispersion par excellence. La variance n’est donc
qu’une étape de calcul pour déterminer l’écart type, quand on
faisait les calculs à la main.
Exemple 23 : L’écart type échantillonnal pour les 3 précédents
exemples où on a calculé les variances échantillonnales est res-
pectivement
√ égal à :
• SX = 18 = 4.24. Pour les données de l’exemple 20 où les
données√sont en vrac.
• SX = 2.74 = 1.655. Pour les données de l’exemple 21 où
les donn√ ées sont groupées par valeurs.
• SX = 20021.54 = 141.497. Pour les données de l’exemple
22 où les données sont groupées par classes. 70/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

Une propriété de l’écart type échantiollonnal.


Soit X une variable quantitative dont l’écart type échantillonnal
est SX et soit Y une autre variable quantitative telle que
Y =a+b∗X
où a et b sont des constantes réelles.
Alors l’écart type échantillonnal de Y sera égal à
SY = |b|SX .
Exemple 24 : Reprenons le contexte de l’exemple précédent, où
X est le nombre d’heures qu’un étudiant travaille à temps partiel
par semaine. Supposons qu’à partir d’un échantillon d’étudiants,
on ait pu trouvé que l’écart type du nombre d’heures travaillées
par ces étudiants est égal àSX = 3.2 heures/semaine. Si le sa-
laire horaire est de 10 DH et que les patrons de ces étudiants
leur offrent 30 DH par semaine pour leurs déplacements, quel
est l’écart type du gain net hebdomadaire de ces étudiants ? 71/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

Posons Y, le gain net hebdomadaire de ces étudiants alors

Y = 30 + 10 ∗ X ,

donc l’écart type du gain net de cet échantillon d’étudiants sera


égal à
SY = |10|SX = 32 DH/semaine.
♣ Le coefficient de variation.
On avait dit que l’unité de l’écart type d’une variable est la même
que celles des données et qu’alors il s’interprète mieux que la
variance. Mais si on veut comparer la dispersion de deux va-
riables ou plus ayant des unités différentes mesurées sur le
même échantillon ou sur des échantillons différents, il nous faut
une mesure de dispersion sans unité. Cette mesure est le coef-
ficient de variation.
72/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

Pour un échantillon de données dont la moyenne est non négative,


on définit le coefficient de variation d’une variable X par :

SX
CVX = 100 %.
X
• Si on a un seul échantillon de données, alors si le coefficient
de variation de X est inférieur à 15%, on dit que la variable est
homogène, sinon elle est dite hétérogène.
• Si on a deux échantillons (sur une ou deux variables) ou plus,
alors celui (ou celle) qui a le plus petit coefficient de variation est
le (ou la) plus homogène.
Exemple 25 : On a pris un échantillon de taille n=50 d’hommes
d’âge adultes, on a mesuré leur poids et leur taille. Les résultats
sont résumés dans le tableau suivant :
73/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

Pour comparer l’homogénéité de ces deux variables, on utilise


leur coefficient de variation.
7.86
CVX = 100 % = 4.53 %.
173.59
11.98
CVY =
100 % = 15.28 %.
78.42
Donc la taille des hommes adultes est plus homogène que leur
poids. Ce qui correspond à l’intuition. Par exemple il est très
rare de voir deux hommes adultes dont l’un serait deux fois
plus grand que l’autre, alors qu’il est fréquent de voir un homme
adulte dont le poids est le double d’un autre. 74/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

♣ La variance et l’écart type dans le cas d’une population.


I Variance de la population : σ 2 = V .


I Ecart-type de la population : σ = V.

75/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

Chapitre 3 :

Série statistique à deux


variables

76/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

3-1 Introduction

Dans le chapitre précédent, nous avons présenté les méthodes


qui permettent de résumer et représenter les informations rela-
tives à une variable. Un même individu peut être étudié à l’aide
de plusieurs caractères (ou variables). Par exemple, les salaries
en regardant leur ancienneté et leur niveau d’étude, la crois-
sance d’un enfant en regardant son poids et sa taille. Dans la
suite de ce chapitre, nous introduisons l’étude globale des rela-
tions entre deux variables.
Soit Ω une population et
Z : Ω → R2 ,
ω 7→ Z (ω) = (X (ω), Y (ω)),
ou directement
(X , Y ) : Ω → R2 ,
ω 7→ (X (ω), Y (ω)),
77/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

Dans ce cas, Z est dite variable statistique à deux dimensions


avec Card (Ω) = N est un entier fini. Le couple (X , Y ) est appelé
le couple de la variable statistique.

Exemple 1 :
On observe simultanément sur un échantillon de 200 foyers,
le nombre d’enfants X et le nombre de chambre Y .
On observe sur un échantillon de 20 foyers, le revenu men-
suel X en Dh et les dépenses mensuelles Y .
Au près des étudiants pris au hasard parmi une section de
génie informatique 1, on observe les notes d’analyse X et
de statistique Y .
Une entreprise mène une étude sur la liaison entre les dépe-
nses mensuelles en publicité X et le volume des ventes Y
qu’elle réalise.
78/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

3-2 Représentation des séries statistiques à deux


variables

Les séries statistiques à deux variables peuvent être présentées


de deux façons.
Présentation 1 : A chaque ωi , on associé (xi , yi ), c’est à dire,
ωi → (xi , yi ).
On rassemblera les données comme dans le tableau suivant
ωi ω1 ω2 ... ωN
Variable X X (ω1 ) X (ω2 ) ... X (ωN )
Variable Y Y (ω1 ) Y (ω2 ) ... Y (ωN )
Cette représentation on la notera ”présentation 1”. Nous allons
utiliser toujours les notations suivantes :
xi := X (ωi ) et yi := Y (ωi ).
79/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

Exemple 2 : Soit Ω l’ensemble de 8 étudiants. Nous avons le


tableau suivant
ωi ω1 ω2 ω3 ω4 ω5 ω6 ω7 ω8
X (ω) 8 2 6 6 11 10 7 2
Y (ω) 9 10 11 7 14 16 12 5

avec X représente le nombre d’heures passées à préparer l’exa-


men de statistique par étudiant et Y représente la note sur 20
obtenue à l’examen par l’étudiant.

Lors de cette représentation, nous pouvons traduire le tableau


associe dans une figure appelée ”le nuage de points” ou ”diagr-
amme de dispersion” (voir Figure ci-dessous). Cette représent-
ation est obtenue en mettant dans un repère cartésien chaque
couple d’observation (xi , yi ) par un point.
80/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

81/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

Présentation 2 :

Soit la variable statistique Z donnée par le couple (X , Y ). Soient


x1 , ..., xk et y1 , ..., yl les valeurs prises respectivement par X et
Y . Dans ce cas, nous définissons les valeurs de Z comme suite,
pour i allant de 1 à k et pour j allant de 1 à l,

zij := (xi , yj ).

La variable statistique Z prend k ×l valeurs. Lors de cette étude,


nous avons le tableau à double entrée (ou tableau de contin-
gence) suivant (discrète ou continue).

82/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

X \Y C10 = [L01 , L02 [ ... Cl0 = [L0l , L0l+1 ] Marginale


ou y1 ... ou yl % à X
C1 = [L1 , L2 [ ou x1 n11 ou f11 ... n1l ou f1l n1• ou f1•
C2 = [L2 , L3 [ ou x2 n21 ou f21 ... n2l ou f2l n2• ou f2•
C3 = [L3 , L4 [ ou x3 n31 ou f31 ... n3l ou f3l n3• ou f3•
.. .. .. .. ..
. . . . .
Ck = [Lk , Lk+1 ] ou xk nk1 ou fk1 ... nkl ou fkl nk• ou fk•
Marginale % à Y n•1 ou f•1 ... n•l ou f•l N

Cette représentation on l’a notera ”présentation 2”. A chaque couple


(xi , yj ), on a nij est l’effectif qui représente le nombre d’individus qui
prennent en même temps la valeur xi et yj , c’est à dire,

nij := Card{ω ∈ Ω : Z (ω) = zij }.

Nous notons par fij la fréquence du coulpe (xi , yj ). Cette fréquence est
donnée par
nij
fij := ,
N
83/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

avec
k X
X l l X
X k
N := Card(Ω) = nij = nij .
i=1 j=1 j=1 i=1

Remarque 3.1
Nous avons la propriété suivante,
k X
X l
fij = 1.
i=1 j=1

Lois marginales :
Sur la marge du tableau de contingence, on peut extraire les
données seulement par rapport à X et seulement par rapport à
Y (voir le tableau de contingence établi auparavant).
84/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

• Effectifs et fréquences marginale par rapport à Y : nous


avons, pour j = 1...l,
k k
X n•j X
n•j := nij , f•j := = fij .
N
i=1 i=1

• Effectifs et fréquences marginale par rapport à X : nous


avons, pour i = 1...k,
l l
X ni• X
ni• := nij , fi• := = fij .
N
j=1 j=1

Remarque 3.2
Nous avons les propriétés suivantes :
k
X l
X k
X l
X
ni• = n•j = N et fi• = f•j = 1.
i=1 j=1 i=1 j=1
85/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

Exemple 3 : Nous considérons 10 salariés qui sont observés


à l’aide de deux variables ”âge” et ”salaire”. Les informations
brutes (pas encore traitées ou façonnées) sont données dans le
tableau suivant,
Salaire 6000 7400 7500 8200 8207
Age 15 26 20 43 47
Salaire 8900 9100 9900 9950 10750
Age 37 52 34 50 44

1. Déterminer le tableau de contingence (X : âge, Y : salaire).


Pour l’âge et pour le salaire, former respectivement des classes
de pas de 10 ans et de 1000 Dh.
2. Calculer f21 , f12 , f45 et f33 .
3. Déterminer les effectifs marginaux de X et de Y . Tracer le
nuages de points.
4. Déterminer le tableau statistique des deux séries marginales
X et Y . 86/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

Solution : En utilisant les hypothèses, nous considérons les


classes suivantes,

[15, 25[, [25, 35[, [35, 45[, [45, 55],

pour l’âge et

[6, 7[, [7, 8[, [8, 9[, [9, 10[, [10, 11],
pour le salaire (×1000). De plus, nous avons
xmax − xmin 52 − 15
Nombre de classe = = = 3.7 ' 4 classes,
amplitude âge 10

pour l’âge et
ymax − ymin 10750 − 6000
Nombre de classe = = = 4.75 ' 5 classes,
amplitude salaire 1000

pour le salaire.
87/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

Cette série statistique est représentée par le tableau suivant,

Age \ Salaire [6, 7[ [7, 8[ [8, 9[ [9, 10[ [10, 11] ni• fi•
[15, 25[ 1 1 0 0 0 2 0.2
[25, 35[ 0 1 0 1 0 2 0.2
[35, 45[ 0 0 2 0 1 3 0.3
[45, 55] 0 0 1 2 0 3 0.3
n•j 1 2 3 3 1 10 1
f•j 0.1 0.2 0.3 0.3 0.1 1 Φ

De ce fait, nous avons


n12 1 n21 0
f12 = = = 0.1, f21 = = =0
N 10 N 10
et
n45 0 n33 2
f45 = = = 0, f33 = = = 0.2.
N 10 N 10
88/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

Le nuage de points est tracé, à partir des données brutes, dans


la figure suivante :

89/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

Enfin, les deux tableaux statistiques de X et de Y sont donnés,


respectivement, par

X ni• fi• xi le centre


[15, 25[ 2 0.2 20
[25, 35[ 2 0.2 30
[35, 45[ 3 0.3 40
[45, 55] 3 0.3 50

Y n•j f•j yj le centre


[6, 7[ 1 0.1 6.5
[7, 8[ 2 0.2 7.5
[8, 9[ 3 0.3 8.5
[9, 10[ 3 0.3 9.5
[10, 11] 1 0.1 10.5

90/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

3-3 Marginales,Conditionnelle, Covariance


3-3-1 Caractéristique des séries marginales
Dans le cas d’une variable statistique à deux dimensions X et
Y , les moyennes sont données respectivement par
k k
1X X
x := ni• xi = fi• xi (moyenne de X),
N
i=1 i=1
et
l l
1X X
y := n•j yj = f•j yj (moyenne de Y).
N
j=1 j=1

Remarque 3.3
Dans le cas continu, xi et yj représentent respectivement le centre des
classes de X et Y, c’est à dire,

Li+1 + Li L0j+1 + L0j


xi = et yj =
2 2 91/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

Exemple 4 :
Nous calculons x et y pour l’exercice traité précédemment.
La moyenne d’âge
1
x= (40 + 60 + 120 + 150) = 37 ans.
10
La moyenne du salaire
1
y= (6.5 + 15 + 25.5 + 28.5 + 10.5) × 1000 = 8600 Dh.
10
Nous définissions maintenant la variance de X et la variance de
Y comme suit,

Var (X ) := x 2 − (x)2 et Var (Y ) := y 2 − (y)2 .

Les écarts-type de X et de Y sont donnés, respectivement, par


p p
σX = Var (X ) et σY = Var (Y ).
92/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

3-3-2 Série conditionnelle


La notion de série conditionnelle est essentielle pour comprendre
l’analyse de la régression. Un tableau de contingence se com-
pose en autant de séries conditionnelles suivant chaque ligne et
chaque colonnes.

Série conditionnelle par rapport à X


Elle est notée par X /yj (ou Xj ) et on dit que c’est la série condi-
tionnelle de X sachant que Y = yj . Nous calculons dans ce cas
la fréquence conditionnelle fi/j (fi sachant j), pour i = 1, ..., k ,
par
nij fij
fi/j := = .
n•j f•j
Nous avons aussi la moyenne conditionnelle xj , c’est à dire la
moyenne des valeurs de X sous la condition yj , elle est définie
par
93/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

k k
X 1 X
x j := fi/j xi = nij xi .
n•j
i=1 i=1
p
Pour l’écart-type conditionnel, nous avons σXj := Var (Xj )
avec
k
X
Var (Xj ) := fi/j (xi − x j )2 = x 2 j − (x j )2 .
i=1

Série conditionnelle par rapport à Y


Elle est notée par Y /xi (ou Yi ) et on dit que c’est la série condi-
tionnelle de Y sachant que x = xi . Nous calculons dans ce cas
la fréquence conditionnelle fj/i (fj sachant i), pour j = 1, ..., l,
par
nij fij
fj/i := = .
ni• fi•

94/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

Nous avons aussi la moyenne conditionnelle yi , c’est à dire la


moyenne des valeurs de Y sous la condition xi , elle est définie
par
l l
X 1 X
y i := fj/i yj = nij yj .
ni•
j=1 j=1
p
Pour l’écart-type conditionnel, nous avons σYi := Var (Yi ) avec

l
X
Var (Yi ) := fj/i (yj − y i )2 = y 2 i − (y i )2 .
j=1

3-3-3 Notion de covariance


Nous notons par Cov (X , Y ) la covariance entre les variables X
et Y. La covariance est un paramètre qui donne la variabilité de
X par rapport à Y (voir figure ci-dessous) :
95/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

La covariance se calcule par l’expression suivante


k l
1 XX
Cov (X , Y ) = xy − x y = nij xi yj − x y.
N
i=1 j=1

96/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

Nous avons aussi cette formule


k l
1 XX
Cov (X , Y ) = nij (xi − x)(yj − y).
N
i=1 j=1

Remarque 3.4
• Dans le cas où nous avons un tableau des données brutes
”representation 1” (nous n’avons pas d’effectifs), nous avons les
formules suivantes
n n n
1X 1X 1X
x= xi , y= yi , xy = xi yi .
N N N
i=1 i=1 i=1

• La covariance est une notion qui généralise la variance

Cov (X , X ) = Var (X ).
97/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

Définition 3.5
On dit que deux variables statistiques X et Y sont
indépendantes si et seulement si, pour tout i et j,

fij = fi• × f•j .

De manière équivalente, pour tout i et j,

N × nij = ni• × n•j .

Dans ce cas, si X et Y sont indépendantes alors Cov (X , Y ) = 0


(réciproque est fausse).

Il suffit que cette égalité ne soit pas vérifiée dans une seule cel-
lule pour que les deux variables ne soient pas indépendantes.

98/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

3-4 Ajustement linéaire

I Est-il possible de trouver une fonction numérique f telle que


y = f (x) ?
I Si une telle fonction existe, on dit que f est un modèle du
phénomène étudié.
99/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

I On désire trouver la droite qui passe ” au mieux ” à l’intérieur


du nuage de points.

100/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

3-4-1 La méthode des moindres carrés :

101/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

Régression linéaire de Y en X :

La droite de régression linéaire de y en x, notée Dy/x , minimise


S = ni=1 ei2 = ni=1 (yi − axi − b)2 . La droite Dy /x passe par
P P
le point moyen (x, y ).
Pn
(x − x)(yi − y) Cov(x, y)
a = i=1 Pn i 2
= , b = y − ax.
i=1 (xi − x) V(x)
102/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

103/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

Régression linéaire de X en Y :

La droite de régression linéaire de x en y , notée Dx/y , minimise


S 0 = ni=1 ei 0 2 = ni=1 (xi − a0 yi − b0 )2 . La droite Dx/y passe par
P P
le point moyen (y, x).
Pn
(x − x)(yi − y) Cov(x, y)
0
a = i=1 Pn i 2
= , b0 = x − a0 y.
(y
i=1 i − y) V(y)
104/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

Liens entre corrélation et droites de régression :


Le coefficient de corrélation linéaire entre X et Y est :
σx σy
ρ=a = a0
σy σx
et on a
ρ2 = aa0 .

105/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

3-4-2 Ajustement à une fonction exponentielle :


xi 2.8 4.3 2.7 4.2 4.1 ... 4.0
yi 0.8 1.2 1.5 1.9 2.3 ... 3.1

106/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

y = bax Forme exponentielle générale.


Alors
ln y = ln b + x ln a.
Changement de variable : Y = AX + B avec :
Y = ln y , X = x, A = ln a, B = ln b.
L’ajustement affine de Y en fonction de X donne A et B, d’où
a = eA , b = eB et le modèle y = bax . 107/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables

Le modèle exponentiel est mieux adapté que le modèle affine.


108/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

PARTIE II :

Eléments de probabilité

109/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

Chapitre 4 :

Analyse combinatoire :
dénombrement

110/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

4-1 Introduction

L’analyse combinatoire est une branche des mathématiques


qui étudie comment compter les objets. Elle fournit des méthodes
de dénombrements particulièrement utiles en théorie des proba-
bilités. Les probabilités dites combinatoires utilisent constam-
ment les formules de l’analyse combinatoire développées dans
ce chapitre. Un exemple des applications intéressantes de cette
dernière est la démonstration du développement du binôme de
Newton utilisé dans le calcul des probabilités d’une loi bino-
miale.

111/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

4-2 Arrangements

Définition 4.1
I Etant donné un ensemble E de n objets, on appelle arrange-
ments de p objets toutes suites ordonnées de p objets pris
parmi les n objets.
I Le nombre d’arrangements de p objets pris parmi n est noté :
Apn .

Remarque 4.2
On a nécessairement 1 ≤ p ≤ n et n, p ∈ N∗ .
Si n < p, alors Apn = 0.
Deux arrangements de p objets sont donc distincts s’ils
diffèrent par la nature des objets qui les composent ou par
leur ordre dans la suite.
112/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

Exemple 1 :
• Une séquence d’ADN est constituée d’un enchaı̂nement de 4 nucléo-
tides [A (Adénine), C (Cytosine), G (Guanine) et T (Thymine)]. Il
existe différents arrangements possibles de deux nucléotides ou di-
nucléotides avec p=2 et n=4.
• Le nombre de mots de 5 lettres (avec ou sans signification) formés
avec les 26 lettres de l’alphabet correspond au nombre d’arrange-
ments possibles avec p=5 et n=26.
• Le tiercé dans l’ordre lors d’une course de 20 chevaux constitue un
des arrangements possibles avec p=3 et n=20.

Dans les exemples précédents, l’ordre des éléments dans la suite est
essentiel. Ainsi pour le deuxième exemple, le mot NICHE est différent
du mot CHIEN. Mais dans les deux premiers exemples, une base ou
une lettre de l’alphabet peut se retrouver plusieurs fois alors que
dans le troisième exemple, les trois chevaux à l’arrivée sont forcément
différents. Il faut donc distinguer le nombre d’arrangements avec rép-
étition et le nombre d’arrangements sans répétition (arrangements
au sens strict). 113/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

4-2-1 Arrangements avec répétitions.


Propriété 4.3
Lorsqu’un objet peut être observé plusieurs fois dans un arran-
gement, le nombre d’arrangement avec répétition de p objets
pris parmi n, est alors :

Apn = np avec 1 ≤ p ≤ n.

Preuve :
Pour le premier objet tiré, il existe n manières de ranger l’objet
parmi n. Pour le second objet tiré, il existe également n possi-
bilités d’arrangements car le premier objet fait de nouveau parti
des n objets. On parle de tirage avec remise. Ainsi pour les p
objets tirés, il y aura n × n × n × .... × n (p fois) arrangements
possibles, soit

Apn = n × n × n × .... × n = np .
114/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

Exemple 2 :
Concernant l’exemple de la séquence d’ADN, le nombre de di-
nucléotides attendus si l’on fait l’hypothèse qu’une base peut
être observée plusieurs fois dans la séquence (ce qui corres-
pond effectivement à la réalité) est donc :

A24 = 42 = 16

dinucléotides possibles.

Les 16 dinucléotides identifiables dans une séquence d’ADN


sont :
AA AC AG AT CA CC CG CT
GA GC GG GT TA TC TG TT

115/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

4-2-2 Arrangements sans répétitions.


Propriété 4.4
Lorsque chaque objet ne peut être observé qu’une seule
fois dans un arrangement, le nombre d’arrangements sans
répétition de p objets pris parmi n est alors :

n!
Apn = avec 1 ≤ p ≤ n.
(n − p)!

Preuve :
Pour le premier objet tiré, il y a n manières de ranger l’objet
parmi n. Pour le second objet tiré, il n’existe plus que n-1 manières
de ranger l’objet car le premier objet ne peut plus être pris en
compte. On parle de tirage sans remise. Ainsi pour les p ob-
jets tirés parmi n, si 1 ≤ p ≤ n, il y aura :
n!
Apn = n(n − 1)(n − 2)....(n − p + 1) = .
(n − p)!
116/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

Exemple 3 :
Concernant l’exemple de la séquence d’ADN, le nombre de di-
nucléotides attendu dans une séquence si l’on fait l’hypothèse
qu’une base n’est observée qu’une seule fois est donc :

4!
A24 = = 12
(4 − 2)!

dinucléotides possibles.

Sous cette contrainte, les 12 dinucléotides possibles sont :

AA
 AC AG AT CA 
CC
 CG CT

GA GC 
GG
 GT TA TC TG 
TT
.

Ceci correspond aux 16 arrangements possibles avec répétition


(Apn = np ) auxquels sont soustraits les 4 dinucléotides (n) résultant
de l’association d’une même base.
117/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

4-3 Permutations
4-3-1 Permutations sans répétition
Définition 4.5
I Etant donné un ensemble E de n objets, on appelle permuta-
tions de n objets distincts toutes suites ordonnées de n objets
ou tout arrangement n à n de ces objets.
I Le nombre de permutations de n objets est noté : Pn = n!.

La permutation de n objets constitue un cas particulier d’arran-


gement sans répétition de p objets pris parmi n lorsque p = n.
Ainsi le nombre de permutations de n objets est :
n!
Ann = = n!
(n − n)!
Exemple 4 :
Le nombre de manières de placer 8 convives autour d’une table
est : P8 = 8! = 40320 possibilités. 118/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

4-3-2 Permutations avec répétition


Définition 4.6
I Dans le cas où il existerait plusieurs répétitions k d’un même
objet parmi les n objets, le nombre de permutations possibles
des n objets doit être rapporté aux nombres de permutations
des k objets identiques.
n!
I Le nombre de permutations de n objets est alors : Pn = .
k!
En effet, les permutations de k objets identiques sont toutes
identiques et ne comptent que pour une seule permutation.
Exemple 5 :
Considérons le mot  CELLULE . Le nombre de mots pos-
sibles (avec ou sans signification) que l’on peut écrire en per-
7!
mutant ces 7 lettres est : P7 = 2!3! = 420 mots possibles en
considérant deux groupes de lettres identiques : L (3 fois) et E
(2 fois). 119/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

4-4 Combinaisons

Si l’on reprend l’exemple de la séquence d’ADN, à la différence


des arrangements où les dinucléotides AC et CA formaient deux
arrangements distincts, ces derniers ne formeront qu’une seule
combinaison. Pour les combinaisons, on ne parle plus de suite ni
de série puisque la notion d’ordre des objets n’est plus prise
en compte. On parle alors de tirages avec ou sans remise.

4-4-1 Combinaisons sans remise


Définition 4.7
I Etant donné un ensemble E de n objets, on appelle combi-
naisons de p objets tout ensemble de p objets pris parmi les n
objets sans remise.
I Le nombre de combinaisons de p objets pris parmi n est noté :
Cnp .

120/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

Exemples 6 :
• Le tirage au hasard de 5 cartes dans un jeu de 32 (main de
poker) est une combinaison avec p=5 et n=32.
• La formation d’une délégation de 5 personnes parmi un groupe
de 50 constitue une combinaison avec p=5 et n=50.

Pour ces deux exemples, les objets tirés sont clairement dis-
tincts.
Propriété 4.8
Le nombre de combinaisons de p objets pris parmi n et sans
remise est :
 
p n! n
Cn = notée avec 1 ≤ p ≤ n.
p!(n − p)! p

121/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

Exemples 7 :
Dans le cadre de l’exemple de la séquence d’ADN, le nombre de
dinucléotides attendus sans tenir compte de l’ordre des bases
dans la séquence (hypothèse justifiée dans le cas de l’ADN non
codant) est donc :
 
2 4 4!
C4 = = = 6 dinucléotides.
2 2!(4 − 2)!

Les 6 dinucléotides possibles sous cette hypothèse sont :

AC AG AT CG CT GT

CA GA TA GC TC TG

122/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

4-4-2 Combinaisons avec remise


Propriété 4.9
Le nombre de combinaisons de p objet parmi n avec remise
est :
p (n + p − 1)!
Cn+p−1 = .
p!(n − 1)!

4-4-3 Propriétés des combinaisons :


z La symétrie :
Cnp = Cnn−p .
z Combinaisons composées ou Formule de Pascal :

Cnp = Cn−1
p−1 p
+ Cn−1 .

Les termes du triangle de Pascal résultent de l’application di-


recte de cette relation.
123/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

... p-1 p ...


...
p−1 p
n-1 Cn−1 Cn−1
n Cnp
Pour établir le triangle de Pascal, il suffit de porter les valeurs
prises par p en colonne et celles prises par n en ligne (voir ta-
bleau ci-dessus). La valeur attribuée à chaque case, Cnp , est ob-
tenue en faisant la somme de la valeur de la case située juste
p
au–dessus, Cn−1 et la valeur de la case située au-dessus et à
p−1
gauche Cn−1 .
Le triangle de Pascal permet d’obtenir par récurrence les coeffi-
cients numériques ou coefficient binomiaux du binôme de New-
ton. 124/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

4-4-4 Formule du binôme de Newton


Propriété 4.10
∀(a, b) ∈ R2 , n ∈ N :
n
Cnp an−p bp .
X
n
(a + b) =
p=0

Les coefficients binomiaux Cnp qui sont les coefficients de la for-


mule du binôme de Newton figurent dans de nombreuses for-
mules mathématiques, notamment pour le calcul des probabi-
lités de la loi binomiale. Ces coefficients peuvent être obtenus
facilement à l’aide du triangle de Pascal.

125/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

Exemple 8 :
Le développement de (a + b)6 donne :
6
C6p a6−p bp
X
(a + b)6 =
p=0
     
6 6 6 5 6
= a + a b+ a4 b 2 +
0 1 2
       
6 6 6 6
a3 b 3 + 2 4
a b + 5
ab + b6
3 4 5 6

L’application du triangle de Pascal (7ème ligne) donne


directement les valeurs des coefficients binomiaux :

(a + b)6 = a6 + 6a5 b + 15a4 b2 + 20a3 b3 + 15a2 b4 + 6ab5 + b6 .

126/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

Remarque 4.11
Si l’on pose a = b = 1, on obtient alors, d’après la formule du
binôme de Newton
n
Cnp .
X
2n =
p=0

Or Cnp étant le nombre


P de parties à p éléments de l’ensemble E
contenant n objets, np=0 Cnp représente le nombre de parties
ou partitions de l’ensemble E que l’on note :

Si card E = n alors card P(E) = 2n .

Le cardinal d’un ensemble (card) correspond au nombre d’élé-


ments constituant cet ensemble.

127/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

Chapitre 5 :

Probabilités : Définitions
élémentaires

128/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

5-1 Expériences aléatoires


Définition 5.1
On appelle expérience aléatoire une expérience dont les
issues (les résultats) ne sont pas déterminés à l’avance.
L’ensemble, souvent noté Ω, de toutes les issues pos-
sibles est appelé univers ou espace d’échantillonnage
de l’expérience.

Exemple 1 :
I On jette un dé à six faces, il y a six issues possibles :
Ω = {1, 2, 3, 4, 5, 6}.
I Un fabricant contrôle les produits sortis de ses chaı̂nes : il y a
deux issues possibles, ou bien le produit est sans défaut et peut
être vendu, ou bien le produit présente des défauts et va être
jeté :
Ω = { conforme , non conforme}. 129/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

Exemple 2 :
I On choisit un nombre entier positif :

Ω = N.

A la différence de l’exemple précédent, l’univers Ω est ici in-


fini. On parle là d’infini discret (les valeurs possibles sont toutes
isolées).
I On choisit un point dans le plan. Là,

Ω = R2 ,

et l’univers est aussi infini, mais cette fois-ci on parle d’infini


continu.

130/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

5-2 Événements

Définition 5.2
Un sous-ensemble, ou partie, de Ω est appelé un
événement. L’ensemble des événements est donc l’en-
semble noté P(Ω) des parties de Ω.
En particulier Ω et ∅ sont appelés événement certain et
événement impossible respectivement.
Un ensemble qui ne contient qu’une seule issue est un
événement élémentaire.
Exemple 3 :
dans l’expérience du dé,  on obtient 1  est un événement
élémentaire,  on obtient un nombre impair  ou  on obtient
un nombre inférieur ou égal à 4  sont deux événements (non
élémentaires).
131/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

5-3 Opérations sur les événements

Définition 5.3
A et B sont deux événements. Alors :
L’événement contraire de A est son complémentaire dans
Ω, noté A ou Ω − A, et se comprend  A n’est pas réalisé .
La réunion de A et B est A ∪ B et se comprend A ou B (ou
les deux) sont réalisés .
L’intersection de A et B est A ∩ B et se comprend  A et B
sont réalisés simultanément .
Exemple 4 :
Dans l’expérience du dé, si

A = {1, 3, 5} = on obtient un nombre impair ,

132/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

B = {1, 2, 3, 4} = on obtient un nombre inférieur ou égal à 4 ,


alors
A = {2, 4, 6} = on obtient un nombre pair ,
B = {5, 6} = on obtient un nombre strictement supérieur à 4 ,
A ∪ B = {1, 2, 3, 4, 5} =  on obtient un nombre impair ou
un nombre inférieur ou égal à 4 ,
A ∩ B = {1, 3} = on obtient un nombre impair
inférieur ou égal à 4  .

Définition 5.4
Deux événements sont incompatibles s’ils ne peuvent se pro-
duire simultanément, i.e si leur intersection est vide : A ∩ B = ∅.
Bien sûr, un événement et son contraire sont toujours incompa-
tibles 133/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

5-4 Loi de probabilité


Définition 5.5
I Une probabilité est une application p de P(Ω) dans [0 ; 1]
telle que :
p(Ω) = 1.
Si A et B sont deux événements incompatibles,
p(A ∪ B) = p(A) + p(B).
I Le couple (Ω, p) est dite un espace probabilisé.

Propriétés 5.6
0 ≤ p(A) ≤ 1 pour tout événement A.
p(∅) = 0, p(Ω) = 1.
p(A) = 1 − p(A) pour tout événement A.
p(A ∪ B) + p(A ∩ B) = p(A) + p(B) pour tous événements
A,B.
134/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

5-5 Le cas particulier des univers finis


Pour étudier un phénomène à l’aide des probabilités, on a be-
soin de connaı̂tre la loi de probabilité p, qui est une fonction de
P(Ω) dans [0 ; 1], donc a priori on a besoin de connaı̂tre sa va-
leur sur chaque sous-ensemble de Ω. Mais en fait, quand Ω est
fini, la connaissance de p sur chaque événement élémentaire
suffit : si A ⊂ Ω est un événement quelconque, A est fini et on
peut écrire A = {a1 , a2 , ..., ak }, donc

p(A) = p(a1 ) + p(a2 ) + ... + p(ak ).

Un cas encore plus particulier mais fondamental est le cas de


l’équiprobabilité :
Définition 5.7
Sur un univers fini, on dit que la loi est équiprobable si tous les
événements élémentaires ont la même probabilité.
135/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

Propriété 5.8
Si la loi p est équiprobable, alors :
La probabilité de chaque événement élémentaire est
1/card(Ω).
La probabilité d’un événement A est :

card(A) nombre d’éléments de A


p(A) = = .
card(Ω) nombre d’éléments de Ω

Exemple 5 :
Dans des expérience de tirage au sort (pile ou face, dé, ...), sans
précisions supplémentaires on supposera que le jeu n’est pas
truqué, ce qui revient à dire que la loi est équiprobable : tous les
événements élémentaires ont la même probabilité (une chance
sur deux de faire pile, une chance sur deux de faire face ; une
chance sur six de tirer 1, une chance sur six de tirer 2, etc... ).
136/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

5-6 Le cas particulier des probabilités infinies


discrètes
Ω infini est dit discret si on peut énumérer ses éléments, i.e si
on peut écrire
Ω = {x1 , x2 , ...}.
Typiquement, cela correspond à des expériences dont le résultat
est un entier naturel. Comme dans le cas précédent, on ob-
tient la probabilité d’un événement quelconque comme somme
(éventuellement infinie) des événements élémentaires qui le com-
posent.
Exemple 6 :
On considère la probabilité de désintégration des atomes d’un
composé radioactif durant un intervalle de temps de longueur t
fixé. Ici, Ω = N, et
Λn t n −Λt
pn = e .
n!
137/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

5-7 Le cas particulier des probabilités continues

Pour étudier les probabilités sur des univers continus infinis, par
exemple :
Choix d’un nombre au hasard dans [0 ; 1] ;
Durée de vie d’une voiture dans [0; +∞[, ...
On va comme dans le cas fini partir d’événements de base qui
permettent de reconstituer tous les événements, donc de calcu-
ler toutes les propriétés. Mais ici le problème est un peu plus
délicat. En effet, en général, avec un univers continu la pro-
babilité de chaque événement élémentaire est nulle, et cette
information ne permet pas de déterminer la valeur de p(A) pour
tout événement A.

Pour ce qui suit on prend pour un intervalle de R (par exemple,


[0 ; 1], ou [0; +∞[, ou R lui-même...).
138/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

Ces événements de base vont ici être les segments [a, b]. Dans
la plupart des cas, les événements qui nous intéressent pourront
être décrits comme réunion, intersection, complémentaires, ...
de segments et on pourra donc déduire ainsi leur probabilité
de celles de ces segments grâce aux règles de calcul sur les
probabilités.
Dans le cas des probabilités continues on associe à chaque pro-
babilité une densité de probabilité :
Définition 5.9
I Une densité deR probabilité est une fonction f intégrable et
positive, telle que Ω f = 1.
I La probabilité p est caractérisée par le fait que pour tout
événement A, Z
p(A) = f.
A
Rb
I En particulier, p([a; b]) = a f pour tout segment [a ; b].
139/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

Exemple 7 :
Le cas le plus simple est celui de la probabilité uniforme sur
[0 ; 1], qui correspond à l’expérience
 on choisit au hasard un nombre compris entre 0 et 1, sans
privilégier aucune valeur .

Alors la densité correspondante est f = 1, et la probabilité d’ob-


tenir un nombre entre a et b (pour 0 ≤ a ≤ b ≤ 1) est égale
à Z b
p([a, b]) = 1 = b − a.
a
Ainsi, avec a = 0 et b = 1, la probabilité est 1 : le choix d’un
nombre entre 0 et 1 donne à coup sûr un nombre entre 0 et 1 !
Au contraire, si a = b, on constate que la probabilité de choisir
un nombre (a) donné à l’avance est nulle. Si a = 0, 25 et b =
0, 75 : on a une chance sur deux que le nombre choisi soit dans
l’intervalle [a ; b] de longueur 1/2.
140/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

5-8 Probabilités conditionnelles

Définition 5.10
Soit (Ω, p) un espace probabilisé, et A un événement de proba-
bilité non nulle.
On appelle  probabilité que B soit réalisé sachant que A
l’est , ou plus simplement  probabilité de B sachant A ,
la quantité
p(A ∩ B)
p(B|A) = .
p(A)

Exemple 8 :
On lance deux dés bien équilibrés.
Quelle est la probabilité que la somme des résultats soit stricte-
ment supérieure à 8 sachant que l’un des dés a donné 6.

141/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

A = ”l’un des dés donne 6”, alors

A = {(6, 1); (6, 2); (6, 3), (6, 4); (6, 5); (6, 6),
(1, 6); (2, 6); (3, 6), (4, 6); (5, 6)}

est de cardinal 11.


B = ”somme > 8”, alors

B = {(3, 6); (4, 5); (4, 6); (5, 5); (5, 6); (6, 6); (6, 5); (6, 4); (5, 4); (6, 3)}.

est de cardinal 10.


L’intersection

A ∩ B = {(3, 6); (4, 6); (5, 6); (6, 6); (6, 5); (6, 4); (6, 3)}

est de cardinal 7, donc la probabilité est


p(A ∩ B) 7
p(B|A) = = .
p(A) 11
142/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

Connaissant p(A|B), on aimerait parfois connaı̂tre p(B|A).


C’est souvent possible en écrivant de deux manières différentes
p(A ∩ B) à l’aide des définitions de p(A|B) et de p(B|A) :

Propriété 5.11

p(A ∩ B) = p(A)p(B|A) = p(B)p(A|B).

La formule ci-dessus peut s’exprimer sous la forme plus direc-


tement utilisable suivante :
Propriété 5.12
p(B|A) × p(A)
p(A|B) = .
p(B)

Dans les cas un peu plus compliqués, on peut avoir besoin de


la formule de Bayes.
143/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

5-9 Formule de Bayes

Considérons des événements incompatibles A1 , A2 , ..., An , et un


événement B qui ne peut se produire que si l’un des Ai se pro-
duit, les p(B|Ai ) étant connus. On cherche la probabilité pour
que, B s’étant produit, Ak en soit la cause. Commençons par
remarquer que p(B) = p(A1 ∩ B) + ... + p(An ∩ B) ; comme
p(Ak ∩ B) = p(Ak )p(B|Ak ), on obtient la formule des proba-
bilités totales :
Propriété 5.13

p(B) = p(B|A1 )p(A1 ) + p(B|A2 )p(A2 ) + ... + p(B|An )p(An ).

Alors en écrivant p(Ak |B) = p(Ak ∩B)/p(B) = p(B|Ak )p(Ak )/p(B),


et en remplaçant p(B) par la formule précédente, on obtient la
formule de Bayes :
144/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

Propriété 5.14
p(A )p(B|Ak )
p(Ak |B) = Pn k .
i=1 p(Ai )p(B|Ai )

Exemple 9 :
Un test de dépistage d’une maladie rare touchant une personne
sur 10000 semble efficace : il détecte 99% des personnes in-
fectées, avec seulement 0, 5% de  faux positifs . Quelle est
la probabilité qu’une personne dont le test est positif (P) soit ef-
fectivement malade (M) ?

p(M)p(P|M)
p(M|P) = ' 1.94%.
p(M)p(P|M) + p(M)p(P|M)

145/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

5-10 Événements indépendants

On dit que deux événements A et B sont indépendants quand


l’un des deux est de probabilité nulle, ou bien, quand les deux
sont de probabilité non nulle, si le fait de savoir que l’un est
réalisé n’influe pas sur la probabilité que l’autre le soit. Autre-
ment dit :
Définition 5.15
Deux événements A et B de probabilité non nulle sont
indépendants quand

p(B|A) = p(B)

ou de manière équivalente quand

p(A|B) = p(A).

146/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

p(A ∩ B)
Comme p(B|A) = , cela équivaut à la
p(A)
Proposition 5.16
Deux événements A et B sont indépendants si et seulement si

p(A ∩ B) = p(A)p(B).

Remarque 5.17
Ne pas confondre les deux notions d’événements indépendants
et d’événements incompatibles ! Deux événements incompa-
tibles ne sont jamais indépendants (sauf si les deux sont de pro-
babilités nulle). En effet, si A et B sont incompatibles et que l’on
sait que A est réalisé, justement, B ne peut pas se produire...il
n’y a donc pas indépendance.

147/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

Chapitre 6 :

Variables aléatoires
réelles discrètes - Lois
usuelles

148/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

6-1 Introduction

Définition 6.1
Étant donné un ensemble Ω, on appelle algèbre d’événements
(ou tribu) toute famille A de parties de Ω telle que :
1 Ω ∈ A.
2 A ∈ A ⇒ A ∈ A.
S
3 Ai ∈ A, i ∈ N ⇒ i∈N Ai ∈ A.
(Ω, A) est dite espace probabilisable.

Dans la plupart des phénomènes aléatoires, le résultat d’une


épreuve peut se traduire par une  grandeur  mathématique,
très souvent représentée par un nombre entier ou un nombre
réel. La notion mathématique qui représente efficacement ce
genre de situation concrète est celle de variable aléatoire (notée
également v.a.).
149/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

Définition 6.2
Soit (Ω, A) un espace probabilisable. On appelle variable
aléatoire sur cet espace, toute application X : Ω → R telle que
pour tout intervalle I de R on a X −1 (I) ∈ A.

Exemple 1 :
Si l’on considère la constitution d’une fratrie de deux enfants,
l’univers est constitué des évènements élémentaires suivant :

Ω = {GG, GF , FG, FF }.

Les valeurs possibles prises par la variable aléatoire X,  nombres


de fille dans la famille  sont :

X (Ω) = {0, 1, 2}.

150/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

6-2 Définition

Définition 6.3
Une variable aléatoire est dite discrète si elle ne prend que
des valeurs discontinues dans un intervalle donné (borné
ou non borné).
L’ensemble des nombres entiers est discret.
En règle générale, toutes les variables qui résultent d’un
dénombrement ou d’une numération sont de type discrètes.

Exemple 2 :
Les variables aléatoires,
I le nombre de petits par porté pour une espèce animale donnée
(chat, marmotte, etc),
I le nombre de bactéries dans 100 ml de préparation,
I le nombre de mutations dans une séquence d’ADN de 10 kb, etc ...
sont des variables aléatoires discrètes.
151/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

6-3 Loi de probabilité


Définition 6.4
La loi de probabilité (ou distribution de probabilité) d’une
variable aléatoire discrète est entièrement déterminée par les
probabilités pi des évènements {X = xi }, xi parcourant l’univers
image X (Ω). La loi de probabilité est donnée par les (xi , pi )i .

Remarque 6.5
Afin de simplifier l’écriture, nous noterons pour la suite du cours :
P({X = xi }) équivalent à P(X = xi ) ou pi .

Exemple 3 :
Dans le cas de la constitution d’une fratrie de deux enfants, si
l’on fait l’hypothèse que la probabilité d’avoir un garçon est égale
à celle d’avoir une fille (1/2), alors la distribution de probabilité
ou loi de probabilité du nombre de filles dans une fratrie de deux
enfants est : 152/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

Ensemble des Valeurs de la Probabilités associées


évènements possibles variable aléatoire à la variable X
de Ω X P(X = xi ) ou pi
G et G 0 1/4
F et G ou G et F 1 1/2
F et F 2 1/4

Propriété 6.6
Une loi de probabilité n’est établie que si
X
pi = 1,
i

la somme étant étendue à tous les indices i.

153/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

6-4 Fonction de répartition

Définition 6.7
On appelle fonction de répartition d’une variable aléatoire X,
la fonction FX telle que :

FX : R → R
t 7→ FX (t) = P(X ≤ t).

Concrètement la fonction de répartition correspond à la distri-


bution des probabilités cumulées.

L’importance pratique de la fonction de répartition est qu’elle


permet de calculer la probabilité de tout intervalle dans R.

154/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

Les propriétés associées à la fonction de répartition sont les


suivantes :
Propriétés 6.8
Soit FX la fonction de répartition d’une variable aléatoire discrète
X alors :
1 ∀t ∈ R, 0 ≤ FX (t) ≤ 1.
2 FX est croissante sur R.
3 limt→−∞ FX (t) = 0 et limt→∞ FX (t) = 1.
4 Si a ≤ b, P(a < X ≤ b) = FX (b) − FX (a).

Dans le cas d’une variable aléatoire discrète, on utilise un dia-


gramme en bâtons pour visualiser la distribution de probabilités
et une fonction en escalier pour la fonction de répartition.
Exemple 4 :
On considère l’évènement ω  lancer de 3 pièces . On introduit
une variable aléatoire X définie par X (ω)  nombre de piles de 155/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

l’évènement ω . La loi de probabilité de X est :


Nombre de piles P(X = xi ) FX
0 1/8 1/8
1 3/8 4/8
2 3/8 7/8
3 1/8 1

156/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

6-5 Espérance mathématique


L’espérance d’une variable aléatoire X correspond à la moyenne des
valeurs possibles de X pondérées par les probabilités associées à ces
valeurs. C’est l’équivalent de la moyenne arithmétique X .
Définition 6.9
Si X est une variable aléatoire discrète définie sur un univers
probabilisé Ω, on appelle espérance de X, le réel défini par :
X
E(X ) = X (ω)P(ω).
ω∈Ω

Théorème 6.10
Si X est une variable aléatoire discrète de loi de probabilité (xi , pi )i
définit sur un nombre fini (n) d’évènements élémentaires alors :
n
X
E(X ) = xi pi .
i
157/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

Exemple 5 :
Si l’on reprend l’exemple d’une fratrie de deux enfants, l’espérance
de la variable aléatoire  nombre de filles  est :
E(X ) = 0 ∗ 1/4 + 1 ∗ 1/2 + 2 ∗ 1/4 = 1,
d’où E(X ) = 1.
Si l’on observe un nombre suffisant de fratries de 2 enfants, on
attend en moyenne une fille par fratrie.
Propriétés 6.11
Si X et Y sont deux variables aléatoires définies sur un même
univers Ω, admettant une espérance, alors :
1 E(X+Y)=E(X)+E(Y).
2 E(aX ) = aE(X ) ∀a ∈ R.
3 Si X ≥ 0 alors E(X ) ≥ 0.
4 Si X est un caractère constant tel que : ∀ω ∈ Ω X (ω) = k
alors E(X ) = k.
158/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

6-6 Variance
La variance d’une variable aléatoire V(X) est l’espérance mathématique
du carré de l’écart à l’espérance mathématique.
Définition 6.12
• Si X est une variable aléatoire ayant une espérance E(X), on
appelle variance de X le réel :

V (X ) = E([X − E(X )]2 ).

• Si X est une variable aléatoire ayant une variance V(X), on


appelle écart-type de X, le réel :
p
σ(X ) = V (X ).

Propriété 6.13

V (X ) = E(X 2 ) − [E(X )]2


159/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

Définition 6.14
Si X est une variable aléatoire discrète de loi de proba-
bilité (xi , pi )i définie sur un nombre fini (n) d’évènements
élémentaires alors la variance est égale à :
n
X n
X
V (X ) = (xi − E(X ))2 pi = x i pi − (E(X ))2 .
i=1 i=1

Exemple 6 :
Si l’on reprend l’exemple d’une fratrie de deux enfants, la va-
riance de la variable aléatoire  nombre de filles  est :

V (X ) = 1/4(0 − 1)2 + 1/2(1 − 1)2 + 1/4(2 − 1)2 = 1/2

V (X ) = 1/2 et σ(X ) = 0, 7.

160/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

6-7 Loi discrète uniforme


Définition 6.15
Une distribution de probabilité suit une loi discrète uniforme
lorsque toutes les valeurs prises par la variable aléatoire sont
équiprobables. Si n est le nombre de valeurs différentes prises
par la variable aléatoire,

1
∀i, P(X = xi ) = .
n
Exemple 7 :
La distribution des chiffres obtenus au lancer de dé (si ce dernier
est non truqué) suit une loi uniforme dont la loi de probabilité est
la suivante :
X 1 2 3 4 5 6
P(X = xi ) 1/6 1/6 1/6 1/6 1/6 1/6
avec pour espérance : 161/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

6
1X
E(X ) = i = 3, 5
6
i=1
et pour variance
6
1X 2
V (X ) = i − (E(X ))2 = 2, 92
6
i=1

où les valeurs xi correspondent au rang i de la variable X dans


la série.
Propriétés 6.16
Dans le cas particulier d’une loi discrète uniforme où les
valeurs de la variable aléatoire X correspondent au rang
xi = i (∀i ∈ [1, n])

n+1 n2 − 1
E(X ) = et V (X ) = .
2 12
162/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

6-8 Loi de Bernoulli


Soit un univers Ω constitué de deux éventualités, S pour succès
et E pour échec
Ω = {E, S}
sur lequel on construit une variable aléatoire discrète,  nombre
de succès  telle que au cours d’une épreuve,

si S est réalisé, X = 1

si E est réalisé, X = 0.

Définition 6.17
On appelle variable de Bernoulli ou variable indicatrice, la va-
riable aléatoire X telle que : X : Ω → R et

X (Ω) = {0; 1}.


163/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

Définition 6.18
La loi de probabilité associée à la variable de Bernoulli X telle
que,
P(X = 1) = p
P(X = 0) = q
avec p+q = 1, est appelée loi de Bernoulli notée B(1, p).

Propriétés 6.19
L’espérance de la variable de Bernoulli est

E(X ) = p.

La variance de la variable de Bernoulli est

V (X ) = pq.

164/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

6-9 Loi binomiale

Définition 6.20
On exécute n épreuves indépendantes, chacune ayant une pro-
babilité p de succès. La variable aléatoire X qui compte le
nombre de succès sur l’ensemble des n épreuves est dite va-
riable aléatoire binomiale de paramètres (n, p), notée B(n, p).

Proposition 6.21
La loi de probabilité d’une v.a. binomiale de paramètres (n, p)
est donnée par :

P(X = i) = p(i) = Cni pi q n−i , avec q = 1 − p.

Exemple 8 :
On jette 5 pièces équilibrées. Les résultats sont supposés indépe-
ndants. Soit X la v.a. qui compte le nombre de piles obtenus.
165/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

X 0 1 2 3 4 5 Somme
P(X = i) 1/32 5/32 10/32 10/32 5/32 1/32 1
iP(X = i) 0 5/32 20/32 30/32 20/32 5/32 80/32
Ainsi l’espérance de X est :
E(X ) = 80/32.

Propriétés 6.22
Soit X une variable aléatoire binomiale de paramètres (n, p).
L’espérance de X est :

E(X ) = np.

La variance de X est :

V (X ) = npq.
166/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

6-10 Loi de Poisson

Définition 6.23
Si la v.a. X est à valeurs dans N, on dit que X suit la loi de
Poisson de paramètre λ > 0 si :

λn −λ
P(X = n) = e .
n!

Propriétés 6.24
Soit X une variable aléatoire poissonnienne de paramètre λ.
L’espérance de X est :

E(X ) = λ.

La variance de X est :
V (X ) = λ.
167/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois

Proposition 6.25

[Approximation poissonnienne d’une loi binomiale]


Soit X une v.a. binomiale de paramètres n, p. Si n est grand et
p petit, la loi de Poisson de paramètre λ = np est une bonne
approximation de X.

Exemple 9 :
On suppose que le nombre d’erreurs par page dans un livre
suit une loi de Poisson de paramètre λ = 1/2. Quelle est la
probabilité qu’il y ait au moins une erreur sur la page 41 ?
Soit X le nombre d’erreurs sur la page 41.
P(X ≥ 1) = 1 − P(X = 0) = 1 − e1/2 ' 0, 393.

MERCI POUR VOTRE ATTENTION


FIN DU COURS

168/168
Pr. M. Iguernane

Vous aimerez peut-être aussi