Académique Documents
Professionnel Documents
Culture Documents
Pr. M. Iguernane
Email: mohamed.iguernane@gmail.com
m.iguernane@uiz.ac.ma
1/168
Pr. M. Iguernane
Sommaire
Statistique descriptive :
Généralités : Population, Echantillon, Variables, Types de
variables.
Séries statistiques unidimensionnelle : Tableau des distri-
butions, graphiques, paramètres de position, paramètres de
dispersion.
Séries statistiques bi-variées : séries appariées, séries non
appariées, table de contingence, covariance, corrélation, ajus-
tement linéaire par la méthode des moindres carrées.
Eléments de probabilité :
Analyse combinatoire : dénombrement
Calcul des probabilités : événements, équiprobabilité, pro-
babilité conditionnelle, indépendance, Théorème de Bayes.
Variables aléatoires réelles discrètes : Principales loi de pro-
babilité, fonction de répartition, espérance mathématique,
variance, écart-type
2/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
PARTIE I :
Statistique descriptive
3/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
Chapitre 1 :
Vocabulaire de la
statistique descriptive
4/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
1-1 Introduction
6/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
7/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
1-3 Terminologie
Critères de classification :
On distingue deux sortes de critères :
1 Les critères quantitatifs.
2 Les critères qualitatifs.
9/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
11/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
Chapitre 2 :
13/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
Ce qui donne :
15/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
Remarque 2.1
Pour une présentation complète des tableaux et graphiques, on
doit mettre le titre en haut et la source des données en bas.
En ce qui concerne la représentation graphique, on va donner 16/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
Remarque 2.2
Les largeurs des barres doivent être les mêmes pour une belle
esthétique du graphique, ainsi que la distance entre les bandes. On
peut aussi ajouter les fréquences relatives au dessus des bandes.
17/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
18/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
19/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
20/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
21/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
23/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
Remarque 2.3
Les bâtons ne doivent pas avoir d’épaisseur, car la variable
prend exactement les valeurs 0, 1, 2,... On peut ajouter les
effectifs ou les fréquences relatives sur les bâtons
24/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
10
Le nombre de classes : K = 1 + log(n)
3
25/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
10
K =1+ log(150) = 8, 25362 ∼
=9
3
(on arrondit à l’entier immédiatement supérieur).
Une fois qu’on sait combien de classes à former. On essaie de
former des classes de même amplitude (largeur) et cette ampli-
tude sera égale à
la plus grande observation -la plus petite observation Xmax − Xmin
A= = .
K K
On arrondit cette amplitude selon les données pour avoir des
bornes de classes faciles à manipuler.
Exemple 4 : Soit X , les recettes quotidiennes (en dirhams) d’un
petit magasin. On a sélectionné un échantillon de taille n = 40
jours au hasard qui ont donné les résultats suivants :
26/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
621.35 − 16
A= = 86.48 ∼
= 90.
7
Cette amplitude est arrondie à 90. 27/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
29/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
30/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
31/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
Ici, on voit qu’il y a deux classes qui ont les plus hautes fréquences,
on les appelle des classes modales. Alors on est en présence
d’une distribution de données bimodale, et les deux modes sont
les milieux des deux classes modales, à savoir Mo(X ) = 235 et
Mo(X ) = 415. 34/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
♣ La moyenne
La moyenne arithmétique ou simplement la moyenne est la
mesure de tendance centrale la plus connue. Elle ne s’applique
qu’aux variables quantitatives. On va décrire la méthode pour
calculer la moyenne d’une variable quantitative selon que les
données sont en vrac, groupées par valeurs ou groupées par
classes.
I Les données en vrac.
Soit X une variable quantitative dont les valeurs observées sur
un échantillon forment une série en vrac x1 , x2 , ..., xn alors la
moyenne de cet échantillon est
Pn
x1 + x2 + ... + xn xi
X = = i=1 .
n n
Exemple 7 : Un commerçant a l’habitude de noter dans son re-
gistre le nombre de clients qui se présentent quotidiennement à
son magasin. On a pris un échantillon de taille 10 de ce registre
et on trouvé les valeurs suivantes : 35/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
36/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
37/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
38/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
40/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
♣ La médiane
La médiane est la valeur de la variable qui divise l’échantillon
en deux groupes d’égal effectif. Il y a 50% des données qui sont
inférieures ou égales à la médiane et 50% des données qui sont
supérieures ou égales à la médiane.
La médiane se calcule pour des variables qualitatives ordinales
et pour des variables quantitatives. On note la médiane d’une
variable X par Med(x) ou par X e . Dans ce qui suit on va décrire
les façons de calculer une médiane dans les différents cas pos-
sibles. 42/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
43/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
n
Ici, n = 60 et l = = 30 est un entier, alors
2
x30 + x31 6+6
Med(X ) = = = 6.
2 2
44/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
n
Ici, n = 41 et l = = 20.5 n’est pas un entier, alors
2
Med(X ) = x[20.5]+1 = x21 = 3.
46/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
où
binf est la borne inférieure de la classe médiane.
F(m−1) est la fréquence cumulée avant la classe médiane.
fr ,m est la fréquence relative de la classe médiane.
Am est l’amplitude de la classe médiane.
47/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
51/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
Exemple 15 :
n = 12 et les observations sont :
Étape 1 :
Étape 2 :
Si on veut déterminer Q1 , on calcule l1 = (25%) ∗ n = 3.
Si on veut déterminer Q2 , on calcule l2 = (50%) ∗ n = 6.
Si on veut déterminer Q3 , on calcule l3 = (75%) ∗ n = 9.
Étape 3 :
Puisque l1 = 3 est un entier alors
la 3ème observation+la 4ème observation 4+6
Q1 = = = 5.
2 2
52/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
Exemple 16 :
n = 10 et les observations sont :
3 10 12 8 6 100 15 6 3 14.
Étape 1 :
3 3 6 6 8 10 12 14 15 100
53/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
Étape 2 :
Si on veut déterminer Q1 , on calcule l1 = (25%) ∗ n = 2.5
Si on veut déterminer Q2 , on calcule l2 = (50%) ∗ n = 5.
Si on veut déterminer Q3 , on calcule l3 = (75%) ∗ n = 7.5.
Étape 3 :
Puisque l1 = 2.5 n’est pas un entier alors
Q1 = la 3ème observation = 6.
54/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
Remarque 2.6
La procédure décrite pour trouver les quartiles est une convention
parmi d’autres. Il n’y a pas d’accord général sur la méthode à utiliser
pour déterminer les quartiles.
Étape 3 :
Puisque l1 = 10.25 n’est pas un entier alors
Q1 = la 11ème observation = 2
Puisque l2 = 20.5 n’est pas un entier alors
Q2 = la 21ème observation = 3
Puisque l3 = 7.5 n’est pas un entier alors
Q3 = la 31ème observation = 4.
56/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
(0.5 − 0.475)
Q2 = 280 + ∗ 90 = 295DH
0.150
Ce qui signifie que dans cet échantillon de données, 50% des
journées, les recettes quotidiennes de ce petit magasin ont été
de 295 DH ou moins.
• Pour déterminer le troisième quartile, les fréquences relatives
cumulées ont dépassé 75% pour la première fois au niveau de
la classe [370 ; 460[, donc
(0.75 − 0.625)
Q3 = 370 + ∗ 90 = 410.91DH
0.275
Ce qui signifie que dans cet échantillon de données, 75% des
journées, les recettes quotidiennes de ce petit magasin ont été
de 410,91 DH ou moins.
59/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
Ceci signifie que dans cet échantillon de données, 40% des journées,
les recettes quotidiennes de ce petit magasin ont été de 255,45 DH
ou moins.
• Les fréquences relatives cumulées dépassent pour la première fois
70% au niveau de la classe [370 ; 460[, ainsi le septième décile est
égal à
(0.70 − 0.625)
D7 = 370 + ∗ 90 = 394.55DH
0.275
Ce qui signifie que dans cet échantillon de données, 70% des journées,
les recettes quotidiennes de ce petit magasin ont été de 394,55 DH ou
moins.
• Les fréquences relatives cumulées dépassent pour la première fois
95% au niveau de la classe [460 ; 550[, ainsi le quatre vingt quinzième
centile est égal à
(0.95 − 0.90)
C95 = 460 + ∗ 90 = 520DH
0.075
Ce qui signifie que dans cet échantillon de données, 95% des journées,
les recettes quotidiennes de ce petit magasin ont été de 520 DH ou
moins. 62/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
63/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
♣ L’étendue.
C’est la mesure de dispersion la plus simple à calculer. Lors-
qu’on a une variable quantitative X, mesurée sur un échantillon
de taille n. Alors l’étendue est égale à
65/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
66/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
67/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
69/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
♣ L’écart type.
L’écart type d’une variable quantitative mesurée sur un échanti-
llon est égal à la racine carrée de sa variance. Son unité de
mesure étant la même que celle de la variable, l’écart type se
prête alors aisément à l’interprétation et est considéré comme
la mesure de dispersion par excellence. La variance n’est donc
qu’une étape de calcul pour déterminer l’écart type, quand on
faisait les calculs à la main.
Exemple 23 : L’écart type échantillonnal pour les 3 précédents
exemples où on a calculé les variances échantillonnales est res-
pectivement
√ égal à :
• SX = 18 = 4.24. Pour les données de l’exemple 20 où les
données√sont en vrac.
• SX = 2.74 = 1.655. Pour les données de l’exemple 21 où
les donn√ ées sont groupées par valeurs.
• SX = 20021.54 = 141.497. Pour les données de l’exemple
22 où les données sont groupées par classes. 70/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
Y = 30 + 10 ∗ X ,
SX
CVX = 100 %.
X
• Si on a un seul échantillon de données, alors si le coefficient
de variation de X est inférieur à 15%, on dit que la variable est
homogène, sinon elle est dite hétérogène.
• Si on a deux échantillons (sur une ou deux variables) ou plus,
alors celui (ou celle) qui a le plus petit coefficient de variation est
le (ou la) plus homogène.
Exemple 25 : On a pris un échantillon de taille n=50 d’hommes
d’âge adultes, on a mesuré leur poids et leur taille. Les résultats
sont résumés dans le tableau suivant :
73/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
√
I Ecart-type de la population : σ = V.
75/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
Chapitre 3 :
76/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
3-1 Introduction
Exemple 1 :
On observe simultanément sur un échantillon de 200 foyers,
le nombre d’enfants X et le nombre de chambre Y .
On observe sur un échantillon de 20 foyers, le revenu men-
suel X en Dh et les dépenses mensuelles Y .
Au près des étudiants pris au hasard parmi une section de
génie informatique 1, on observe les notes d’analyse X et
de statistique Y .
Une entreprise mène une étude sur la liaison entre les dépe-
nses mensuelles en publicité X et le volume des ventes Y
qu’elle réalise.
78/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
81/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
Présentation 2 :
zij := (xi , yj ).
82/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
Nous notons par fij la fréquence du coulpe (xi , yj ). Cette fréquence est
donnée par
nij
fij := ,
N
83/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
avec
k X
X l l X
X k
N := Card(Ω) = nij = nij .
i=1 j=1 j=1 i=1
Remarque 3.1
Nous avons la propriété suivante,
k X
X l
fij = 1.
i=1 j=1
Lois marginales :
Sur la marge du tableau de contingence, on peut extraire les
données seulement par rapport à X et seulement par rapport à
Y (voir le tableau de contingence établi auparavant).
84/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
Remarque 3.2
Nous avons les propriétés suivantes :
k
X l
X k
X l
X
ni• = n•j = N et fi• = f•j = 1.
i=1 j=1 i=1 j=1
85/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
pour l’âge et
[6, 7[, [7, 8[, [8, 9[, [9, 10[, [10, 11],
pour le salaire (×1000). De plus, nous avons
xmax − xmin 52 − 15
Nombre de classe = = = 3.7 ' 4 classes,
amplitude âge 10
pour l’âge et
ymax − ymin 10750 − 6000
Nombre de classe = = = 4.75 ' 5 classes,
amplitude salaire 1000
pour le salaire.
87/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
Age \ Salaire [6, 7[ [7, 8[ [8, 9[ [9, 10[ [10, 11] ni• fi•
[15, 25[ 1 1 0 0 0 2 0.2
[25, 35[ 0 1 0 1 0 2 0.2
[35, 45[ 0 0 2 0 1 3 0.3
[45, 55] 0 0 1 2 0 3 0.3
n•j 1 2 3 3 1 10 1
f•j 0.1 0.2 0.3 0.3 0.1 1 Φ
89/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
90/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
Remarque 3.3
Dans le cas continu, xi et yj représentent respectivement le centre des
classes de X et Y, c’est à dire,
Exemple 4 :
Nous calculons x et y pour l’exercice traité précédemment.
La moyenne d’âge
1
x= (40 + 60 + 120 + 150) = 37 ans.
10
La moyenne du salaire
1
y= (6.5 + 15 + 25.5 + 28.5 + 10.5) × 1000 = 8600 Dh.
10
Nous définissions maintenant la variance de X et la variance de
Y comme suit,
k k
X 1 X
x j := fi/j xi = nij xi .
n•j
i=1 i=1
p
Pour l’écart-type conditionnel, nous avons σXj := Var (Xj )
avec
k
X
Var (Xj ) := fi/j (xi − x j )2 = x 2 j − (x j )2 .
i=1
94/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
l
X
Var (Yi ) := fj/i (yj − y i )2 = y 2 i − (y i )2 .
j=1
96/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
Remarque 3.4
• Dans le cas où nous avons un tableau des données brutes
”representation 1” (nous n’avons pas d’effectifs), nous avons les
formules suivantes
n n n
1X 1X 1X
x= xi , y= yi , xy = xi yi .
N N N
i=1 i=1 i=1
Cov (X , X ) = Var (X ).
97/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
Définition 3.5
On dit que deux variables statistiques X et Y sont
indépendantes si et seulement si, pour tout i et j,
Il suffit que cette égalité ne soit pas vérifiée dans une seule cel-
lule pour que les deux variables ne soient pas indépendantes.
98/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
100/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
101/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
Régression linéaire de Y en X :
103/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
Régression linéaire de X en Y :
105/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
106/168
Pr. M. Iguernane
Vocabulaire de la statistique descriptive Réduction des données Série statistique à deux variables
PARTIE II :
Eléments de probabilité
109/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois
Chapitre 4 :
Analyse combinatoire :
dénombrement
110/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois
4-1 Introduction
111/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois
4-2 Arrangements
Définition 4.1
I Etant donné un ensemble E de n objets, on appelle arrange-
ments de p objets toutes suites ordonnées de p objets pris
parmi les n objets.
I Le nombre d’arrangements de p objets pris parmi n est noté :
Apn .
Remarque 4.2
On a nécessairement 1 ≤ p ≤ n et n, p ∈ N∗ .
Si n < p, alors Apn = 0.
Deux arrangements de p objets sont donc distincts s’ils
diffèrent par la nature des objets qui les composent ou par
leur ordre dans la suite.
112/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois
Exemple 1 :
• Une séquence d’ADN est constituée d’un enchaı̂nement de 4 nucléo-
tides [A (Adénine), C (Cytosine), G (Guanine) et T (Thymine)]. Il
existe différents arrangements possibles de deux nucléotides ou di-
nucléotides avec p=2 et n=4.
• Le nombre de mots de 5 lettres (avec ou sans signification) formés
avec les 26 lettres de l’alphabet correspond au nombre d’arrange-
ments possibles avec p=5 et n=26.
• Le tiercé dans l’ordre lors d’une course de 20 chevaux constitue un
des arrangements possibles avec p=3 et n=20.
Dans les exemples précédents, l’ordre des éléments dans la suite est
essentiel. Ainsi pour le deuxième exemple, le mot NICHE est différent
du mot CHIEN. Mais dans les deux premiers exemples, une base ou
une lettre de l’alphabet peut se retrouver plusieurs fois alors que
dans le troisième exemple, les trois chevaux à l’arrivée sont forcément
différents. Il faut donc distinguer le nombre d’arrangements avec rép-
étition et le nombre d’arrangements sans répétition (arrangements
au sens strict). 113/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois
Apn = np avec 1 ≤ p ≤ n.
Preuve :
Pour le premier objet tiré, il existe n manières de ranger l’objet
parmi n. Pour le second objet tiré, il existe également n possi-
bilités d’arrangements car le premier objet fait de nouveau parti
des n objets. On parle de tirage avec remise. Ainsi pour les p
objets tirés, il y aura n × n × n × .... × n (p fois) arrangements
possibles, soit
Apn = n × n × n × .... × n = np .
114/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois
Exemple 2 :
Concernant l’exemple de la séquence d’ADN, le nombre de di-
nucléotides attendus si l’on fait l’hypothèse qu’une base peut
être observée plusieurs fois dans la séquence (ce qui corres-
pond effectivement à la réalité) est donc :
A24 = 42 = 16
dinucléotides possibles.
115/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois
n!
Apn = avec 1 ≤ p ≤ n.
(n − p)!
Preuve :
Pour le premier objet tiré, il y a n manières de ranger l’objet
parmi n. Pour le second objet tiré, il n’existe plus que n-1 manières
de ranger l’objet car le premier objet ne peut plus être pris en
compte. On parle de tirage sans remise. Ainsi pour les p ob-
jets tirés parmi n, si 1 ≤ p ≤ n, il y aura :
n!
Apn = n(n − 1)(n − 2)....(n − p + 1) = .
(n − p)!
116/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois
Exemple 3 :
Concernant l’exemple de la séquence d’ADN, le nombre de di-
nucléotides attendu dans une séquence si l’on fait l’hypothèse
qu’une base n’est observée qu’une seule fois est donc :
4!
A24 = = 12
(4 − 2)!
dinucléotides possibles.
AA
AC AG AT CA
CC
CG CT
GA GC
GG
GT TA TC TG
TT
.
4-3 Permutations
4-3-1 Permutations sans répétition
Définition 4.5
I Etant donné un ensemble E de n objets, on appelle permuta-
tions de n objets distincts toutes suites ordonnées de n objets
ou tout arrangement n à n de ces objets.
I Le nombre de permutations de n objets est noté : Pn = n!.
4-4 Combinaisons
120/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois
Exemples 6 :
• Le tirage au hasard de 5 cartes dans un jeu de 32 (main de
poker) est une combinaison avec p=5 et n=32.
• La formation d’une délégation de 5 personnes parmi un groupe
de 50 constitue une combinaison avec p=5 et n=50.
Pour ces deux exemples, les objets tirés sont clairement dis-
tincts.
Propriété 4.8
Le nombre de combinaisons de p objets pris parmi n et sans
remise est :
p n! n
Cn = notée avec 1 ≤ p ≤ n.
p!(n − p)! p
121/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois
Exemples 7 :
Dans le cadre de l’exemple de la séquence d’ADN, le nombre de
dinucléotides attendus sans tenir compte de l’ordre des bases
dans la séquence (hypothèse justifiée dans le cas de l’ADN non
codant) est donc :
2 4 4!
C4 = = = 6 dinucléotides.
2 2!(4 − 2)!
AC AG AT CG CT GT
CA GA TA GC TC TG
122/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois
Cnp = Cn−1
p−1 p
+ Cn−1 .
125/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois
Exemple 8 :
Le développement de (a + b)6 donne :
6
C6p a6−p bp
X
(a + b)6 =
p=0
6 6 6 5 6
= a + a b+ a4 b 2 +
0 1 2
6 6 6 6
a3 b 3 + 2 4
a b + 5
ab + b6
3 4 5 6
126/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois
Remarque 4.11
Si l’on pose a = b = 1, on obtient alors, d’après la formule du
binôme de Newton
n
Cnp .
X
2n =
p=0
127/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois
Chapitre 5 :
Probabilités : Définitions
élémentaires
128/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois
Exemple 1 :
I On jette un dé à six faces, il y a six issues possibles :
Ω = {1, 2, 3, 4, 5, 6}.
I Un fabricant contrôle les produits sortis de ses chaı̂nes : il y a
deux issues possibles, ou bien le produit est sans défaut et peut
être vendu, ou bien le produit présente des défauts et va être
jeté :
Ω = { conforme , non conforme}. 129/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois
Exemple 2 :
I On choisit un nombre entier positif :
Ω = N.
Ω = R2 ,
130/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois
5-2 Événements
Définition 5.2
Un sous-ensemble, ou partie, de Ω est appelé un
événement. L’ensemble des événements est donc l’en-
semble noté P(Ω) des parties de Ω.
En particulier Ω et ∅ sont appelés événement certain et
événement impossible respectivement.
Un ensemble qui ne contient qu’une seule issue est un
événement élémentaire.
Exemple 3 :
dans l’expérience du dé, on obtient 1 est un événement
élémentaire, on obtient un nombre impair ou on obtient
un nombre inférieur ou égal à 4 sont deux événements (non
élémentaires).
131/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois
Définition 5.3
A et B sont deux événements. Alors :
L’événement contraire de A est son complémentaire dans
Ω, noté A ou Ω − A, et se comprend A n’est pas réalisé .
La réunion de A et B est A ∪ B et se comprend A ou B (ou
les deux) sont réalisés .
L’intersection de A et B est A ∩ B et se comprend A et B
sont réalisés simultanément .
Exemple 4 :
Dans l’expérience du dé, si
132/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois
Définition 5.4
Deux événements sont incompatibles s’ils ne peuvent se pro-
duire simultanément, i.e si leur intersection est vide : A ∩ B = ∅.
Bien sûr, un événement et son contraire sont toujours incompa-
tibles 133/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois
Propriétés 5.6
0 ≤ p(A) ≤ 1 pour tout événement A.
p(∅) = 0, p(Ω) = 1.
p(A) = 1 − p(A) pour tout événement A.
p(A ∪ B) + p(A ∩ B) = p(A) + p(B) pour tous événements
A,B.
134/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois
Propriété 5.8
Si la loi p est équiprobable, alors :
La probabilité de chaque événement élémentaire est
1/card(Ω).
La probabilité d’un événement A est :
Exemple 5 :
Dans des expérience de tirage au sort (pile ou face, dé, ...), sans
précisions supplémentaires on supposera que le jeu n’est pas
truqué, ce qui revient à dire que la loi est équiprobable : tous les
événements élémentaires ont la même probabilité (une chance
sur deux de faire pile, une chance sur deux de faire face ; une
chance sur six de tirer 1, une chance sur six de tirer 2, etc... ).
136/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois
Pour étudier les probabilités sur des univers continus infinis, par
exemple :
Choix d’un nombre au hasard dans [0 ; 1] ;
Durée de vie d’une voiture dans [0; +∞[, ...
On va comme dans le cas fini partir d’événements de base qui
permettent de reconstituer tous les événements, donc de calcu-
ler toutes les propriétés. Mais ici le problème est un peu plus
délicat. En effet, en général, avec un univers continu la pro-
babilité de chaque événement élémentaire est nulle, et cette
information ne permet pas de déterminer la valeur de p(A) pour
tout événement A.
Ces événements de base vont ici être les segments [a, b]. Dans
la plupart des cas, les événements qui nous intéressent pourront
être décrits comme réunion, intersection, complémentaires, ...
de segments et on pourra donc déduire ainsi leur probabilité
de celles de ces segments grâce aux règles de calcul sur les
probabilités.
Dans le cas des probabilités continues on associe à chaque pro-
babilité une densité de probabilité :
Définition 5.9
I Une densité deR probabilité est une fonction f intégrable et
positive, telle que Ω f = 1.
I La probabilité p est caractérisée par le fait que pour tout
événement A, Z
p(A) = f.
A
Rb
I En particulier, p([a; b]) = a f pour tout segment [a ; b].
139/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois
Exemple 7 :
Le cas le plus simple est celui de la probabilité uniforme sur
[0 ; 1], qui correspond à l’expérience
on choisit au hasard un nombre compris entre 0 et 1, sans
privilégier aucune valeur .
Définition 5.10
Soit (Ω, p) un espace probabilisé, et A un événement de proba-
bilité non nulle.
On appelle probabilité que B soit réalisé sachant que A
l’est , ou plus simplement probabilité de B sachant A ,
la quantité
p(A ∩ B)
p(B|A) = .
p(A)
Exemple 8 :
On lance deux dés bien équilibrés.
Quelle est la probabilité que la somme des résultats soit stricte-
ment supérieure à 8 sachant que l’un des dés a donné 6.
141/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois
A = {(6, 1); (6, 2); (6, 3), (6, 4); (6, 5); (6, 6),
(1, 6); (2, 6); (3, 6), (4, 6); (5, 6)}
B = {(3, 6); (4, 5); (4, 6); (5, 5); (5, 6); (6, 6); (6, 5); (6, 4); (5, 4); (6, 3)}.
A ∩ B = {(3, 6); (4, 6); (5, 6); (6, 6); (6, 5); (6, 4); (6, 3)}
Propriété 5.11
Propriété 5.14
p(A )p(B|Ak )
p(Ak |B) = Pn k .
i=1 p(Ai )p(B|Ai )
Exemple 9 :
Un test de dépistage d’une maladie rare touchant une personne
sur 10000 semble efficace : il détecte 99% des personnes in-
fectées, avec seulement 0, 5% de faux positifs . Quelle est
la probabilité qu’une personne dont le test est positif (P) soit ef-
fectivement malade (M) ?
p(M)p(P|M)
p(M|P) = ' 1.94%.
p(M)p(P|M) + p(M)p(P|M)
145/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois
p(B|A) = p(B)
p(A|B) = p(A).
146/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois
p(A ∩ B)
Comme p(B|A) = , cela équivaut à la
p(A)
Proposition 5.16
Deux événements A et B sont indépendants si et seulement si
p(A ∩ B) = p(A)p(B).
Remarque 5.17
Ne pas confondre les deux notions d’événements indépendants
et d’événements incompatibles ! Deux événements incompa-
tibles ne sont jamais indépendants (sauf si les deux sont de pro-
babilités nulle). En effet, si A et B sont incompatibles et que l’on
sait que A est réalisé, justement, B ne peut pas se produire...il
n’y a donc pas indépendance.
147/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois
Chapitre 6 :
Variables aléatoires
réelles discrètes - Lois
usuelles
148/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois
6-1 Introduction
Définition 6.1
Étant donné un ensemble Ω, on appelle algèbre d’événements
(ou tribu) toute famille A de parties de Ω telle que :
1 Ω ∈ A.
2 A ∈ A ⇒ A ∈ A.
S
3 Ai ∈ A, i ∈ N ⇒ i∈N Ai ∈ A.
(Ω, A) est dite espace probabilisable.
Définition 6.2
Soit (Ω, A) un espace probabilisable. On appelle variable
aléatoire sur cet espace, toute application X : Ω → R telle que
pour tout intervalle I de R on a X −1 (I) ∈ A.
Exemple 1 :
Si l’on considère la constitution d’une fratrie de deux enfants,
l’univers est constitué des évènements élémentaires suivant :
Ω = {GG, GF , FG, FF }.
150/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois
6-2 Définition
Définition 6.3
Une variable aléatoire est dite discrète si elle ne prend que
des valeurs discontinues dans un intervalle donné (borné
ou non borné).
L’ensemble des nombres entiers est discret.
En règle générale, toutes les variables qui résultent d’un
dénombrement ou d’une numération sont de type discrètes.
Exemple 2 :
Les variables aléatoires,
I le nombre de petits par porté pour une espèce animale donnée
(chat, marmotte, etc),
I le nombre de bactéries dans 100 ml de préparation,
I le nombre de mutations dans une séquence d’ADN de 10 kb, etc ...
sont des variables aléatoires discrètes.
151/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois
Remarque 6.5
Afin de simplifier l’écriture, nous noterons pour la suite du cours :
P({X = xi }) équivalent à P(X = xi ) ou pi .
Exemple 3 :
Dans le cas de la constitution d’une fratrie de deux enfants, si
l’on fait l’hypothèse que la probabilité d’avoir un garçon est égale
à celle d’avoir une fille (1/2), alors la distribution de probabilité
ou loi de probabilité du nombre de filles dans une fratrie de deux
enfants est : 152/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois
Propriété 6.6
Une loi de probabilité n’est établie que si
X
pi = 1,
i
153/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois
Définition 6.7
On appelle fonction de répartition d’une variable aléatoire X,
la fonction FX telle que :
FX : R → R
t 7→ FX (t) = P(X ≤ t).
154/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois
156/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois
Théorème 6.10
Si X est une variable aléatoire discrète de loi de probabilité (xi , pi )i
définit sur un nombre fini (n) d’évènements élémentaires alors :
n
X
E(X ) = xi pi .
i
157/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois
Exemple 5 :
Si l’on reprend l’exemple d’une fratrie de deux enfants, l’espérance
de la variable aléatoire nombre de filles est :
E(X ) = 0 ∗ 1/4 + 1 ∗ 1/2 + 2 ∗ 1/4 = 1,
d’où E(X ) = 1.
Si l’on observe un nombre suffisant de fratries de 2 enfants, on
attend en moyenne une fille par fratrie.
Propriétés 6.11
Si X et Y sont deux variables aléatoires définies sur un même
univers Ω, admettant une espérance, alors :
1 E(X+Y)=E(X)+E(Y).
2 E(aX ) = aE(X ) ∀a ∈ R.
3 Si X ≥ 0 alors E(X ) ≥ 0.
4 Si X est un caractère constant tel que : ∀ω ∈ Ω X (ω) = k
alors E(X ) = k.
158/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois
6-6 Variance
La variance d’une variable aléatoire V(X) est l’espérance mathématique
du carré de l’écart à l’espérance mathématique.
Définition 6.12
• Si X est une variable aléatoire ayant une espérance E(X), on
appelle variance de X le réel :
Propriété 6.13
Définition 6.14
Si X est une variable aléatoire discrète de loi de proba-
bilité (xi , pi )i définie sur un nombre fini (n) d’évènements
élémentaires alors la variance est égale à :
n
X n
X
V (X ) = (xi − E(X ))2 pi = x i pi − (E(X ))2 .
i=1 i=1
Exemple 6 :
Si l’on reprend l’exemple d’une fratrie de deux enfants, la va-
riance de la variable aléatoire nombre de filles est :
V (X ) = 1/2 et σ(X ) = 0, 7.
160/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois
1
∀i, P(X = xi ) = .
n
Exemple 7 :
La distribution des chiffres obtenus au lancer de dé (si ce dernier
est non truqué) suit une loi uniforme dont la loi de probabilité est
la suivante :
X 1 2 3 4 5 6
P(X = xi ) 1/6 1/6 1/6 1/6 1/6 1/6
avec pour espérance : 161/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois
6
1X
E(X ) = i = 3, 5
6
i=1
et pour variance
6
1X 2
V (X ) = i − (E(X ))2 = 2, 92
6
i=1
n+1 n2 − 1
E(X ) = et V (X ) = .
2 12
162/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois
si S est réalisé, X = 1
si E est réalisé, X = 0.
Définition 6.17
On appelle variable de Bernoulli ou variable indicatrice, la va-
riable aléatoire X telle que : X : Ω → R et
Définition 6.18
La loi de probabilité associée à la variable de Bernoulli X telle
que,
P(X = 1) = p
P(X = 0) = q
avec p+q = 1, est appelée loi de Bernoulli notée B(1, p).
Propriétés 6.19
L’espérance de la variable de Bernoulli est
E(X ) = p.
V (X ) = pq.
164/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois
Définition 6.20
On exécute n épreuves indépendantes, chacune ayant une pro-
babilité p de succès. La variable aléatoire X qui compte le
nombre de succès sur l’ensemble des n épreuves est dite va-
riable aléatoire binomiale de paramètres (n, p), notée B(n, p).
Proposition 6.21
La loi de probabilité d’une v.a. binomiale de paramètres (n, p)
est donnée par :
Exemple 8 :
On jette 5 pièces équilibrées. Les résultats sont supposés indépe-
ndants. Soit X la v.a. qui compte le nombre de piles obtenus.
165/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois
X 0 1 2 3 4 5 Somme
P(X = i) 1/32 5/32 10/32 10/32 5/32 1/32 1
iP(X = i) 0 5/32 20/32 30/32 20/32 5/32 80/32
Ainsi l’espérance de X est :
E(X ) = 80/32.
Propriétés 6.22
Soit X une variable aléatoire binomiale de paramètres (n, p).
L’espérance de X est :
E(X ) = np.
La variance de X est :
V (X ) = npq.
166/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois
Définition 6.23
Si la v.a. X est à valeurs dans N, on dit que X suit la loi de
Poisson de paramètre λ > 0 si :
λn −λ
P(X = n) = e .
n!
Propriétés 6.24
Soit X une variable aléatoire poissonnienne de paramètre λ.
L’espérance de X est :
E(X ) = λ.
La variance de X est :
V (X ) = λ.
167/168
Pr. M. Iguernane
Analyse combinatoire : dénombrement Probabilités : Définitions élémentaires Variables aléatoires réelles discrètes - Lois
Proposition 6.25
Exemple 9 :
On suppose que le nombre d’erreurs par page dans un livre
suit une loi de Poisson de paramètre λ = 1/2. Quelle est la
probabilité qu’il y ait au moins une erreur sur la page 41 ?
Soit X le nombre d’erreurs sur la page 41.
P(X ≥ 1) = 1 − P(X = 0) = 1 − e1/2 ' 0, 393.
168/168
Pr. M. Iguernane