COURS DE PROBABILITESetSTATISTIQUES - LPSICS-1

MTH15250 - PROBABILITES ET
STATISTIQUES
Tchilabalo Abozou KPANZOU
Faculté des Sciences et Techniques
Université de Kara
Email: kpanzout@gmail.com
Page web: https://sites.google.com/a/aims.ac.za/tchilabalo/
HARMATTAN 2021-2022
Table des matières
1 Dénombrement et Calcul de probabilité Variables aléatoires et

lois usuelles 1
1.1 Ensembles nis de cardinal n (n ∈ N) . . . . . . . . . . . . . . . . . 1
1.1.1 Cardinal d'un ensemble ni E . . . . . . . . . . . . . . . . . . 1
1.1.2 Propriétés des cardinaux d'ensembles nis . . . . . . . . . . . 1
1.1.3 Nombre d'applications, d'injections et de bijections . . . . . . 1
1.1.4 Nombre de parties de cardinal p d'un ensemble ni E de car-
dinal n (p ≤ n) . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.1.5 Formule du binôme de Newton . . . . . . . . . . . . . . . . . 3
1.2 Notion de tribu et de mesure de probabilité . . . . . . . . . . . . . . 4
1.2.1 Notion de tribu . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2.2 Mesure de probabilité . . . . . . . . . . . . . . . . . . . . . . . 4
1.3 Probabilité sur un ensemble ni . . . . . . . . . . . . . . . . . . . . . 5
1.3.1 Dénition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.3.2 Equiprobabilité . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.3.3 Propriétés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.4 Probabilité conditionnelle . . . . . . . . . . . . . . . . . . . . . . . . 6
1.4.1 Dénition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.4.2 Probabilité composée . . . . . . . . . . . . . . . . . . . . . . . 6
1.4.3 Evènements indépendants . . . . . . . . . . . . . . . . . . . . 6
1.4.4 Probabilité totale . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.4.5 Probabilité de cause ou formule de Bayes . . . . . . . . . . . . 7
1.5 Variable aléatoire discrète . . . . . . . . . . . . . . . . . . . . . . . . 7
1.5.1 Loi de probabilité . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.5.2 Fonction de répartition . . . . . . . . . . . . . . . . . . . . . . 8
1.5.3 Moments . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.6 Variable aléatoire continue . . . . . . . . . . . . . . . . . . . . . . . . 9
1.6.1 Moments . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.7 Quelques lois usuelles . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.7.1 Lois discrètes . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.7.2 Lois continues . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2 Étude d'une série statistique à une variable 14

2.1 Concepts de base . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.1.1 Population et unité statistique - échantillon . . . . . . . . . . 14
2.1.2 Caractères et modalités . . . . . . . . . . . . . . . . . . . . . . 14
i
TABLE DES MATIÈRES KPANZOU T.A./FaST/UK
2.2 Étude d'une variable qualitative . . . . . . . . . . . . . . . . . . . . . 16

2.2.1 Tableau statistique . . . . . . . . . . . . . . . . . . . . . . . . 16
2.2.2 Représentations graphiques . . . . . . . . . . . . . . . . . . . 16
2.3 Étude d'une variable quantitative discrète . . . . . . . . . . . . . . . 17
2.3.2 Caractéristiques de tendance centrale . . . . . . . . . . . . . . 17
2.3.3 Caractéristiques de dispersion . . . . . . . . . . . . . . . . . . 19
2.4 Étude d'une variable quantitative continue . . . . . . . . . . . . . . . 20
2.4.1 Classe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
2.4.3 Représentation graphique . . . . . . . . . . . . . . . . . . . . 21
2.4.4 Caractéristiques de tendance centrale . . . . . . . . . . . . . . 22
2.4.5 Caractéristiques de dispersion . . . . . . . . . . . . . . . . . . 23
3 Étude d'une série statistique à deux variables 26

3.1 Tableaux de contingence, distributions marginales et conditionnelles . 26
3.1.1 Tableau de contingence : croisement de deux variables . . . . . 26
3.1.2 Fréquence conjointe . . . . . . . . . . . . . . . . . . . . . . . . 27
3.1.3 Distribution marginale : prole ligne et prole colonne . . . . 27
3.1.4 Distribution conditionnelle . . . . . . . . . . . . . . . . . . . . 27
3.2 Caractéristiques marginales et conditionnelles . . . . . . . . . . . . . 27
3.2.1 Caractéristiques marginales . . . . . . . . . . . . . . . . . . . 28
3.2.2 Caractéristiques conditionnelles . . . . . . . . . . . . . . . . . 28
3.3 Ajustement linéaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
3.3.1 Covariance entre deux variables . . . . . . . . . . . . . . . . . 29
3.3.2 Méthode des moindres carrées ordinaires . . . . . . . . . . . . 29
3.3.3 Coecient de corrélation linéaire . . . . . . . . . . . . . . . . 30
3.3.4 Propriétés importantes . . . . . . . . . . . . . . . . . . . . . . 30
3.3.5 Ajustement linéaire par la méthode de Mayer . . . . . . . . . 30
ii ANNEE UNIVERSITAIRE 2021-2022

Chapitre 1
Dénombrement et Calcul de
probabilité Variables aléatoires et
lois usuelles
1.1 Ensembles nis de cardinal n (n ∈ N)

1.1.1 Cardinal d'un ensemble ni E
Dénition 1.1.1 On appelle cardinal d'un ensemble ni E , le nombre n d'éléments
dans E . On le note cardE .
Dénition 1.1.2 Deux ensembles nis E et F sont dits équipotents s'il existe une
bijection de l'un dans l'autre. Donc, deux ensembles sont équipotents s'ils ont le
même cardinal.
Dénition 1.1.3 Le produit n × (n − 1) × · · · × 2 × 1 des n premiers entiers naturels

non nuls est appelé factorielle n et noté n!. Par convention, 0! = 1.
1.1.2 Propriétés des cardinaux d'ensembles nis

Soient E et F deux ensembles nis. Alors E ∩ F , E ∪ F et E × F sont nis et on a :
i) E ⊂ F =⇒ cardE ≤ cardF .
ii) E ∩ F = ∅ (i.e. E et F sont disjoints) =⇒ card(E ∪ F ) = cardE + cardF .
(Cas particulier du iii))
iii) card(E ∪ F ) = cardE + cardF − card(E ∩ F ).
iv) card(E × F ) = cardE × cardF .
Remarque : La propriété iv) sera souvent utilisée dans les problèmes d'épreuves à
répétition. Elle permet d'écrire : ∀n ∈ N∗ , card(An ) = (cardA)n .
1.1.3 Nombre d'applications, d'injections et de bijections

Soient E et F deux ensembles nis tels que cardE = p et cardF = n (p, n ∈ N).
1
CHAPITRE 1. DÉNOMBREMENT ET CALCUL DE PROBABILITÉ VARIABLES ALÉATOIRES ET LOIS
USUELLES KPANZOU T.A./FaST/UK
a) Nombre d' applications de E → F

Il y a autant d'applications possibles de E dans F qu'il y a de choix possibles
pour aecter à chaque élément de E une image dans F . Pour chacun des p éléments
de E , il y a n choix possibles et donc on a n
|
× n × · · · × n = np applications de
{z }
p fois
E dans F .
Dénition 1.1.4 Soient p et n ∈ N∗ . On appelle nombre de p-uplets (ou p-listes)

à n éléments, le nombre d'applications d'un ensemble E à p éléments dans un
ensemble F à n éléments. Ce nombre vaut np .
Exemple 1.1 Le nombre de nombres de 3 chires pouvant être formés à l'aide des
chires 1, 2, 3, · · · , 9 vaut 93 = 729.
b) Nombre d'applications injectives de E → F (p ≤ n)

Lorsque f est injective, deux éléments distincts de E ne peuvent avoir une même
image. Il y a donc n images possibles pour le premier élément de E , n − 1 pour le
deuxième, . . ., et n − (p − 1) pour le p-ième. Ainsi, le nombre de ces injections est
n × (n − 1) × · · · × (n − p + 1).
Dénition 1.1.5 (Arrangements)

Soient p et n ∈ N∗ tels que p ≤ n. On appelle arrangement de p dans n et on
note Apn , le nombre de manières d'ordonner p éléments d'un ensemble à n éléments.
C'est le nombre d'injections d'un ensemble E à p éléments dans un ensemble F à
n!
n éléments. Donc, Apn = n × (n − 1) × · · · × (n − p + 1) = .
(n − p)!
Exemple 1.2 Le nombre de nombres de 3 chires diérents pouvant être formés

avec les 9 chires de F = {1, 2, · · · , 9} vaut A39 = 9 × 8 × 7 = 504. On en
déduit que le nombre de nombres de 3 chires formés avec les chires de F et ayant
au moins 2 chires identiques vaut 93 − A39 = 729 − 504 = 225.
c) Nombre d'applications bijectives de E sur F (p = n)

n!
D'après ce qui précède, ce nombre vaut Ann = = n!.
0!
Dénition 1.1.6 (Nombre de permutations de E )

Soit E un ensemble ni de cardinal n ∈ N∗ . Une permutation de E étant une
bijection de E sur E , le nombre de permutations de E est n!.
Dénition 1.1.7 (Complémentaire d'un ensemble)

On appelle complémentaire de A dans E , le sous-ensemble Ā de E déni par Ā =
E = {x ∈ E / x 6∈ A}.
{A
2 ANNEE UNIVERSITAIRE 2021-2022

Dénition 1.1.8 (Partition d'un ensemble)

Une partition de E est une partie de P(E) constituée de sous-ensembles non
vides de E , deux à deux disjoints et dont la réunion est égale à E . Autrement dit,
(Ai )i=1,··· ,n est une partition de E si Ai 6= ∅ ∀i, Ai ∩ Aj = ∅ ∀i, j, avec i 6= j
n
et
S
Ai = E.
i=1
Exemple 1.3 Soit A une partie propre de E . {A, Ā} forme une partition de E .
En eet, A et Ā sont non vides car A est une partie propre de E , A ∩ Ā = ∅ et
A ∪ Ā = E .
1.1.4 Nombre de parties de cardinal p d'un ensemble ni E

de cardinal n (p ≤ n)
Proposition 1.1.1 Le nombre des sous-ensembles (ou parties) comportant p élé-
Apn n!
ments d'un ensemble de n éléments est Cnp = = . Ce nombre est
p! p!(n − p)!
aussi parfois noté n
.

p
Propriétés des Cnp

1. ∀n ∈ N∗ on a : Cn0 = Cnn = 1 et Cn1 = Cnn−1 = n.
2. ∀n ∈ N et ∀p ∈ N tel que p ≤ n on a : Cnp = Cnn−p .
3. ∀n ∈ N∗ et ∀p ∈ N tel que 1 ≤ p ≤ n − 1 on a : Cnp = Cn−1
p p−1
+ Cn−1 .
1.1.5 Formule du binôme de Newton

n
∀a ∈ R, ∀b ∈ R, ∀n ∈ N∗ : (a + b)n = Cnp ap bn−p .
P
p=0
Application : Montrer que :
(i) 2n = Cn0 + Cn1 + Cn2 + · · · + Cnn−1 + Cnn .
(ii) Cn0 − Cn1 + Cn2 + · · · + (−1)n−1 Cnn−1 + (−1)n Cnn = 0.
Réponse: Il suffit de faire a = b = 1 dans la formule du binôme de
Newton pour obtenir le (i) et de faire a = −1 et b = 1 pour obtenir
le (ii).
Triangle de Pascal :
En utilisant les relations Cn0 = 1, Cn1 = n, Cnn = 1 et Cnp = Cn−1 p p−1
+ Cn−1 , on
peut tracer un tableau triangulaire composé de lignes numérotées 0, 1, 2, · · · , n
et de colonnes numérotées 0, 1, 2, · · · , p de telle façon que les Cnp gure dans
la case intersection de la ligne n et de la colonne p. Il s'agit du triangle de Pascal,
qui permet d'obtenir rapidement les coecients de la forme Cnp d'un développement
binomial.

1.2 Notion de tribu et de mesure de probabilité

1.2.1 Notion de tribu
Soit Ω l'ensemble des cas possibles observables à l' issue d'une épreuve aléatoire.
Ω est appelé ensemble fondamental. Un évènement lié à cette épreuve peut être
représenté par un sous-ensemble de Ω.
a) Algèbre d'évènements
Une famille A , non vide, d'évènements de Ω est une algèbre d'évènements si :
i) ∀A ∈ A , Ā ∈ A ;
ii) ∀A ∈ A , ∀B ∈ A , A ∪ B ∈ A .
b) Tribu
Soit A une algèbre d'évènements de Ω (l'ensemble fondamental est inni). A est
une tribu si pour toute suite innie dénombrable A1 , A2 , · · · , Ai , · · · d'éléments
∞
de A on a Ai ∈ A .
[
i=1
∞
Conséquence : Ai ∈ A .
\
i=1
1.2.2 Mesure de probabilité

a) Espace probabilisable
On appelle espace probabilisable un couple (Ω, A ) constitué d'un ensemble Ω et
d'une tribu d'évènements A de parties de Ω.
b) Evènements incompatibles
Soient (Ω, A ) un espace probabilisable et A et B deux évènements de A . On dit
que A et B sont incompatibles si A et B ne peuvent se réaliser en même temps.
c) Système complet d'évènements

On appelle système complet d'évènements de l'espace (Ω, A ), tout sous-ensemble
ni ou dénombrable de A , formant une partition de Ω. {Ci / Ci ∈ A , i ∈ I} est
un système complet d'évènements si, et seulement si :


 ∀i ∈ I, Ci =
6 ∅


∀i ∈ I, ∀j ∈ I, i 6= j ⇒ Ci ∩ Cj = ∅
 S


 Ci = Ω
i∈I

d) Espace probabilisé
Soit (Ω, A ) un espace probabilisable. Une probabilité est une application p de A
dans R+ telle que :
i) p(Ω) = 1
ii) ∀A ∈ A , ∀B ∈ A tels que A ∩ B = ∅, p(A ∪ B) = p(A) + p(B) et
si A1 , A2 , · · · , Ai , · · · est une suite dénombrable d'évènements deux à
deux incompatibles, alors :
∞
! ∞
[ X
p Ai = p(Ai ).
i=1 i=1
On appelle espace probabilisé ou espace de probabilité le triplet (Ω, A , p).
1.3 Probabilité sur un ensemble ni

1.3.1 Dénition
Soit Ω un ensemble ni : Ω = {a1 , a2 , · · · , an }. Dans ce cas, A = P(Ω), et
(Ω, P(Ω)) est un espace probabilisable sur lequel on dénit une probabilité p telle
n
que pi = p ({ai }) avec pi ∈ [0, 1] et pi = 1 ∀i ∈ {1, 2, · · · , n}.
X
i=1
1.3.2 Equiprobabilité
Soit Ω = {a1 , a2 , · · · , an } tel que card(Ω) = n ∈ N∗ . L'application
p : P(Ω) → [0, 1]
1
{ai } 7→
n
est une probabilité sur (Ω, P(Ω)). Etant donné que pour tout i = 1, 2, . . . , n,
P ({ai }) = n1 , on parle déquiprobabilité sur Ω.
card(A)
De façon générale on a : ∀A ∈ P(Ω), p(A) = .
card(Ω)
Exemple 1.4 Considérons l'univers Ω constitué d'un jeu de 32 cartes. Il comporte

8 hauteurs (7, 8, 9, 10, J, Q, K, A). Dans chaque hauteur, il y a 4 couleurs : pique,
coeur, carreau et trèe. On tire au hasard une carte.
Soient A l'évènement : Tirer la hauteur 7 et B l'évènement : Tirer la couleur
pique .
4 1 8 1
On a: p(A) = = et p(B) = = .
32 8 32 4

1.3.3 Propriétés
i) ∀A ∈ A , p Ā = 1 − p(A).

ii) p(∅) = 0.
iii) ∀A ∈ A , 0 ≤ p(A) ≤ 1.
iv) ∀A ∈ A , ∀B ∈ A , p(A ∪ B) = p(A) + p(B) − p(A ∩ B).
1.4 Probabilité conditionnelle

1.4.1 Dénition
Soient (Ω, A , p) un espace probabilisé et A ∈ A tel que p(A) > 0. L'application
pA de A dans R+ telle que :
p(A ∩ B)
∀B ∈ A , pA (B) =
p(A)
est une probabilité. C'est une probabilité conditionnelle.
Exemple 1.5 Soit un jeu de 52 cartes. Les cartes ont été regroupées selon leurs
couleurs. On tire au hasard une carte. Quelle est la probabilité d'extraire la hauteur
Roi sachant que l'on a tiré dans le paquet des Coeur ?
13 1 1
On a p(Coeur) = et p(Roi ∩ Coeur) = , donc pCoeur (Roi) = .
52 52 13
Notation : ∀B ∈ A , pA (B) sera notée p(B / A) et elle se lit probabilité de B
sachant A .
1.4.2 Probabilité composée

∀A ∈ A , ∀B ∈ A tels que p(A) > 0 et p(B) > 0 on a :
p(A ∩ B) = p(A) × p(B / A) = p(B) × p(A / B).
∀A ∈ A , ∀B ∈ A tels que B ⊂ A, p(A / B) = 1.
1.4.3 Evènements indépendants

Dénition 1.4.1 Deux évènement A et B sont indépendants pour p si
p(A ∩ B) = p(A) × p(B).
Propriétés
Si A et B sont indépendants, alors :
i) p(A / B) = p(A) si p(B) > 0 et p(B / A) = p(B) si p(A) > 0.
ii) p(A ∪ B) = p(A) + p(B)(1 − p(A)) = p(A) + p(Ā) × p(B).
iii) Ā et B sont indépendants.
iv) A et B̄ sont indépendants.
v) Ā et B̄ sont indépendants.

1.4.4 Probabilité totale

Théorème 1.4.1 Soit (An )n≥0 un système complet d'évènements. Alors, pour tout
∞
évènement B , on a p(B) = p(B / An )p(An ).
X
n=0
1.4.5 Probabilité de cause ou formule de Bayes

Théorème 1.4.2 Soit (An )n≥0 un système complet d'évènements. Alors, pour tout
évènement B tel que p(B) > 0, on a
p(B / A0 )p(A0 )
p(A0 / B) = P
∞ .
p(B / An )p(An )
n=0
1.5 Variable aléatoire discrète

Dénition 1.5.1
Soit (Ω, A , p) un espace probabilisé. Une variable aléatoire réelle est une application
X : Ω → R, w 7→ x tel que :
∀x ∈ R, X −1 ({x}) ∈ A où X −1 ({x}) = {ω ∈ Ω / X(ω) = x}.
Si l'ensemble X(Ω) des valeurs possibles prises par la variable aléatoire X est au
plus dénombrable, alors on dit que X est une variable aléatoire discrète. Sinon, on
parle d'une variable aléatoire continue.
Exemple 1.6
On lance trois fois une pièce de monnaie (qui prend deux valeurs possibles Pile
ou Face ). L'univers est Ω = {P, F }.
Notons X le nombre de fois que Face apparaît au bout des trois lancers. Les
valeurs possibles de X sont dans l'ensemble X(Ω) = {0, 1, 2, 3}. X est une
application de Ω dans X(Ω).
1.5.1 Loi de probabilité

On peut probabiliser (Ω, P(X(Ω))) par l'application PX dénie par :
pX : P(X(Ω)) → [0, 1]
A 7→ pX (A) = p−1 (X(A)).
Si X(Ω) = {xi / i ∈ I}, avec I un ensemble ni ou dénombrable, alors pX est en-
tièrement déterminée par la donnée des nombres pi dénis par : pi = pX ({xi }) =
p(X = xi ), ∀i ∈ I .
La loi de probabilité de X est bien dénie si, et seulement si :
n
∀i ∈ {1, · · · , n}, pi ≥ 0 et pi = 1 lorsque X(Ω) est ni.
P
i=1
∞
∀i ∈ N , pi ≥ 0 et
∗
pi = 1 lorsque X(Ω) est dénombrable.
P
i=1

1.5.2 Fonction de répartition

La fonction de répartition F d'une variable aléatoire X est une fonction dénie sur
R comme suit :
F : R → [0, 1]
x 7→ F (x) = p(X ≤ x) où (X ≤ x) = {ω ∈ Ω / X(ω) ≤ x}.
Dans le cas d'une variable aléatoire discrète nie telle que card(X(Ω)) = n, la
fonction de répartition se dénit de la façon suivante :
si

 0 x < x1

si

x1 ≤ x < x2



 p1

.. .. ..


. . .




F (x) = j
pi si xj ≤ x < xj+1

 P


i=1
.. .. ..



. . .






si

1 x ≥ xn
a) Propriétés
i) ∀x, y ∈ R / x ≤ y, F (x) ≤ F (y).
ii) lim F (x) = 1.
x→+∞
iii) lim F (x) = 0.

x→−∞
iv) F est une fonction continue à gauche.
1.5.3 Moments
a) Moments d'ordre k
On appelle moment d'ordre k d'une variable aléatoire X , le réel mk (X) déni par :
 n
pi xki si X(Ω) est ni
 P



i=1
mk (X) = ∞
pi xki si X(Ω) est dénombrable et la série converge absolument.

 P


i=1
b) Espérance mathématique
L'espérance mathématique d'une variable aléatoire X est égale au moment d'ordre
1 de X , s'il existe. Elle se note E(X).
X
E(X) = m1 (X) = pi x i .
i

c) Moment centré d'ordre k

On appelle variable aléatoire centrée d'une variable aléatoire X , la variable aléatoire
Y dénie par : Y = X − E(X) = X − m1 (X).
On appelle moment centré d'ordre k de la variable aléatoire X , le réel µk (X) déni
par :
 n
pi (xi − E(X))k si X(Ω) est ni
 P



i=1
µk (X) = ∞
pi (xi − E(X))k si X(Ω) est dénombrable et la série converge absolument.

 P


i=1
d) Variance et écart-type
La variance Var(X) d'une variable aléatoire X est son moment centré d'ordre 2 :
Var(X) = µ2 (X).
L'écart-type de X est la racine carrée de sa variance. On le note σ(X).

p
σ(X) = Var(X).
Propriété
Var(X) = m2 (X) − (m1 (X))2 .
1.6 Variable aléatoire continue

Soient X une variable aléatoire réelle dénie sur un espace probabilisé (Ω, A , p) et
F sa fonction de répartition :
F : R → [0, 1]
x 7→ F (x) = p(X ≤ x).
On dit que X est une variable aléatoire continue s'il existe une fonction numérique
f dénie sur R telle que :
i) ∀x ∈ R, f (x) ≥ 0.
ii) f est continue sur R sauf peut-être aux points pour lesquels elle admet une
limite nie à gauche et à droite.
iii) ∀x ∈ R, F (x) = −∞ f (t)dt et lim F (x) = lim −∞ f (t)dt =
Rx Rx
x→+∞ x→+∞
f (t)dt est bien dénie et est égale à 1.
R +∞
−∞
Dans ces conditions, f est alors une densité de probabilité de la variable aléatoire X .
Exemple 1.7 Soit f (x) = λe−λx 1R+ (x) avec λ > 0. Montrer que f est bien une
fonction de densité.

1.6.1 Moments
Soit X une variable aléatoire continue de densité f . On dénit, en supposant la
convergence des intégrales, les notions suivantes :
a) Les moments d'ordre k (k ∈ N)

Z +∞
mk (X) = xk f (x)dx.
−∞
b) L'espérance mathématique
Z +∞
E(X) = m1 (X) = xf (x)dx.
−∞
Remarque :
1. Une variable aléatoire continue peut ne pas avoir d'espérance mathématique
(l'intégrale n'est pas convergente !)
2. Si f est paire (c'est-à-dire : ∀x ∈ R, f (x) = f (−x)) et si E(X) existe,
alors E(X) = 0.
c) Les moments centrés d'ordre k (k ∈ N)

Z +∞
µk (X) = (x − E(X))k f (x)dx.
−∞
d) La variance
Z +∞
Var(X) = µ2 (X) = (x − E(X))2 f (x)dx.
−∞
1.7 Quelques lois usuelles

1.7.1 Lois discrètes
a) Loi constante
Loi de probabilité : P (X = a) = 1.
Espérance et variance : E(X) = a, Var(X) = 0.
b) Loi uniforme discrète sur {1,2,. . . ,n}

Loi de probabilité : ∀k ∈ {1, 2, . . . , n}, P (X = k) = n1 .
Espérance et variance :
n+1 n2 − 1
E(X) = , Var(X) = .
2 12

c) Loi de Bernoulli
Loi de probabilité : P (X = 1) = p = 1 − P (X = 0).
Espérance et variance : E(X) = p, Var(X) = p(1 − p).
d) Loi binomiale
Loi de probabilité : ∀k ∈ {0, 1, . . . , n}, P (X = k) = Cnk pk (1−p)n−k .
Espérance et variance : E(X) = np, Var(X) = np(1 − p).
e) Loi hypergéométrique de paramètres N, n, p

Loi de probabilité : ∀k ∈ {0, 1, . . . , min(N, M )}, P (X = k) =
k Cn−k
CM
n
CN
.
N −M
Espérance et variance : E(X) = np et Var(X) = N −n

N −1
np(1 − p).
f) Loi de Poisson
Loi de probabilité : ∀k ∈ N, P (X = k) = λk! e−λ .
k
Espérance et variance : E(X) = Var(X) = λ.
1.7.2 Lois continues

a) Loi uniforme sur un intervalle [a; b], a, b ∈ R, a < b
Densité de probabilité : fX (x) = b−a
1
1[a;b] (x).
Espérance et variance : E(X) = 2 et Var(X) =
a+b (b−a)2
12
.
b) Loi exponentielle de paramètre λ > 0

Densité de probabilité : fX (x) = λe−λx 1[0;+∞[ (x).
Espérance et variance : E(X) = λ1 et Var(X) = λ12 .
c) Loi normale de paramètres µ et σ 2

Densité de probabilité :
1 (x−µ)2
fX (x) = √ e− 2σ2 .
σ 2π
Espérance et variance : E(X) = µ et Var(X) = σ 2 .
Remarque 1.1 Pour µ = 0 et σ 2 = 1, nous avons la loi normale centrée et

réduite, N (0, 1), pour laquelle la fonction de répartition est notée par Φ.

d) Loi gamma de paramètres p et λ positifs

Une v.a. X suit la loi γ(p, λ) si sa densité est donnée par
λp
fX (x) = xp−1 e−λx 1[0,+∞[ (x),
Γ(p)
où Z +∞
Γ(p) = xp−1 e−x dx.
0
On a en intégrant E(X) = p
λ
and Var(X) = p
λ2
.
Remarque 1.2
L
Noter que pour p = 1 on a la loi exponentielle de paramètre λ, i.e. γ(1, λ) =
E (λ).
Si X1 , X2 , . . . , Xn sont des variables aléatoires réelles indépendantes de
même loi E (λ), alors X1 + X2 + . . . + Xn ; γ(n, λ).
e) Loi de Chi-deux ou Chi-carré à n degrés de liberté (d.d.l)

Une v.a. X suit la loi χ2n si sa densité est de la forme
1 n 1
fX (x) = n x 2 −1 e− 2 x 1[0,+∞[ (x).
2 2
L
On remarque que χ2n = Γ n2 , 2 , si bien que E(X) = n et Var(X) = 2n. De
1

plus, si X ; χ2n , Y ; χ2m avec X et Y indépendantes, alors X + Y ; χ2n+m .
f) Loi de Cauchy de paramètre θ ≥ 0

Une v.a. X suit une loi de Cauchy de paramètre θ ≥ 0, i.e. X ; Cauchy(θ),
si sa densité est de la forme
1
fX (x) = .
π (1 + (x − θ)2 )
Cette loi a une expérance innie, i.e. E(X) = +∞. On prend souvent θ = 0 et
donc
1
fX (x) = .
π (1 + x2 )
g) Loi de Student à n d.d.l

La loi de Student à n d.d.l est la loi suivie par la variable aléatoire
X
Tn = p ,
Y /n
où X ; N (0, 1) et Y ; χ2n avec X et Y indépendantes.

Tn a pour densité
− n+1
x2

1 2
fX (x) = √ 1 + , x ∈ R,
nβ 21 , n2

n
avec
1
Γ(p)Γ(q)
Z
β(p, q) = x p−1
(1 − x) q−1
dx = pour p, q ∈ N .
?
0 Γ(p + q)
On prouve que la loi de Student est centrée comme la loi normale. On a E(Tn ) = 0
et Var(Tn ) = n−2
n
pour n > 2.
h) Loi de Fisher-Snedecor à n et m d.d.l

La loi de Fisher-Snedecor à n et m d.d.l est la loi suivie par la v.a.
X/n
Fn,m = ,
Y /m
où X ; χ2n et Y ; χ2m avec X et Y indépendantes. Si U ; Fn,m alors

1
U
; Fm,n .

Chapitre 2
Étude d'une série statistique à une
variable
2.1 Concepts de base

2.1.1 Population et unité statistique - échantillon
Lors d'une étude statistique, les observations sont faites à partir d'un ensemble
précis (ensemble de référence) appelé population. Chaque élément de cet ensemble
est une unité statistique ou un individu. Les termes de population et d'individu
sont employés aussi bien lorsqu'il s'agit d'êtres humains que d'êtres inanimés, d'êtres
abstraits ou d'évènements.
Le recensement est l'étude de tous les individus d'une population. Ceci est dicile
en pratique, lorsque les populations sont grandes, pour des questions de coût et de
temps.
Le sondage, par contre, est un recueil d'une partie (ou d'un sous-ensemble) de la
population. La partie des individus étudiés s'appelle un échantillon. Le recueil d'un
échantillon à partir de la population initiale se fait par des techniques statistiques
appelées méthodes d'échantillonnage.
Remarque : La population soumise à l'analyse statistique doit être dénie avec

précision an que l'ensemble considéré soit déterminé sans ambiguïté, de sorte qu'un
individu quelconque puisse y être aecté sans incertitude.
Exemple 2.1 Les étudiants de l'université de Kara, les salariés d'une entreprise,
la production d'automobiles d'une année, le stock des machines à une date donnée.
2.1.2 Caractères et modalités

Pour décrire une population, on classe les individus selon certains aspects ou attri-
buts que l'on appelle caractères ou variables.
Exemple 2.2 Si la population étudiée est constituée des étudiants de la faculté des
sciences, les caractères étudiés peuvent être : le parcours, la spécialité, l'âge, le sexe,
le nombre de crédits capitalisés, etc.
14
CHAPITRE 2. ÉTUDE D'UNE SÉRIE STATISTIQUE À UNE VARIABLE KPANZOU T.A./FaST/UK
Le caractère est un critère de classement, il peut présenter plusieurs situations dif-

férentes appelées modalités.
Exemple 2.3 Les deux modalités du caractère sexe sont : masculin et féminin.
Le nombre de modalités d'un caractère dépend de l'information disponible et du

but de l'étude. Il existe deux classes de caractères en Statistique : les caractères
qualitatifs et les caractères quantitatifs (ou numériques).
a) Caractères qualitatifs
Les caractères qualitatifs ou variables catégorielles sont des caractères dont les dif-
férentes modalités ne sont pas mesurables. Elles sont non numériques dans le sens
où les opérations de base n'ont pas de sens.
On distingue deux types de caractères qualitatifs : les caractères qualitatifs nomi-
naux et les caractères qualitatifs ordinaux (ou ordonnés).
Caractères qualitatifs nominaux : les diérentes modalités ne sont que des noms
ou des catégories qui ne suivent pas un ordre naturel. C'est le cas par exemple de la
race, la couleur des yeux, la marque de voiture, le sexe, etc.
Caractères qualitatifs ordonnés : les modalités suivent un ordre naturel ou
peuvent être classées dans un ordre spécique. C'est le cas par exemple du niveau
d'éducation, du degré de satisfaction, etc. Ces variables sont repérables selon un
type d'échelle plus ou moins légitime. Les catégories pourront alors donner lieu à un
codage par les rangs qui ouvrira une autre gamme de traitements possibles proches
de ceux des variables quantitatives.
b) Caractères quantitatifs ou numériques
Il s'agit des caractères (ou variables) dont les modalités sont mesurables, c'est-à-dire
appartiennent à R. On distingue deux types de variables quantitatives : les variables
discrètes et les variables continues.
Variable discrète : les valeurs sont obtenues par dénombrement. C'est le cas par
exemple du nombre d'élèves. Une variable discrète peut ne prendre que certaines
valeurs isolées (dans N). C'est le cas du nombre de personnes qui composent un
ménage. Elle peut prendre une innité de valeurs dénombrables, mais elle peut aussi
n'en prendre que quelques unes.
Variable continue : peut prendre toutes les valeurs à l'intérieur d'un intervalle. Le
nombre de modalités possibles d'une telle variable est alors inni. C'est le cas par
exemple de la taille, la température, le salaire, le PIB par habitant, etc.

2.2 Étude d'une variable qualitative
2.2.1 Tableau statistique
Modalité Eectif ni Fréquence fi Pourcentage pi FCC Fi

M1 n1 f1 p1 F1
.. .. .. .. ..
. . . . .
ni ni i
P
Mi ni fi = pi = × 100 Fi = fk
n n k=1
.. .. .. .. ..
. . . . .
Mm nm fm pm Fm = 1
m m m
Total
P P P
n= ni fi = 1 pi = 100
i=1 i=1 i=1
2.2.2 Représentations graphiques
On peut représenter une variable qualitative soit par un diagramme en tuyaux

d'orgue ou en barres, soit par un diagramme à secteurs ou camembert.
Diagramme en tuyaux d'orgue ou en barres : Il est constitué d'une suite de
rectangles dont les hauteurs sont proportionnelles à l'eectif (ou à la fréquence ou
au pourcentage) des modalités et dont les bases sont identiques. Il est soit représenté
en horizontal, soit en vertical.
Diagramme en secteur ou camembert : Il permet de visualiser la part rela-
tive des modalités d'une variable qualitative sur la population. Le cercle représente
l'ensemble de la population, les diérentes modalités seront représentées par des
secteurs dont les surfaces sont proportionnelles aux eectifs (ou fréquences ou pour-
centages). Une telle représentation n'est possible que si la somme des pourcentages
donne 100%.
Exercice 2.1 On considère le brin d'ADN suivant : GGGAGTGTBTATTAABTB

BGAABTBBBAGBGBTAGBTBGBGBGGAGTGABBGAGBBTABATGAGGGTA
BTGTBAATAABGBATGTTABBAGAAGGA. En considérant comme modalités les
lettres A, B, G et T, faire le dépouillement et donner le tableau statistique. Faire les
représentations graphiques décrites précédemment.

2.3 Étude d'une variable quantitative discrète

Modalité Eectif ni Fréquence fi Pourcentage pi FCC Fi

x1 n1 f1 p1 F1
.. .. .. .. ..
. . . . .
ni ni i
P
xi ni fi = pi = × 100 Fi = fk
n n k=1
.. .. .. .. ..
. . . . .
xm nm fm pm Fm = 1
m m m
Total
P P P
n= ni fi = 1 pi = 100
i=1 i=1 i=1
2.3.2 Caractéristiques de tendance centrale

a) Mode
Le mode (M o) d'une distribution est la valeur la plus fréquente dans la série. Il
correspond à la valeur de la variable pour laquelle la fréquence est la plus élevée.
b) Percentile
Le p-ième percentile est la valeur telle qu'au moins p pour cent des observations ont
une valeur inférieure ou égale à cette valeur, et (100 − p) pour cent des observations
ont une valeur supérieure ou égale à cette valeur.
Calcul du p-ième percentile
Étape 1 : classer les données dans l'ordre croissant.
p
Étape 2 : calculer l'index i = × n où n le nombre d'observations.
100
Étape 3 (décision) : si i n'est pas un nombre entier naturel, la position du p-ième
percentile correspond à l'entier E(i) + 1, où E(i) désigne la partie entière de i ; si
i est un nombre entier, le p-ième percentile correspond à la moyenne des valeurs des
observations i et i + 1.
c) Quartile
Les quartiles sont des percentiles particuliers. Les étapes de calcul des percentiles
peuvent être directement appliquées au calcul des quartiles. Il y a trois quartiles :
Q1 = Premier quartile soit 25e percentile,
Q2 = Deuxième quartile soit 50e percentile,
Q3 = Troisième quartile soit 75e percentile.

d) Médiane
La médiane (M e) d'une distribution est la valeur de la variable statistique qui
partage en deux eectifs égaux les individus de la population rangés selon la valeur
croissante du caractère. C'est le cas où p = 50.
Si F est la fonction de répartition représentée par les fréquences cumulées, la médiane
est la valeur statistique telle que F (M e) = 0, 5.
Exercice 2.2 Les données sur les salaires mensuels initiaux (en euros) des em-
ployés d'une agence de voyage sont : 2850 2950 3050 2880 2755 2710 2890 3130 2940
3325 2920 2880. Déterminer le 10e percentile ainsi que les quartiles Q1 , Q2 et Q3 .
e) Moyenne arithmétique
La moyenne arithmétique d'une variable statistique est la somme, pondérée par les
fréquences, des valeurs.
m m
X 1X
x̄ = fi xi = ni xi .
i=1
n i=1
f) Moyenne de sous-populations
La moyenne x̄ d'une population P composée de p sous-populations Pj peut être
exprimée en fonction des moyennes x̄j des sous-populations :
p nj
fj x̄j , où
X X
x̄ = x̄j = fij xij .
j=1 i=1
La moyenne x̄ est donc la moyenne des moyennes des sous-populations.
g) Moyenne harmonique
La moyenne harmonique (H ) est utilisée pour estimer la moyenne des inverses quand
la grandeur a une dimension de vitesse. Elle est dénie par :
1 1
H = = .
1 Pm n
i Pm f
i
n i=1 xi i=1 xi
h) Moyenne géométrique
La moyenne géométrique (G) est utilisée quand on étudie les variations relatives, en
particulier les accroissements. Elle est dénie par :
v
um
uY n
n
G= t xi i .
i=1

i) Moyenne quadratique
La moyenne quadratique (Q2 ) est utilisée pour calculer la moyenne des carrés des
observations. m X
Q2 = fi x2i .
i=1
2.3.3 Caractéristiques de dispersion

a) Ecart absolu moyen
L'écart absolu moyen (eM ) est la moyenne arithmétique des écarts absolus à la
moyenne ou à la médiane.
Ecart absolu moyen à la médiane :
m m
1X X
eM (M e) = ni |xi − M e| = fi |xi − M e|.
n i=1 i=1
Ecart absolu moyen à la moyenne :

m m
1X X
eM (x̄) = ni |xi − x̄| = fi |xi − x̄|.
n i=1 i=1
b) Variance et écart-type
La variance V (X) se calcule par la formule
m m m
1X 2
X
2
X
V (X) = ni (xi − x̄) = fi (xi − x̄) = fi x2i − x̄2 .
n i=1 i=1 i=1
L'écart-type σX est la racine carrée de la variance :

p
σX = V (X).
Pour une population composée de sous-populations :

La variance d'une population P composée de p sous-populations Pj s'exprime en
fonction des variances Vj (X) et des moyennes x̄j des sous-populations.
p p p p
! !
X X 1X 1X
V (X) = fj Vj (X)+ fj x̄2j − x̄ 2
= nj Vj (X)+ nj x̄2j − x̄ 2
.
j=1 j=1
n j=1
n j=1
La variance totale est donc la somme de la moyenne arithmétique des variances et

de la variance des moyennes.
p
1 P
La moyenne des variances, nj Vj (X) est appelée la variance intragroupe.
n j=1
1 Pp
La variance des moyennes, nj x̄2j − x̄2 est appelée la variance intergroupe.
n j=1

c) Coecient de variation
C'est le rapport de la moyenne arithmétique à l'écart type, déni par :
σX
CV (X) = .
x̄
Le CV permet d'apprécier la représentativité de la moyenne par rapport à l'ensemble
des observations. Il donne une bonne idée du degré d'homogénéité d'une série. Il faut
qu'il soit le plus faible possible (< 0.15 en pratique).
d) Moment d'ordre k
m
1X
mk = ni xki .
n i=1
e) Moment centré d'ordre k
m
1X
µk = ni (xi − x̄)k .
n i=1
Exercice 2.3 Lors d'une journée, on a relevé les âges de 20 personnes venant se
présenter à l'examen théorique du permis de conduire : 19, 20, 20, 24, 37, 22, 58, 24,
23, 20, 19, 19, 21, 22, 20, 27, 33, 20, 22, 21. (a) Préciser la population, l'échantillon et
le caractère étudiés. Quelle est la nature de ce caractère ? (b) Déterminer la moyenne
arithmétique, géométrique, harmonique et quadratique de cette série. (c) Déterminer
la médiane, le mode, la variance, l'écart-type, le coecient de variation et l'écart
inter-quartile de cette distribution d'âges. (d) La distribution est-elle homogène ?
Justier.
2.4 Étude d'une variable quantitative continue

2.4.1 Classe
a) Dénition des classes
Pour les variables continues, il est nécessaire que leurs valeurs soient regroupées en
classes avant tout traitement pour les besoins d'analyse. Le choix des classes répond
en général aux exigences suivantes :
Elles ne doivent pas être trop nombreuses sinon il y aurait une diculté de
compréhension.
Elles ne doivent pas être trop peu nombreuses car il y aurait perte d'infor-
mation.
Il ne doit pas y avoir de classe vide.
Le nombre de classes à retenir dépend de la précision des mesures et de l'eectif de
la population étudiée.

b) Amplitude de classe
La valeur de l'amplitude d'une classe est calculée par la diérence entre la valeur de
la borne supérieure et celle de la borne inférieure. Il arrive que la borne inférieure de
la première classe et la borne supérieure de la dernière classe ne soient pas données.
Pour estimer les bornes absentes, nous disposons des possibilités suivantes :
Rééchir à ce que pourrait être la valeur de cette borne.
Donner à la première classe l'amplitude de la deuxième classe et à la dernière
l'amplitude de l'avant dernière.
Les classes peuvent avoir une amplitude variable ou constante. Par exemple, la va-
riable âge est souvent subdivisée en classes d'amplitude de 5 ans, 0 à moins de
5 ans, 5 ans à moins de 10 ans, etc. 0, 5, 10, etc. sont les extrémités des classes.
c) Centre de classe
Pour mener des calculs statistiques sur des séries classées, les classes sont réduites à
une seule donnée, à savoir, le centre de classe. Cela revient à considérer que tous les
individus peuvent être décrits par ce centre de classe. Par dénition, le centre ci de
xi + xi+1
la classe [xi ; xi+1 [ est donné par ci = .
2
Classe Centre ci Eectif ni Fréquence fi Pourcentage pi FCC Fi

[x1 ; x2 [ c1 n1 f1 p1 F1
.. .. .. .. .. ..
. . . . . .
ni ni i
P
[xi ; xi+1 [ ci ni fi = pi = × 100 Fi = fk
n n k=1
.. .. .. .. .. ..
. . . . . .
[xm ; xm+1 [ cm nm fm pm Fm = 1
m m m
Total
P P P
n= ni fi = 1 pi = 100
i=1 i=1 i=1
2.4.3 Représentation graphique

a) Histogramme
Il est destiné aux séries regroupées en classes. L'histogramme est une représentation
graphique de la distribution des eectifs ou des fréquences d'une variable statistique
continue. Il se construit en plaçant en abscisse l'amplitude des classes et en ordonnée
la fréquence (ou l'eectif) par unité d'amplitude. Soit la distribution ([xi ; xi+1 [, ni )
d'une variable statistique continue X . Pour chaque classe [xi ; xi+1 [, l'histogramme
associe un rectangle de largeur ai = xi+1 −xi (amplitude da la classe) et de hauteur
fi
hi = .
ai

b) Polygone des fréquences

Il lisse l'histogramme de façon à éliminer les ruptures qui dépendent du choix du
découpage en classe. Il respecte la compensation des aires ; la surface incluse par la
courbe est identique à celle de l'histogramme.
c) Courbe cumulative des fréquences

Elle représente graphiquement la fonction cumulative ou fonction de répartition
dénie par F (x) = Fi . En abscisse se trouvent les bornes supérieures des classes et
en ordonnée, les fréquences cumulés croissantes.
Exercice 2.4 Compléter le tableau statistique ci-après puis représenter l'histo-
gramme des fréquences, le polygone des fréquences et la courbe cumulative des fré-
quences croissantes.
Classe Eectif ni
[15 ;20[ 67
[20 ;30[ 1942
[30 ;35[ 1364
[35 ;45[ 2814
[45 ;55[ 2540
[55 ;70[ 710
2.4.4 Caractéristiques de tendance centrale

a) Mode
Pour une variable continue on dénit la classe modale. C'est celle dont la fréquence
par unité d'amplitude hi = fi /ai est la plus élevée. Après la dénition de la classe
modale, on déduit la valeur du mode par la formule suivante :
|∆i |
M o = xi + × ai
|∆i | + |∆i+1 |
avec M o le mode, xi la borne inférieure de la classe modale, ai l'amplitude de la
classe modale, ∆i = ni − ni−1 , diérence entre l'eectif de la classe modale et
l'eectif de la classe précédant la classe modale, ∆i+1 = ni+1 − ni , diérence entre
l'eectif de la classe suivant la classe modale et l'eectif de la classe modale.
b) Percentile
Pour déterminer le p-ième percentile P e dans le cas d'une variable continue, on
détermine d'abord l'intervalle auquel appartient ledit percentile : P e ∈ [xi ; xi+1 [
et F (P e) = p/100 = p̃ avec Fi−1 < p̃ ≤ Fi . Par la formule de l'interpolation
linéaire, on obtient alors :
p̃ − Fi−1 p̃ − Fi−1
P e = xi + ai × = xi + ai × .
Fi − Fi−1 fi
La médiane, M e, est le 50-ième percentile.

c) Moyennes arithmétique, harmonique, géométrique et quadratique

Toutes ces moyennes se calculent comme dans le cas d'une variable discrète, en y
remplaçant les xi par les centres de classe, i.e par les ci . Pour la moyenne arithmé-
tique par exemple, on a :
m m
X 1X
x̄ = fi ci = ni ci .
i=1
n i=1
Il en est de même pour la moyenne des sous-populations.
2.4.5 Caractéristiques de dispersion

a) Etendue
L'étendue ou amplitude de la distribution est la diérence entre la plus grande et la
plus petite valeur observée : E = xmax − xmin .
b) Ecart inter-quartile
L'écart inter-quartile se dénit par : IQ = Q3 − Q1 . L'intervalle inter-quartile,
[Q1 ; Q3 ], contient 50% des observations.
c) Rapport inter-quartile
Q3
Le rapport inter-quartile est le rapport . C'est un nombre sans dimension qui
Q1
donne une mesure relative des écarts entre les 25% des valeurs les plus basses et les
25% des valeurs les plus élevées.
d) Ecart inter-décile
L'écart inter-décile se dénit par : ID = D9 − D1 . L'intervalle inter-décile,
[D1 ; D9 ], contient 80% de l'eectif de la population, il élimine les 10% des valeurs
les plus élevées et les 10% des valeurs les plus basses.
e) Rapport inter-décile
D9
Le rapport inter-décile vaut . C'est un nombre sans dimension qui compare les
D1
valeurs extrêmes de la distribution en excluant les 10% des valeurs les plus basses
et les 10% des valeurs les plus élevées.
f) Coecient de dispersion
Le coecient de dispersion Cdis est déni par le rapport de l'écart inter-quartile à
la médiane ou encore le rapport de l'écart inter-décile à la médiane, i.e.
Q3 − Q1 D9 − D1
Cdis = ou Cdis = .
Me Me

g) Ecart absolu moyen

Ecart absolu moyen à la médiane :
m m
1X X
eM (M e) = ni |ci − M e| = fi |ci − M e|.
n i=1 i=1
Ecart absolu moyen à la moyenne :

m m
1X X
eM (x̄) = ni |ci − x̄| = fi |ci − x̄|.
n i=1 i=1
h) Variance et écart-type
m m m
1X 2
X
2
X
V (X) = ni (ci − x̄) = fi (ci − x̄) = fi c2i − x̄2
n i=1 i=1 i=1
et p
σX = V (X).
i) Coecient de variation
σX
CV (X) = .
x̄
j) Moment d'ordre k
m
1X
mk = ni cki .
n i=1
k) Moment centré d'ordre k
m
1X
µk = ni (ci − x̄)k .
n i=1
Exercice 2.5 On donne la série unidimensionnelle suivante, correspondant à la

répartition des entreprises du secteur automobile en fonction de leur chire d'aaire
en millions d'euros.
Chires d'aaires Nombre d'entreprises
moins de 0,25 137
[0,25 ;0,5[ 106
[0,5 ;1[ 112
[1 ;2,5[ 154
[2,5 ;5[ 100
[5 ;10[ 33

1. Calculer le chire d'aaire moyen et l'écart-type de la série.

2. Calculer le mode, les intervalles inter-quartile et inter-décile de la série.
3. Calculer la médiane et le coecient de dispersion de la distribution.
4. Calculer la proportion d'entreprises dont le chire d'aaire est supérieur à 3
millions d'euros.

Chapitre 3
Étude d'une série statistique à deux
variables
3.1 Tableaux de contingence, distributions margi-

nales et conditionnelles
3.1.1 Tableau de contingence : croisement de deux variables
Il est courant d'étudier une population à l'aide de plusieurs caractères. Pour deux
variables X et Y , on a le tableau suivant, qui est appelé tableau de contingence.
HH
Y
H y1 ··· yj ··· yp E. marg. de X
X HH
H
p
P
x1 n11 ··· n1j ··· n1p n1· = n1j
j=1
.. .. .. .. .. .. ..
. . . . . . .
p
P
xi ni1 ··· nij ··· nip ni· = nij
j=1
.. .. .. .. .. .. ..
. . . . . . .
p
P
xm nm1 ··· nmj ··· nmp nm· = nmj
j=1
E. marg. Pm m
P m
P m
P p
P
n·1 = ni1 · · · n·j = nij ··· n·p = nip n= ni· = n·j
de Y i=1 i=1 i=1 i=1 j=1
L'eectif nij de la classe (i, j) est le nombre d'individus de la population qui pré-
sentent simultanément la modalité xi de la variable X et la modalité yj de la
variable Y . La distribution s'écrit (xi , yj , nij ). Tous les individus présentant ces
deux modalités sont comme équivalents. Le total des lignes et le total des colonnes
dénissent les distributions marginales. Une ligne ou une colonne constitue une dis-
tribution conditionnelle.
26
CHAPITRE 3. ÉTUDE D'UNE SÉRIE STATISTIQUE À DEUX VARIABLES KPANZOU T.A./FaST/UK
3.1.2 Fréquence conjointe

On appelle fréquence conjointe de xi et yj , la proportion fij d'individus qui pré-
sentent simultanément les modalités xi et yj . Elle s'obtient par :
nij
fij = .
n
3.1.3 Distribution marginale : prole ligne et prole colonne

La série (xi , ni· ) dénit le prole ligne. La fréquence marginale des individus pré-
sentant la modalité xi est
p
X ni·
fi· = fij = .
j=1
n
De même, la série (yj , n·j ) constitue le prole colonne. La fréquence marginale des
individus présentant la modalité yj est
m
X n·j
f·j = fij = .
i=1
n
p
m X m p
On a la relation suivante : f·j = 1.
X X X
fij = fi· =
i=1 j=1 i=1 j=1
3.1.4 Distribution conditionnelle

La fréquence conditionnelle de la modalité xi sachant la modalité yj est
nij
f (xi | yj ) = .
n·j
La fréquence conditionnelle de la modalité yj sachant la modalité xi est

nij
f (yj | xi ) = .
ni·
La relation entre fréquences marginales et fréquences conditionnelles est
fij = f (xi | yj ) × f·j = f (yj | xi ) × fi·
3.2 Caractéristiques marginales et conditionnelles

Dans toute la suite de ce chapitre, X et Y désigneront des caractères quantitatifs.

3.2.1 Caractéristiques marginales

a) Pour la variable X
m m
1X
Moyenne marginale : x̄ = fi· xi .
X
ni· xi =
n i=1 i=1
m m
1
Variance marginale : V (X) = fi· (xi − x̄)2 .
X 2
X
2
σX = ni· (xi − x̄) =
n i=1 i=1
b) Pour la variable Y
p p
1X
Moyenne marginale : ȳ = f·j yj .
X
n·j yj =
n j=1 j=1
p p
1X
Variance marginale : V (Y ) = f·j (yj − ȳ)2 .
2
X
σY2 = n·j (yj − ȳ) =
n j=1 j=1
3.2.2 Caractéristiques conditionnelles

a) Pour la variable X
m m
1 X
Moyenne conditionnelle : x̄j = f (xi | yj )xi .
X
nij xi =
n·j i=1 i=1
m m
1
Variance conditionnelle : Vj (X) = f (xi | yj ) (xi − x̄j )2 .
X 2
X
nij (xi − x̄j ) =
n·j i=1 i=1
b) Pour la variable Y
p p
1 X
Moyenne conditionnelle : ȳi = f (yj | xi )yj .
X
nij yj =
ni· j=1 j=1
p p
1 X
Variance conditionnelle : Vi (Y ) = f (yj | xi ) (yj − ȳi )2 .
X
nij (yj − ȳi )2 =
ni· j=1 j=1
Exercice 3.6 La tableau suivant présente les revenus des ménages (RM) en fonc-
tion du niveau d'étude (NE) du chef de ménage.
PP RM
PP
[0 ;25[ [25 ;50[ [50 ;75[ [75 ;100[ [100 ;125[ Total
P
NE PP
PP
Secondaire sans diplôme 9285 4093 1589 541 354 15862
Secondaire avec diplôme 10150 9821 6050 2737 2028 30786
Université sans diplôme 5011 9221 5813 3215 3120 26380
Licence 2138 3985 3952 2698 4748 17521
Master et plus 813 1497 1815 1589 3765 9479
Total 27397 28617 19219 10780 14015 100028

(a) Calculer les fréquences marginales. (b) Quel est le pourcentage des chefs de mé-
nages diplômés d'université et ayant un revenu compris entre 50 et 75 mille francs ?
(c) Calculer le revenu moyen des ménages, le revenu le plus fréquent, la médiane, et
l'écart-type des revenus.
3.3 Ajustement linéaire

L'ajustement linéaire consiste à trouver une relation de la forme Y = aX + b
entre la variable X appelée variable explicative ou encore variable indépendante et
la variable Y appelée variable expliquée ou encore variable dépendante. La représen-
tation graphique de Y en fonction de X , ou plus précisément du nuage des points
(xi , yi ) permet d'avoir une idée sur le type de relation entre X et Y .
3.3.1 Covariance entre deux variables

La covariance entre la variable X et la variable Y est le nombre noté cov(X, Y ) ou
1 P
n
encore σXY et déni par cov(X, Y ) = σXY = nk (xk − x̄)(yk − ȳ) dans
n k=1
m p
1 XX
le cas de la série (xk , yk , nk ) et par cov(X, Y ) = σXY = nij (xi −
n i=1 j=1
x̄)(yj − ȳ) dans le cas de la série (xi , yj , nij ).
3.3.2 Méthode des moindres carrées ordinaires

Cette méthode consiste à déterminer la fonction ane y = ax + b telle que les
carrés des erreurs entre les valeurs observées yi et les valeurs estimées ŷi = axi + b
soient les plus petites possibles. En clair, il s'agit de trouver les valeurs de a et b
n n
qui minimisent la fonction g(a, b) = (yi − axi − b)2 .
X X
ε2i =
i=1 i=1
On démontre que les valeurs a et b qui minimisent la fonction de deux variables

g(a, b) sont :
σXY
a= 2
et b = ȳ − ax̄.
σX
La droite d'équation y = ax + b pour les valeurs de a et b précédemment trouvées

s'appelle la droite de régression linéaire de Y sur X et se note DY /X .
De la même façon, on dénit la droite de régression linéaire de X sur Y notée DX/Y
et ayant pour équation x = a0 y + b0 , avec :
σXY
a0 = et b0 = x̄ − a0 ȳ.
σY2

3.3.3 Coecient de corrélation linéaire

Le coecient de corrélation linéaire entre la variable X et la variable Y est le nombre
σXY
r = ρXY = .
σX σY
La corrélation linéaire entre X et Y est d'autant plus importante que D = r2
(appelé coecient de détermination) est proche de 1.
3.3.4 Propriétés importantes

√
1. ρXY = aa0 .
2. La variance de Y se décompose de la façon suivante (formule de décomposi-
tion de la variance) :
Var(Y ) = Var(Ŷ ) + Var(Y − Ŷ )
avec Var(Y ) = variance totale, Var(Ŷ ) = variance expliquée et Var(Y −

Ŷ ) = variance résiduelle. La proportion de variance expliquée par le modèle
Var(Ŷ )
linéaire est R2 = .
Var(Y )
3. R2 = r2 .
On note que r indique le signe de la liaison et le R2 explicite la proportion de la
variance qui pourrait être expliquée si une relation entre les deux variables existait.
Les uctuations de la variable dépendante sont expliquées et non causées par les
mouvements de la variable indépendante.
Exercice 3.7 On considère la série suivante :
X 1 2 3 4 5 6
Y 2,5 3 4 5 5,5 7
(a) Déterminer l'ajustement linéaire de Y sur X par la méthode des moindres
carrées ordinaires. (b) Donner la décomposition de la variance totale Var(Y ). (c)
Représenter le nuage de points ainsi que la droite de régression obtenue.
3.3.5 Ajustement linéaire par la méthode de Mayer

Cette méthode est empirique et ne se repose sur aucun critère d'erreur à minimiser.
Elle peut s'avérer ecace en présence de valeurs aberrantes.
Principe : La distribution est partagée en deux groupes comportant un nombre
égal de données (si n est pair) et un nombre égal de données à l'unité près (si n
est impair). On détermine dans chaque groupe le centre de gravité ou point moyen.
Soient G1 (xI , yI ) et G2 (xII , yII ) les centres de gravité des deux groupes :
m1 m1 m2 m2
1 X 1 X 1 X 1 X
xI = ni xi ; yI = ni yi ; xII = ni xi et yII = ni yi ;
n1 i=1
n1 i=1
n2 i=1
n2 i=1

m
P1 m
P2
avec n1 = ni , n2 = ni et n = n1 + n2 .
i=1 i=1
La droite d'ajustement linéaire de Y sur X par la méthode de Mayer est la droite

(G1 G2 ) d'équation y = ax + b avec :
yI − yII
a= , et b = yI − axI = yII − axII .
xI − xII
Exercice 3.8 Reprendre l'exercice précédent pour la méthode de Mayer.

COURS DE PROBABILITESetSTATISTIQUES - LPSICS-1

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

COURS DE PROBABILITESetSTATISTIQUES - LPSICS-1

Transféré par

Droits d'auteur :

Formats disponibles

MTH15250 - PROBABILITES ET

Tchilabalo Abozou KPANZOU

Faculté des Sciences et Techniques

Page web: https://sites.google.com/a/aims.ac.za/tchilabalo/

1 Dénombrement et Calcul de probabilité  Variables aléatoires et

2 Étude d'une série statistique à une variable 14

2.2 Étude d'une variable qualitative . . . . . . . . . . . . . . . . . . . . . 16

3 Étude d'une série statistique à deux variables 26

ii ANNEE UNIVERSITAIRE 2021-2022

1.1 Ensembles nis de cardinal n (n ∈ N)

Dénition 1.1.3 Le produit n × (n − 1) × · · · × 2 × 1 des n premiers entiers naturels

1.1.2 Propriétés des cardinaux d'ensembles nis

1.1.3 Nombre d'applications, d'injections et de bijections

a) Nombre d' applications de E → F

Dénition 1.1.4 Soient p et n ∈ N∗ . On appelle nombre de p-uplets (ou p-listes)

b) Nombre d'applications injectives de E → F (p ≤ n)

Dénition 1.1.5 (Arrangements)

Exemple 1.2 Le nombre de nombres de 3 chires diérents pouvant être formés

c) Nombre d'applications bijectives de E sur F (p = n)

Dénition 1.1.6 (Nombre de permutations de E )

Dénition 1.1.7 (Complémentaire d'un ensemble)

2 ANNEE UNIVERSITAIRE 2021-2022

Dénition 1.1.8 (Partition d'un ensemble)

1.1.4 Nombre de parties de cardinal p d'un ensemble ni E

Propriétés des Cnp

1.1.5 Formule du binôme de Newton

3 ANNEE UNIVERSITAIRE 2021-2022

1.2 Notion de tribu et de mesure de probabilité

1.2.2 Mesure de probabilité

c) Système complet d'évènements

4 ANNEE UNIVERSITAIRE 2021-2022

On appelle espace probabilisé ou espace de probabilité le triplet (Ω, A , p).

1.3 Probabilité sur un ensemble ni

Exemple 1.4 Considérons l'univers Ω constitué d'un jeu de 32 cartes. Il comporte

5 ANNEE UNIVERSITAIRE 2021-2022

1.4 Probabilité conditionnelle

1.4.2 Probabilité composée

1.4.3 Evènements indépendants

6 ANNEE UNIVERSITAIRE 2021-2022

1.4.4 Probabilité totale

1.4.5 Probabilité de cause ou formule de Bayes

1.5 Variable aléatoire discrète

1.5.1 Loi de probabilité

7 ANNEE UNIVERSITAIRE 2021-2022

1.5.2 Fonction de répartition

iii) lim F (x) = 0.

iv) F est une fonction continue à gauche.

8 ANNEE UNIVERSITAIRE 2021-2022

c) Moment centré d'ordre k

L'écart-type de X est la racine carrée de sa variance. On le note σ(X).

1.6 Variable aléatoire continue

9 ANNEE UNIVERSITAIRE 2021-2022

a) Les moments d'ordre k (k ∈ N)

c) Les moments centrés d'ordre k (k ∈ N)

1.7 Quelques lois usuelles

b) Loi uniforme discrète sur {1,2,. . . ,n}

10 ANNEE UNIVERSITAIRE 2021-2022

e) Loi hypergéométrique de paramètres N, n, p

 Espérance et variance : E(X) = np et Var(X) = N −n

 Espérance et variance : E(X) = Var(X) = λ.

1.7.2 Lois continues

b) Loi exponentielle de paramètre λ > 0

c) Loi normale de paramètres µ et σ 2

1 Dénombrement et Calcul de probabilité Variables aléatoires et

1.1 Ensembles nis de cardinal n (n ∈ N)

Dénition 1.1.3 Le produit n × (n − 1) × · · · × 2 × 1 des n premiers entiers naturels

1.1.2 Propriétés des cardinaux d'ensembles nis

Dénition 1.1.4 Soient p et n ∈ N∗ . On appelle nombre de p-uplets (ou p-listes)

Dénition 1.1.5 (Arrangements)

Exemple 1.2 Le nombre de nombres de 3 chires diérents pouvant être formés

Dénition 1.1.6 (Nombre de permutations de E )

Dénition 1.1.7 (Complémentaire d'un ensemble)

Dénition 1.1.8 (Partition d'un ensemble)

1.1.4 Nombre de parties de cardinal p d'un ensemble ni E

1.3 Probabilité sur un ensemble ni

Espérance et variance : E(X) = np et Var(X) = N −n

Espérance et variance : E(X) = Var(X) = λ.

Espérance et variance : E(X) = µ et Var(X) = σ 2 .

Remarque : La population soumise à l'analyse statistique doit être dénie avec

Modalité Eectif ni Fréquence fi Pourcentage pi FCC Fi

Modalité Eectif ni Fréquence fi Pourcentage pi FCC Fi

Classe Centre ci Eectif ni Fréquence fi Pourcentage pi FCC Fi

1. Calculer le chire d'aaire moyen et l'écart-type de la série.

3.1.3 Distribution marginale : prole ligne et prole colonne