Vous êtes sur la page 1sur 48

PROBABILITÉS-STATISTIQUES

Essomanda Tchandao Mangamana

Email : tchandesso@gmail.com

Année académique 2022-2023


Table des matières

1 Dénombrement et Calcul de probabilité  Variables aléatoires et


lois usuelles 1
1.1 Ensembles nis de cardinal n (n ∈ N) . . . . . . . . . . . . . . . . . 1
1.1.1 Cardinal d'un ensemble ni E . . . . . . . . . . . . . . . . . . 1
1.1.2 Propriétés des cardinaux d'ensembles nis . . . . . . . . . . . 1
1.1.3 Nombre d'applications, d'injections et de bijections . . . . . . 1
1.1.4 Nombre de parties de cardinal p d'un ensemble ni E de car-
dinal n (p ≤ n) . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.1.5 Formule du binôme de Newton . . . . . . . . . . . . . . . . . 4
1.2 Notion de tribu et de mesure de probabilité . . . . . . . . . . . . . . 4
1.2.1 Notion de tribu . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2.2 Mesure de probabilité . . . . . . . . . . . . . . . . . . . . . . . 4
1.3 Probabilité sur un ensemble ni . . . . . . . . . . . . . . . . . . . . . 5
1.3.1 Dénition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.3.2 Equiprobabilité . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.3.3 Propriétés . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.4 Probabilité conditionnelle . . . . . . . . . . . . . . . . . . . . . . . . 6
1.4.1 Dénition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.4.2 Probabilité composée . . . . . . . . . . . . . . . . . . . . . . . 7
1.4.3 Evènements indépendants . . . . . . . . . . . . . . . . . . . . 7
1.4.4 Probabilité totale . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.4.5 Probabilité de cause ou formule de Bayes . . . . . . . . . . . . 7
1.5 Variable aléatoire discrète . . . . . . . . . . . . . . . . . . . . . . . . 8
1.5.1 Loi de probabilité . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.5.2 Fonction de répartition . . . . . . . . . . . . . . . . . . . . . . 8
1.5.3 Moments . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
1.6 Variable aléatoire continue . . . . . . . . . . . . . . . . . . . . . . . . 10
1.6.1 Moments . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.7 Quelques lois usuelles . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.7.1 Lois discrètes . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.7.2 Lois continues . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.8 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14

2 Étude d'une série statistique à une variable 17


2.1 Concepts de base . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.1.1 Population et unité statistique - échantillon . . . . . . . . . . 17

1
TABLE DES MATIÈRES Tchandao Mangamana E.

2.1.2 Caractères et modalités . . . . . . . . . . . . . . . . . . . . . . 17


2.2 Étude d'une variable qualitative . . . . . . . . . . . . . . . . . . . . . 19
2.2.1 Tableau statistique . . . . . . . . . . . . . . . . . . . . . . . . 19
2.2.2 Représentations graphiques . . . . . . . . . . . . . . . . . . . 19
2.3 Étude d'une variable quantitative discrète . . . . . . . . . . . . . . . 20
2.3.1 Tableau statistique . . . . . . . . . . . . . . . . . . . . . . . . 20
2.3.2 Représentations graphiques . . . . . . . . . . . . . . . . . . . 20
2.3.3 Caractéristiques de tendance centrale . . . . . . . . . . . . . . 21
2.3.4 Caractéristiques de dispersion . . . . . . . . . . . . . . . . . . 22
2.4 Étude d'une variable quantitative continue . . . . . . . . . . . . . . . 24
2.4.1 Classe . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
2.4.2 Tableau statistique . . . . . . . . . . . . . . . . . . . . . . . . 25
2.4.3 Représentation graphique . . . . . . . . . . . . . . . . . . . . 25
2.4.4 Caractéristiques de tendance centrale . . . . . . . . . . . . . . 26
2.4.5 Caractéristiques de dispersion . . . . . . . . . . . . . . . . . . 27
2.5 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29

3 Étude d'une série statistique à deux variables 32


3.1 Tableaux de contingence, distributions marginales et conditionnelles . 32
3.1.1 Tableau de contingence : croisement de deux variables . . . . . 32
3.1.2 Fréquence conjointe . . . . . . . . . . . . . . . . . . . . . . . . 33
3.1.3 Distribution marginale : prole ligne et prole colonne . . . . 33
3.1.4 Distribution conditionnelle . . . . . . . . . . . . . . . . . . . . 33
3.2 Caractéristiques marginales et conditionnelles . . . . . . . . . . . . . 33
3.2.1 Caractéristiques marginales . . . . . . . . . . . . . . . . . . . 34
3.2.2 Caractéristiques conditionnelles . . . . . . . . . . . . . . . . . 34
3.3 Ajustement linéaire . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
3.3.1 Covariance entre deux variables . . . . . . . . . . . . . . . . . 35
3.3.2 Méthode des moindres carrées ordinaires . . . . . . . . . . . . 35
3.3.3 Coecient de corrélation linéaire . . . . . . . . . . . . . . . . 35
3.3.4 Propriétés importantes . . . . . . . . . . . . . . . . . . . . . . 35
3.3.5 Ajustement linéaire par la méthode de Mayer . . . . . . . . . 36
3.4 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

4 Notions de base sur la statistique inférentielle 39


4.1 Echantillonnage . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
4.1.1 Méthodes d'échantillonnage . . . . . . . . . . . . . . . . . . . 39
4.1.2 Echantillonnage aléatoire simple . . . . . . . . . . . . . . . . . 40
4.1.3 Distribution d'échantillonage . . . . . . . . . . . . . . . . . . . 40
4.2 Estimation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 41
4.2.1 Estimation ponctuelle . . . . . . . . . . . . . . . . . . . . . . 41
4.2.2 Estimation par intervalle de conance . . . . . . . . . . . . . . 42
4.3 Tests d'hypothèses . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
4.3.1 Risques d'erreur et puissance d'un test . . . . . . . . . . . . . 42
4.3.2 Méthodologie d'un test . . . . . . . . . . . . . . . . . . . . . . 43
4.3.3 Quelques exemples . . . . . . . . . . . . . . . . . . . . . . . . 43

2 Année académique 2022-2023


TABLE DES MATIÈRES Tchandao Mangamana E.

4.4 Exercices . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44

3 Année académique 2022-2023


Chapitre 1
Dénombrement et Calcul de
probabilité  Variables aléatoires et
lois usuelles

1.1 Ensembles nis de cardinal n (n ∈ N)


1.1.1 Cardinal d'un ensemble ni E
Dénition 1.1.1 On appelle cardinal d'un ensemble ni E , le nombre n d'éléments
dans E . On le note cardE .

Dénition 1.1.2 Deux ensembles nis E et F sont dits équipotents s'il existe une
bijection de l'un dans l'autre. Donc, deux ensembles sont équipotents s'ils ont le
même cardinal.

Dénition 1.1.3 Le produit n × (n − 1) × · · · × 2 × 1 des n premiers entiers naturels


non nuls est appelé factorielle n et noté n!. Par convention, 0! = 1.

1.1.2 Propriétés des cardinaux d'ensembles nis


Soient E et F deux ensembles nis. Alors E ∩ F , E ∪ F et E × F sont nis et on a :
i) E ⊂ F =⇒ cardE ≤ cardF .
ii) E ∩ F = ∅ (i.e. E et F sont disjoints) =⇒ card(E ∪ F ) = cardE + cardF .
(Cas particulier du iii))
iii) card(E ∪ F ) = cardE + cardF − card(E ∩ F ).
iv) card(E × F ) = cardE × cardF .
Remarque : La propriété iv) sera souvent utilisée dans les problèmes d'épreuves à
répétition. Elle permet d'écrire : ∀n ∈ N∗ , card(An ) = (cardA)n .

1.1.3 Nombre d'applications, d'injections et de bijections


Soient E et F deux ensembles nis tels que cardE = p et cardF = n (p, n ∈ N).

1
CHAPITRE 1. DÉNOMBREMENT ET CALCUL DE PROBABILITÉ  VARIABLES ALÉATOIRES ET LOIS
USUELLES Tchandao Mangamana E.

a) Nombre d' applications de E → F


Il y a autant d'applications possibles de E dans F qu'il y a de choix possibles
pour aecter à chaque élément de E une image dans F . Pour chacun des p éléments
de E , il y a n choix possibles et donc on a n
|
× n × · · · × n = np applications de
{z }
p fois
E dans F .

Dénition 1.1.4 Soient p et n ∈ N∗ . On appelle nombre de p-uplets (ou p-listes)


à n éléments, le nombre d'applications d'un ensemble E à p éléments dans un
ensemble F à n éléments. Ce nombre vaut np .

Exemple 1.1 Combien de nombres de 3 chires peuvent être formés à l'aide des
chires 1, 2, 3, · · · , 9 ?

Exemple 1.2 Vous achetez une carte téléphonique dont le code secret est choisi par
les chires 0 à 9. Vous eacez par inadvertance 2 chires en grattant. Vous décidez
de tester l'ensemble des cas possibles pour retrouver le bon numéro. Combien de
possibilités avez-vous de choisir les 2 chires manquants ? S'il vous faut en moyenne
1 min 30 sec pour tester un code, combien de temps faudra-til en moyenne pour
tester l'ensemble de code possible ?

b) Nombre d'applications injectives de E → F (p ≤ n)


Lorsque f est injective, deux éléments distincts de E ne peuvent avoir une même
image. Il y a donc n images possibles pour le premier élément de E , n − 1 pour le
deuxième, . . ., et n − (p − 1) pour le p-ième. Ainsi, le nombre de ces injections est
n × (n − 1) × · · · × (n − p + 1).

Dénition 1.1.5 (Arrangements)


Soient p et n ∈ N∗ tels que p ≤ n. On appelle arrangement de p dans n et on
note Apn , le nombre de manières d'ordonner p éléments d'un ensemble à n éléments.
C'est le nombre d'injections d'un ensemble E à p éléments dans un ensemble F à
n!
n éléments. Donc, Apn = n × (n − 1) × · · · × (n − p + 1) = .
(n − p)!

Exemple 1.3 Combien de nombres de 3 chires diérents peuvent être formés avec
les 9 chires de F = {1, 2, · · · , 9} ?
Combien de nombres de 3 chires peuvent être formés avec les chires de F et ayant
au moins 2 chires identiques ?

Exemple 1.4 Une compétition réunit 16 équipes. Un podium est un triplet (x1 , x2 , x3 )
avec x1 , x2 et x3 désignant respectivement le vainqueur, le naliste malheureux et
l'équipe classé 3è. Combien y a-t-il de podium possible ?

Exemple 1.5 Une urne contient 4 boules numérotées de 1 à 4. On tire successive-


ment et sans remise 2 boules de l'urne. Combien de tirage diérents peut-on avoir
(si on tient compte de l'ordre de tirage) ?

2 Année académique 2022-2023


CHAPITRE 1. DÉNOMBREMENT ET CALCUL DE PROBABILITÉ  VARIABLES ALÉATOIRES ET LOIS
USUELLES Tchandao Mangamana E.

c) Nombre d'applications bijectives de E sur F (p = n)


n!
D'après ce qui précède, ce nombre vaut Ann = = n!.
0!
Dénition 1.1.6 (Nombre de permutations de E )
Soit E un ensemble ni de cardinal n ∈ N∗ . Une permutation de E étant une
bijection de E sur E , le nombre de permutations de E est n!.

Exemple 1.6 Quel est le nombre de permutations possibles de 3 éléments distincts


A, B et C que l'on peut faire ?

Exemple 1.7 Dans une classe de terminale, cinq élèves n'ont pas encore été évalués
à l'oral. Dans combien d'ordres diérents le professeur peut-il les interroger, chaque
élève n'étant interrogé qu'une et une seule fois ?

Dénition 1.1.7 (Complémentaire d'un ensemble)


On appelle complémentaire de A dans E , le sous-ensemble Ā de E déni par Ā =
E = {x ∈ E / x 6∈ A}.
{A

Dénition 1.1.8 (Partition d'un ensemble)


Une partition de E est une partie de P(E) constituée de sous-ensembles non
vides de E , deux à deux disjoints et dont la réunion est égale à E . Autrement dit,
(Ai )i=1,··· ,n est une partition de E si Ai 6= ∅ ∀i, Ai ∩ Aj = ∅ ∀i, j, avec i 6= j
n
et
S
Ai = E.
i=1

Exemple 1.8 Soit A une partie propre de E . {A, Ā} forme une partition de E .
En eet, A et Ā sont non vides car A est une partie propre de E , A ∩ Ā = ∅ et
A ∪ Ā = E .

1.1.4 Nombre de parties de cardinal p d'un ensemble ni E


de cardinal n (p ≤ n)
Proposition 1.1.1 Le nombre des sous-ensembles (ou parties) comportant p élé-
Apn n!
ments d'un ensemble de n éléments est Cnp = = . Ce nombre est
p! p!(n − p)!
aussi parfois noté n
.

p

Propriétés des Cnp


1. ∀n ∈ N∗ on a : Cn0 = Cnn = 1 et Cn1 = Cnn−1 = n.
2. ∀n ∈ N et ∀p ∈ N tel que p ≤ n on a : Cnp = Cnn−p .
3. ∀n ∈ N∗ et ∀p ∈ N tel que 1 ≤ p ≤ n − 1 on a : Cnp = Cn−1
p p−1
+ Cn−1 .

3 Année académique 2022-2023


CHAPITRE 1. DÉNOMBREMENT ET CALCUL DE PROBABILITÉ  VARIABLES ALÉATOIRES ET LOIS
USUELLES Tchandao Mangamana E.

1.1.5 Formule du binôme de Newton


n
∀a ∈ R, ∀b ∈ R, ∀n ∈ N∗ : (a + b)n = Cnp ap bn−p .
P
p=0
Application : Montrer que :
(i) 2n = Cn0 + Cn1 + Cn2 + · · · + Cnn−1 + Cnn .
(ii) Cn0 − Cn1 + Cn2 + · · · + (−1)n−1 Cnn−1 + (−1)n Cnn = 0.
Triangle de Pascal :
En utilisant les relations Cn0 = 1, Cn1 = n, Cnn = 1 et Cnp = Cn−1 p p−1
+ Cn−1 , on
peut tracer un tableau triangulaire composé de lignes numérotées 0, 1, 2, · · · , n
et de colonnes numérotées 0, 1, 2, · · · , p de telle façon que les Cnp gure dans
la case intersection de la ligne n et de la colonne p. Il s'agit du triangle de Pascal,
qui permet d'obtenir rapidement les coecients de la forme Cnp d'un développement
binomial.

1.2 Notion de tribu et de mesure de probabilité


1.2.1 Notion de tribu
Soit Ω l'ensemble des cas possibles observables à l' issue d'une épreuve aléatoire.
Ω est appelé ensemble fondamental. Un évènement lié à cette épreuve peut être
représenté par un sous-ensemble de Ω.

a) Algèbre d'évènements
Une famille A , non vide, d'évènements de Ω est une algèbre d'évènements si :
i) ∀A ∈ A , Ā ∈ A ;
ii) ∀A ∈ A , ∀B ∈ A , A ∪ B ∈ A .

b) Tribu
Soit A une algèbre d'évènements de Ω (l'ensemble fondamental est inni). A est
une tribu si pour toute suite innie dénombrable A1 , A2 , · · · , Ai , · · · d'éléments

de A on a Ai ∈ A .
[

i=1

Conséquence : Ai ∈ A .
\

i=1

1.2.2 Mesure de probabilité


a) Espace probabilisable
On appelle espace probabilisable un couple (Ω, A ) constitué d'un ensemble Ω et
d'une tribu d'évènements A de parties de Ω.

4 Année académique 2022-2023


CHAPITRE 1. DÉNOMBREMENT ET CALCUL DE PROBABILITÉ  VARIABLES ALÉATOIRES ET LOIS
USUELLES Tchandao Mangamana E.

b) Evènements incompatibles
Soient (Ω, A ) un espace probabilisable et A et B deux évènements de A . On dit
que A et B sont incompatibles si A et B ne peuvent se réaliser en même temps.

c) Système complet d'évènements


On appelle système complet d'évènements de l'espace (Ω, A ), tout sous-ensemble
ni ou dénombrable de A , formant une partition de Ω. {Ci / Ci ∈ A , i ∈ I} est
un système complet d'évènements si, et seulement si :


 ∀i ∈ I, Ci =
6 ∅


∀i ∈ I, ∀j ∈ I, i 6= j ⇒ Ci ∩ Cj = ∅
 S


 Ci = Ω
i∈I

d) Espace probabilisé
Soit (Ω, A ) un espace probabilisable. Une probabilité est une application p de A
dans R+ telle que :
i) p(Ω) = 1
ii) ∀A ∈ A , ∀B ∈ A tels que A ∩ B = ∅, p(A ∪ B) = p(A) + p(B) et
si A1 , A2 , · · · , Ai , · · · est une suite dénombrable d'évènements deux à
deux incompatibles, alors :

! ∞
[ X
p Ai = p(Ai ).
i=1 i=1

On appelle espace probabilisé ou espace de probabilité le triplet (Ω, A , p).

1.3 Probabilité sur un ensemble ni


1.3.1 Dénition
Soit Ω un ensemble ni : Ω = {a1 , a2 , · · · , an }. Dans ce cas, A = P(Ω), et
(Ω, P(Ω)) est un espace probabilisable sur lequel on dénit une probabilité p telle
n
que pi = p ({ai }) avec pi ∈ [0, 1] et pi = 1 ∀i ∈ {1, 2, · · · , n}.
X

i=1

1.3.2 Equiprobabilité
Soit Ω = {a1 , a2 , · · · , an } tel que card(Ω) = n ∈ N∗ . L'application
p : P(Ω) → [0, 1]
1
{ai } 7→
n

5 Année académique 2022-2023


CHAPITRE 1. DÉNOMBREMENT ET CALCUL DE PROBABILITÉ  VARIABLES ALÉATOIRES ET LOIS
USUELLES Tchandao Mangamana E.

est une probabilité sur (Ω, P(Ω)). Etant donné que pour tout i = 1, 2, . . . , n,
P ({ai }) = n1 , on parle déquiprobabilité sur Ω.
card(A)
De façon générale on a : ∀A ∈ P(Ω), p(A) = .
card(Ω)

Exemple 1.9 Considérons l'univers Ω constitué d'un jeu de 32 cartes. Il comporte


8 hauteurs (7, 8, 9, 10, J, Q, K, A). Dans chaque hauteur, il y a 4 couleurs : pique,
coeur, carreau et trèe. On tire une carte du lot. Soient A l'évènement :  Tirer la
hauteur 7  et B l'évènement :  Tirer la couleur pique . Calculer P(A) et P(B).

Exemple 1.10 Dans un tiroir, il y a 3 paires de chaussures de couleurs diérentes.


On tire au hasard 2 chaussures. Quelle est la probabilité pour que :
a. Elles appartiennent à la même chaussure ?
b. Qu'il y ait un pied droit et un pied gauche ?

1.3.3 Propriétés
i) ∀A ∈ A , p Ā = 1 − p(A).


ii) p(∅) = 0.
iii) ∀A ∈ A , 0 ≤ p(A) ≤ 1.
iv) ∀A ∈ A , ∀B ∈ A , p(A ∪ B) = p(A) + p(B) − p(A ∩ B).

1.4 Probabilité conditionnelle


1.4.1 Dénition
Soient (Ω, A , p) un espace probabilisé et A ∈ A tel que p(A) > 0. L'application
pA de A dans R+ telle que :

p(A ∩ B)
∀B ∈ A , pA (B) =
p(A)

est une probabilité. C'est une probabilité conditionnelle.

Exemple 1.11 Une urne contient deux boules blanches et 3 boules rouges indiscer-
nables au touché. On tire successivement deux boules avec remise. Soient les événe-
ments :
R1 : "Obtenir une boule rouge au premier tirage".
R2 : "Obtenir une boule rouge au second tirage".
1. Calculer P(R1 ), P(R2 ), P(R1 ∩ R2 ), P(R2 /R1 ) et P(R1 /R2 ).
2. Reprendre les mêmes questions si le tirage est sans remise.

Notation : ∀B ∈ A , pA (B) sera notée p(B / A) et elle se lit  probabilité de B


sachant A .

6 Année académique 2022-2023


CHAPITRE 1. DÉNOMBREMENT ET CALCUL DE PROBABILITÉ  VARIABLES ALÉATOIRES ET LOIS
USUELLES Tchandao Mangamana E.

1.4.2 Probabilité composée


∀A ∈ A , ∀B ∈ A tels que p(A) > 0 et p(B) > 0 on a :
p(A ∩ B) = p(A) × p(B / A) = p(B) × p(A / B).
∀A ∈ A , ∀B ∈ A tels que B ⊂ A, p(A / B) = 1.

1.4.3 Evènements indépendants


Dénition 1.4.1 Deux évènement A et B sont indépendants pour p si
p(A ∩ B) = p(A) × p(B).
Propriétés
Si A et B sont indépendants, alors :
i) p(A / B) = p(A) si p(B) > 0 et p(B / A) = p(B) si p(A) > 0.
ii) p(A ∪ B) = p(A) + p(B)(1 − p(A)) = p(A) + p(Ā) × p(B).
iii) Ā et B sont indépendants.
iv) A et B̄ sont indépendants.
v) Ā et B̄ sont indépendants.
Exemple 1.12 On lance 2 fois de suite un dé cubique parfait. Soient les événe-
ments :
A1 : "le premier nombre obtenu est pair".
A2 : "le deuxième nombre obtenu est impair".
A3 : "la somme des deux nombres obtenus est paire".
Les trois événements sont ils deux à deux indépendants ? Mutuellement indépen-
dants ?

1.4.4 Probabilité totale


Théorème 1.4.1 Soit (An )n≥0 un système complet d'évènements. Alors, pour tout

évènement B , on a p(B) = p(B / An )p(An ).
X

n=0

1.4.5 Probabilité de cause ou formule de Bayes


Théorème 1.4.2 Soit (An )n≥0 un système complet d'évènements. Alors, pour tout
évènement B tel que p(B) > 0, on a
p(B / A0 )p(A0 )
p(A0 / B) = P
∞ .
p(B / An )p(An )
n=0

Exemple 1.13 Soit U1 et U2 deux urnes. U1 contient 2 boules noires et 1 boule


rouge ; U2 contient 1 boule noire et 4 boules rouges. Le jeu consiste à tirer au hasard
une urne et ensuite à tirer une boule de cette urne. Le résultat nal est connue : la
boule tirée est rouge. Quelle est la probabilité qu'elle provienne de l'urne U1 ?

7 Année académique 2022-2023


CHAPITRE 1. DÉNOMBREMENT ET CALCUL DE PROBABILITÉ  VARIABLES ALÉATOIRES ET LOIS
USUELLES Tchandao Mangamana E.

Exemple 1.14 1/4 d'une population a été vacciné contre une certaine maladie.
Parmi les vaccinés, on compte 1/12 de malades. Parmi les malades il y a 4 non
vaccinés pour 1 vacciné. Quelle est la probabilité pour un non vacciné d'être malade ?

1.5 Variable aléatoire discrète


Dénition 1.5.1
Soit (Ω, A , p) un espace probabilisé. Une variable aléatoire réelle est une application
X : Ω → R, w 7→ x tel que :

∀x ∈ R, X −1 ({x}) ∈ A où X −1 ({x}) = {ω ∈ Ω / X(ω) = x}.

Si l'ensemble X(Ω) des valeurs possibles prises par la variable aléatoire X est au
plus dénombrable, alors on dit que X est une variable aléatoire discrète. Sinon, on
parle d'une variable aléatoire continue.

Exemple 1.15
On lance trois fois une pièce de monnaie (qui prend deux valeurs possibles  Pile 
ou  Face ). L'univers est Ω = {P, F }.
Notons X le nombre de fois que  Face  apparaît au bout des trois lancers. Les
valeurs possibles de X sont dans l'ensemble X(Ω) = {0, 1, 2, 3}. X est une
application de Ω dans X(Ω).

1.5.1 Loi de probabilité


On peut probabiliser (Ω, P(X(Ω))) par l'application PX dénie par :
pX : P(X(Ω)) → [0, 1]
A 7→ pX (A) = p−1 (X(A)).

Si X(Ω) = {xi / i ∈ I}, avec I un ensemble ni ou dénombrable, alors pX est en-
tièrement déterminée par la donnée des nombres pi dénis par : pi = pX ({xi }) =
p(X = xi ), ∀i ∈ I .
La loi de probabilité de X est bien dénie si, et seulement si :
n
 ∀i ∈ {1, · · · , n}, pi ≥ 0 et pi = 1 lorsque X(Ω) est ni.
P
i=1

 ∀i ∈ N∗ , pi ≥ 0 et pi = 1 lorsque X(Ω) est dénombrable.
P
i=1

1.5.2 Fonction de répartition


La fonction de répartition F d'une variable aléatoire X est une fonction dénie sur
R comme suit :

F : R → [0, 1]
x 7→ F (x) = p(X ≤ x) où (X ≤ x) = {ω ∈ Ω / X(ω) ≤ x}.

8 Année académique 2022-2023


CHAPITRE 1. DÉNOMBREMENT ET CALCUL DE PROBABILITÉ  VARIABLES ALÉATOIRES ET LOIS
USUELLES Tchandao Mangamana E.

Dans le cas d'une variable aléatoire discrète nie telle que card(X(Ω)) = n, la
fonction de répartition se dénit de la façon suivante :
si

 0 x < x1

si

x1 ≤ x < x2



 p1

.. .. ..


. . .




F (x) = j
pi si xj ≤ x < xj+1

 P


i=1
.. .. ..



. . .






si

1 x ≥ xn

a) Propriétés
i) ∀x, y ∈ R / x ≤ y, F (x) ≤ F (y).
ii) lim F (x) = 1.
x→+∞

iii) lim F (x) = 0.


x→−∞

iv) F est une fonction continue à gauche.

1.5.3 Moments
a) Moments d'ordre k
On appelle moment d'ordre k d'une variable aléatoire X , le réel mk (X) déni par :
 n
pi xki si X(Ω) est ni
 P



i=1
mk (X) = ∞
pi xki si X(Ω) est dénombrable et la série converge absolument.

 P


i=1

b) Espérance mathématique
L'espérance mathématique d'une variable aléatoire X est égale au moment d'ordre
1 de X , s'il existe. Elle se note E(X).
X
E(X) = m1 (X) = pi x i .
i

c) Moment centré d'ordre k


On appelle variable aléatoire centrée d'une variable aléatoire X , la variable aléatoire
Y dénie par : Y = X − E(X) = X − m1 (X).

9 Année académique 2022-2023


CHAPITRE 1. DÉNOMBREMENT ET CALCUL DE PROBABILITÉ  VARIABLES ALÉATOIRES ET LOIS
USUELLES Tchandao Mangamana E.

On appelle moment centré d'ordre k de la variable aléatoire X , le réel µk (X) déni


par :
 n
pi (xi − E(X))k si X(Ω) est ni
 P



i=1
µk (X) = ∞
pi (xi − E(X))k si X(Ω) est dénombrable et la série converge absolument.

 P


i=1

d) Variance et écart-type
La variance Var(X) d'une variable aléatoire X est son moment centré d'ordre 2 :

Var(X) = µ2 (X).

L'écart-type de X est la racine carrée de sa variance. On le note σ(X).


p
σ(X) = Var(X).

Propriété
Var(X) = m2 (X) − (m1 (X))2 .

1.6 Variable aléatoire continue


Soient X une variable aléatoire réelle dénie sur un espace probabilisé (Ω, A , p) et
F sa fonction de répartition :

F : R → [0, 1]
x 7→ F (x) = p(X ≤ x).

On dit que X est une variable aléatoire continue s'il existe une fonction numérique
f dénie sur R telle que :
i) ∀x ∈ R, f (x) ≥ 0.
ii) f est continue sur R sauf peut-être aux points pour lesquels elle admet une
limite nie à gauche et à droite.
iii) ∀x ∈ R, F (x) = −∞ f (t)dt et lim F (x) = lim −∞ f (t)dt =
Rx Rx
x→+∞ x→+∞
f (t)dt est bien dénie et est égale à 1.
R +∞
−∞
Dans ces conditions, f est alors une densité de probabilité de la variable aléatoire X .

1.6.1 Moments
Soit X une variable aléatoire continue de densité f . On dénit, en supposant la
convergence des intégrales, les notions suivantes :

10 Année académique 2022-2023


CHAPITRE 1. DÉNOMBREMENT ET CALCUL DE PROBABILITÉ  VARIABLES ALÉATOIRES ET LOIS
USUELLES Tchandao Mangamana E.

a) Les moments d'ordre k (k ∈ N)


Z +∞
mk (X) = xk f (x)dx.
−∞

b) L'espérance mathématique
Z +∞
E(X) = m1 (X) = xf (x)dx.
−∞

Remarque :
1. Une variable aléatoire continue peut ne pas avoir d'espérance mathématique
(l'intégrale n'est pas convergente !)
2. Si f est paire (c'est-à-dire : ∀x ∈ R, f (x) = f (−x)) et si E(X) existe,
alors E(X) = 0.

c) Les moments centrés d'ordre k (k ∈ N)


Z +∞
µk (X) = (x − E(X))k f (x)dx.
−∞

d) La variance
Z +∞
Var(X) = µ2 (X) = (x − E(X))2 f (x)dx.
−∞

1.7 Quelques lois usuelles


1.7.1 Lois discrètes
a) Loi constante
 Loi de probabilité : P (X = a) = 1.
 Espérance et variance : E(X) = a, Var(X) = 0.

b) Loi uniforme discrète sur {1,2,. . . ,n}


 Loi de probabilité : ∀k ∈ {1, 2, . . . , n}, P (X = k) = n1 .
 Espérance et variance :
n+1 n2 − 1
E(X) = , Var(X) = .
2 12

11 Année académique 2022-2023


CHAPITRE 1. DÉNOMBREMENT ET CALCUL DE PROBABILITÉ  VARIABLES ALÉATOIRES ET LOIS
USUELLES Tchandao Mangamana E.

c) Loi de Bernoulli
 Loi de probabilité : P (X = 1) = p = 1 − P (X = 0).
 Espérance et variance : E(X) = p, Var(X) = p(1 − p).

d) Loi binomiale
 Loi de probabilité : ∀k ∈ {0, 1, . . . , n}, P (X = k) = Cnk pk (1−p)n−k .
 Espérance et variance : E(X) = np, Var(X) = np(1 − p).

e) Loi hypergéométrique de paramètres N, n, p


 Loi de probabilité : ∀k ∈ {0, 1, . . . , min(N, M )}, P (X = k) =
k C n−k
CM
n
CN
.
N −M

 Espérance et variance : E(X) = np et Var(X) = N −n


N −1
np(1 − p).

f) Loi de Poisson
 Loi de probabilité : ∀k ∈ N, P (X = k) = λk! e−λ .
k

 Espérance et variance : E(X) = Var(X) = λ.

1.7.2 Lois continues


a) Loi uniforme sur un intervalle [a; b], a, b ∈ R, a < b
 Densité de probabilité : fX (x) = b−a
1
1[a;b] (x).
 Espérance et variance : E(X) = 2 et Var(X) =
a+b (b−a)2
12
.

b) Loi exponentielle de paramètre λ > 0


 Densité de probabilité : fX (x) = λe−λx 1[0;+∞[ (x).
 Espérance et variance : E(X) = λ1 et Var(X) = λ12 .

c) Loi normale de paramètres µ et σ 2


 Densité de probabilité :
1 (x−µ)2
fX (x) = √ e− 2σ2 .
σ 2π
 Espérance et variance : E(X) = µ et Var(X) = σ 2 .

Remarque 1.1 Pour µ = 0 et σ 2 = 1, nous avons la loi normale centrée et


réduite, N (0, 1), pour laquelle la fonction de répartition est notée par Φ.

12 Année académique 2022-2023


CHAPITRE 1. DÉNOMBREMENT ET CALCUL DE PROBABILITÉ  VARIABLES ALÉATOIRES ET LOIS
USUELLES Tchandao Mangamana E.

d) Loi gamma de paramètres p et λ positifs


Une v.a. X suit la loi γ(p, λ) si sa densité est donnée par
λp
fX (x) = xp−1 e−λx 1[0,+∞[ (x),
Γ(p)
où Z +∞
Γ(p) = xp−1 e−x dx.
0

On a en intégrant E(X) = p
λ
and Var(X) = p
λ2
.
Remarque 1.2
L
 Noter que pour p = 1 on a la loi exponentielle de paramètre λ, i.e. γ(1, λ) =
E (λ).
 Si X1 , X2 , . . . , Xn sont des variables aléatoires réelles indépendantes de
même loi E (λ), alors X1 + X2 + . . . + Xn ; γ(n, λ).

e) Loi de Chi-deux ou Chi-carré à n degrés de liberté (d.d.l)


Une v.a. X suit la loi χ2n si sa densité est de la forme
1 n 1
fX (x) = n x 2 −1 e− 2 x 1[0,+∞[ (x).
2 2

L
On remarque que χ2n = Γ n2 , 2 , si bien que E(X) = n et Var(X) = 2n. De
1


plus, si X ; χ2n , Y ; χ2m avec X et Y indépendantes, alors X + Y ; χ2n+m .

f) Loi de Cauchy de paramètre θ ≥ 0


Une v.a. X suit une loi de Cauchy de paramètre θ ≥ 0, i.e. X ; Cauchy(θ),
si sa densité est de la forme
1
fX (x) = .
π (1 + (x − θ)2 )

Cette loi a une expérance innie, i.e. E(X) = +∞. On prend souvent θ = 0 et
donc
1
fX (x) = .
π (1 + x2 )

g) Loi de Student à n d.d.l


La loi de Student à n d.d.l est la loi suivie par la variable aléatoire
X
Tn = p ,
Y /n

où X ; N (0, 1) et Y ; χ2n avec X et Y indépendantes.

13 Année académique 2022-2023


CHAPITRE 1. DÉNOMBREMENT ET CALCUL DE PROBABILITÉ  VARIABLES ALÉATOIRES ET LOIS
USUELLES Tchandao Mangamana E.

Tn a pour densité
− n+1
x2

1 2

fX (x) = √ 1 + , x ∈ R,
nβ 21 , n2

n
avec
1  
Γ(p)Γ(q)
Z
β(p, q) = x p−1
(1 − x) q−1
dx = pour p, q ∈ N .
?
0 Γ(p + q)

On prouve que la loi de Student est centrée comme la loi normale. On a E(Tn ) = 0
et Var(Tn ) = n−2
n
pour n > 2.

h) Loi de Fisher-Snedecor à n et m d.d.l


La loi de Fisher-Snedecor à n et m d.d.l est la loi suivie par la v.a.
X/n
Fn,m = ,
Y /m

où X ; χ2n et Y ; χ2m avec X et Y indépendantes. Si U ; Fn,m alors


1
U
; Fm,n .

1.8 Exercices
Exercice 1.1 On dispose de 4 boules de couleurs diérentes notée R, B, J, V.
On a la possibilité soit de ne choisir de boules, soit d'en choisir une, deux, trois ou
quatre. Combien peut-on eectuer de choix possibles ?

Exercice 1.2 a) On dispose de trois tiroirs notés A, B, C dans lesquels on doit


ranger à sa guise 7 objets discernables numérotés 1 à 7. Combien de rangements
diérents peut-on réaliser ? On pourra faire un arbre.
b) On dispose cette fois-ci de 3 objets discernables notés 1, 2, 3 et de 5 tiroirs notés
A, B, C, D, E mais l'on ne veut ranger deux objets dans un même tiroir. Combien
de rangements diérents peut-on en faire ?

Exercice 1.3 On veut fabriquer des mots de trois lettres (ayant ou non un sens)
avec les lettres de l'alphabet. Déterminer les nombres :
1. N1 de mots diérents que l'on peut fabriquer.
2. N2 de mots contenant trois lettres distinctes.
3. N3 de mots commençant et nissant par une consonne.
4. N4 de mots contenant au moins une voyelle.
5. N5 de mots contenant exactement deux consonnes et une voyelle.

Exercice 1.4

14 Année académique 2022-2023


CHAPITRE 1. DÉNOMBREMENT ET CALCUL DE PROBABILITÉ  VARIABLES ALÉATOIRES ET LOIS
USUELLES Tchandao Mangamana E.

1. On dispose de n boules d'une même couleur indiscernables au toucher. Mon-


trer que le nombre de façons de les répartir en trois groupes de n1 , n2 et n3
boules respectivement telle que n1 + n2 + n3 = n est
n!
.
n1 !n2 !n3 !

2. Dans un commissariat, huit (08) agents de police sont répartis aléatoirement


de telle sorte qu'il y ait 3 agents de patrouille, 2 agents de garde au com-
missariat et 3 agents de réserve. Quel est le nombre total de répartitions
possibles ?

Exercice 1.5 On rappelle que dans un jeu de cartes, chacune des cartes peut-
être considérée comme un élément du produit E × F où E est l'ensemble des 4
couleurs : c÷ur, carreau, trèe, pique et F est l'ensemble des valeurs 2, 3, · · · , 10,
Valet, Dame, Roi et As.

Un jeu de Bridge est composé de 52 cartes et un jeu de Belotte de 32 cartes. On


considère un jeu de Belotte. On appelle main, tout ensemble de 5 cartes.
1. Combien y-a-il de mains possibles ?

2. Combien y-a-il de mains contenant le valet de trèe ?

3. Combien y-a-il de mains contenant exactement un As ?

4. Combien y-a-il de mains contenant au moins un Roi ?

Exercice 1.6 Déterminer le nombre de numéros de téléphone à 7 chires tels


que :
1. Le numéro est formé de deux 1, deux 3 et trois 7.
2. Le numéro est formé de deux chires distincts et deux seulement.
3. Le numéro est formé de trois 1 et trois seulement.
4. La somme des chires du numéro est égale à 10.
Exercice 1.7 Un étudiant s'habille très vite le matin et prend, au hasard dans la
pile d'habits, un pantalon, un T-shirt, une paire de chaussettes ; il y a ce jour-là dans
l'armoire 5 pantalons dont 2 noirs, 6 T-shirt dont 4 noirs, 8 paires de chaussettes,
dont 5 paires noires.
Combien y-a-t-il de façons de s'habiller ?
Quelles sont les probabilités des événements suivants : il est tout en noir.
Une seule pièce est noire sur les trois.
Exercice 1.8 Quelle est la probabilité pour que, dans une famille de huit enfants,
il y ait
1. Exactement 5 lles ;
2. Au moins 5 lles.

15 Année académique 2022-2023


CHAPITRE 1. DÉNOMBREMENT ET CALCUL DE PROBABILITÉ  VARIABLES ALÉATOIRES ET LOIS
USUELLES Tchandao Mangamana E.

NB : Donner les résultats sous forme de fractions irréductibles.

Exercice 1.9 On dispose de 10 livres (deux livres de chimie, trois livres de phy-
sique et cinq livres de mathématiques) qu'on range au hasard sur un étagère. Quelle
est la probabilité
1. p1 pour que 3 livres donnés soient rangés côte à côte ?
2. p2 que les livres soient bien rangés (les livres sont rangés par discipline) ?

Exercice 1.10 On compose au hasard un numéro de téléphone à 8 chires. Quelle


est la probabilité pour que :
1. tous les chires du numéro soient distincts ?
2. le produit des chires soit divisible par 2 ?
3. les chires forment une suite strictement croissante ?
4. les chires forment une suite croissante au sens large ?

Exercice 1.11 Pour se rendre à l'université, un étudiant a le choix entre 4 itiné-


raires : A, B, C et D. La probabilité qu'il a de choisir l'itinéraire A (resp. B, C) est
1
3
(resp. 14 , 12
1
). La probabilité d'arriver en retard en empruntant A (resp. B, C) est
1
20
(resp. 10 , 5 ). En empruntant D, il n'est jamais en retard. Calculer la probabilité
1 1

pour que :
1. l'étudiant choisisse l'itinéraire D ?
2. l'étudiant arrive en retard ?
3. l'étudiant ait emprunté l'itinéraire C sachant qu'il est arrivé en retard ?

Exercice 1.12 La proportion des pièces défectueuses dans un lot est de 0.05. Le
contrôle de fabrication des pièces est tel que :
 Si la pièce est bonne, elle est acceptée avec une probabilité de 0.96.
 Si la pièce est mauvaise, elle est refusée avec probabilité 0.98.
On choisit une pièce au hasard et la contrôle. Probabilité pour :
1. qu'il y ait une erreur de contrôle ?
2. qu'une pièce acceptée soit mauvaise ?

16 Année académique 2022-2023


Chapitre 2
Étude d'une série statistique à une
variable

2.1 Concepts de base


2.1.1 Population et unité statistique - échantillon
Lors d'une étude statistique, les observations sont faites à partir d'un ensemble
précis (ensemble de référence) appelé population. Chaque élément de cet ensemble
est une unité statistique ou un individu. Les termes de population et d'individu
sont employés aussi bien lorsqu'il s'agit d'êtres humains que d'êtres inanimés, d'êtres
abstraits ou d'évènements.
Le recensement est l'étude de tous les individus d'une population. Ceci est dicile
en pratique, lorsque les populations sont grandes, pour des questions de coût et de
temps.
Le sondage, par contre, est un recueil d'une partie (ou d'un sous-ensemble) de la
population. La partie des individus étudiés s'appelle un échantillon. Le recueil d'un
échantillon à partir de la population initiale se fait par des techniques statistiques
appelées méthodes d'échantillonnage.

Remarque : La population soumise à l'analyse statistique doit être dénie avec


précision an que l'ensemble considéré soit déterminé sans ambiguïté, de sorte qu'un
individu quelconque puisse y être aecté sans incertitude.

Exemple 2.1 Les étudiants de l'université de Kara, les salariés d'une entreprise,
la production d'automobiles d'une année, le stock des machines à une date donnée.

2.1.2 Caractères et modalités


Pour décrire une population, on classe les individus selon certains aspects ou attri-
buts que l'on appelle caractères ou variables.

Exemple 2.2 Si la population étudiée est constituée des étudiants de la faculté des
sciences, les caractères étudiés peuvent être : le parcours, la spécialité, l'âge, le sexe,
le nombre de crédits capitalisés, etc.

17
CHAPITRE 2. ÉTUDE D'UNE SÉRIE STATISTIQUE À UNE VARIABLE Tchandao Mangamana E.

Le caractère est un critère de classement, il peut présenter plusieurs situations dif-


férentes appelées modalités.

Exemple 2.3 Les deux modalités du caractère sexe sont : masculin et féminin.

Le nombre de modalités d'un caractère dépend de l'information disponible et du


but de l'étude. Il existe deux classes de caractères en Statistique : les caractères
qualitatifs et les caractères quantitatifs (ou numériques).

a) Caractères qualitatifs
Les caractères qualitatifs ou variables catégorielles sont des caractères dont les dif-
férentes modalités ne sont pas mesurables. Elles sont non numériques dans le sens
où les opérations de base n'ont pas de sens.
On distingue deux types de caractères qualitatifs : les caractères qualitatifs nomi-
naux et les caractères qualitatifs ordinaux (ou ordonnés).
Caractères qualitatifs nominaux : les diérentes modalités ne sont que des noms
ou des catégories qui ne suivent pas un ordre naturel. C'est le cas par exemple de la
race, la couleur des yeux, la marque de voiture, le sexe, etc.
Caractères qualitatifs ordonnés : les modalités suivent un ordre naturel ou
peuvent être classées dans un ordre spécique. C'est le cas par exemple du niveau
d'éducation, du degré de satisfaction, etc. Ces variables sont repérables selon un
type d'échelle plus ou moins légitime. Les catégories pourront alors donner lieu à un
codage par les rangs qui ouvrira une autre gamme de traitements possibles proches
de ceux des variables quantitatives.

b) Caractères quantitatifs ou numériques


Il s'agit des caractères (ou variables) dont les modalités sont mesurables, c'est-à-dire
appartiennent à R. On distingue deux types de variables quantitatives : les variables
discrètes et les variables continues.
Variable discrète : les valeurs sont obtenues par dénombrement. C'est le cas par
exemple du nombre d'élèves. Une variable discrète peut ne prendre que certaines
valeurs isolées (dans N). C'est le cas du nombre de personnes qui composent un
ménage. Elle peut prendre une innité de valeurs dénombrables, mais elle peut aussi
n'en prendre que quelques unes.
Variable continue : peut prendre toutes les valeurs à l'intérieur d'un intervalle. Le
nombre de modalités possibles d'une telle variable est alors inni. C'est le cas par
exemple de la taille, la température, le salaire, le PIB par habitant, etc.

18 Année académique 2022-2023


CHAPITRE 2. ÉTUDE D'UNE SÉRIE STATISTIQUE À UNE VARIABLE Tchandao Mangamana E.

2.2 Étude d'une variable qualitative


2.2.1 Tableau statistique

Modalité Eectif ni Fréquence fi Pourcentage pi FCC Fi


M1 n1 f1 p1 F1
.. .. .. .. ..
. . . . .
ni ni i
P
Mi ni fi = pi = × 100 Fi = fk
n n k=1
.. .. .. .. ..
. . . . .
Mm nm fm pm Fm = 1
m m m
Total
P P P
n= ni fi = 1 pi = 100
i=1 i=1 i=1

Exemple 2.4 On note C : célibataire, M : marié, V : veuf, D : divorcé. On s'inté-


resse à la variable X=(état-civil) sur une population de n = 20 personnes. Considé-
rons la série statistique suivante : M D M C C M C C C M C M V M V D C C M
C. Établir le tableau statistique.

Exemple 2.5 On interroge une population de n = 50 personnes sur leur dernier


diplôme obtenu. On note : Sd : Sans diplôme, P : Primaire, Se : Secondaire, Su :
Supérieur non-universitaire et U : Universitaire : Sd Sd Sd Sd P P P P P P P P P
P P Se Se Su Se Se Se Se Se Se Se Se Se Se Se Se Su Su Su Su Su Su Su U U U
U U U U U U U U U Su. Établir le tableau statistique.

2.2.2 Représentations graphiques


On peut représenter une variable qualitative soit par un diagramme en tuyaux
d'orgue ou en barres, soit par un diagramme à secteurs ou camembert.
Diagramme en tuyaux d'orgue ou en barres : Il est constitué d'une suite de
rectangles dont les hauteurs sont proportionnelles à l'eectif (ou à la fréquence ou
au pourcentage) des modalités et dont les bases sont identiques. Il est soit représenté
en horizontal, soit en vertical.
Diagramme en secteur ou camembert : Il permet de visualiser la part rela-
tive des modalités d'une variable qualitative sur la population. Le cercle représente
l'ensemble de la population, les diérentes modalités seront représentées par des
secteurs dont les surfaces sont proportionnelles aux eectifs (ou fréquences ou pour-
centages). Une telle représentation n'est possible que si la somme des pourcentages
donne 100%.

19 Année académique 2022-2023


CHAPITRE 2. ÉTUDE D'UNE SÉRIE STATISTIQUE À UNE VARIABLE Tchandao Mangamana E.

2.3 Étude d'une variable quantitative discrète


2.3.1 Tableau statistique

Modalité Eectif ni Fréquence fi Pourcentage pi FCC Fi


x1 n1 f1 p1 F1
.. .. .. .. ..
. . . . .
ni ni i
P
xi ni fi = pi = × 100 Fi = fk
n n k=1
.. .. .. .. ..
. . . . .
xm nm fm pm Fm = 1
m m m
Total
P P P
n= ni fi = 1 pi = 100
i=1 i=1 i=1

Exemple 2.6 Un quartier est composé d'une population de 50 ménages, et la va-


riable X représente le nombre de personnes par ménage. Les valeurs de la variable
sont : 1 1 1 1 1 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 4 4 4 4 4
5 5 5 5 5 5 6 6 6 8 8. Établir le tableau statistique.

2.3.2 Représentations graphiques


Diagramme en bâtons
Pour représenter une variable quantitative discrète, on peut utiliser un graphique
appelé diagramme en bâtons. Pour obtenir un diagramme en bâtons, on trace un
repère formé de deux axes orientés et orthogonaux. Sur l'axe des abscisses, on place
les modalités x1 , ..., xm prises par la variable. Sur l'axe des ordonnées, on place
les eectifs ou les fréquences ou les proportions correspondant à ces modalités. Ce
graphique consiste donc à dessiner pour chaque modalité de la variable, un trait de
hauteur l'eectif, la fréquence ou la proportion de cette modalité.
La courbe joignant les sommets des bâtons est appelée polygone des eectifs, si l'on a
représenté les eectifs, ou polygone des fréquences, si l'on a représenté les fréquences.
C'est une ligne brisée joignant les points de coordonnées (xi , ni ) ou (xi , fi ).

Courbe des fréquences cumulées


C'est une courbe en escaliers qui représente la fonction de répartition dénie de R
dans [0, 1] et valant :

si x < x1

0

F (x) = Fi si xi ≤ x < xi+1
si x ≥ xm

1

20 Année académique 2022-2023


CHAPITRE 2. ÉTUDE D'UNE SÉRIE STATISTIQUE À UNE VARIABLE Tchandao Mangamana E.

2.3.3 Caractéristiques de tendance centrale


a) Mode
Le mode (M o) d'une distribution est la valeur la plus fréquente dans la série. Il
correspond à la valeur de la variable pour laquelle la fréquence est la plus élevée.

b) Percentile
Le p-ième percentile est la valeur telle qu'au moins p pour cent des observations ont
une valeur inférieure ou égale à cette valeur, et (100 − p) pour cent des observations
ont une valeur supérieure ou égale à cette valeur.
Calcul du p-ième percentile
Étape 1 : classer les données dans l'ordre croissant.
p
Étape 2 : calculer l'index i = × n où n le nombre d'observations.
100
Étape 3 (décision) : si i n'est pas un nombre entier naturel, la position du p-ième
percentile correspond à l'entier E(i) + 1, où E(i) désigne la partie entière de i ; si
i est un nombre entier, le p-ième percentile correspond à la moyenne des valeurs des
observations i et i + 1.

c) Quartile
Les quartiles sont des percentiles particuliers. Les étapes de calcul des percentiles
peuvent être directement appliquées au calcul des quartiles. Il y a trois quartiles :
Q1 = Premier quartile soit 25e percentile,
Q2 = Deuxième quartile soit 50e percentile,
Q3 = Troisième quartile soit 75e percentile.

d) Médiane
La médiane (M e) d'une distribution est la valeur de la variable statistique qui
partage en deux eectifs égaux les individus de la population rangés selon la valeur
croissante du caractère. C'est le cas où p = 50.
Si F est la fonction de répartition représentée par les fréquences cumulées, la médiane
est la valeur statistique telle que F (M e) = 0, 5.
Exemple 2.7 Les données sur les salaires mensuels initiaux (en euros) des em-
ployés d'une agence de voyage sont : 2850 2950 3050 2880 2755 2710 2890 3130
2940 3325 2920 2880. Déterminer le 10e percentile ainsi que les quartiles Q1 , Q2 et
Q3 .

e) Moyenne arithmétique
La moyenne arithmétique d'une variable statistique est la somme, pondérée par les
fréquences, des valeurs.

21 Année académique 2022-2023


CHAPITRE 2. ÉTUDE D'UNE SÉRIE STATISTIQUE À UNE VARIABLE Tchandao Mangamana E.

m m
X 1X
x̄ = fi xi = ni xi .
i=1
n i=1

f) Moyenne de sous-populations
La moyenne x̄ d'une population P composée de p sous-populations Pj peut être
exprimée en fonction des moyennes x̄j des sous-populations :
p nj

fj x̄j , où
X X
x̄ = x̄j = fij xij .
j=1 i=1

La moyenne x̄ est donc la moyenne des moyennes des sous-populations.

g) Moyenne harmonique
La moyenne harmonique (H ) est utilisée pour estimer la moyenne des inverses quand
la grandeur a une dimension de vitesse. Elle est dénie par :
1 1
H = = .
1 m
P ni m f
P i
n i=1 xi i=1 xi

h) Moyenne géométrique
La moyenne géométrique (G) est utilisée quand on étudie les variations relatives, en
particulier les accroissements. Elle est dénie par :
v
um
uY n
n
G= t xi i .
i=1

i) Moyenne quadratique
La moyenne quadratique (Q2 ) est utilisée pour calculer la moyenne des carrés des
observations. m X
Q2 = fi x2i .
i=1

2.3.4 Caractéristiques de dispersion


a) Ecart absolu moyen
L'écart absolu moyen (eM ) est la moyenne arithmétique des écarts absolus à la
moyenne ou à la médiane.
Ecart absolu moyen à la médiane :
m m
1X X
eM (M e) = ni |xi − M e| = fi |xi − M e|.
n i=1 i=1

22 Année académique 2022-2023


CHAPITRE 2. ÉTUDE D'UNE SÉRIE STATISTIQUE À UNE VARIABLE Tchandao Mangamana E.

Ecart absolu moyen à la moyenne :


m m
1X X
eM (x̄) = ni |xi − x̄| = fi |xi − x̄|.
n i=1 i=1

b) Variance et écart-type
La variance V (X) se calcule par la formule
m m m
1X 2
X
2
X
V (X) = ni (xi − x̄) = fi (xi − x̄) = fi x2i − x̄2 .
n i=1 i=1 i=1

L'écart-type σX est la racine carrée de la variance :


p
σX = V (X).

Pour une population composée de sous-populations :


La variance d'une population P composée de p sous-populations Pj s'exprime en
fonction des variances Vj (X) et des moyennes x̄j des sous-populations.
p p p p
! !
X X 1X 1X
V (X) = fj Vj (X)+ fj x̄2j − x̄2 = nj Vj (X)+ nj x̄2j − x̄2 .
j=1 j=1
n j=1
n j=1

La variance totale est donc la somme de la moyenne arithmétique des variances et


de la variance des moyennes.
p
1 P
La moyenne des variances, nj Vj (X) est appelée la variance intragroupe.
n j=1
1 Pp
La variance des moyennes, nj x̄2j − x̄2 est appelée la variance intergroupe.
n j=1

c) Coecient de variation
C'est le rapport de la moyenne arithmétique à l'écart type, déni par :
σX
CV (X) = .

Le CV permet d'apprécier la représentativité de la moyenne par rapport à l'ensemble
des observations. Il donne une bonne idée du degré d'homogénéité d'une série. Il faut
qu'il soit le plus faible possible (< 0.15 en pratique).

d) Moment d'ordre k

m
1X
mk = ni xki .
n i=1

23 Année académique 2022-2023


CHAPITRE 2. ÉTUDE D'UNE SÉRIE STATISTIQUE À UNE VARIABLE Tchandao Mangamana E.

e) Moment centré d'ordre k

m
1X
µk = ni (xi − x̄)k .
n i=1

Exemple 2.8 Lors d'une journée, on a relevé les âges de 20 personnes venant se
présenter à l'examen théorique du permis de conduire : 19, 20, 20, 24, 37, 22, 58,
24, 23, 20, 19, 19, 21, 22, 20, 27, 33, 20, 22, 21.
(a) Déterminer la moyenne arithmétique, géométrique, harmonique et quadratique
de cette série.
(b) Déterminer la médiane, le mode, la variance, l'écart-type, le coecient de varia-
tion et l'écart inter-quartile de cette distribution d'âges.
(c) La distribution est-elle homogène ? Justier.

2.4 Étude d'une variable quantitative continue


2.4.1 Classe
a) Dénition des classes
Pour les variables continues, il est nécessaire que leurs valeurs soient regroupées en
classes avant tout traitement pour les besoins d'analyse. Le choix des classes répond
en général aux exigences suivantes :
 Elles ne doivent pas être trop nombreuses sinon il y aurait une diculté de
compréhension.
 Elles ne doivent pas être trop peu nombreuses car il y aurait perte d'infor-
mation.
 Il ne doit pas y avoir de classe vide.
Le nombre de classes à retenir dépend de la précision des mesures et de l'eectif de
la population étudiée.

b) Amplitude de classe
La valeur de l'amplitude d'une classe est calculée par la diérence entre la valeur de
la borne supérieure et celle de la borne inférieure. Il arrive que la borne inférieure de
la première classe et la borne supérieure de la dernière classe ne soient pas données.
Pour estimer les bornes absentes, nous disposons des possibilités suivantes :
 Rééchir à ce que pourrait être la valeur de cette borne.
 Donner à la première classe l'amplitude de la deuxième classe et à la dernière
l'amplitude de l'avant dernière.
Les classes peuvent avoir une amplitude variable ou constante. Par exemple, la va-
riable  âge  est souvent subdivisée en classes d'amplitude de 5 ans, 0 à moins de
5 ans, 5 ans à moins de 10 ans, etc. 0, 5, 10, etc. sont les extrémités des classes.

24 Année académique 2022-2023


CHAPITRE 2. ÉTUDE D'UNE SÉRIE STATISTIQUE À UNE VARIABLE Tchandao Mangamana E.

c) Centre de classe
Pour mener des calculs statistiques sur des séries classées, les classes sont réduites à
une seule donnée, à savoir, le centre de classe. Cela revient à considérer que tous les
individus peuvent être décrits par ce centre de classe. Par dénition, le centre ci de
xi + xi+1
la classe [xi ; xi+1 [ est donné par ci = .
2

2.4.2 Tableau statistique

Classe Centre ci Eectif ni Fréquence fi Pourcentage pi FCC Fi


[x1 ; x2 [ c1 n1 f1 p1 F1
.. .. .. .. .. ..
. . . . . .
ni ni i
P
[xi ; xi+1 [ ci ni fi = pi = × 100 Fi = fk
n n k=1
.. .. .. .. .. ..
. . . . . .
[xm ; xm+1 [ cm nm fm pm Fm = 1
m m m
Total
P P P
n= ni fi = 1 pi = 100
i=1 i=1 i=1

Exemple 2.9 Étude de la consommation aux 100 km de 20 voitures d'un nouveau


modèle : 6.11, 6.05, 5.98, 5.77, 5.18, 5.66, 5.28, 5.11, 5.58, 5.49, 5.62, 5.33, 5.55,
5.45, 5.76, 5.23, 5.57, 5.52, 5.8, 6.0. Faire le tableau statistique.

2.4.3 Représentation graphique


a) Histogramme
Il est destiné aux séries regroupées en classes. L'histogramme est une représentation
graphique de la distribution des eectifs ou des fréquences d'une variable statistique
continue. Il se construit en plaçant en abscisse l'amplitude des classes et en ordonnée
la fréquence (ou l'eectif) par unité d'amplitude. Soit la distribution ([xi ; xi+1 [, ni )
d'une variable statistique continue X . Pour chaque classe [xi ; xi+1 [, l'histogramme
associe un rectangle de largeur ai = xi+1 −xi (amplitude da la classe) et de hauteur
fi
hi = .
ai

b) Polygone des fréquences


Il lisse l'histogramme de façon à éliminer les ruptures qui dépendent du choix du
découpage en classe. Il respecte la compensation des aires ; la surface incluse par la
courbe est identique à celle de l'histogramme.

25 Année académique 2022-2023


CHAPITRE 2. ÉTUDE D'UNE SÉRIE STATISTIQUE À UNE VARIABLE Tchandao Mangamana E.

c) Courbe cumulative des fréquences


Elle représente graphiquement la fonction cumulative ou fonction de répartition
dénie par F (x) = Fi . En abscisse se trouvent les bornes supérieures des classes et
en ordonnée, les fréquences cumulés croissantes.

Exemple 2.10 Compléter le tableau statistique ci-après puis représenter l'histo-


gramme des fréquences, le polygone des fréquences et la courbe cumulative des fré-
quences croissantes.
Classe Eectif ni
[15 ;20[ 67
[20 ;30[ 1942
[30 ;35[ 1364
[35 ;45[ 2814
[45 ;55[ 2540
[55 ;70[ 710

2.4.4 Caractéristiques de tendance centrale


a) Mode
Pour une variable continue on dénit la classe modale. C'est celle dont la fréquence
par unité d'amplitude hi = fi /ai est la plus élevée. Après la dénition de la classe
modale, on déduit la valeur du mode par la formule suivante :
|∆i |
M o = xi + × ai
|∆i | + |∆i+1 |

avec M o le mode, xi la borne inférieure de la classe modale, ai l'amplitude de la


classe modale, ∆i = ni − ni−1 , diérence entre l'eectif de la classe modale et
l'eectif de la classe précédant la classe modale, ∆i+1 = ni+1 − ni , diérence entre
l'eectif de la classe suivant la classe modale et l'eectif de la classe modale.

b) Percentile
Pour déterminer le p-ième percentile P e dans le cas d'une variable continue, on
détermine d'abord l'intervalle auquel appartient ledit percentile : P e ∈ [xi ; xi+1 [
et F (P e) = p/100 = p̃ avec Fi−1 < p̃ ≤ Fi . Par la formule de l'interpolation
linéaire, on obtient alors :
p̃ − Fi−1 p̃ − Fi−1
P e = xi + ai × = xi + ai × .
Fi − Fi−1 fi

La médiane, M e, est le 50-ième percentile.

26 Année académique 2022-2023


CHAPITRE 2. ÉTUDE D'UNE SÉRIE STATISTIQUE À UNE VARIABLE Tchandao Mangamana E.

c) Moyennes arithmétique, harmonique, géométrique et quadratique


Toutes ces moyennes se calculent comme dans le cas d'une variable discrète, en y
remplaçant les xi par les centres de classe, i.e par les ci . Pour la moyenne arithmé-
tique par exemple, on a :
m m
X 1X
x̄ = fi ci = ni ci .
i=1
n i=1

Il en est de même pour la moyenne des sous-populations.

2.4.5 Caractéristiques de dispersion


a) Etendue
L'étendue ou amplitude de la distribution est la diérence entre la plus grande et la
plus petite valeur observée : E = xmax − xmin .

b) Ecart inter-quartile
L'écart inter-quartile se dénit par : IQ = Q3 − Q1 . L'intervalle inter-quartile,
[Q1 ; Q3 ], contient 50% des observations.

c) Rapport inter-quartile
Q3
Le rapport inter-quartile est le rapport . C'est un nombre sans dimension qui
Q1
donne une mesure relative des écarts entre les 25% des valeurs les plus basses et les
25% des valeurs les plus élevées.

d) Ecart inter-décile
L'écart inter-décile se dénit par : ID = D9 − D1 . L'intervalle inter-décile,
[D1 ; D9 ], contient 80% de l'eectif de la population, il élimine les 10% des valeurs
les plus élevées et les 10% des valeurs les plus basses.

e) Rapport inter-décile
D9
Le rapport inter-décile vaut . C'est un nombre sans dimension qui compare les
D1
valeurs extrêmes de la distribution en excluant les 10% des valeurs les plus basses
et les 10% des valeurs les plus élevées.

f) Coecient de dispersion
Le coecient de dispersion Cdis est déni par le rapport de l'écart inter-quartile à
la médiane ou encore le rapport de l'écart inter-décile à la médiane, i.e.
Q3 − Q1 D9 − D1
Cdis = ou Cdis = .
Me Me

27 Année académique 2022-2023


CHAPITRE 2. ÉTUDE D'UNE SÉRIE STATISTIQUE À UNE VARIABLE Tchandao Mangamana E.

g) Ecart absolu moyen


Ecart absolu moyen à la médiane :
m m
1X X
eM (M e) = ni |ci − M e| = fi |ci − M e|.
n i=1 i=1

Ecart absolu moyen à la moyenne :


m m
1X X
eM (x̄) = ni |ci − x̄| = fi |ci − x̄|.
n i=1 i=1

h) Variance et écart-type

m m m
1X 2
X
2
X
V (X) = ni (ci − x̄) = fi (ci − x̄) = fi c2i − x̄2
n i=1 i=1 i=1
et p
σX = V (X).

i) Coecient de variation

σX
CV (X) = .

j) Moment d'ordre k

m
1X
mk = ni cki .
n i=1

k) Moment centré d'ordre k

m
1X
µk = ni (ci − x̄)k .
n i=1

Exemple 2.11 On donne la série unidimensionnelle suivante, correspondant à la


répartition des entreprises du secteur automobile en fonction de leur chire d'aaire
en millions d'euros.
Chires d'aaires Nombre d'entreprises
moins de 0,25 137
[0,25 ;0,5[ 106
[0,5 ;1[ 112
[1 ;2,5[ 154
[2,5 ;5[ 100
[5 ;10[ 33

28 Année académique 2022-2023


CHAPITRE 2. ÉTUDE D'UNE SÉRIE STATISTIQUE À UNE VARIABLE Tchandao Mangamana E.

1. Calculer le chire d'aaire moyen et l'écart-type de la série.


2. Calculer le mode, les intervalles inter-quartile et inter-décile de la série.
3. Calculer la médiane et le coecient de dispersion de la distribution.
4. Calculer la proportion d'entreprises dont le chire d'aaire est supérieur à 3
millions d'euros.

2.5 Exercices
Exercice 2.13 On considère le brin d'ADN suivant : GGGAGTGTBTATTAABTB
BGAABTBBBAGBGBTAGBTBGBGBGGAGTGABBGAGBBTABATGAGGGTA
BTGTBAATAABGBATGTTABBAGAAGGA.
En considérant comme modalités les lettres A, B, G et T, faire le dépouillement,
donner le tableau statistique et faire les représentations graphiques adéquates.

Exercice 2.14 Le tableau suivant donne le nombre d'enfants par famille sur un
échantillon de 1000 familles.
xi 0 1 2 3 4 5 6 7 8
ni 162 240 297 208 62 16 8 5 2
1. Faire le tableau statistique correspondant.
2. Combien de familles ont au moins 3 enfants ?
3. Combien de familles ont au plus 3 enfants ?

Exercice 2.15 Les 33 élèves d'une classe ont obtenu les notes suivantes lors d'un
devoir
Note 2 4 5 8 10 11 12 14 15 18 20
Eectif 1 2 1 4 2 7 6 3 4 2 1
1. Déterminer l'étendue et le mode de cette série.
2. Calculer la moyenne de cette série.
3. Construire un tableau donnant les eectifs cumulés, les fréquences et les fréquences
cumulées.
4. Déterminer la médiane de cette série.
5. Quel est le nombre d'élèves ayant une notre strictement inférieure à 8 ?
6. Quel est le pourcentage d'élèves ayant une note supérieure ou égale à 10 ?

Exercice 2.16 On donne la distribution de 35 étudiants d'une lière selon leur


nombre de frères.
Nombre de frères 0 1 2 3 4 5
Nombre d'élèves 9 13 7 3 2 1
1.Établir le diagramme d'illustration de cette distribution.
2. Calculer les eectifs cumulés (croissants et décroissants) de cette série statistique.
3. Combien d'élèves ont :

29 Année académique 2022-2023


CHAPITRE 2. ÉTUDE D'UNE SÉRIE STATISTIQUE À UNE VARIABLE Tchandao Mangamana E.

a. 2 frères au moins ?
b. Moins de 2 frères ?
4. Représenter graphiquement les fréquences cumulées de cette distribution.
5. Déterminer la moyenne, la médiane, le mode, l'écart-type et le coecient de
variation de cette distribution. La distribution est-elle homogène ? Justier.
Exercice 2.17 La série suivante est constituée des observations d'une variable
discrète :
8 ; 5 ; 10 ; 1 ; 2 ; 7 ; 2 ; 2 ; 11 ; 1 ; 3 ; 7 ; 3 ; 3 ; 7 ; 2 ; 2 ; 8 ; 8 ; 5.
Calculer le 33è percentile (P33 ), le 9è décile (D9 ) ainsi que la moyenne arithmétique
(x̄) des valeurs de la série strictement comprises entre eux.
Exercice 2.18 Lors d'un examen de Statistique, 30 étudiants ont obtenu les notes
suivantes : 2 ; 3 ; 3 ; 4 ; 5 ; 6 ; 6 ; 7 ; 7 ; 7 ; 8 ; 8 ; 8 ; 8 ; 8 ; 9 ; 9 ; 9 ; 9 ; 9 ; 9 ; 10 ; 10 ; 11 ;
11 ; 11 ; 13 ; 13 ; 15 ; 16. Déterminer le 10e percentile ainsi que les quartiles Q1 , Q2
et Q3 .
Exercice 2.19 Les étudiants de la FaST ont pesé leurs sacs. Le sac le moins lourd
a une masse de 0, 9 kg , le plus lourd 7, 8 kg . La médiane est de 6 kg , le premier
quartile 2, 5 kg et le troisième quartile 7 kg . En moyenne, les sacs de cette faculté
pèsent 4, 2 kg . Compléter :
a) Au moins 25% des sacs de la classe pèsent entre ........ kg et ........ kg .
b) Au moins 50% des sacs pèsent ........ kg ou moins et au moins 50% des sacs
pèsent ........ kg ou plus.
c) Au moins 75% des sacs ont une masse comprise entre ...... kg et ...... kg .
d) Toutes les masses relevées sont entre ........ kg et ........ kg .
e) Si tous les sacs de la classe avaient la même masse, elle serait de ....... kg .
Exercice 2.20 Soit la distribution de 100 entreprises selon le nombre de tra-
vailleurs. On donne : X̄ = 46.9 et M e = 50.
Nombre de travailleurs (Xi ) 0-10 10-20 20-X1 X1 -X2 X2 -110 110-130
Nombre d'entreprises (ni ) 10 18 22 32 16 2

Déterminer la valeur de X1 , X2 et σX .
Exercice 2.21 La prise de taille d'un certain nombre d'étudiants de la FaST a
donné les résultats suivants (en centimètres) : 165, 158, 172, 171, 149, 153, 157, 160,
155, 162, 164, 158, 166, 170, 150, 165, 174, 175, 180, 164, 181, 171, 157, 167. On
regroupe ces mesures par classes d'amplitude 5 cm, la première étant [145 ;150[ et
la dernière [180 ;185[.
1. Dresser le tableau statistique en y incluant toutes les informations concernant les
classes (eectifs, centres, amplitudes, etc.)
2. Représenter graphiquement :
a. les fréquences ainsi que le polygone des fréquences ;
b. les fréquences cumulées croissantes et les fréquences cumulées décroissantes.
3. Calculer de deux manières diérentes la moyenne arithmétique et la variance de
cette série. Que constatez-vous ?

30 Année académique 2022-2023


CHAPITRE 2. ÉTUDE D'UNE SÉRIE STATISTIQUE À UNE VARIABLE Tchandao Mangamana E.

Exercice 2.22 Une organisation non gouvernementale cherche à appuyer les grou-
pements agricoles opérant dans la culture du café. Elle mène une enquête dans ce
sens et relève les quantités (en tonnes) de café produites en fonction des nance-
ments (en millions de francs CFA). Les résultats sont les suivants : 159, 178, 181,
158, 170, 169, 158, 190, 154, 181, 164, 150, 154, 157, 172, 163, 169, 178, 182, 187,
164, 165, 161, 167, 172, 152, 160, 166, 169, 180, 189, 173, 170, 150, 158, 164, 151,
165, 177, 159, 157, 172, 176, 179, 185, 168, 167, 157, 173, 157, 184, 179, 153, 160,
162, 158, 182, 180, 150, 171.
1. En considérant les classes suivantes, présenter le tableau de dépouillement :
[150 ;155[ , [155 ;165[ , [165 ;175[ , [175 ;180[ , [180 ;185[ , [185 ;195[.
2. Déterminer :
a. la quantité moyenne de café produite ;
b. la quantité de café fréquemment produite ;
c. la quantité de café médiane produite ;
d. la quantité de café telle que les 15 plus gros producteurs aient une production qui
lui est supérieure.
3. Déterminer la variation moyenne de production de café d'un groupement à un
autre.

Exercice 2.23 Au 31 décembre 1992, le directeur d'un grand magasin a enregistré


le montant des ventes et le nombre d'articles vendus, selon le tableau suivant, où
ni désigne le nombre d'articles vendus dont le prix exprimé en euros est situé dans
l'intervalle correspondant :
Classe de prix [50 ;150[ [150 ;250[ [250 ;350[ [350 ;450[ [450 ;550[
Eectif ni 80 160 720 1680 2720
Classe de prix [550 ;650[ [650 ;750[ [750 ;850[ [850 ;950[
Eectif ni 1760 640 160 80
1. Donner la valeur approchée de l'étendue.
2. Quelle est la classe modale ?
3. Construire l'histogramme des fréquences cumulées croissantes.
4. On fait l'hypothèse que les prix sont repartis uniformément dans chaque classe.
Construire une ligne brisée qui peut remplacer l'histogramme précédent.
5. Déterminer graphiquement puis par calcul une valeur approchée de la médiane de
cette série statistique.

31 Année académique 2022-2023


Chapitre 3
Étude d'une série statistique à deux
variables

3.1 Tableaux de contingence, distributions margi-


nales et conditionnelles
3.1.1 Tableau de contingence : croisement de deux variables
Il est courant d'étudier une population à l'aide de plusieurs caractères. Pour deux
variables X et Y , on a le tableau suivant, qui est appelé tableau de contingence.
HH
Y
H y1 ··· yj ··· yp E. marg. de X
X HH
H
p
P
x1 n11 ··· n1j ··· n1p n1· = n1j
j=1
.. .. .. .. .. .. ..
. . . . . . .
p
P
xi ni1 ··· nij ··· nip ni· = nij
j=1
.. .. .. .. .. .. ..
. . . . . . .
p
P
xm nm1 ··· nmj ··· nmp nm· = nmj
j=1
E. m m m m p
marg.
P P P P P
n·1 = ni1 ··· n·j = nij ··· n·p = nip n= ni· = n·j
de Y i=1 i=1 i=1 i=1 j=1

L'eectif nij de la classe (i, j) est le nombre d'individus de la population qui pré-
sentent simultanément la modalité xi de la variable X et la modalité yj de la
variable Y . La distribution s'écrit (xi , yj , nij ). Tous les individus présentant ces
deux modalités sont comme équivalents. Le total des lignes et le total des colonnes
dénissent les distributions marginales. Une ligne ou une colonne constitue une dis-
tribution conditionnelle.

32
CHAPITRE 3. ÉTUDE D'UNE SÉRIE STATISTIQUE À DEUX VARIABLES Tchandao Mangamana E.

3.1.2 Fréquence conjointe


On appelle fréquence conjointe de xi et yj , la proportion fij d'individus qui pré-
sentent simultanément les modalités xi et yj . Elle s'obtient par :
nij
fij = .
n

3.1.3 Distribution marginale : prole ligne et prole colonne


La série (xi , ni· ) dénit le prole ligne. La fréquence marginale des individus pré-
sentant la modalité xi est
p
X ni·
fi· = fij = .
j=1
n

De même, la série (yj , n·j ) constitue le prole colonne. La fréquence marginale des
individus présentant la modalité yj est
m
X n·j
f·j = fij = .
i=1
n

p
m X m p
On a la relation suivante : f·j = 1.
X X X
fij = fi· =
i=1 j=1 i=1 j=1

3.1.4 Distribution conditionnelle


La fréquence conditionnelle de la modalité xi sachant la modalité yj est
nij
f (xi | yj ) = .
n·j

La fréquence conditionnelle de la modalité yj sachant la modalité xi est


nij
f (yj | xi ) = .
ni·
La relation entre fréquences marginales et fréquences conditionnelles est

fij = f (xi | yj ) × f·j = f (yj | xi ) × fi·

3.2 Caractéristiques marginales et conditionnelles


Dans toute la suite de ce chapitre, X et Y désigneront des caractères quantitatifs.

33 Année académique 2022-2023


CHAPITRE 3. ÉTUDE D'UNE SÉRIE STATISTIQUE À DEUX VARIABLES Tchandao Mangamana E.

3.2.1 Caractéristiques marginales


a) Pour la variable X
m m
1X
Moyenne marginale : x̄ = fi· xi .
X
ni· xi =
n i=1 i=1
m m
1X
Variance marginale : V (X) = fi· (xi − x̄)2 .
2
X
2
σX = ni· (xi − x̄) =
n i=1 i=1

b) Pour la variable Y
p p
1X
Moyenne marginale : ȳ = f·j yj .
X
n·j yj =
n j=1 j=1
p p
1X
Variance marginale : V (Y ) = f·j (yj − ȳ)2 .
2
X
σY2 = n·j (yj − ȳ) =
n j=1 j=1

3.2.2 Caractéristiques conditionnelles


a) Pour la variable X
m m
1 X
Moyenne conditionnelle : x̄j = f (xi | yj )xi .
X
nij xi =
n·j i=1 i=1
m m
1 X
Variance conditionnelle : Vj (X) = f (xi | yj ) (xi − x̄j )2 .
2
X
nij (xi − x̄j ) =
n·j i=1 i=1

b) Pour la variable Y
p p
1 X
Moyenne conditionnelle : ȳi = f (yj | xi )yj .
X
nij yj =
ni· j=1 j=1
p p
1 X
Variance conditionnelle : Vi (Y ) = f (yj | xi ) (yj − ȳi )2 .
2
X
nij (yj − ȳi ) =
ni· j=1 j=1

Exemple 3.1 Sur une population de 50 individus, on a observé deux caractères :


l'un ayant pour modalités A et B , l'autre ayant pour modalités X et Y . On sait que
la fréquence de la modalité X est 0.7 et on connaît les fréquences conditionnelles
f (A|X) = 0.2 et f (B|Y ) = 0.8. Remplir le tableau de contingence.

3.3 Ajustement linéaire


L'ajustement linéaire consiste à trouver une relation de la forme Y = aX + b
entre la variable X appelée variable explicative ou encore variable indépendante et

34 Année académique 2022-2023


CHAPITRE 3. ÉTUDE D'UNE SÉRIE STATISTIQUE À DEUX VARIABLES Tchandao Mangamana E.

la variable Y appelée variable expliquée ou encore variable dépendante. La représen-


tation graphique de Y en fonction de X , ou plus précisément du nuage des points
(xi , yi ) permet d'avoir une idée sur le type de relation entre X et Y .

3.3.1 Covariance entre deux variables


La covariance entre la variable X et la variable Y est le nombre noté cov(X, Y ) ou
1 P
n
encore σXY et déni par cov(X, Y ) = σXY = nk (xk − x̄)(yk − ȳ) dans
n k=1
m p
1 XX
le cas de la série (xk , yk , nk ) et par cov(X, Y ) = σXY = nij (xi −
n i=1 j=1
x̄)(yj − ȳ) dans le cas de la série (xi , yj , nij ).

3.3.2 Méthode des moindres carrées ordinaires


Cette méthode consiste à déterminer la fonction ane y = ax + b telle que les
carrés des erreurs entre les valeurs observées yi et les valeurs estimées ŷi = axi + b
soient les plus petites possibles. En clair, il s'agit de trouver les valeurs de a et b
n n
qui minimisent la fonction g(a, b) = (yi − axi − b)2 .
X X
ε2i =
i=1 i=1

On démontre que les valeurs a et b qui minimisent la fonction de deux variables


g(a, b) sont :
σXY
a= 2 et b = ȳ − ax̄.
σX
La droite d'équation y = ax + b pour les valeurs de a et b précédemment trouvées
s'appelle la droite de régression linéaire de Y sur X et se note DY /X .
De la même façon, on dénit la droite de régression linéaire de X sur Y notée DX/Y
et ayant pour équation x = a0 y + b0 , avec :
σXY
a0 = et b0 = x̄ − a0 ȳ.
σY2

3.3.3 Coecient de corrélation linéaire


Le coecient de corrélation linéaire entre la variable X et la variable Y est le nombre
σXY
r = ρXY = .
σX σY

La corrélation linéaire entre X et Y est d'autant plus importante que D = r2


(appelé coecient de détermination) est proche de 1.

3.3.4 Propriétés importantes



1. ρXY = aa0 .

35 Année académique 2022-2023


CHAPITRE 3. ÉTUDE D'UNE SÉRIE STATISTIQUE À DEUX VARIABLES Tchandao Mangamana E.

2. La variance de Y se décompose de la façon suivante (formule de décomposi-


tion de la variance) :

Var(Y ) = Var(Ŷ ) + Var(Y − Ŷ )

avec Var(Y ) = variance totale, Var(Ŷ ) = variance expliquée et Var(Y −


Ŷ ) = variance résiduelle. La proportion de variance expliquée par le modèle
Var(Ŷ )
linéaire est R2 = .
Var(Y )
3. R2 = r2 .
On note que r indique le signe de la liaison et le R2 explicite la proportion de la
variance qui pourrait être expliquée si une relation entre les deux variables existait.
Les uctuations de la variable dépendante sont expliquées et non causées par les
mouvements de la variable indépendante.

Exemple 3.2 On considère la série suivante :


X 1 2 3 4 5 6
Y 2,5 3 4 5 5,5 7
(a) Déterminer l'ajustement linéaire de Y sur X par la méthode des moindres car-
rées ordinaires. (b) Donner la décomposition de la variance totale Var(Y ). (c) Re-
présenter le nuage de points ainsi que la droite de régression obtenue.

3.3.5 Ajustement linéaire par la méthode de Mayer


Cette méthode est empirique et ne se repose sur aucun critère d'erreur à minimiser.
Elle peut s'avérer ecace en présence de valeurs aberrantes.
Principe : La distribution est partagée en deux groupes comportant un nombre
égal de données (si n est pair) et un nombre égal de données à l'unité près (si n
est impair). On détermine dans chaque groupe le centre de gravité ou point moyen.
Soient G1 (xI , yI ) et G2 (xII , yII ) les centres de gravité des deux groupes :
m1 m1 m2 m2
1 X 1 X 1 X 1 X
xI = ni xi ; yI = ni yi ; xII = ni xi et yII = ni yi ;
n1 i=1
n1 i=1
n2 i=1
n2 i=1

m
P1 m
P2
avec n1 = ni , n2 = ni et n = n1 + n2 .
i=1 i=1

La droite d'ajustement linéaire de Y sur X par la méthode de Mayer est la droite


(G1 G2 ) d'équation y = ax + b avec :
yI − yII
a= , et b = yI − axI = yII − axII .
xI − xII

Exemple 3.3 Reprendre l'exercice précédent pour la méthode de Mayer.

36 Année académique 2022-2023


CHAPITRE 3. ÉTUDE D'UNE SÉRIE STATISTIQUE À DEUX VARIABLES Tchandao Mangamana E.

3.4 Exercices
Exercice 3.24 On étudie un échantillon de taille n = 100 sur Plequel ont été
mesurés deux caractères X et Y , on a observé les résultats suivants : i=1 xi = 800,
100

i=1 yi = 1200, i=1 xi = 7200, i=1 yi = 16000 et i=1 xi yi = 10200.


P100 P100 2 P100 2 P100
Calculer la covariance de X et Y , le coecient de corrélation entre X et Y , la
droite de régression linéaire de Y sur X et la variance résiduelle.

Exercice 3.25 Le PDG d'une entreprise fait analyser la production d'un produit
sur 10 ans. Nous avons le tableau suivant :
Années (X ) 1 2 3 4 5 6 7 8 9 10
Production (Y ) 49 48 50 50 56 57 62 65 65 68
Représenter graphiquement ces données puis déterminer la droite de régression de
Y sur X à partir de la méthode de Mayer et des MCO.

Exercice 3.26 L'indice moyen d'un salaire a évolué de la façon suivante :

Année 1 2 3 4 5 6 7
Indice 165 176 193 202 222 245 253

1. Représenter cette série statistique par un nuage de points.


2. En utilisant la méthode des moindres carrées, calculer l'équation de la droite
représentant l'indice en fonction de l'année.
3. Comment pourrait-on prévoir l'indice à l'année 9 ?

Exercice 3.27 Le tableau suivant donne la distance de freinage en Km (Y) d'un


véhicule automobile en fonction de sa vitesse en Km/h (X).
X 40 50 60 70 80 90 100 110 120
Y 7 11 17 23 31 39 47 57 71
1. Déterminer l'équation de la droite de régression de Y sur X par la méthode des
moindres carrés et en déduire une estimation de la distance de freinage de ce véhicule
lorsqu'il roule à 130 Km/h.
2. Calculer le coecient de corrélation linéaire entre la variable et la variable.
3. Représenter le nuage de points ainsi que la droite de régression obtenue.
4. Calculer la variance expliquée de ainsi que le coecient de détermination. Que
peut-on dire de ce modèle ?

Exercice 3.28 Le tableau suivant indique, pour un pays ctif et pour chaque
année donnée, le nombre de milliers de demandes d'emploi non satisfaites.

Année 1986 1988 1990 1992 1994 1996 1998


Rang de l'année : x 0 1 2 3 4 5 6
Nombre de chômeurs : y 395 374 p 334 312 q 266

37 Année académique 2022-2023


CHAPITRE 3. ÉTUDE D'UNE SÉRIE STATISTIQUE À DEUX VARIABLES Tchandao Mangamana E.

Le nombre de milliers de chômeurs constatés en 1990 et en 1996 ont été égarés. Ces
valeurs avaient permis, par la méthode des moindres carrés ordinaires, d'obtenir :
y = −22x + 397 comme équation de la droite d'ajustement de y en x.
1.a. A combien peut-on estimer le nombre de chômeurs en 1995 ?
b. A partir de quelle année, si l'évolution observée reste semblable au cours des
années à venir, y aura-t-il deux fois moins de chômeurs qu'en 1986 ?
2.a. Calculer la moyenne x de x et la variance σx2 de x.
b. Exprimer en fonction de p et q , la moyenne y de y et la covariance σxy de x et
y.
c. Retrouver alors les valeurs de p et q .

Exercice 3.29 Lors d'une étude sur la dynamique des populations de la tenthrède
du pin (Diprion fruterarum), la capacité de reproduction (nombre Y d'ovocytes par
cocon) des individus de cet insecte a été étudiée en fonction de la longueur du cocon
(X en mm). On obtient le tableau ci-dessous.
HH
Y
H [20 ; 40[ [40 ; 60[ [60 ; 80[ [80 ; 100[
X H
HH
[7 ; 7,5[ 8 2 0 0
[7,5 ; 8[ 11 15 1 1
[8 ; 8,5[ 0 22 8 0
[8,5 ; 9[ 1 9 10 0
[9 ; 9,5[ 0 12 19 11
[9,5 ; 10[ 0 0 10 20

1. Calculer la moyenne X , Y et l'écart type σX , σY de X et Y .


2. Calculer la covariance σXY et le coecient de corrélation r de X et Y .
3. Déterminer l'équation de la droite de régression de Y en X .

38 Année académique 2022-2023


Chapitre 4
Notions de base sur la statistique
inférentielle

Dans ce chapitre nous donnons des notions de base sur l'échantillonnage, l'estimation
et les tests d'hypothèses.

4.1 Echantillonnage
L'échantillonnage est l'étude des liaisons existant entre une population et les échan-
tillons de cette population, prélevés par sondage. Les méthodes permettant de réa-
liser un échantillon de bonne qualité (qui ressemble à la population dont il est issu)
sont étudiées en théorie de l'échantillonnage.

4.1.1 Méthodes d'échantillonnage


Ce sont des méthodes permettant de réaliser un sondage (de prélever un échantillon
de données) au sein d'une population, de manière à reproduire un échantillon aussi
représentatif que possible de cette population. Les méthodes empiriques sont les plus
utilisées par les instituts de sondage. Leur précision ne peut pas être calculée et leur
réussite dépend de l'expertise des enquêteurs. Il s'agit de :
1. l'échantillonnage sur la base du jugement : échantillon prélevé à partir
d'avis d'experts, qui connaissent bien la population et sont capable de dire
quelles sont les entités représentatives.
2. l'échantillonnage par la méthode des quotas : Echantillon prélevé li-
brement à condition de respecter une composition donnée à l'avance.
Les méthodes aléatoires quant à elles reposent sur le tirage au hasard d'échantillons
et sur le calcul des probabilités. Il s'agit de :
1. l'échantillonnage aléatoire simple : On prélève dans la population, des
individus au hasard, sans remise : tous les individus ont la même probabilité
d'être prélevés, et ils le sont indépendamment les uns des autres.
2. l'échantillonnage aléatoire stratié : Suppose que la population soit stra-
tiée, i.e. constituée de sous-populations homogènes, les strates. (ex : stra-
tication par tranche d'âge). Dans chaque strate, on fait un échantillonnage

39
CHAPITRE 4. NOTIONS DE BASE SUR LA STATISTIQUE INFÉRENTIELLE Tchandao Mangamana E.

aléatoire simple, de taille proportionnelle à la taille de strate dans la popula-


tion (échantillon représentatif). Les individus de la population n'ont pas tous
la même probabilité d'être tirés. Ceci nécessite une homogénéité des strates
et augmente la précision des estimations.
3. l'échantillonnage par grappe : on tire au hasard des grappes ou familles
d'individus, et on examine tous les individus de la grappe (ex : on tire des
immeubles puis on y interroge tous les habitants). La méthode est d'autant
meilleure que les grappes se ressemblent et que les individus d'une même
grappe sont diérents, contrairement aux strates.
Nous considérons ici juste le cadre d'un échantillonnage aléatoire simple.

4.1.2 Echantillonnage aléatoire simple


Modélisation
On considère une variable aléatoire X et on s'intéresse à un tirage aléatoire de n
individus. On associe au premier individu tiré une variable aléatoire X1 de même loi
que X ; au deuxième individu on associe une v.a X2 et ainsi de suite jusqu'à l'indi-
vidu n. Le n-uplet (X1 , X2 , . . . , Xn ), où Xi est la valeur de X pour le ie individu
tiré, est un vecteur de v.a. i.i.d. de même loi que X . Un tirage correspond à une seule
réalisation de celui-ci, à savoir (x1 , x2 , . . . , xn ). Le n-uplet (X1 , X2 , . . . , Xn ) est
appelé l'échantillon aléatoire.

Quelques statistiques classiques


En statistique inférentielle, les indicateurs usuels de la statistique descriptive de-
viennent des statistiques de l'échantillon aléatoire. On appelle statistique toute
variable aléatoire, dénie comme une fonction de l'échantillon aléatoire :

S = f (X1 , X2 , . . . , Xn ).

Lorsqu'une réalisation de (X1 , X2 , . . . , Xn ) est (x1 , x2 , . . . , xn ), la réalisation de


S vaut
s = f (x1 , x2 , . . . , xn ).
Comme exemples nous avons la fonction de répartition empirique, la moyenne em-
pirique, la variance empirique, la covariance empirique, les moments empiriques,
etc.

4.1.3 Distribution d'échantillonage


On s'intéresse à la caractéristique X d'une population. On pose E(X) = m et
V (X) = σ 2 .

40 Année académique 2022-2023


CHAPITRE 4. NOTIONS DE BASE SUR LA STATISTIQUE INFÉRENTIELLE Tchandao Mangamana E.

Moyenne empirique
Pour l'échantillon aléatoire X1 , X2 , . . . , Xn , i.i.d de X , la moyenne empirique est
dénie par
n
1X
Xn = Xi .
n i=1

D'après le théorème central limite (TCL),


 pour
 n susamment grand, X n suit
approximativement la loi normale N m, n .
σ2

Pourcentage
Considérons une population dont un pourcentage p d'éléments possèdent une cer-
taine propriété. Soit F la v.a qui, à tout échantillon aléatoire prélevé d'eectif n xé,
associe le pourcentage des éléments de cet échantillon possédant cette propriété. Pour
n susamment grand, F suit approximativement la loi normale N p, n p(1−p)
.

4.2 Estimation
Nous allons ici donner de petites notions sur l'estimation ponctuelle et l'estimation
par intervalle de conance.

4.2.1 Estimation ponctuelle


Une estimation ponctuelle d'une caractéristique de la population est une valeur
(nombre réel) de la caractéristique considérée, calculée à partir de l'échantillon dis-
ponible, valeur que l'on peut représenter par exemple sur un axe. Nous donnons ici
l'exemple de la moyenne et du pourcentage.

Moyenne
D'une manière générale, on choisit la moyenne arithmétique x d'un échantillon pré-
levé au hasard dans une population, comme estimation ponctuelle de la moyenne
inconnue m de cette population.

Pourcentage
D'une manière générale, on choisit le pourcentage f des éléments possédant une
certaine propriété dans un échantillon prélevé au hasard dans une population, comme
estimation ponctuelle du pourcentage inconnu p des éléments de cette population
ayant cette même propriété.

Autres exemples
D'autres exemples d'estimation ponctuelle sont donnés dans les chapitres précédents.
C'est le cas de la variance, l'écart-type, les moments, etc.

41 Année académique 2022-2023


CHAPITRE 4. NOTIONS DE BASE SUR LA STATISTIQUE INFÉRENTIELLE Tchandao Mangamana E.

4.2.2 Estimation par intervalle de conance


D'un échantillon à l'autre, l'estimation ponctuelle va diérer. Pour cela, l'on cherche
une bande ou intervalle qui contiendrait le paramètre de la population tout en me-
surant les risques de se tromper. Pour rester dans la logique de la section précédente
nous allons également donner juste l'exemple de la moyenne et du pourcentage.

Moyenne
 
On rappelle que d'après le TCL, X n suit la loi N m, . Ceci étant, l'intervalle
σ2
n
de conance de niveau 95% de la moyenne m, pour σ connue, est
2

 
1, 96σ 1.96σ
IC0,95 (m) = X n − √ ; X n + √ .
n n

Pourcentage
L'intervalle de conance de niveau 95% d'un pourcentage p de la population ayant
une certaine propriété est
" p p #
1, 96 F (1 − F ) 1, 96 F (1 − F )
IC0,95 (p) = F − √ ;F + √ ,
n n

où F est décrite dans le dernier paragraphe de la section 4.1.3.

4.3 Tests d'hypothèses


Soit X une caractéristique dont la distribution dépend d'un paramètre θ inconnu.
Faire un test de la valeur du paramètre θ consiste à prendre une décision concernant
la valeur de ce paramètre à partir d'un sondage de la population. Un test, pour ainsi
dire, est un procédé d'inférence permettant de contrôler une hypothèse à partir de
l'étude d'un ou de plusieurs échantillons aléatoires.

Nous noterons par H0 l'hypothèse nulle et par H1 l'hypothèse alternative. On ap-


pelle test unilatéral un test pour lequel l'hypothèse alternative se compose d'une
seule partie. Un test bilatéral est un test pour lequel l'hypothèse alternative se dé-
compose en deux parties. Par expemple si l'on s'intéresse à l'hypothèse H0 : m = 5,
alors le test de H0 : m = 5 contre H1 : m 6= 5 est bilatéral alors que le test de
H0 : m = 5 contre H1 : m < 5 est unilatéral.

4.3.1 Risques d'erreur et puissance d'un test


Risque d'erreur de première espèce : C'est la probabilité de rejeter H0 alors
qu'elle est vraie. On la note souvent α.
Risque d'erreur de seconde espèce : C'est la probabilité de ne pas rejeter H0
alors qu'elle est fausse. On la note souvent β .

42 Année académique 2022-2023


CHAPITRE 4. NOTIONS DE BASE SUR LA STATISTIQUE INFÉRENTIELLE Tchandao Mangamana E.

Puissance d'un test : C'est la probabilité de rejeter H0 alors qu'elle est fausse.
Sa valeur est 1 − β .

4.3.2 Méthodologie d'un test


En général, les questions faisant intervenir un test de validité d'hypothèse peuvent
être résolues en adoptant le plan suivant :
 Dénir H0 et H1 ;
 Déterminer la région critique Rc à un seuil α donné ;
 Enoncer la règle de décision : condition de rejet ou de non rejet de H0 ;
 Calculer la valeur du paramètre considéré à partir de l'échantillon disponible ;
 Appliquer la règle de décision.

4.3.3 Quelques exemples


Nous allons à présent illustrer la procédure que nous venons de décrire.

Comparaison de la moyenne m d'une population à un nombre m0 xé,


pour la variance σ 2 connue et α = 0.05
On dispose d'un échantillon x1 , x2 , ..., xn et on se place dans le cas d'un test bila-
téral.
 H0 : m = m0 et H1 i: m 6= m0 . h i h
 Région critique Rc = −∞; m0 − n ∪ m0 + n ; +∞ .
1,96σ

1,96σ

 Règle de décision : pour un échantillon aléatoire de taille n prélevé, calculer


la moyenne arithmétique x ; si x ∈ Rc , rejeter H0 , sinon, ne pas rejeter H0 .
 Calculer x pour l'échantillon x1 , x2 , ..., xn .
 Appliquer la règle de décision : il sut de voir si x ∈ Rc .

Comparaison des moyennes mA et mB de deux populations A et B , pour


les variances σA
2
et σB
2
connues et α = 0.05
On dispose ici d'un échantillon a1 , a2 , ..., an1 de A et d'un échantillon b1 , b2 , ..., bn2
de B ; on se place toujours dans le cas d'un test bilatéral.
 H0 : mA = mB et H1 : mA 6= mB .
σ2 σ2
 Région critique : on pose D = An1 − An2 et on a σD 2
= nA1 + nB2 , et donc
la région critique est Rc = ]−∞; −1, 96σD [ ∪ ]1, 96σD ; +∞[.
 Règle de décision : pour deux échantillons aléatoires de tailles n1 et n2 pré-
levés, calculer la diérence entre les moyennes arithmétiques (la noter d) ; si
d ∈ Rc , rejeter H0 , sinon, ne pas rejeter H0 .
 Calculer d = an1 − bn2 .
 Appliquer la règle de décision : il sut de voir si d ∈ Rc .

43 Année académique 2022-2023


CHAPITRE 4. NOTIONS DE BASE SUR LA STATISTIQUE INFÉRENTIELLE Tchandao Mangamana E.

4.4 Exercices
Exercice 4.30 Une entreprise utilise des camions pour transporter sa production.
Elle dispose de 100 camions. Elle repère sur un échantillon de 30 jours choisis au
hasard le nombre de camions en panne. Voici les résultats : 5, 5, 6, 4, 6, 6, 8, 3, 5,
5, 5, 4, 3, 6, 5, 6, 4, 7, 6, 6, 5, 4, 3, 6, 5, 4, 5, 4, 5, 5.
1. Déterminer une estimation ponctuelle de la moyenne m et de la variance σ 2 du
nombre de camions en panne chaque jour pour la population correspondant aux
jours ouvrables de l'année.
2. En prenant l'estimation ponctuelle de la variance pour σ 2 , déterminer un intervalle
de conance de la moyenne m de la population avec le coecient de conance 95%.
3. Au garage où sont stationnés les camions, le responsable arme qu'il y a en
moyenne 6 camions en panne par jour. Un des chaueurs prétend que c'est plutôt 5.
Se basant sur l'échantillon donné plus haut, construire un test permettant de rejeter
ou non, au seuil de signication de 5% et au vu des résultats sur 30 jours, le point
de vue du responsable. Le point de vue du chaueur est-il rejeté au même seuil de
signication ?

Exercice 4.31 On a eectué 90 mesures de concentration d'une solution de uo-


resceïne. On a observé une moyenne empirique de 4.38 mg/l et un écart-type empi-
rique de 0.08 mg/l. Donner un intervalle de conance pour la concentration réelle
de la solution, au niveau de conance 0.95.

Exercice 4.32 On administre des somnifères à deux groupes de malades A et B


comprenant 50 et 100 individus. Le groupe A reçoit un nouveau somnifère, le groupe
B reçoit l'ancien. Les patients du groupe A ont dormi 7.82 heures en moyenne avec
un écart-type de 0.24 h ; ceux du groupe B ont dormi 6.75 heures en moyenne avec
un écart-type de 0.30 h.
1. Calculer l'intervalle de conance pour le nombre moyen d'heures de sommeil d'un
patient recevant le nouveau somnifère, au niveau de conance 0.95.
2. Même question pour un patient recevant l'ancien somnifère.
3. Pensez-vous que le nouveau somnifère soit plus ecace que l'ancien ?

44 Année académique 2022-2023

Vous aimerez peut-être aussi