Vous êtes sur la page 1sur 53

REPUBLIC OF CAMEROON

REPUBLIQUE DU CAMEROUN
Peace  Work - Fatherland
Paix  Travail  Patrie
MINISTRY OF HIGHER EDUCATION
MINISTERE DE L'ENSEIGNEMENT SUPERIEUR
THE UNIVERSITY OF D`EBOLOWA
UNIVERSITE D`EBOLOWA
HIGHER INSTITUTE OF
ECOLE SUPERIEURE DE TRANSPORT, DE
TRANSPORT, LOGISTICS AND
LOGISTIQUE ET DE COMMERCE
COMMERCE
DEPARTEMENT DES ENSEIGNEMENTS
DEPARTMENT OF GENERAL
GENERAUX
TEACHINGS
BP. 22 AMBAM
PO Box : 22 AMBAM
Tél. : (+237) 222 482 412
Phone : (+237) 222 482 412
E-Mail : estlc@estlc-ueb.cm
E-Mail : estlc@estlc-ueb.cm
Site web : www.estlc-ueb.cm
Site web : www.estlc-ueb.cm

GLTCO 122 :
Probabilités et Statistique Descriptive

Équipe pédagogique :

1. Dr. DIBOMA Benjamin (Chargé de Cours)

2. Dr. SAPNKEN Flavian (Chargé de Cours)


✠ Table des matières ✠

1 Analyse combinatoire 2
1.1 Arrangements . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.1.1 Arrangements avec répétitions . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.1.2 Arrangements sans répétitions . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.2 Permutations . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2.1 Permutations sans répétition . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2.2 Permutations avec répétitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.3 Combinaisons . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.3.1 Combinaisons sans remise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
1.3.2 Combinaisons avec remise . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.3.3 Quelques proprités des combinaisons . . . . . . . . . . . . . . . . . . . . . . . . 6

2 Probabilités 7
2.1 Voabulaire important dans la théorie des probabilités . . . . . . . . . . . . . . . . . . . 8
2.1.1 Espace des possibles . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.1.2 Evènements . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
2.2 Calcul des probabilités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
2.2.1 Dénition et propriétés d'une probabilité . . . . . . . . . . . . . . . . . . . . . 9
2.2.2 Probabilités Uniformes ou combinatoires . . . . . . . . . . . . . . . . . . . . . . 11
2.2.3 Probabilité conditionnelle . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12

3 Variables aléatoires discrètes 15


3.1 Les éléments essentiels d'une variable aléatoire . . . . . . . . . . . . . . . . . . . . . . 15
3.1.1 Loi de probabilité d'une variable aléatoire . . . . . . . . . . . . . . . . . . . . . 16
3.1.2 Fonction de répartition d'une variable aléatoire . . . . . . . . . . . . . . . . . . 17
3.1.3 Espérance mathématique d'une variable aléatoire . . . . . . . . . . . . . . . . . 17
3.1.4 Variance d'une variable aléatoire . . . . . . . . . . . . . . . . . . . . . . . . . . 18

ESTLC/GLTCO 122 1 Probabilités et statistique descriptive/semestre 1


Table des matières

3.2 Quelques Lois discrètes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19


3.2.1 La loi Binomiale . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
3.2.2 La loi Loi géométrique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 20

4 Statistique descriptive 21
4.1 Vocabulaire Statistique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 21
4.2 Etude des variables quantitatives discrètes . . . . . . . . . . . . . . . . . . . . . . . . . 22
4.2.1 Regroupement des données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 22
4.2.2 Représentation graphique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
4.2.3 Caractéristiques de Position . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
4.2.4 Caractéristiques de dispersion . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
4.3 Etude des variables quantitatives continues . . . . . . . . . . . . . . . . . . . . . . . . 25
4.3.1 Organisation des données . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
4.3.2 Représentation graphique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
4.3.3 Caractéristiques de position . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
4.3.4 Caractéristiques de dispersion . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
4.4 Introduction à la statistique bivariée . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
4.4.1 Deux variables quantitatives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30
4.4.2 Deux variables qualitatives . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
4.5 Analyse Combinatoire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
4.6 Probabilités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
4.7 Variables Aléatoires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
4.8 Statistique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
4.9 Analyse Combinatoire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
4.10 Probabilités . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
4.11 Variables aléatoires . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
4.12 Statistique . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49

ESTLC/GLTCO 122 2 Probabilités et statistique descriptive/semestre 1


⋆ ⋆ Chapitre Un ⋆ ⋆

Analyse combinatoire

Introduction
L'analyse combinatoire est une branche des mathématiques qui étudie comment compter les
objets. Elle fournit des méthodes de dénombrements particulièrement utiles en théorie des probabilités.
Les probabilités dites combinatoires utilisent constamment les formules de l'analyse combinatoire
développées dans ce chapitre.

1.1 Arrangements
Dénition 1.1.1. Etant donné un ensemble E de n objets, on appelle arrangement de p objets de
E toute suite ordonnée de p objets pris parmi les n objets.
Remarque 1.1.1. Deux arrangements de p objets sont donc distincts s'ils dièrent par la nature
des objets qui les composent ou par leur ordre dans la suite.

Exemple 1.1.1. Le code Orange Money est constitué d'un enchaînement de 5 chires. Il existe donc

diérents arrangements possibles de 5 chires parmi 10 ( de 0 à 9, cela fait 10 chires).

Exemple 1.1.2. Le nombre de mots de 5 lettres (avec ou sans signication) formés avec les 26 lettres

de l'alphabet français correspond au nombre d'arrangements possibles avec p=5 et n = 26.

Exemple 1.1.3. Le tiercé dans l'ordre lors d'une course de 20 chevaux constitue un des arrangements
possibles avec p=3 et n = 20.

Dans les exemples précédents, l'ordre des éléments dans la suite est essentiel. Ainsi pour le deuxième
exemple, le mot NICHE est diérent du mot CHIEN, pourtant ils utilisent tous les deux les mêmes
lettres. Il s'agit donc là de deux arrangements qui dièrent par leur ordre dans la suite d'objets et non
pas par la nature des objets qui là compose.
De plus, un chire ( Pour le cas du premier exemple) ou une lettre de l'alphabet ( pour le cas
du deuxième exemple) peut se retrouver plusieurs fois alors que dans le troisième exemple, les trois

ESTLC/GLTCO 122 3 Probabilités et statistique descriptive/semestre 1


1.1. Arrangements

chevaux à l'arrivée sont forcément diérents. Il faut donc distinguer le nombre d'arrangements avec
répétition et le nombre d'arrangements sans répétition (arrangements au sens strict).

1.1.1. Arrangements avec répétitions


Lorsqu'un objet peut être observé plusieurs fois dans un arrangement, On parle d'arrangement
avec répétition ou de p-liste ou alors de n-uplet.

Propriétés 1.1.1. Le nombre d'arrangement avec répétition de p objets pris parmi n, est alors : np
avec p ≥ n.

Explication :
Il y a n choix disponibles pour tirer le premier objet (que l'on range à la première position de la
séquence).
Pour le second objet tiré, il existe également n possibilités d'arrangements car le premier objet fait
de nouveau parti des n objets. On parle parfois de tirage avec remise.
Ainsi pour les p objets tirés, il y aura n × n × n × n × ... × n(pfois) = np arrangements possibles.

Exemple 1.1.4. Dans le cas des codes OM, le nombre de codes à 5 chires que l'on peut former avec
5
les 10 chires disponibles est : 10 = 100000 codes.

Remarque 1.1.2. Dans une p-liste, on peut avoir p >n . En eet, même si l'on dispose d'un seul

chire (1 par exemple), on peut former un code OM (qui serait naturellement 11111).

1.1.2. Arrangements sans répétitions


Lorsque chaque objet ne peut être observé qu'une seule fois au plus dans un arrangement, on parle
d'arrangement sans répétition ou simplement d'arrangement.

Remarque 1.1.3. Dans le langage courant, le mot arrangement renvoie à un arrangement sans

répétitions. Lorsqu'on veut faire référence à un arrangement avec répétition, l'expression p-liste est

souvent utilisée.

Propriétés 1.1.2. le nombre d'arrangements sans répétition de p objets pris parmi n est alors :
n!
Apn = .
(n − p)!
Explication :
Il y a n choix disponibles pour tirer le premier objet (que l'on range à la première position de la
séquence).
Pour le second objet à ranger à la deuxième position, il n'existe plus que n − 1 choix diponibles
car le premier objet ne peut plus être pris en compte. On parle de tirage sans remise.
Ainsi pour les p objets tirés parmi n, si p ≤ n, il y aura : Apn = n(n − 1)(n − 2)...(n − p + 1).

ESTLC/GLTCO 122 4 Probabilités et statistique descriptive/semestre 1


1.2. Permutations

n!
Remarque 1.1.4. Apn = n(n − 1)(n − 2)....(n − p + 1) =
(n − p)!
Remarque 1.1.5. Apn n'est possible que si p ≤ n. On peut naturellement comprendre qu'en prenant

des oranges une à une dans un panier, il est impossible d'en prendre 10 alors que le panier n'en

contient que 6.

Rappel :
Si n ∈ N⋆ , on appelle factorielle n le nombre noté n! qui représente le produit des n premiers
entiers. Donc n! = 1 × 2 × 3 × ... × (n − 1) × n.
par convention car 0! = 1.

Exemple 1.1.5. Une assemblée de 15 personnes désire élire un bureau constitué d'un président, d'un

sécrétaire, d'un trésorier et d'un censeur. un s'accorde qu'il n'y a pas de cumul de fonctions. Combien

de bureaux peut-on ainsi former ?

On dispose de 15 personnes pour choisir le président. Lorsque le président est choisi, on dispose

de 14 personnes pour choisir le sécrétaire. En poursuivant ce raisonnement, on trouve que le nombre

de bureaux possibles est de 15 × 14 × 13 × 12 = 32760.


15!
Remarquons que c'est le même résultat si l'on pose la formule A415 = .
11!

1.2 Permutations

1.2.1. Permutations sans répétition


Dénition 1.2.1. Etant donné un ensemble E de n objets, on appelle permutations de n objets

distincts toutes suites ordonnées de n objets ou tout arrangement n à n de ces objets.

Propriétés 1.2.1. Le nombre de permutations de n objets est noté : Pn = n!

Explication :
La permutation de n objets constitue un cas particulier d'arrangement sans répétition de p objets
n! n!
pris parmi n lorsque p = n. Ainsi le nombre de permutations de n objets est : Ann = = =
(n − n)! (0)!
n!.

Exemple 1.2.1. Le nombre de manières de placer 8 convives autour d'une table est : P8 = 8! = 40320
possibilités.

ESTLC/GLTCO 122 5 Probabilités et statistique descriptive/semestre 1


1.3. Combinaisons

1.2.2. Permutations avec répétitions


Dans le cas où il existerait plusieurs répétitions k d'un même objet parmi les n objets, le nombre
de permutations possibles des n objets doit être rapporté aux nombres de permutations des k objets
identiques.
Dans ce cas, le nombre de permutations de n objets est alors : Pn = k! .
n!

En eet, les permutations de k objets identiques sont toutes identiques et ne comptent que pour
une seule permutation.

Exemple 1.2.2. Considérons le mot  CELLULE . Le nombre de mots possibles (avec ou sans
7!
signication) que l'on peut écrire en permutant ces 7 lettres est : Pn = 2!×3! = 420 mots possibles.

Ceci en considérant deux groupes de lettres identiques ; le L qui apparait 3 fois et le E qui apparait 2
fois.

1.3 Combinaisons
L'on parle généralement de combinaison lorsque les objets choisis dans un ensemble E ne sont pas
ordonés suivant un certain critère. Ainsi, dans une combinaison, l'on ne saurait parler de suite
ou séquence ordonnée comme cela est le cas dans un arrangement.

1.3.1. Combinaisons sans remise


Dénition 1.3.1. Étant donné un ensemble E de n objets, on appelle combinaisons de p objets de E
tout ensemble de p objets pris parmi les n objets. On parle de tirage simulatané.

Propriétés 1.3.1. Le nombre de combinaisons de p objets sans répétitions pris parmi n est : Cnp =
Apn n!
=
p! (n − p)!p!
Explication : Pour calculer ce nombre, on utilise le principe de la division.
n!
 Il y a Apn manières de tirer p objets parmi n en les ordonnant soit Apn = .
(n − p)!
 Une fois les p objets tirés, il y a p! manières de les ordonner.
Ap n!
 Il y a donc n
p! manières de tirer p objets parmi n sans les ordonner. D'où Cnp =
(n − p)!p!
Remarque 1.3.1. On a nécessairement p ≤ n, avec p, n ∈ N. Si p>n alors Cnp = 0.

Remarque 1.3.2. n

A la notation ancienne Cnp , on préfère parfois la notation moderne p . Les

nombres n et p constituent les coecients binomiaux.

Exemple 1.3.1. On désire choisir au hasard 15 étudiants de l'ESTLC parmi les 200 recrus pour

représenter cette école aux concours national des grands instituts de formation au Cameroun. De

combien de manières peut-on opérer ce choix ?

ESTLC/GLTCO 122 6 Probabilités et statistique descriptive/semestre 1


1.3. Combinaisons

Puisqu'il n'y a aucune distinction à eectuer entre les étudiants choisis (qui vont tous au même
15 200!
concours au même titre), alors le nombre de choix possibles est : C200 = ( Le soin est laissé
(185)!15!
à l'étudiant de terminer ce calcul.

1.3.2. Combinaisons avec remise


(n + p − 1)!
Le nombre de combinaisons de p objets parmi n avec remise est : Cn+p−1
p
=
(n − 1)!p!
L'explication est assez complexe pour un étudiant de ce niveau. elle utilise néanmoins la formule
de Pascal qui es donnée dans la section suivante.

1.3.3. Quelques proprités des combinaisons


Propriétés 1.3.2. La combinaison vérie la propriété de symétrie c'est-à-dire :
si 0≤p≤ n, alors Cnp = Cnn−p

Propriétés 1.3.3. Si 0 ≤ p ≤ n, alors


p−1
Cn−1 p
+ Cn−1 = Cnp
Cette propriété est connue sous le nom de combinaisons composées ou Formule de Pascal
n
Propriétés 1.3.4. Formule du binôme
X
∀a, b ∈ R, ∀n ∈ N, (a+b)n = Cnp an bn−p Ceci est appelée
p=0
de Newton
Remarque 1.3.3. En remplaçant a par 1 et b par 1 dans la formule du binôme de Newton, on
n
X
obtient : (2)n = Cnp . Or Cnp est le nombre de parties ayant p éléments d'un ensemble E qui en a
p=0
n
X
n, alors Cnp représente le nombre de sous-ensembles de que l'on note P(E). On peut déduire que
p=0
si E a n éléments alors P(E) a 2n éléments.

Remarque 1.3.4. Le nombre d'éléments d'un ensemble E est appelé le cardinal de E . Il est noté
card(E) ou parfois |E|.

ESTLC/GLTCO 122 7 Probabilités et statistique descriptive/semestre 1


⋆ ⋆ Chapitre Deux ⋆ ⋆

Probabilités

Introduction
Les probabilités vont nous servir à modéliser une expérience aléatoire, c'est-à-dire un phénomµene
dont on ne peut pas prédire l'issue avec certitude, et pour lequel on décide que le dénouement sera le
fait du hasard.
Exemples :
 l'enfant à naître sera une lle
 l'équipe de Bamboutos va battre Coton lors du prochain match qui les opposera
 le dé va faire un nombre pair
La première tâche qui vous attend est de décrire les diérentes issues possibles de cette expérience
aléatoire. Puis on cherche à associer à chacune de ces issues un nombre compris entre 0 et 1 qui mesure
la chance qu'elles ont de se réealiser. Comment interpréter/xer ce nombre, appelle probabilité ? Il
existe plusieurs manières de voir.
 Proportion : On lance un dé. Quelle est la probabilité de A="obtenir un chire pair" ? Chaque
face du dé a la même chance, et il y en a 6. Quant aux chires pairs, ils sont 3. D'où, intuiti-
vement la probabilité de A est : P (A) = 3
6 = 1
2

 Fréquence : Un enfant est attendu. Quelle est la probabilité que ce soit une lle ? On a observé
un grand nombre de naissances. Notons fn le nombre de lles nées en observant n naissances.
kn
Alors la probabilité d'avoir une lle est : P (f ille) = lim . Mais cette limite a-t-elle un
n→+∞ n
sens ?
 Opinion : Quelle est la probabilité pour que l'équipe du Cameroun gagne la coupe d'Afrique
des nations ? pour que le Real soit championne d'Europe ? Dans ce cas, on ne peut pas rejouer
le même match dans les mêmes conditions plusieurs fois. On peut considérer les qualités des
joueurs, des entraîneurs, les résultats de la saison... Mais le choix de la probabilité est forcément
subjectif.

ESTLC/GLTCO 122 8 Probabilités et statistique descriptive/semestre 1


2.1. Voabulaire important dans la théorie des probabilités

2.1 Voabulaire important dans la théorie des probabilités

2.1.1. Espace des possibles


En face des situations dont l'issue est incertaine, on a bien souvent envie d'attribuer à chaque
issue possible une vraisemblance plus ou moins grande. An de donner une rigueur mathématique à
ce concept, il est necessaire de donner au préalable quelques dénitions.

Dénition 2.1.1. Une expérience aléatoire est une expérience dont on ne peut pas porévoir son
résultat (issue incertaine) et si, repétée dans des conditions identiques, elle peut donner des résultats

diérents.

Exemple 2.1.1. On lance un dé cubique à six faces numerotées de 1 à 6 et on observe le numéro

obtenu à la face supérieure.

Exemple 2.1.2. On eectue un contrôle sanguin sur un patient, et on s'interesse au nombre de

globules blancs

Exemple 2.1.3. On eectue un contrôle sanguin sur un patient, et on s'interesse au taux de glycémie

Dénition 2.1.2. Une éventualité d'une expérience aléatoire est tout résultat possible de cette ex-
périence aléatoire.

Exemple 2.1.4. Dans le cas de l'exemple 2.1.1, Obtenir le chire 2 est une éventualité

Dénition 2.1.3. L'ensemble des éventualités d'une expérience aléatoire est appelé espace des pos-
sibles ou espace fondamental ou univers. On le note généralement Ω.
Exemple 2.1.5. Dans le cas de l'exemple 2.1.1, Ω = {1, 2, 3, 4, 5, 6, } ; dans celui de 2.1.2, Ω =
{1, 2, ..., n, ...} et dans celui de 2.1.3 Ω = [0; 15] (on delà de 15, on ne peut plus faire une prise de

sang)

On constate que pour une expérience aléatoire, l'univers peut être ni (toutes les éventualités
sont connues : cas de l'exemple 2.1.1) ou inni (toutes les éventualités ne sont pas connues : cas des
exemples 2.1.2 et 2.1.3).
Lorsque l'univers est inni, il peut être dénombrable (Si l'on peut numeroter les éventualités
connues comme à l'exemple 2.1.2) ou continu ( comme dans le cas de l'exemple 2.1.3).

2.1.2. Evènements
Dénition 2.1.4. évènement est un sous ensemble (ou une partie) de l'univers Ω. Une éven-
Un

tualité est parfois appelée évènement élémentaire.

ESTLC/GLTCO 122 9 Probabilités et statistique descriptive/semestre 1


2.2. Calcul des probabilités

∅ évènement impossible (qui ne pourra jamais se réaliser) et Ω lui-même est appelé


est appelé

évènement certain (dont on est sûr de la réalisation).


Exemple 2.1.6. Dans le cas de l'exemple 2.1.1, A = {1, 3, 5} est un évènement. De façon litté-

rale, c'est l'évènement  Obtenir un chire impair . L'évènement  Obtenir un chire pair  est

l'évènement contraire de A ; il est noté A se met sous forme d'ensemble comme suit A = {2, 4, 6}
Dénition 2.1.5. On appelle intersection de deux évènements A et B l'évènement qui est réalisé
si et seulement si A et B sont réalisés. Il est noté A∩B et est constitué des éventualité appartenant

à la fois à A et à B.

Dénition 2.1.6. Deux évènement A et B sont dits incompatibles ou disjoints lorsqu'ils ne peuvent
pas se réaliser au même moment. on écrit A ∩ B = ∅.

Dénition 2.1.7. On appelle réunion de deux évènements A et B l'évènement qui est réalisé si et
seulement si A est réalisé ou B est réalisé. Il est noté A∪B et est constitué des éventualité appartenant

soit à A soit à B.

Dénition 2.1.8. Des évènements A1 , A2 ,..., An forment un système complet d'évènements ou


une partition de l'univers Ω, s'ils sont deux à deux disjoints, et si la réunion de tous ces évènements
reconstitue Ω.

2.2 Calcul des probabilités


On se limite dans ce cours à étudier les univers ni. La probabilité d'un évènement est une valeur
numérique qui représente la proportion de fois où l'évènement va se réaliser, quand on répète l'ex-
périence dans des conditions identiques. On peut déduire de cette dénition qu'une probabilité doit
être entre 0 et 1 et que la probabilité d'un évènement est la somme des probabilités de chacun des
évènements élémentaires qui le constituent. Enn, la somme des probabilités de tous les éléments de
Ω est 1.
Important : rappelons qu'un évènement n'est rien d'autre qu'une partie de Ω. Une probabilité
associe à chaque évènement un nombre entre 0 et 1. Il s'agit donc d'une application de l'ensemble des
parties de Ω, notée P(Ω), dans [0; 1].
Exemple : soit Ω = {0; 1; 2}, Construisons P(Ω).
P(Ω) = {∅, {1}, {2}, {0, 1}, {0, 2}, {1, 2}, Ω}.

2.2.1. Dénition et propriétés d'une probabilité


Dénition 2.2.1. Soit Ω un univers et P(Ω) l'ensembles des parties de Ω.
On appelle probabilité toute application P dénie de P(Ω) vers [0, 1] telle que :

ESTLC/GLTCO 122 10 Probabilités et statistique descriptive/semestre 1


2.2. Calcul des probabilités

 P (∅) = 0 (L'évènement impossible a une probabilité nulle)

 Pour tout évènement A ⊆ Ω, 0 ≤ P (A) ≤ 1


X
 Pour tout évènement A, P (A) = P (ω)
ω∈A
(La probalité d'un évènement est la somme des probabilités de chacune des éventualités qui

constituaient cet évènement).


X
 P (Ω) = P (ω) = 1 (La probabilité de l'évènement certain est 1)
ω∈Ω

Exemple d'interprétation : dire qu'un évènement A a pour probabilité de :


 0.95 signie que A va très probablement se produire.
 0.03 signie que A a très peu de chance de se réaliser.
 4 incorrect.
 −2 incorrect
 0.4 signie que A va se produire dans un peu moins de la moitié des essais.
 0.5 signie une chance sur deux de se realiser
 0 aucune chance de se réaliser

Remarque 2.2.1. La dénition 2.2.1 implique que pour dénir une probabilité, on peut simplement

donner la probabilité de chacune des éventualités.

Exercice d'application : (Calcul des probabilités en utilisant la dénition)


On lance un dé cubique dont les faces sont numerotées de 1 à 6. Les probabilités des faces sont
telles que :
 Toutes les faces paires ont les mêmes chances d'apparition
 Toutes les faces impaires ont les mêmes chaces d'apparition
 On a deux fois plus de chances d'obtenir le 1 que le 2.
Caluler la probabilité de l'évènement A :  Obtenir une face paire .
Solution :
On commence par calculer la probabilité de chaque face. On pose x la probabilité de chaque face
paire et y celle de chaque face impaire.
P(Ω) = 1 ⇒ P (1) + P (2) + P (3) + P (4) + P (5) + P (6) = 1. Donc 3x + 3y = 1
P (1) = 2P (2) doc y = 2x
.
 3x + 3y = 1
on a alors le système :
 y = 2x
En résolvant ce système, on trouve x = 1
9 et y = 29 . On peut donc calculer P (A) sachant que
A = {2, 4, 6}
P (A) = P (2) + P (4) + P (6) = 1
9 + 1
9 + 1
9 = 3
9 = 31 .

Propriétés 2.2.1. Soient A et B deux évènements :

ESTLC/GLTCO 122 11 Probabilités et statistique descriptive/semestre 1


2.2. Calcul des probabilités

 P (A) = 1 − P (A)
 P (A ∪ B) = P (A) + P (B) − P (A ∩ B)
 Si A et B sont incompatibles, P (A ∪ B) = P (A) + P (B)
 Si A1 , A2 ,..., An sont des évènements deux à deux incompatibles, alors :

P (A1 ∪ A2 ∪ .... ∪ An ) = P (A1 ) + P (A2 ) + .... + P (An ).

2.2.2. Probabilités Uniformes ou combinatoires


Soit Ω un ensemble ni ayant n éventualités. Il arrive, comme quand on lance un dé équilibré, que
les évènements élémentaires ont tous la même probabilité. On parle alors d'évènements élémentaires
équiprobables. Notons p la probabilité de chaque évènement élémentaire ω. Alors :
1
.
X
P (Ω) = P (ω) = 1 ⇒ np = 1 ⇒ p =
n
ω∈Ω
Ainsi, pour un évènement A ayant k éventualités, on aura :
k
P (A) = 1
n + 1
n + ... + 1
n (k fois)=
. Cette formule s'énonce souvent comme :
n
card(A) N ombredecasf avorablesA
P (A) = = .
card(Ω) N ombredecaspossibles
Cette formule permet de ramener les calculs des probabilités à des décomptes d'évènements élé-
mentaires eectués par des techniques d'analyse combinatoire qui ne sont pas des probabilités.

Remarque 2.2.2. Cette formule des probabilités combinatoires n'est valable que si les évènements

élémentaires sonts équiprobables.

Exemple 2.2.1. Une urne contient 4 boules noires, 3 boule jaunes et 4 boules vertes, toutes indis-

cernables au toucher. On eectue au hazard un tirage simultané de 2 dans cette urne. Calculer la

probabilité d'avoir exactement 2 boules rouges.

A est l'évènement :  Avoir deux boules rouges . L'analyse combinatoire nous permet de calculer :

Card(A) = C32 et
2
Card(Ω) = C11
Puisque les boules sont indiscernables au toucher et que le tirage est eectué au hasard, alors les

évènements élémentaires sont équiprobables. la probabilité de A est donc donnée par :


C2
P (A) = 23 (Le soin est laissé à l'étudiant de terminer ce calcul).
C11
Dénition 2.2.2. (Indépendance statique) Deux évènements A et B sont indépendants si l'on a

P (A ∩ B) = P (A) × P (B)

Exemple 2.2.2. Dans un jeu de 32 cartes, on extrait au hasard 1 carte. A est l'évènement  obtenir un
As et B est l'évèvenement  obtenir une carte rouge . Les évènements A et B sont-ils indépendants ?

Dans le jeu de carte, il y a 16 cartes rouges, 4 As parmi lesquels deux sont rouges. En appliquant

la formule des probabilités uniformes, on :


4 1 16 1 2 1 1 1 1
P (A) = = ; P (b) = = ; P (A ∩ B) = = ; P (A) × P (B) = × = .
32 8 32 2 32 16 8 2 16
On conclut donc que les évènements A et B sont indépendants.

ESTLC/GLTCO 122 12 Probabilités et statistique descriptive/semestre 1


2.2. Calcul des probabilités

Propriétés 2.2.2. Si A et B sont indépendants, alors A et B sont indépendants ; A et B sont

indépendants ; A et B sont indépendants.

Propriétés 2.2.3. Si E1 , E2 ,...,En sont n expériences aléatoires indépendantes ( c'est-à-dire que le

résultat d'une expérience n'a pas d'eet sur le résultat d'une autre), et si A1 est un évènement lié à

E 1 , A2 est un évènement lié à E2 ,..., An est un évènement lié à En alors on a :

P (A1 ∩ A2 ∩ ... ∩ An ) = P (A1 ) × P (A2 ) × ... × P (An )

Exemple 2.2.3. Un jeu consiste à lancer une pièce de monnaie dont les côtés sont pile et face avec
3
P (pile) = 4 puis de tirer une boule dans une urne qui en contient 3 dont 2 rouges et 1 noire. Calculer

la probabilité que le joueur obtienne le côté face et tire la couleur rouge.


1 2
P (f ace ∩ rouge) = P (f ace) × P (rouge). Or P (f ace) = 1 − P (pile) = 4 et P (rouge) = 3 . Ainsi,
1 2 1
P (f ace ∩ rouge) = × = .
4 3 6

2.2.3. Probabilité conditionnelle


Quelle est la probabilité d'avoir un cancer du poumon pour un individus ?
Information supplémentaire :
Cet individus fume une vingtaine de cigarettes par jour.
Cette information va changer la probabilité.
L'outil qui permet cette mise à jour est la probabilité conditionnelle.

Dénition 2.2.3. Soient A et B deux évènements d'un univers Ω avec P (B) ̸= 0. On appelle pro-
babilité conditionnelle de l'évènement A sachant B  encore noté A|B , le quotient :
P (A ∩ B)
P (A|B) = . Onte parfois PB (A) au lieu de P (A|B).
P (B)
On dénit ainsi une nouvelle probabilité sur Ω au sens de la dénition 2.2.1.

Théorème 2.2.1. Soit B un évènement de probabilité non nulle. Alors l'application


P (A ∩ B)
PB dénie de P(Ω) vers [0; 1] et qui à tout évènement A associe PB (A) = P (A|B) = est
P (B)
une probablité sur Ω.

On remarquera que l'application PB est une probabilité signie en sous entendu qu'elle vérie
toutes les propriétés d'une probabilité qui ont déjà été données. Par exemple, PB (A) = 1 − PB (A).
P (A ∩ B)
Par ailleurs, l'écriture P (A|B) = conduit à P (A ∩ B) = P (A|B) × P (B).
P (B)
De plus, lorsque A et B sont indépendants, on a P (A|B) = P (A).

Théorème 2.2.2. (Formule des probabilités composées) Si A et B sont deux évènements d'un

univers Ω, alors :

P (A ∩ B) = P (B|A) × P (A) = P (A|B) × P (B).

ESTLC/GLTCO 122 13 Probabilités et statistique descriptive/semestre 1


2.2. Calcul des probabilités

Théorème 2.2.3. (Formule des probabilités totatles) Si les évènements A1 , A2 ,..., An forment

un système complet d'évènemnents, alors pour tout évènenement B, on a :

P (B) = P (B|A1 ) × P (A1 ) + P (B|A2 ) × P (A2 ) + ... + P (B|An ) × P (An )

Théorème 2.2.4. (Théorème de Bayes) Si les évènements A1 , A2 ,..., An forment un système

complet d'évènemnents, alors pour tout évènenement B tel que P (B) ̸= 0, on a :


P (B|Ai ) × P (Ai )
P (Ai |B) = .
P (B|A1 ) × P (A1 ) + P (B|A2 ) × P (A2 ) + ... + P (B|An ) × P (An )
EXERCICE RESOLU
Dans une municipalité, il y a 65% de personnes qui sont contre la construction d'un aéroport. Parmi
ces personnes contre cette construction, 70% sont des écologistes. Parmi les personnes favorables à la
construction, 20% sont des écologistes. Une personne est interrogée au hasard dans cette municipalité.
On note C l'évènement "la personne interrogée est contre la construction" et E l'évènement "la
personne interrogée est écologiste".
 Expliciter les probabilités PC (E) et PC(E) .
 Calculer la probabilité P (C ∩ E).
 Montrer que la probabilité P (E) est égale à 0, 525.
 Calculer alors la probabilité PE (C).
SOLUTION
La première des choses à faire consiste à comprendre et à relever les données.
65% = 0, 65 peut-être interprété comme la propababilité que la personne soit contre la construction.
70% = 0, 7 peut-être interprété comme la propababilité que la personne soit écologiste avec l'informa-
tion supplétaire qu'elle est contre la construction.
20% = 0.2 peut-être interprété comme la propababilité que la personne soit écologiste avec l'informa-
tion supplétaire qu'elle est favorable à la construction.
L'évènement C est l'évènement "la personne interrogée est favorable à la construction" et E l'évène-
ment "la personne interrogée est n'est pas écologiste".
 Explicitons les probabilités PC (E) et PC(E)
PC (E) = P (E|C) = 0, 7 et PC(E) = P (E|C) = 0.2
 Calculons P (C ∩ E)
P (C ∩ E) = P (E|C) × P (C) = 0, 7 × 0, 65 = 0, 455
De part la formule des probabilités composées, on peut également écrire P (C ∩ E) = P (C|E) ×
P (E). Sauf qu'on ne connait pas (encore) P (E), donc ça ne mène nulle part.
 Montrer que la probabilité P (E) est égale à 0, 525.
Une personne est soit contre la construction, soit favorable à la construction, jamais les deux au
même moment. De plus si l'on réunis tout ceux qui sont favorables à tout ceux qui sont contre, on
reconstitue toute la population (ceci est le principe même des systèmes complets d'évènements).

ESTLC/GLTCO 122 14 Probabilités et statistique descriptive/semestre 1


2.2. Calcul des probabilités

On peut donc conclure que C et C forment un système complet d'évènements. ( en raisonnant


comme précédemment, E et E forment également un système complet d'évènements, juste pour
information, mais nous n'utilisons pas cela).
En appliquant donc la formule des probabilités totales, on a :
P (E) = P (E|C) × P (C) + P (E|C) × P (C).
or P (C = 1 − P (C) = 1 − 0, 65 = 0, 35 Donc P (E) = 0, 455 + 0, 2 × 0, 35 = 0, 525.
 Calculer alors la probabilité PE (C)
P (E ∩ C) P (E|C) × P (C)
PE (C) = P (C|E) = = (Formule de Bayes)
P (E) P (E|C) × P (C) + P (E|C) × P (C)
0, 07 2
PE (C) = =
0, 525 15

ESTLC/GLTCO 122 15 Probabilités et statistique descriptive/semestre 1


⋆ ⋆ Chapitre Trois ⋆ ⋆

Variables aléatoires discrètes

Introduction
Dans la plupart des phénomènes aléatoires, le résultat d'une épreuve peut se traduire par une
 grandeur  mathématique, très souvent représentée par un nombre entier ou un nombre réel. La
notion mathématique qui représente ecacement ce genre de situation concrète est celle de variable
aléatoire (notée également v.a.). Ainsi la somme des numéros obtenus lors du lancé de deux dés, le
nombre de boules rouges obtenus lors d'un tirages de boules dans une urne qui en contient plusieurs
de diérentes couleurs sont des exemples de variables aléatoires.

3.1 Les éléments essentiels d'une variable aléatoire


Dénition 3.1.1. Etant donné un univers Ω et une probabilité P, on appelle variable aléatoire sur
Ω , toute application X de Ω dans R qui à toute éventualité ω ∈ Ω associe un nombre réel X(ω).
A chaque évènement élémentaire ω de Ω correspond un nombre réel x associé à la variable aléatoire
X . Mais attention, il n'y a pas obligatoirement autant de valeurs possibles prises par la variable
aléatoire X que d'évènements élémentaires.
Une variable qui ne prend qu'un nombre dénombrable de valeurs est dite discrète, sinon, elle est
dite continue (exemples : hauteur d'un arbre, distance de freinage d'une voiture roulant à 100 km/h).
Les v.a. continues ne sont pas étudiées dans le cadre de ce cours.

Exemple 3.1.1. On lance deux fois de suite un dé et on obtient un couple (i, j). L'application X qui

associe au couple (i, j) le nombre X(i, j) = i + j est une variable aléatoire.

Exemple 3.1.2. Une urne contient 2 boules blanches et 3 boules noires. On tire simultanément 2
boules de cette urne. A chaque tirage on associe le nombre de boules noires obtenus ; on dénit ainsi

une variable aléatoire.

ESTLC/GLTCO 122 16 Probabilités et statistique descriptive/semestre 1


3.1. Les éléments essentiels d'une variable aléatoire

3.1.1. Loi de probabilité d'une variable aléatoire


Dénition 3.1.2. (Univers image) Soit X une variable aléatoire dénit sun un univers Ω. On

appelle univers image, l'ensemble des valeurs que peut prendre la variable aléatoire X . L'univers
image est noté X(Ω).

Pour le cas de l'exemple 3.1.1, X(Ω) = {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12} et pour le cas de l'exemple
3.1.2, X(Ω) = {0, 1, 2}.
Une variable aléatoire est caractérisée par l'ensemble des valeurs qu'elle peut prendre et par l'ex-
pression mathématique de la probabilité de ces valeurs. Cette expression s'appelle la loi de probabilité
(ou distribution de probabilité) de la variable aléatoire.
La loi de probabilité d'une variable aléatoire discrète est entièrement déterminée par les probabilités
pi des évènements X = xi , xi parcourant l'univers image X(Ω) . La loi de probabilité est donnée par
les (xi , pi )i .

Remarque 3.1.1. Lorsqu'on demande la loi de probabilité d'une variable aléatoire, on demande de

préciser l'univers image puis de calculer pour chaque valeur de l'univers image, la probabilité que la

variable aléatoire soit égale à cette valeur.

Une loi de probabilité peut être résumée dans un tableau.

An de simplier l'écriture, nous noterons pour la suite du cours : P (X = xi ) par P (X = xi ) ou

simplement pi

Exemple 3.1.3. Reprenons l'exemple 3.1.2 et donnons la loi de probabilité.

On sait déjà que X(Ω) = {0, 1, 2}.


X=0 si l'on a tiré 0
boule noire ( les deux boules sont donc rouges) lors du tirage simultané de deux
C22 1
boules dans 5. Ainsi, p(X = 0) = =
C52 10
X = 1 si l'on a tiré une boule noire (l'autre boule est donc rouge) lors du tirages simultané de deux
C31 × C21 6
boules dans 5. Ainsi, p(X = 1) = =
C52 10
X = 2 si l'on a tiré 2 boules noires ( il n'y a donc pas de boules rouges) lors du tirage simultané de
C32 6
deux boules dans 5. Ainsi, p(X = 2) = =
C52 10
Ceci peut être résumé dans le tableau suivant :

xi 0 1 2
1 6 3
P (X = xi )
10 10 10
Table 3.1  Loi de probabilité de l'exemple 3.1.2

Remarque 3.1.2. La somme des probabilités dans une loi de probababilité est toujours égale à 1.

ESTLC/GLTCO 122 17 Probabilités et statistique descriptive/semestre 1


3.1. Les éléments essentiels d'une variable aléatoire

3.1.2. Fonction de répartition d'une variable aléatoire


Dénition 3.1.3. On appelle fonction de répartition d'une variable aléatoire X, la fonction FX telle

que :

FX : R → R
t 7−→ FX (t) = P (X < t)

Concrètement la fonction de répartition correspond à la distribution des probabilités cumulées. Le


plafond atteint par la fonction de répartition correspond à la valeur de probabilité 1.
L'importance pratique de la fonction de répartition est qu'elle permet de calculer la probabilité de
tout intervalle dans R
Les propriétés associées à la fonction de répartition sont les suivantes :
Soit FX la fonction de répartition d'une variable aléatoire discrète X ; alors :
 ∀t ∈ R, 0 ≤ FX (t) ≤ 1
 FX est croissante sur R
 lim FX (t) = 0 et lim FX (t) = 1
t→−∞ t→+∞
 Si a ≤ b P (a ≤ X ≤ b) = FX (b) − FX (a)

Exemple 3.1.4. Le tableau suivant donne la fonction de répartition de la variable aléatoire de

l'exemple 3.1.2.

t∈ ] − ∞; 0] ]0; 1] ]1; 2] ]2; +∞[


1 7
Fx (t) 0 1
10 10
Table 3.2  Fonction de répartition de l'exemple 3.1.2

Dans le cas d'une variable aléatoire discrète, on utilise une fonction escalier pour visualiser la fonction
de répartition, voir la Figure 3.1 ci-dessous.
Une loi de probabilité peut être caractérisée par certaines valeurs typiques correspondant aux
notions de valeur centrale, de dispersion et de forme de distribution. Il s'agit notamment de l'espérance
mathématique et de la variance.

3.1.3. Espérance mathématique d'une variable aléatoire


L'espérance d'une variable aléatoire notée E(X) correspond à la moyenne des valeurs possibles de
X pondérées par les probabilités associées à ces valeurs. C'est un paramètre de position qui correspond
au moment d'ordre 1 de la variable aléatoire X . C'est l'équivalent de la moyenne arithmétique X . En
eet lorsque le nombre d'épreuves n est grand, X tend vers E(X)

Dénition 3.1.4. Si X est une variable aléatoire discrète dénie sur un univers Ω on appelle espé-
P
rance de X, le réel déni par : E(X) = ω∈Ω X(ω)P (ω)

ESTLC/GLTCO 122 18 Probabilités et statistique descriptive/semestre 1


3.1. Les éléments essentiels d'une variable aléatoire

Figure 3.1  fonction de repartition de l'exemple 3.1.2

Théorème 3.1.1. Si X est une variable aléatoire discrète de loi de probabilité (xi , P (X = xi ))i dénit

sur un nombre ni n d'évènements élémentaires alors :


Xn
E(X) = xi × P (X = xi ) = x1 × P (X = x1 ) + x2 × P (X = x2 ) + ... + xn × P (X = xn )
i=1

Exemple 3.1.5. Revenons à l'exemple 3.1.2 que nous utilisé pour illustrer les notions. La loi de

probabilité est déjà donnée sous forme de tableau. On peut donc calculer l'espérance mathématique de

la sorte :
1 6 3 12 6
E(X) = 0 × +1× +2× = = .
10 10 10 10 5
Propriétés de l'espérance Mathématiques Si X et Y sont deux variables aléatoires dénies
sur un même univers Ω, admettant chacune une espérance, alors :
 E(X + Y ) = E(X) + E(Y )
 E(aX) = aE(X), Pour tout nombre réel a
 Si X ≥ 0 alors E(X) ≥ 0
 Si X est un caractère constant tel que : ∀ω ∈ Ω, X(ω) = k alors E(X) = k.

3.1.4. Variance d'une variable aléatoire


La variance d'une variable aléatoire V (X) est l'espérance mathématique du carré de l'écart à
l'espérance mathématique. C'est un paramètre de dispersion qui correspond au moment centré d'ordre
2 de la variable aléatoire X . C'est l'équivalent de la variance observée S 2 . En eet lorsque le nombre

ESTLC/GLTCO 122 19 Probabilités et statistique descriptive/semestre 1


3.2. Quelques Lois discrètes

d'épreuves n est grand, S 2 tend vers V (X)

Dénition 3.1.5. Si X est une variable aléatoire ayant une espérance E(X), on appelle variance de

X, le réel V (X) qui correspond à l'espérance de la variable aléatoire [X − E(X)]2 . Donc :


2 2 2
V (X) = E([X − E(X)] ) = E(X ) − [E(X)]

Théorème 3.1.2. Si X est une variable aléatoire discrète de loi de probabilité (xi , P (X = xi ))i dénit

sur un nombre ni nd'évènements élémentaires alors :


Xn Xn
V (X) = (xi − E(X))2 × P (X = xi ) = x2i × P (X = xi ) − (E(X))2
i=1 i=1

Remarque 3.1.3. Pour faire simple, lorsqu'on veut calculer la variance d'une variable aléatoire x,
on clacule d'abord :
Xn
E(X 2 ) = x2i × P (X = xi ) = x21 × P (X = x1 ) + x22 × P (X = x2 ) + ... + x2n × P (X = xn ) puis on
i=1
2 2
calcule V (X) = E(X ) − (E(X))

6
Exemple 3.1.6. Reprenons l'exemple 3.1.2. On sait déjà que E(X) = .
5
n
X 1 6 3 18 9
E(X 2 ) = x2i × P (X = xi ) = 02 × + 12 × + 22 × = = .
i=1
10 10 10 10 5
9 9 9
Ainsi, V (X) = − ( )2 = .
5 5 25

3.2 Quelques Lois discrètes

3.2.1. La loi Binomiale


Dénition 3.2.1. On appelle épreuve de Bernoulli Toute épreuve aléatoire qui a deux éventualités.
L'une est appelé le succès (celle que l'on souhaite obtenir) et l'autre l'échec.

Exemple 3.2.1. Lorsqu'on lance une pièce de monnaie en observant la face supérieure, on a que

deux éventualités : soit on a la côté pile soit on a la côté face. C'est donc une épreuve de Bernoulli.

Exemple 3.2.2. Lorsqu'on choisit au hasard un étudiant dans un amphi et qu'on s'interesse à son

genre, on a que deux éventualités : Soit l'étudiant est de sexe masculin soit il est de sexe féminin.

Dénition 3.2.2. En repetant plusieurs fois la même épreuve de Bernoulli dans les même conditions,

On obtient un schéma de Bernoulli.

Par exemple lancé 8 fois la même pièce de monnaie et observer à chaque fois la face supérieure est

une épreuve de Bernoulli.

Soit X la variable aléatoire qui représente le nombre fois qu'on obtient le succès lorsqu'on repète
une épreuve de Bernoulli n fois.

ESTLC/GLTCO 122 20 Probabilités et statistique descriptive/semestre 1


3.2. Quelques Lois discrètes

Si l'on suppose que la probabilité du succès est le nombre p, alors on dit que X suit une loi binomiale
de paramµetres n et p ou simplement (n; p) et on note X ∼ B(n; p).
Cette loi est donnée par la formule :
P (X = k) = Cnk P k (1 − p)n−k

Exemple 3.2.3. Quelle est la probabilité d'obtenir le côté pile 3 fois lorsqu'on lance une pièce de

monnaie équilibréee 8 fois ?

Réponse :
1
La probabilité d'obtenir le côté pile lors d'un lancé est p= .
2
L'expérience est repetée n=8 fois.

On veut le côté pile (succès) 3 fois.


1 1 1 1
Donc : P (X = 3) = C53 ( )3 (1 − )5−3 = C53 ( )3 ( )2 . Le soin est laissé à l'étudiant de terminer le
2 2 2 2
calcul.

Propriétés 3.2.1. Si X ∼ B(n; p), alors E(X) = np et V (X) = np(1 − p).

3.2.2. La loi Loi géométrique


Au lieu de réaliser un nombre xéd'essais lors d'un schéma de Bernoulli, l'expérimentateur s'arrête
au premier succès. La valeur qui nous intéresse est le nombre d'essais eectués jusqu'au premier succès
inclus. Le nombre de succès est donc xé à 1, mais le nombre d'essais total Y est aléatoire et peut
prendre n'importe quelle valeur entiµere supérieure ou égale à 1.
Y est donc une variable aléatoire qui compte le nombre le nombre d'essais eectués pour avoir
le premier succès. On dit que Y suit la loi géométrique de paramètre p et on note Y ∼ G(p) (p est
toujours la probabilité du succès dans l'épreuve de Bernoulli).
1 1−p
Propriétés 3.2.2. Si Y ∼ G(p), alors P (Y = k) = p(1 − p)k−1 , E(Y ) = et V (Y ) =
p p2
D'autres lois discrètes existent, mais ne sont pas présentées dans ce cours ; on peut par exemple
citer la loi de poisson qui est une approximation de laloi binomiale, on peut également citer la loi
uniforme.

ESTLC/GLTCO 122 21 Probabilités et statistique descriptive/semestre 1


⋆ ⋆ Chapitre Quatre ⋆ ⋆

Statistique descriptive

Introduction
La statistique est une méthode scientique qui consiste à réunir des données chirées sur des
ensembles nombreux, puis à analyser, à commenter et à critiquer ces données. Il ne faut pas confondre
la statistique qui est la science qui vient d'être dénie et une statistique qui est un ensemble de données
chirées sur un sujet précis.
Les premières statistiques correctement élaborées ont été celles des recensements démographiques.
Ainsi le vocabulaire statistique est essentiellement celui de la démographie.

4.1 Vocabulaire Statistique


Dénition 4.1.1. On appelle :

 population tout ensemble étudié par la statistique ;


 individu tout élément de la population ;
 eectif total le nombre d'individus dans la population
Notation :
La population est Notée P et l'eectif total est noté N .

Exemple 4.1.1.
 Si la population P est l'ensemble des étudiants de la première promotion de l'ESTLC, un

individu est un étudiant de ladite promotion.

 Si la population P est l'ensemble des jours du mois de septembre 2023, chaque jour de ce mois

est un individu et l'eectif total est N = 30.

Dénition 4.1.2. Soit P une population. On appelle variable statistique (ou caractère) une quan-
tité ou qualité d´enie sur P susceptible de varier d'un individu à l'autre. On appelle modalitàs les

diérentes valeurs ou aspects pris par cette variable.

On distingue :

ESTLC/GLTCO 122 22 Probabilités et statistique descriptive/semestre 1


4.2. Etude des variables quantitatives discrètes

 les variables qualitatives pour lesquelles les modalités ne sont pas objectivement comparables ;
 les variables quantitatives (ou ordinales) dont les modalités sont mesurables et comparables

deux à deux.

Parmi les variables quantitatives, on distingue :

 les variables quantitatives discrètes dont les valeurs possibles sont isolées ;
 les variables quantitatives continues pouvant prendre toutes les valeurs contenues dans un

intervalle.

Notation :
Les variables statistiques sont désignées par des lettres majuscules, généralement X ou Y .

Exemple 4.1.2.
 Si la population P est l'ensemble des étudiants de la promotion, une variable statistique peut

être la couleur des yeux (variable qualitative) ou son âge (variable quantitative discrète).

 Si la population P est l'ensemble des jours de septembre 2023, une variable statistique peut

être la hauteur totale des précipitations journalières relevées à Ambam (variable quantitative

continue).

4.2 Etude des variables quantitatives discrètes


Lorsque les variables sont quantitatives discrètes, on dit encore qu'elles n'admettent pas un re-
groupement en classes.

4.2.1. Regroupement des données


Les données d'une variable statistique quantitative discrète X sur une population P d'eectif total.
Peuvent être regroupées dans un tableau des eectifs. Ce tableau précise les modalités
x1 < x2 < ... < xr , puis associe à chaque modalité xi , son eectif ni .

Exemple 4.2.1. Une enquête réalisée auprès d'une population de 100 femmes de 40 ans a recensé le

nombre d'enfant(s) de chacune. Les résultats obtenus sont regroupés dans le tableau ci-dessous

Modalités (xi ) 0 1 2 3 4 5 6
Eectifs (ni ) 9 28 32 24 4 2 1

Pour obtenir le tableau statistique plus fourni, on peut également ajouter :


ni
 La fréquence fi = de chaque modalité xi
N
i
 L'Eectif Cumulé Croissant (ECC) Ni = nk = n1 + n2 + ... + ni jusqu'à la modalité xi
X

k=1

ESTLC/GLTCO 122 23 Probabilités et statistique descriptive/semestre 1


4.2. Etude des variables quantitatives discrètes

i
Ni
 La Fréquence Cumulée Croissante (FCC) Fi =
X
fk = f1 + f2 + ... + fi =
N
k=1
Reprenons l'exemple 4.2.1 et complétons ce tableau par les éléments donnés ci-dessus.

Modalités (xi ) 0 1 2 3 4 5 6
Eectifs (ni ) 9 28 32 24 4 2 1
Fréquences (fi ) 0,09 0,28 0,32 0,24 0,04 0,02 0,01
ECC (Ni ) 9 37 69 93 97 99 100
FCC (Fi ) 0,09 0,37 0,69 0,93 0, 97 0,99 1

4.2.2. Représentation graphique


Les représentations graphiques ont l'avantage de renseigner immédiatement sur l'allure générale
de la distribution. Elles facilitent l'interprétation des données recueillies.
Le diagramme en bâton est la représentation grapique la plus courante, mais pas la seule. On peut
par exemple faire un histogramme de fréquence. Cependant, ces représentations graphiques permettent
d'extraire les mêmes informations. Le diagramme en bâtons de l'exemple 4.2.1 est donné dans la
FIGURE 4.1 ci-dessous.

Figure 4.1  Diagramme en bâtons de l'exemple 4.2.1

On observe dans ce cas une traine (ou queue de distribution) étalée vers la droite.

4.2.3. Caractéristiques de Position


Notations
P [X < t] : la fréquence totale des modalités xi telles que xi < t autrement dit, la proportion de

ESTLC/GLTCO 122 24 Probabilités et statistique descriptive/semestre 1


4.2. Etude des variables quantitatives discrètes

données < t P [X ≤ t] : la proportion de données ≤ t P [X > t] : la proportion de données > t


P [X ≥ t] : la proportion de données ≥ t P [t1 < X < t2 ] : la proportion de donn´ees strictement
comprises entre t1 et t2

Dénition 4.2.1. ( Fonction de répartition)


On appelle fonction de répartition d'une variable statistique X, la fonction :

F : R −→ [0; 1]
t 7−→ F (t) = P [X ≤ t]

Proposition 4.2.1. Soit X une variable statistique discrète dont les modalités sont x1 , ...., xr .
 La fonction de répartition F de X est croissante, en escalier telle que :



0, si t ≤ x1


F (t) = Fi , si xi ≤ t ≤ xi+1




1, sit ≥ Xr
 On a :

P [X > t] = 1 − P [X ≤ t] = 1 − F (t),
P [t1 < X ≤ t2 ] = P [X ≤ t2 ] − P [X ≤ t1 ] = F (t2 ) − F (t1 )
, P [X = xi ] = fi et P [X = t] = 0 si t∈
/ {x1 , ..., xr },
P [X < t] = P [X ≤ t] − P [X = t]

Dénition 4.2.2. Parlant des paramètres (caractéristiques) de position, il s'agit principalement des

notions de :

 moyenne
r
arithmétique notée X telle que :
X
ni xi r
i=1 n1 x1 + n2 x2 + ... + nr xr X
X= = = fi xi
N N
mode qu'on
i=1
 dénit comme toute modalité xi dont l'eectif
est maximal parmi tous les eectifs

 Mediane qu'on dénit comme toute valeur me telle que P [X ≤ me] ≥ 0, 5 et P [X ≥ me] ≥ 0.5.
 Quantile d'ordre p ∈]0; 1[ qu'on dénit comme toute valeur qp telle que P [X ≤ qp ] ≥ qp et
P [X ≥ qp ] ≥ 1 − p.

Remarque 4.2.1.
 La notion de médiane correspond au quantile d'ordre 0, 5
 Les quantiles d'ordre 0, 25 et 0, 75 sont respectivement appelés premier et troisième quartiles,

on note parfois Q1 et Q3
 Les quantiles d'ordre 0, 1 et 0, 9 sont respectivement appelés premier et neuvième déciles.

Exemple 4.2.2. Nous revenons à l'exemple 4.2.1

ESTLC/GLTCO 122 25 Probabilités et statistique descriptive/semestre 1


4.3. Etude des variables quantitatives continues

9 × 0 + 28 × 1 + 32 × 2 + 24 × 3 + 4 × 4 + 2 × 5 + 1 × 6
 X= = 1, 96
100
 Le mode est 2 (l'eectif correspondant est 32 qui est maximal)

 La médiane est 2 car P [X ≤ 2] = 069 > 0, 5 et P [X ≥ 2] = 1 − P [X ≤ 1] = 1 − 0, 37 = 0, 63 >


0, 5
 q0,25 = 1 et q0,75 = 3. (Ces valeurs sont matérialisées dans la Figure 4.1)

4.2.4. Caractéristiques de dispersion


Dénition 4.2.3. Parlant des paramètres (caractéristiques) de dispersion, il s'agit principalement

des notions de :

 Etendu : xr − x1 où x1 est la plus petite modalité et xr la plus grande modalité


 Etendue inter-quartiles : q0,75 − q0,25
 Variancernotée V (X) telle que
r
:
X X
ni (xi − X)2 ni x2i
i=1 i=1 2
V (X) = = −X
N Np
 Ecart-type noté σ tel que σ = V (X)
 Ecart-type relatif ou coecient de variation noté cv tel que cv = σ (si X ̸= 0).
X
 Ecart absolu
r
moyen : noté EAM avec :
X
ni |xi − X|
i=1
EAM = .
N
Exemple 4.2.3. On revient au tableau de l'exemple 4.2.1

 Etendu = x7 − x1 = 6 − 0 = 6
 Etendue inter-quartiles = q0,75 − q0,25 = 3 − 1 = 2
9 × (0 − 1, 96)2 + ... + 1 × (6 − 1, 96)2
 V (X) = ≃ 1, 3784
√ 100
 σ = √1, 3784 ≃ 1, 1741
1, 3784
 cv = ≃ 0, 5990
1, 96
9 × |0 − 1, 96| + ... + 1 × |6 − 1, 96|
 EAM = = 0, 8904
100

4.3 Etude des variables quantitatives continues

4.3.1. Organisation des données


Dans le cas d'un caractère quantitatif continu, l'établissement du tableau des eectifs et/ou des
fréquences implique d'eectuer au préalable une répartition en classes des données. Cela nécessite
de dénir le nombre de classes attendu et donc l'amplitude associée à chaque classe ou intervalle de

ESTLC/GLTCO 122 26 Probabilités et statistique descriptive/semestre 1


4.3. Etude des variables quantitatives continues

classe.
En règle générale, on choisit des classes de même amplitude. Pour que la distribution en fréquence
est un sens, il faut que chaque classe comprenne un nombre susant de valeurs (ni ). Diverses formules
empiriques permettent d'établir le nombre de classes pour un échantillon de taille n.
La règle de STURGE : Nombre de classes = 1 + (3, 3logn)

La règle de YULE : Nombre de classes = 2, 5 4 n.
L'intervalle entre chaque classe est obtenu ensuite de la manière suivante :
Xmax − Xmin
Intervalle de classe = ;
Nombre de classes
avec Xmax et Xmin, respectivement la plus grande et la plus petite valeur de X dans la série statis-
tique.
A partir de Xmin on obtient les limites de classes ou bornes de classes par addition successive de
l'intervalle de classe. En règle général, on tente de faire coïncider l'indice de classe ou valeur centrale
de la classe avec un nombre entier ou ayant peu de décimales.
Les grands changements par rapport au cas quantitatif discret sont les suivant :
 On n'a pas des modalités isolées xi mais des classes ]bi−1 , bi ]. Ces classes peuvent être d'égales
amplitudes ou d'amplitudes diérentes ; l'amplitude de la classe Ci =]bi−1 , bi ] étant donnée par
le nombre ai = bi − bi−1 .
 La fonction de répartition est continue et P [X = t] = 0 pour tout t
 En supposant les données r´eparties uniformément dans chaque classe, on choisira comme
représentant d'une classe son centre pour le calcul de certains paramètres. le centre de la
bi−1 + bi
classe Ci =]bi−1 , bi ] est donnéé par le nombre ci = .
2
Les autres éléments (fréquences, ECC, ...) se calculent de la même façon que dans le cas des caractères
quantitatifs discrèts.

Exemple 4.3.1. Durant le mois de Septembre 2023, on a relevé la hauteur totale des précipitations

journalières ( en mm) à Ambam. Le tableau suivant résume les données recueillies.

Hauteur des précipitations (en mm) [0 ;1[ [1 ;3[ [3 ;6[ [6 ;9[ [9 ;14[
Nombre de jours (ni ) 17 5 5 2 2
Amplitude des classes (ai ) 1 2 3 3 5
Centre des classes (ci ) 0,5 2 4,5 7,5 11,5
Fréquences (fi ) 0,55 0,16 0,16 0,06 0,06
ECC (Ni ) 17 22 27 29 31
FCC (Fi ) 0,55 0,71 0,87 0,94 1

ESTLC/GLTCO 122 27 Probabilités et statistique descriptive/semestre 1


4.3. Etude des variables quantitatives continues

4.3.2. Représentation graphique


Pour les caractères quantitatifs continus, la représentation graphique est l'histogramme où la
hauteur du rectangle est proportionnelle à l'eectif ni . Ceci n'est vrai que si l'intervalle de classe est
constant. Dans ce cas l'aire comprise sous l'histogramme s'avère proportionnelle à l'eectif total. En
revanche lorsque les intervalles de classe sont inégaux, des modications s'imposent pour conserver
cette proportionnalité. Dans ce cas, en ordonnée, au lieu de porter l'eectif, on indique le rapport de
l'eectif sur l'amplitude de classe ; Ce rapport est appelé densité ou eectif relatif de la classe.
Ainsi la supercie de chaque rectangle représente alors l'eectif associé à chaque classe.
La gure ci-dessous est l'histogramme associé à l'exemple 4.3.1

Figure 4.2  Histogramme asocié à l'exemple 4.3.1

Sur l'histogramme des ci-dessus, on observe une traine (ou queue de distribution) étalée vers la
droite.
On peut également représenter graphiquement l'un des polygones des eectifs cumulés. Le polygone
des ECC est une ligne brisée qui relie des points dont l'abscisse est la borne supérieure de la classe
correspondante et l'ordonnée est l' ECC de la classe correspondante. Le polygone des ECC associé à
l'exemple 4.3.1 est donné par la Figure 4.3 ; il a été construit en utlisant les points du tableau :

4.3.3. Caractéristiques de position

ESTLC/GLTCO 122 28 Probabilités et statistique descriptive/semestre 1


4.3. Etude des variables quantitatives continues

Bornes supérieures (en abscisses) 0 1 3 6 9


ECC (en ordonnées) 0 17 22 29 31

Figure 4.3  Polygone des ECC asocié à l'exemple 4.3.1

 Moyenne arithmétique :
r
X
ni ci r
i=1 n1 c1 + n2 c2 + ... + nr cr X
X= = = fi ci
N N i=1
 Classe modale : toute classe ayant une densité maximale, parmi toutes les densités.
 Médiane : c'est l'unique nombre M e tel que P [X ≤ M e] = 0, 5 ; sur le polygone des ECC,
la médiane correspond à l'abscisse du point dont l'ordonnée est la moitié de l'eectif total.
Cette caractérisation permet de déterminer la médiane par une méthode appelée interpolation
linéaire.
 Quantile d'ordre p ∈]0, 1[ : l'unique valeur qp telle que : P [X ≤ qp ] = p

Exemple 4.3.2. On revient à l'exemple 4.3.1


17 × 0, 5 + 5 × 2 + 5 × 4, 5 + 2 × 7, 5 + 2 × 11, 5
X= ≃ 2, 5483871
31
eectif 17
La classe modale est la classe [0; 1[ avec pour densité = = 17
amplitude 1
Calculons la médiane par inerpolation linéaire. Pour cela, on se rappelle que dans le polygone des

ESTLC/GLTCO 122 29 Probabilités et statistique descriptive/semestre 1


4.4. Introduction à la statistique bivariée

eectifs cumulés croissanrs, On connait l'ordonnée de la médiane, qui est la moiyié de l'eectif total
31
(dans le cas précis, 2 = 15, 5). Le tableau ci-après donne un apperçu de ce que l'on cherche. Ainsi,

Bornes supérieures (en abscisses) 0 Me 1 3 6 9


ECC (en ordonnées) 0 15,5 17 22 29 31

l'interpolation est faite avec les points A(0; 0) ; B(M e; 15, 5) et C(1; 17). La formule à poser est donc :
Me − 0 15, 5 − 0 15, 5 31
= ; donc Me = = ≃ 0, 9117647
1−0 17 − 0 17 34

4.3.4. Caractéristiques de dispersion

 Etendu : br − b0 où b0 est la borne inférieure de la première classe et br la borne supérieure


de la dernière classe
 Etendue inter-quartiles : q0,75 − q0,25
 Variance notée V (X) telle que :
r
X r
X
ni (ci − X)2 ni c2i
i=1 i=1 2
V (X) = = −X
N Np
 Ecart-type noté σ tel que σ = V (X)
σ
 Ecart-type relatif ou coecient de variation noté cv tel que cv = (si X ̸= 0).
X
 Ecart absolu moyen : noté EAM avec :
r
X
ni |ci − X|
EAM = i=1
.
N
Exemple 4.3.3. On revient au tableau de l'exemple 4.3.1

 Etendu = b5 − b0 = 14 − 0 = 14
 V (X) ≃ 9, 71540

 σ = 9, 71540 ≃ 3, 11695
 cv ≃ 1, 22310

4.4 Introduction à la statistique bivariée


Il arrive parfois que pour une population P ayant N individus, que l'on s'intéresse à deux variables
(caractères) X et Y . Pour chaque individus, on obtient donc deux mesures. La série statistique est
alors une suite de N couples des valeurs prises par les deux variables sur chaque individu : (x1 ; y1 ),
(x2 ; y2 ), ... , (xn ; yn ). On parle alors de statistique bivariée ou alors de statististique double (ou à deux
caractères). Chacune des deux variables peut être, soit quantitative, soit qualitative. On examine deux
cas dans ce cours :

ESTLC/GLTCO 122 30 Probabilités et statistique descriptive/semestre 1


4.4. Introduction à la statistique bivariée

 Les deux variables sont quantitatives.


 Les deux variables sont qualitatives.

4.4.1. Deux variables quantitatives


Représentation graphique de deux variables
Dans ce cas, chaque couple est composé de deux valeurs numériques. Un couple de nombres (entiers
ou réels) peut toujours être représenté comme un point dans un plan. Ainsi, si xi est modalité du
caractère X et yj est une modalité du caractère Y , l'ensemble des points Mij (xi ; yj ) est appelé nuage
de points de la série statistique double.

Exemple 4.4.1. On a relevé la taille X et le poids Y de 15 individus et ona a obtenu le tableau

suivant :

Taille (x) 155 162 157 170 164 162 169 170 178 173 180 175 173 175 179
Poids (y ) 60 61 64 67 68 69 70 70 72 73 75 76 78 80 85

Le nuage de points associé à cette série double est donnéé par la FIGURE 4.4 :

Figure 4.4  Nuage de points associé à l'exemple 4.4.1

ESTLC/GLTCO 122 31 Probabilités et statistique descriptive/semestre 1


4.4. Introduction à la statistique bivariée

Remarque 4.4.1. Chacun des caractères X et Y forme une serie statistique simple (à une variable)

que l'on peut étudier comme cela a déjà été vu au cas des caractères quantitatifs discrèts. On les

appelle séries marginales de la serie double ; leurs paramètres sont donc dits marginaux (moyennes

marginales, écart-types marginaux,...).

Covariance
Dénition 4.4.1. La covariance d'une série statistique bivariée d'eectif total N est notée Cov(X, Y )
et dénie par :
N
X N
X
(xi − X)(yi − Y ) xi yi
i=1 i=1
Cov(X, Y ) = = −X ×Y.
N N
Remarque 4.4.2.
 La covariance peut prendre des valeurs positives, négatives ou nulles.

 Quand xi = yi pour tout i = 1, ..., N , la covariance est égale à la variance.

Coecient de corrélation
Dénition 4.4.2. Le coecient de corrélation noté r est la covariance divisée par les deux écart-types

marginaux :
Cov(X, Y )
r= .
σX × σY
Le coecient de détermination est le carré du coecient de corrélation :

Remarque 4.4.3. Le coecient de corrélation mesure la dépendance linéaire entre deux variables :

 Le coecient de corrélation est toujours compris entre −1 et 1. Donc −1 ≤ r ≤ 1,.


 Si le coecient de corrélation est positif, les points sont alignés le long d'une droite croissante

(dépendance positive).

 Si le coecient de corrélation est négatif, les points sont alignés le long d'une droite décroissante

(dépendance négative).

 Si le coecient de corrélation est nul ou proche de zéro, il n'y a pas de dépendance linéaire.

On peut cependant avoir une dépendance non linéaire avec un coecient de corrélation nul.
3
Généralement la dépendandence linéaire est considérée à partir de r≥ .
4
 Le coecient de détermination est compris entre 0 et 1

Ajustement linéaire - Droite de regression


Lorsqu'il est possible de construire une courbe qui passe le plus près possible des points du nuages, on
dit qu'un ajustement est possible. Lorsque cette courbe est une droite, on parle d'ajustement linéaire.
Il existe de nombreuses manières d'obtenir une droite d'ajustement : entre autres, la méthode de
Mayer et la méthode dite des moindres carrés.

ESTLC/GLTCO 122 32 Probabilités et statistique descriptive/semestre 1


4.4. Introduction à la statistique bivariée

La droite de régression est la droite qui ajuste au mieux un nuage de points au sens des moindres
carrés. On considère que la variable X est explicative et que la variable Y est dépendante. L'équation
de la droite de regression de Y en X est :
Cov(X, Y )
y = ax + b où a = et b = Y − aX .
V (X)
Remarque 4.4.4. La droite de régression de Y en X n'est pas la même que la droite de régression

de X en Y qui elle a pour équation :


Cov(X, Y )
x = ay + b où a= et b = X − aY .
V (Y )
Exemple 4.4.2. Revenons à l'exemple 4.4.1

 X = 169, 467
 X = 71, 2
p
 σX = V (X) = 7, 60585
p
 σY = V (Y ) = 6, 69527
 Covariance : 42,9067

 Coecient de corrélation : 0,842576

 Nature de la régression : Linéaire

 Équation de la courbe de régression : y = 0, 74170252x + −54, 493853

Résidus et valeurs ajustées


Les valeurs ajustées sont obtenues au moyen de la droite de régression :
yi∗ = axi + b.
Les valeurs ajustées sont les `prédictions' des yi réalisées au moyen de la variable x et de la droite de
régression de y en x.
Les résidus sont les diérences entre les valeurs observées et les valeurs ajustées de la variable
dépendante.
ei = yi = yi∗ .
Les résidus représentent la partie inexpliquée des yi par la droite de régression.

4.4.2. Deux variables qualitatives


Si les deux variables x et y sont qualitatives, alors les données observées sont une suite de couples
de variables (x1 ; y1 ), (x2 ; y2 ), ... , (xn ; yn ). Chacune des deux variables prend comme valeurs des
modalités qualitatives.
Tableaux de contingence ou tableau à double entrée Les données observées peuvent être
regroupées sous la forme d'un tableau de contingence comme le montre l'exemple ci-dessous.

Exemple 4.4.3. On s'intéresse à une éventuelle relation entre le genre de 200 personnes et la couleur

des yeux.

ESTLC/GLTCO 122 33 Probabilités et statistique descriptive/semestre 1


4.4. Introduction à la statistique bivariée

Bleu Vert Marron Total


Homme 10 50 20 80
Femme 20 60 40 120
Total 30 110 60 200

Table 4.1  Tableau des eectifs d'une série double à deux caractères qualitatifs

La lecture de ce tableau est assez facile. par exemple voir que des 200 personnes, il y a :
 au total 80 hommes et 120 femmes
 30 personnes au total ont des yeux bleus
 40 femmes ont des marrons.
On peut également preférer un tableau des fréquences à celui des eectifs. Le tableau de fréquences
s'obtient en divisant tous les eectifs par le nombre total d'individus : Le tableau ci-dessus est obtenu

Bleu Vert Marron Total


Homme 0,05 0,25 0,10 0,40
Femme 0,10 0,30 0,20 0,60
Total 0,15 0,55 0,30 1

Table 4.2  Tableau des fréquences d'une série double à deux caractères qualitatifs

en divisant chaque eectif par 200.


Tableaux de contingence ou tableau à double entrée Un tableau de contingence s'interprète
toujours en comparant des fréquences en lignes ou des fréquences en colonnes (appelés aussi prols
lignes et prols colonnes). Pour Obtenir ce tableau ( des prols lignes) on a divisé l'eectif de chaque

Bleu Vert Marron Total


Homme 0,13 0,63 0,25 1
Femme 0,17 0,50 0,33 1
Total 0,15 0,55 0,30 1

Table 4.3  Tableau des prols lignes

ligne par le total correspondant à cette ligne.


De façon analogue, on peut dresser le tableau des prols colonnes comme ci-dessous. Eectifs
théoriques et khi-carré
On cherche souvent une interaction entre des lignes et des colonnes, un lien entre les variables. Pour
mettre en évidence ce lien, on construit un tableau d'eectifs théoriques qui représente la situation où
les variables ne sont pas liées (indépendance). Ces eectifs théoriques sont construits de la manière

ESTLC/GLTCO 122 34 Probabilités et statistique descriptive/semestre 1


4.4. Introduction à la statistique bivariée

Bleu Vert Marron Total


Homme 0,33 0,45 0,33 0,40
Femme 0,67 0,55 0,67 0,60
Total 1 1 1 1

Table 4.4  Tableau des fréquences d'une série double à deux caractères qualitatifs

suivante :
Pour Chaque case, on multiplie l'eectif total de la ligne correspondant à cette case par l'eectif total
de la colonne correspondant à cette case ; ce résultat est ensuite divisé par l'eectif total de la série
double.
Pour le cas de notre exemple, le tableau des eectifs théoriques est donné ci-dessous.

Bleu Vert Marron Total


Homme 12 44 24 80
Femme 18 66 36 120
Total 30 110 60 200

Table 4.5  Tableau des eectifs théoriques

Les écarts à l'indépendance sont dénis de la manière suivante :


Pour chaque case du tableau, l'écart à l'indépendance est la diérence entre l'eectif observé et l'eectif
théorique claculé. le tableau ci-dessous présente les écart à l'indépendance. À partir de là, on remplit

Bleu Vert Marron Total


Homme -2 6 -4 0
Femme 2 -6 4 0
Total 0 0 0 0

Table 4.6  Tableau des écarts à l'indépendance

un nouveau tableau où l'on porte sur chaque case, le rapport entre le carré de l'écart à l'indépendance
(écart à l'indépendance)2
et l'eectif théorique ( ).
eectif théorique
La dépendance du tableau se mesure au moyen du khi-carré noté χ2obs déni par le total des
(écart à l'indépendance)2
totaux dans le tableau . comme le montre le tableau ci-dessous Le khi-carré
eectif théorique
peut être normalisé pour ne plus dépendre du nombre d'observations.Ondénit le phi-deux par :
χ2obs
Φ2 = . Le Φ2 ne dépend plus du nombre d'observations. Il est possible de montrer que Φ2 est
N
inférieur ou égal au plus petit nombre entre le nombre de lignes du tableau −1 et le nombre de colonnes
du tableau −1. Si l'on désigne par min ce nombre, le V de Cramer est déni par :

ESTLC/GLTCO 122 35 Probabilités et statistique descriptive/semestre 1


4.4. Introduction à la statistique bivariée

Bleu Vert Marron Total


Homme 0,33 0,82 0,67 1,82
Femme 0,22 0,55 0,44 1,21
Total 0,56 1,36 1,11 χ2obs =3,03

(écart à l'indépendance)2
Table 4.7  Tableau des
eectif théorique

r
Φ2
V = .
min

Le V de Cramer est compris entre 0 et 1. Il ne dépend ni de la taille de l'échantillon ni de la


taille du tableau. Si V ≃ 0, les deux variables sont indépendantes. Si V ≃ 1, il existe une relation
fonctionnelle entre les variables.
Pour terminer l'exemple, on a :
 χ2obs = 3, 03
 Φ2 = 0, 01515
 Nombre de lignes −1 = 2 − 1 = 1
 Nombre de colonnes −1 = 3 − 1 = 2
 Donc min = 1
 V = 0, 123 ; la dépendance entre les deux variables est très faible.
Références :
1. Manuel de Probabilités et Statistique : Françoise Couty-Fredon, Jean Debord et Daniel Fredon,
3è édition DUNOD

ESTLC/GLTCO 122 36 Probabilités et statistique descriptive/semestre 1


✠ Fiche de TD : Les énoncés ✠

4.5 Analyse Combinatoire


Produit cartésien (ou  principe multiplicatif )
Exercice 1. Combien de menus diérents peut-on composer si on a le choix entre 3 entrées, 2 plats

et 4 desserts ?

Exercice 2. Une femme a dans sa garde-robe 4 jupes, 5 chemisiers et 3 vestes. Elle choisit au hasard

une jupe, un chemisier et une veste.

De combien de façons diérentes peut-elle s'habiller ?

p-listes
Exercice 3. Un questionnaire à choix multiples, autorisant une seule réponse par question, comprend

15 questions. Pour chaque question, on propose 4 réponses possibles.

De combien de façons peut-on répondre à ce questionnaire ?

Exercice 4. En informatique, on utilise le système binaire pour coder les caractères. Un bit (binary

digit : chire binaire) est un élément qui prend la valeur 0 ou la valeur 1. Avec 8 chires binaires (un

octet), combien de caractères peut-on coder ?

Exercice 5. Combien peut-on former de numéros de téléphone à 8 chires ? Combien peut-on former

de numéros de téléphone à 8 chires ne comportant pas le chire 0 ?

Arrangements
Exercice 6. A l'occasion d'une compétition sportive groupant 18 athlètes, on attribue une médaille

d'or, une d'argent, une de bronze. Combien y-a-t-il de distributions possibles (avant la compétition,

bien sûr. . .) ?

Exercice 7. Un groupe d'élèves de GLTCO 1 constitue le bureau de l'association " Bal des Débutants :

le succès ". Ce bureau est composé d'un président, d'un secrétaire et d'un trésorier. Combien y a-t-il

de bureaux possibles ? ( il y a 24 élèves dans la classe )

ESTLC/GLTCO 122 37 Probabilités et statistique descriptive/semestre 1


4.5. Analyse Combinatoire

Exercice 8. Un clavier de 9 touches permet de composer le code d'entrée d'un immeuble, à l'aide

d'une lettre suivie d'un nombre de 3 chires distincts ou non.

1. Combien de codes diérents peut-on former ?

2. Combien y a-t-il de codes sans le chire 1 ?

3. Combien y a-t-il de codes comportant au moins une fois le chire 1 ?

4. Combien y a-t-il de codes comportant des chires distincts ?

5. Combien y a-t-il de codes comportant au moins deux chires identiques ?

Permutations et anagrammes
Exercice 9. Le groupe des étudiants de GLTCO 1 doit s'inscrire à un concours de logistique. Il faut

établir une liste de passage. Combien y a-t-il de manières de constituer cette liste ? ( il y a 24 élèves

dans la classe )

Exercice 10. Combien y-a-t-il d'anagrammes du mot MATH ?

Exercice 11. Les nombres 5, -1 et 3 constituent la solution d'un système de trois équations à trois

inconnues. Donner tous les triplets diérents qui peuvent être la solution de ce système

Exercice 12.
1. Dénombrer les anagrammes du mot PATRICE

2. Dans chacun des cas suivants, dénombrer les anagrammes du mot PATRICE :

(a) commençant et nissant par une consonne ;

(b) commençant et nissant par une voyelle ;

(c) commençant par une consonne et nissant par une voyelle

(d) commençant par une voyelle et nissant par une consonne

Exercice 13.
1. Combien peut-on réaliser de mots de n lettres comportant k lettres se répétant p1 , p2 ,..., pk fois ?

2. Quel est le nombre d'anagrammes du mot  ANAGRAMME  ?

Combinaisons
Exercice 14. Un groupe de 3 étudiants de GLTCO 1 doit aller chercher des livres à la bibliothèque.

De combien de manières peut-on former ce groupe ? (il y a 24 élèves dans la classe )

Exercice 15. Dans une classe de 32 élèves, on compte 19 garçons et 13 lles. On doit élire deux

délégués

1. Quel est le nombre de choix possibles ?

ESTLC/GLTCO 122 38 Probabilités et statistique descriptive/semestre 1


4.6. Probabilités

2. Quel est le nombre de choix si l'on impose un garçon et lle

3. Quel est le nombre de choix si l'on impose 2 garçons ?

Exercice 16. Au service du personnel, on compte 12 célibataires parmi les 30 employés. On désire

faire un sondage : pour cela on choisit un échantillon de quatre personnes dans ce service.

1. Quel est le nombre d'échantillons diérents possibles ?

2. Quel est le nombre d'échantillons ne contenant aucun célibataire ?

3. Quel est le nombre d'échantillons contenant au moins un célibataire ?

4.6 Probabilités
Exercice 17. Une urne contient 12 boules : 3 rouges, 4 bleues et 5 jaunes. On tire simultanément 3

boules. Calculer la probabilité des événements suivants :

1. A="les trois boules sont rouges" ;

2. B="on a tiré une boule de chaque couleur" ;

3. C="aucune des trois boules n'est rouge" ;

4. D="au moins une des trois boules est rouge" ;

5. E="au moins une des trois boules est bleue" ;

6. F="au plus une des trois boules est bleue" ;

Exercice 18. De 25 calculatrices, 5 ont un défaut. On en choisit 4 de manière aléatoire. Quelle est

la probabilité qu'aucune des 4 calculatrices soit défectueuse ?

Exercice 19. On sélectionne un échantillon ordonné de taille 3 d'un ensemble de 26 jetons sur lesquels

gurent les lettres de l'alphabet. Calculer la probabilité des événements suivants :

1. A = "ce sont 3 consonnes" ;

2. B = "ce sont 3 voyelles" ;

3. C = "c'est le mot MOI" ;

4. D = "c'est un anagramme du mot MOI".

Exercice 20. Un comité de 5 personnes doit être choisi parmi 20 hommes et 5 femmes, quelle est la

probabilité

1. qu'il se compose de 5 femmes ?

2. qu'il se compose de 4 hommes et 1 femme ?

ESTLC/GLTCO 122 39 Probabilités et statistique descriptive/semestre 1


4.7. Variables Aléatoires

Exercice 21. Dans une classe de 36 élèves, il y a 15 garçons. 25 % des élèves sont des lles qui font

de la musique. Parmi les garçons, 20 % font de la musique. On choisit un élève au hasard dans cette

classe. M est l'événement "l'élève choisi fait de la musique" et G l'événement "l'élève choisi est un

garçon".

1. Traduire avec les notations des probabilités et les événements M et G, les informations de cet

énoncé.

2. On a choisi une lle qu'elle est la probabilité qu'elle fasse de la musique ?

Exercice 22. Une boîte contient 30 caramels et 20 nougats. On choisit deux bonbons au hasard,

successivement et sans remise.

1. Quelle est la probabilité que le deuxième bonbon choisi soit un caramel sachant que le premier

était un nougat ?

2. Quelle est la probabilité que le deuxième bonbon choisi soit un nougat sachant que le premier

était un nougat ?

Exercice 23. Un maraîcher propose trois sortes de poivrons à la vente : des rouges, des verts et des

jaunes. Les poivrons rouges forment 60 % de son stock, les poivrons verts 15 % et le reste est constitué

de poivrons jaunes. 2 % des poivrons rouges sont abîmés ainsi que 1 % des poivrons verts et 0 ; 5 %

de poivrons jaunes. On tire au hasard un poivron dans le stock.

1. Quelle est, arrondie au millième, la probabilité que le poivron tiré au hasard soit abîmé ?

2. Le poivron choisi est abîmé. Calculez une valeur approchée de la probabilité qu'il soit rouge.

4.7 Variables Aléatoires


Exercice 24. La loi de probabilité d'une variable aléatoire X est donnée par le tableau suivant : Avec

xi 1 2 3 4 5 6
P {X = xi } a 2a 3a 3a a a

a ∈ R;

1. A quelle(s) condition(s) sur a ce tableau dénit bien une loi de probabilité ?

2. Calculer P (X ≤ 3) et P (X > 4).

3. Calculer l'espérance et la variance de X.

Exercice 25. Dans une population de 3000 individus, 1470 ont un groupe sanguin du type O, 1140

ont le type A, 300 le type B et le reste le type AB. Soit X la V.A. qui associe à chaque individus la

valeur 0,1,2 ou 3 si la personne a respectivement le groupe sanguin du type O, A, B, AB.

ESTLC/GLTCO 122 40 Probabilités et statistique descriptive/semestre 1


4.8. Statistique

1. Déterminer la loi de probabilité de la V.A.X .

2. Calculer l'espérance mathématique, la variance et l'écart type.

Exercice 26. Une usine fabrique des composants électroniques. La probabilité qu'un composant soit

défectueux 0,05. On considère un échantillon de 200 objets. Soit X la variable aléatoire qui compte le

nombre de composants défectueux.

1. Donner la loi que suit X et sa formule.

2. Quelle est la probabilité qu'aucun objet ne soit défectueux ?

3. Quelle est la probabilité que deux objets soient défectueux ?

Exercice 27. Un examen du type Q.C.M. comporte 20 questions, chacune des questions ayant 4

choix dont une est juste. Un étudiant qui ignore complètement son cours, il coche au hasard. Soit X
la variable aléatoire égale au nombre de bonnes réponses trouvées :

1. Donner la loi que suit X et sa formule.

2. Quelle est la probabilité que cet étudiant rate toutes les questions ?

3. Quelle est la probabilité que cet étudiant donne 3 réponses justes.

4. Quelle est la probabilité que cet étudiant donne au plus 2 réponses justes ?

4.8 Statistique
Exercice 28. On dispose des résultats d'une enquête concernant les loyers annuels des appartements

dans un quartier de la ville.

Montant du loyer (× 1000) Eectifs


[4 ;6[ 20
[6 ;8[ 40
[8 ;10[ 80
[10 ;15[ 30
[15 ;20[ 20
[20 ;30[ 10

1. Compléter le tableau statistique (valeurs centrales, eectifs cumulés, fréquence, fréquences cu-

mulés)

2. Déterminez les valeurs de tendance centrale de la distribution : moyenne, mode et les quartiles.

3. Mesurez la dispersion de la distribution au moyen de : l'étendue, l'écart type et de l'intervalle

interquartile.

ESTLC/GLTCO 122 41 Probabilités et statistique descriptive/semestre 1


4.8. Statistique

4. Tracez l'histogramme de cette distribution.

Exercice 29. On considère la série double suivante

xi 2 5 6 10 12
yi 83 70 70 54 49

1. Calculer la covariance,

2. Le coecient de corrélation linéaire,

3. Déterminer l'équation de la droite de régression Y = aX + b

Exercice 30. Un échantillon aléatoire de 1367 diplômes d'université, délivrés en 1984, a donné la

répartition suivante :

Licence Maîtrise Doctorat


Masculin 534 144 22
Féminin 515 141 11

Le sexe et le niveau de diplôme obtenu sont-ils liés ?

ESTLC/GLTCO 122 42 Probabilités et statistique descriptive/semestre 1


✠ Fiche de TD : les corrigés ✠

4.9 Analyse Combinatoire


Produit cartésien (ou  principe multiplicatif )
Corrigé 1. Le nombre de menus que l'on peut composer est donc égal à :

Nombre d'entrées × Nombre de plats × Nombre de desserts = 3 × 2 × 4 = 24


On peut donc composer 24 menus diérents.

Corrigé 2. Cette femme peut s'habiller de 4 × 5 × 3 = 60 façons

p-listes
Corrigé 3. Une réponse à ce QCM peut être désignée par une 15-liste de 15 chires choisis dans

l'ensemble Ω = {1; 2; 3; 4}. Le nombre de ces 15-listes est donc de cardinal (Card(Ω))15 = 415

Corrigé 4. En informatique, on utilise le système binaire pour coder les caractères. Un bit (binary

digit : chire binaire) est un élément qui prend la valeur 0 ou la valeur 1. Avec 8 chires binaires

(un octet), combien de caractères peut-on coder ? Un octet est une 8-liste d'éléments choisis dans

l'ensemble Ω = {0; 1}. L'ensemble de ces 8-listes est donc de cardinal (Card(Ω))8 = 28 = 256 Avec

un octet, on peut donc coder jusqu'à 256 caractères.

Corrigé 5. Un numéro de téléphone à 8 chires est une 8-liste d'éléments choisis dans l'ensemble

Ω = {0; 1; 2; 3; 4; 5; 6; 7; 8; 9}. L'ensemble de ces 8-listes est donc de cardinal (Card(Ω))8 = 108 On

peut ainsi former 108 numéros de téléphone à 8 chires Un numéro de téléphone à 8 chires ne com-

portant pas le chire 0 est une 8-liste d'éléments choisis dans l'ensemble Ω′ = {1; 2; 3; 4; 5; 6; 7; 8; 9}.
L'ensemble de ces 10-listes est donc de cardinal (Card(Ω′ ))8 = 98 = 43046721 On peut ainsi former

43046721 numéros de téléphone à 8 chires ne comportant pas le chire 0

Arrangements
Corrigé 6. Un tel podium est un arrangement de 3 athlètes choisis parmi l'ensemble des 18 athlètes

(l'ordre compte et il ne peut y avoir de répétition, un athlète ne pouvant remporter deux médailles

ESTLC/GLTCO 122 43 Probabilités et statistique descriptive/semestre 1


4.9. Analyse Combinatoire

simultanément). Il existe donc :


18! 18!
A318 = = = 18 × 17 × 16 = 4896 podiums diérents
(18 − 3)! 15!
Corrigé 7. Le fait d'attribuer un rôle à chaque élève de terminale induit un ordre dans le choix des

trois élèves. En eet, le choix (Pierre, Paul, Jacques) est diérent de (Paul, Pierre, Jacques), car dans

le premier cas, c'est Pierre qui est président, alors que c'est Paul dans le deuxième cas) Un bureau

est donc un arrangement de 3 élèves choisis parmi l'ensemble des 24 élèves. Il existe donc :
24! 24!
A324 = = = 24 × 23 × 22 = 12144 bureaux diérents
(24 − 3)! 21!
Corrigé 8. 1. Un code est un élément du produit cartésien entre un élément de l'ensemble {A; B; C},
de cardinal 3, et de l'ensemble des 3-listes d'éléments de {1; 2; 3; 4; 5; 6}, de cardinal 63 = 216 Il
3
y a donc 3 × 6 = 3 × 216 = 648 codes possibles

2. Si le code ne doit pas contenir de chire 1, alors les 3-listes sont constituées d'éléments de

{2; 3; 4; 5; 6}. Il y en a donc 53 = 125, et le nombre de codes vaut alors 3 × 53 = 3 × 125 = 375

3. Le contraire de  le code contient au moins une fois le chire 1  est  le code ne contient aucun

chire 1  Le nombre de codes contenant au moins une fois le chire 1 est donc égal au nombre

total de codes diminué du nombre de codes ne contenant pas le chire 1. Ces deux nombres ayant

été calculés dans les deux questions précédentes, on conclut que le nombre de codes contenant au

moins une fois le chire 1 est égal à 648 − 375 = 273

Permutations et anagrammes

Corrigé 9. Une liste de passage des 24 élèves est une permutation des 24 éléments de l'ensemble

classe. Il y a donc 24! listes possibles.

Corrigé 10. L'ordre dans lequel on énonce le triplet solution est important. Le nombre de triplets

solutions est donc : 3! = 6

Corrigé 11. Le mot  MATH  étant vu comme une liste ordonnée des 4 lettre (M,A,T,H), un

anagramme du mot  MATH  est une permutation de ces quatre lettres. Il y en a donc 4! = 24. Il y

a 24 anagrammes du mot MATH

Corrigé 12.
1. Il y a 7! = 5040 anagrammes du mot PATRICE

2.

(a) Pour constituer un mot commençant et nissant par une consonne, il faut d'abord choisir

les deux consonnes parmi les quatre que contient ce mot. L'ordre est important car un mot

commençant par P et nissant par T n'est pas identique à un mot commençant par T et

nissant par P. Il y a donc A24 = 12 choix possibles. Une fois ce choix eectué, il reste

ESTLC/GLTCO 122 44 Probabilités et statistique descriptive/semestre 1


4.9. Analyse Combinatoire

5! = 120 façons de permuter les 5 autres lettres. Il aura donc : A24 × 5! = 12 × 120 = 1440
anagrammes du mot PATRICE commençant et nissant par une consonne.

(b) Suivant le même raisonnement, il aura A23 × 5! = 720 anagrammes du mot PATRICE

commençant et nissant par une voyelle.

(c) Pour constituer un mot commençant par une consonne et nissant par une voyelle, il faut

d'abord choisir le couple (consonne,voyelle), qui est un élément du produit cartésien entre

l'ensemble des consonnes et l'ensemble des voyelles. Il y aura donc 4 × 3 = 12 tels choix

Une fois ce choix eectué, il y aura 5! = 120 façons de permuter les 5 autres lettres. Il aura

donc 4 × 3 × 5! = 12 × 120 = 1440 anagrammes du mot PATRICE commençant par une

consonne et nissant par une voyelle.

(d) La consonne et la voyelle gurant à l'extrémité du mot jouant des rôles parfaitement symé-

triques, il y aura 3 × 4 × 5! = 12 × 120 = 1440 anagrammes du mot PATRICE commençant

par une voyelle et nissant par une consonne

Corrigé 13.
1. Une anagramme d'un mot de n lettres est une permutation des n éléments de ce mot. Il y en

a donc, a priori n! Mais si un groupe de lettres se répète p1 fois au sein de ce mot, alors les

permutations de ces p1 lettres, qui sont au nombre de p1 ! ne changent pas le mot, de sorte que

l'on a compté, dans les n! anagrammes, p1 ! fois trop d'anagrammes. Il faut donc diviser n!
par p1 ! pour ne pas compter trop d'anagrammes. On procède de même avec le deuxième groupe

de mots se répétant p2 fois. Et ainsi de suite Le nombre d'anagrammes de mots de n lettres


n!
comportant k groupes lettres se répétant p1 , p2 , ... , pk fois est donc égal à : .
p1 ! × p2 ! × ... × pk !
2. Dans le mot ANAGRAMME gurent un groupe de trois lettres A se répétant et un groupe de 2
9!
lettres M se répétant Le nombre d'anagrammes du mot ANAGRAMME vaut donc : =
3! × 2!
30240

Combinaisons
Corrigé 14. L'ordre dans lequel on choisit les 3 élèves n'a, ici, pas d'importance. En eet, que l'on ait

choisi  dans cet ordre  (Pierre, Paul, Jacques) ou (Paul, Pierre, Jacques), c'est l'ensemble constitué

de ces trois élèves qui devra aller chercher les livres au CDI. Ces deux  choix  sont donc identiques.

La désignation de ces trois élèves correspond donc à un choix simultané (sans ordre, sans répétition
3 24!
possible) de 3 élèves parmi 24. Il y a donc : C24 = = 2024 choix diérents
(24 − 3)!3!
Corrigé 15. Les délégués sont choisis sans ordre

2
1. Les choix simultanés de 2 délégués parmi les 32 élèves sont au nombre de C32 = 496

2. Si on impose d'avoir un garçon et une lle, alors le choix des deux délégués est un élément du

produit cartésien entre :

ESTLC/GLTCO 122 45 Probabilités et statistique descriptive/semestre 1


4.10. Probabilités

 l'ensemble des choix simultanés de 1 délégué parmi les 19 garçons, soit 19 choix

 l'ensemble des choix simultanés de 1 délégué parmi les 13 lles, soit 13 choix

Le nombre des choix est donc 19 × 13 = 247

3. Si on impose d'avoir 2 garçons comme délégués, le nombre de choix des deux délégués est donc
2
 réduit  au nombre de choix de 2 délégués parmi les 19 garçons, au nombre de C19 = 171

Corrigé 16.
1. Le nombre de d'échantillons diférents est égal au nombre de choix de 4 personnes parmi les 30,
4
soit : C30 = 27405

2. Le nombre d'échantillons ne contenant aucun célibataires est égal au nombre de choix de 4


4
personnes parmi les 30- 12=18 non célibataires, soit C18 = 3060

3. Le contraire de  au moins un célibataire  est  aucun célibataire . Le nombre d'échantillons

contenant au moins un célibataire est égal au nombre total d'échantillons diminué du nombre

d'échantillons ne contenant aucun célibataire. Ces deux nombres ayant été déterminés dans les

deux questions rpécédentes, on conclut que le nombre d'échantillons contenant au moins un

célibataire est égal à : 27405 − 3060 = 24345

4.10 Probabilités
Corrigé 17. Il ne faut pas perdre de vue que chacune des boules a exactement la même chance d'être

choisie indépendamment de sa couleur. On commence par calculer le nombre total de combinaisons


3
possibles de 3 boules parmi douze qui est C12 = 220

1. Intuitivement il y a une seule possibilité de choisir 3 boules rouges parmi 3, cela se traduit

mathématiquement par C33 = 1. Donc la probabilité étant dénie par le nombre de cas favorables
1
divisé par le nombre de cas possibles on obtient P (A) =
220
2. Le nombre de façons diérentes de tirer une boule rouge est de 3, une bleue de 4 et une jaune
C31 × C41 × C51 3×4×5
de 5 donc la probabilité cherchée est P (B) = = =
220 220
3. Cela implique que l'on peut avoir soit :

(a) (3 boules bleues et 0 boule jaune) ou

(b) (1 boule bleue et 2 boules jaunes) ou

(c) (2 boules bleues et 1 boule jaune) ou

(d) 0 boule bleue et 3 boules jaunes)

C43 × C50 + C41 × C52 + C42 × C51 + C40 × C53 84


P (C) = = =
220 220

ESTLC/GLTCO 122 46 Probabilités et statistique descriptive/semestre 1


4.10. Probabilités

4. On pourait suivre le même raisonnement que sous c) mais il est plus simple de se convaincre

que l'événement "avoir au moins une boule rouge" est l'événement complémentaire de "n'avoir
136
aucune boule rouge" donc d'après les propriétés de probabilités, P (D) = 1 − P (C) =
220
5. "Au moins une des trois boules est bleue" signie que l'on peut avoir 1, 2 ou 3 boules bleues.

Il est parfois plus simple de calculer la probabilité l'événement complémentaire "ne pas avoir de

boule bleue du tout", plutôt que celle de l'événement lui-même.


C3 C3
P (E) = 8 ; Donc P (E) = 1 − 8
220 220
6. "Avoir au plus une boule bleue" signie ne pas en avoir du tout (déjà calculé sous e) ou alors

"avoir exactement 1 boule bleue". Donc


C41 × C82
P (F ) = P (E) +
220
Corrigé 18. L'ensemble fondamental compte
4
C25 = 12650 possibilités de choisir 4 machines parmi
4
25. La cardinalité de l'événement "tirer 4 machines non défectueuses" est de C20 = 4845 (le choix de

4 calculatrices parmi 20 en état de marche). La probabilité cherchée est :


C4 4845
P = 20 4 = 12650 = 0, 3830.
C25
Corrigé 19. Le nombre de voyelles est de 6 et celui des consonnes de 20.

3
1. L'ordre n'importe pas ici, l'ensemble fondamental aura donc C26 = 2600 éléments et le cardinal
3 1140 57
de l'ensemble qui nous intéresse est C20 = 1140. De ce fait la probabilité sera P1 = =
2600 130
3
2. l'ordre n'importe pas non plus ici, l'ensemble fondamental aura C26 = 2600 éléments et l'en-
20 1
semble qui nous intéresse C63 = 20. De ce fait la probabilité sera P2 = =
2600 130
3. dans le mot "moi" l'ordre a de l'importance, le nombre d'arrangements de 3 lettres que l'on peut

faire avec ces 26 jetons est A326 = 150600. Le mot "moi" étant l'un de ces arrangements, on

alaors :
1
P3 =
150600
1 1
4. P4 = 3 = = P3 × 3!
C26 2600
Corrigé 20. Le nombre de possibilités totales de former un comité de 5 personnes parmi 25
5
C25 =
530130..

1. Il n'y a qu'une seule manière de choisir 5 femmes parmi 5, car C55 = 1. La probabilité de
1
l'événement est
530130
4
2. Il y a C20 × C51 de choisir 4 hommes et 1 femme. La probabilité cherchée est alors :
C20 × C51
4
5 .
C25
Corrigé 21.

ESTLC/GLTCO 122 47 Probabilités et statistique descriptive/semestre 1


4.11. Variables aléatoires

15
1. P (G) =
36
25
P (M ∩ G) =
100
20
PG (M ) = P (M |G) =
100
P (G ∩ M P (G ∩ M 0, 25 3
2. PG (M ) = = = =
P (G) 1 − P (G) 1 − 15
36
7
Corrigé 22.
1. Si au premier tirage le bonbon était un nougat, alors au deuxième tirage, la boîte est composée
30
de 30 caramels et de 19 nougats. La probabilité cherchée est donc : .
49
19
2. Un raisonnement analogue à celui ci-dessus permet de dire que la probabalité cherchée est :
49
Corrigé 23.
1. D'après la formule des probabilités totales, on a :

P (A) = P (A ∩ R) + P (A ∩ V ) + P (A ∩ J)
P (A) = P (A|R) × P (R) + P (A|V ) × P (V ) + P (A|J) × P (J)
P (A) = 0, 6 × 0, 02 + 0, 15 × 0, 01 + 0, 25 × 0005
P (A) = 0, 01475 ≃ 0, 015
P (R ∩ A) P (A|R) × P (R) 0, 6 × 0, 2
2. PA (R) = = = = 0, 8
P (A) P (A) P (0, 015)

4.11 Variables aléatoires


Corrigé 24.
1. Ce tableau dénit une loi de probabilité si chacune de ces probabilité est positive et si la somme

de toutes ces probabilités vaut 1. Donc :


X6
P {X = xi } = 1 ⇒ a + 2a + 3a + 3a + 2a + aRightarrow12a = 1.
i=1
1
On en déduit donc que que a= .
12
2.
1 1
 P (X ≤ 3) = P (X = 1) + P (X = 2) + P (X = 3) = a + 2a + 3a = 6a = 6 × =
12 2
1 1
 P (X > 4) = P (X = 5) + P (X = 6) = 2a + a = 3a = 3 × =
12 4
1 7
 E(X) = (1 × a) + (2 × a) + (3 × 3a) + (4 × 3a) + (5 × 2a) + (6 × a) = 42a = 42 × = = 3, 5
12 2
 V (X) = E(X 2 ) − (E(X))2
1 85
E(X 2 ) = (12 ×a)+(22 ×a)+(32 ×3a)+(42 ×3a)+(52 ×2a)+(62 ×a) = 170a = 170× =
12 6
85
V (X) = ( )2 − (3, 5)2 ≃ 1, 92
6
Corrigé 25. Dans une population de 3000 individus, 1470 ont un groupe sanguin du type O, 1140

ont le type A, 300 le type B et le reste le type AB. Soit X la variable aléatoire qui associe à chaque

ESTLC/GLTCO 122 48 Probabilités et statistique descriptive/semestre 1


4.11. Variables aléatoires

individus la valeur 0,1,2 ou 3 si la personne a respectivement le groupe sanguin du type O, A, B, AB.

Soient les événements suivants :

O : `'l'individu a le groupe sanguin O

A : `'l'individu a le groupe sanguin A

B : `'l'individu a le groupe sanguin B

AB : `'l'individu a le groupe sanguin AB

Les données de l'exercice sont :

Card(O) = 1470 ; Card(A) = 1140 ; Card(B) = 300 et Card(AB) = 3000−1470−1140−300 = 90

1. Donnons alors la loi de probabilité de la variable X

X(Ω) = {0; 1; 2; 3}

xi 0 1 2 3
1470 1140 300 90
P {X = xi } = 0, 49 = 0, 38 = 0, 1 = 0, 03
3000 3000 3000 3000

2.

 E(X) = (0 × 0, 49) + (1 × 0, 38) + (2 × 0, 1) + (3 × 0, 03) = 0, 67


 E(X 2 ) = (02 × 0, 49) + (12 × 0, 38) + (22 × 0, 1) + (32 × 0, 03) = 3, 39
V (X) = E(x2 ) − (E(X))2 = 3, 39 − (0, 67)2 = 2, 9411
p √
 σX = V (X) = 2, 9411

Corrigé 26. Une usine fabrique des composants électroniques. La probabilité qu'un composant soit

défectueux 0,05. On considère un échantillon de 200 objets. Soit X la variable aléatoire qui compte le

nombre de composants défectueux.

1. Donnons la loi de X et sa formule.

X(Ω) = {0, 1, 2, ..., 200} et X ∼ B(n = 200; p = 0, 05). Ainsi, Pour tout k ∈ {0, 1, 2, ..., 200},
k
P {X = k} = C200 (0, 05)k (0, 95)200−k

2. Calculons la probabilité qu'aucun objet ne soit défectueux


0
P {X = 0} = C200 (0, 05)0 (0, 95)200−0 = C200
0
(0, 95)200 = (0, 95)200

3. Calculons la probabilité que deux objets soient défectueux


2
P {X = 2} = C200 (0, 05)2 (0, 95)200−2 = C200
2
(0, 05)2 (0, 95)198

Corrigé 27. Un examen du type Q.C.M. comporte 20 questions, chacune des questions ayant 4 choix

dont une est juste. Un étudiant qui ignore complètement son cours, il coche au hasard :

1. Donnons la loi de X.
1
X(Ω) = {0, 1, 2, ..., 20}. X suit la loi binomiale de paramètres n = 20 et p= = 0, 25 ; on écrit
4
k
alors X ∼ B(20; 0, 25). Ainsi, Pour tout k ∈ {0, 1, 2, ..., 20}, P {X = k} = C20 (0, 25)k (0, 75)20−k

ESTLC/GLTCO 122 49 Probabilités et statistique descriptive/semestre 1


4.12. Statistique

2. Calculons la probabilité que cet étudiant rate toutes les questions


0
P {X = 0} = C20 (0, 25)0 (0, 5)20−0 = C20
0
(0, 75)200 = (0, 75)20

3. Calculons la probabilité que cet étudiant donne 3 réponses justes.


3
P {X = 3} = C20 (0, 25)3 (0, 75)20−3 = C20
3
(0, 25)3 (0, 75)17

4. P {X ≤ 2} = P {X = 0} + P {X = 1} + P {X = 2} (L'étudiant pourra terminer les calculs en

suivant la manière dont sont traitées les questions ci-dessus)

4.12 Statistique
Corrigé 28.
1. Completons le tableau :

Montant du loyer (× 1000) Eectifs Centre (ci ) ECC Fréquences (fi ) FCC fi × ci densité (di )
[4 ;6[ 20 5 20 0.,1 0,1 0,5 10
[6 ;8[ 40 7 60 0,2 0,3 1,4 20
[8 ;10[ 80 9 140 0,4 0,7 3,6 40
[10 ;15[ 30 12,5 170 0,15 0,85 1,875 6
[15 ;20[ 20 17,5 190 0,1 0,95 1,75 4
[20 ;30[ 10 25 200 0,05 1 1,25 1
Total 1 10,375 (× 1000)

2.

 La moyenne est 10, 375 × 1000


 La classe modale est la classe [8; 10[×1000 car c'est elle qui a la plus grande densité.
40 − 20
De ce fait, le mode est : M = 8000 + ( )(10000 − 8000) ≃ 9176, 470
40 − 6
 Par interpolation :
(8 − 6) × (0, 25 − 0, 1)
Q1 = (6 + ) × 1000 = 7500
(0, 3 − 0, 1)
(10 − 8) × (0, 5 − 0, 3)
Q2 = (8 + ) × 1000 = 9000.
(0, 7 − 0, 3)
(15 − 10) × (0, 75 − 0, 7)
Q3 = (10 + ) × 1000 ≃ 11666
(0, 875 − 0, 7)
3.

 étendu= (30 − 4) × 1000 = 26000


 intervalle interquartile = Q3 − Q1 = 4166
 écart-type ≃ 47298

4. Histogramme

ESTLC/GLTCO 122 50 Probabilités et statistique descriptive/semestre 1


4.12. Statistique

Corrigé 29.
1. Calcul de la covariance :
2 + 5 + 6 + 10 + 12
X= = 7.
5
83 + 70 + 70 + 54 + 49
Y = = 65, 2.
5
2 × 83 + 5 × 70 + 6 × 70 + 10 × 54 + 12 × 49
cov(X, Y ) = − (7 × 65, 2) = −43, 6.
5
2. Calcul du coecient de corrélation linéaire :
22 + 52 + 62 + 102 + 122 2
V (X) = − (7) = 61.8˘49 = 12, 8
5
83 + 70 + 70 + 54 + 492
2 2 2 2
V (Y ) = − (65, 2)2 = 17754, 96.
5
Le coecient de correlation linéaire est :
cov(X, Y )
r= p = −0, 009
V (X) × V (Y )
3.

Corrigé 30.  Tableau complet :

Licence Maîtrise Doctorat Total


Masculin 534 144 22 700
Féminin 515 141 11 667
Total 1049 285 33 1367

 tableau des eectifs théoriques :

 Si l'on pose n∗ij l'eectif théorique d'une case et nij l'eectif réel.
X n∗ij − nij
2
Khi-2= χ = = 14, 72100052.
i,j
n∗ij
Si χ2 = 0 alors X ,Y sont indépendant.

ESTLC/GLTCO 122 51 Probabilités et statistique descriptive/semestre 1


4.12. Statistique

Licence Maîtrise Doctorat


Masculin 537,161668 145,940015 16,8983175
Féminin 511,838332 139,059985 16,1016825

On va choisir le seuil de signication 5%(0, 05)


Le degré de liberté = (nombreligne − 1)(nombrecolonne − 1) = (3 − 1)(2 − 1) = 2
χ2critique = 5, 99 (voir table de Khi-2).
2
Comme χ > χ2critique alors donc existe un lien entre X et Y.

ESTLC/GLTCO 122 52 Probabilités et statistique descriptive/semestre 1

Vous aimerez peut-être aussi