Vous êtes sur la page 1sur 82

INSTITUT SUPERIEUR DES METIER DE L’AGRICULURE

SUPPORT DU COURS DE STATISTIQUES ET


PROBABILITE

PARCOURS : LICENCE PROFESSIONNELLE EN SOINS VETERINAIRES

CREDIT : 3

VOLUME HORAIRE : 30 H

Enseignant : PILO Mikémina

Contact : pilomikena15@gmail.com

ANNEE ACADEMIQUE 2022-2023

1
Plan du cours

INTRODUCTION GENERALE

PARTIE 1 : STATISTIQUES

Chapitre 1 : vocabulaire, définitions, représentations graphiques

Chapitre 2 : série statistique à un caractère

Travaux pratiques

PARTIE 2 : CALCUL DES PROBABILITES

Chapitre 1 : Analyse combinatoire

Chapitre 2 : Espace probabilisé- probabilités

Chapitre 3 : Variable aléatoire

Chapitre 4 : Lois de probabilité

Travaux Dirigés

2
INTRODUCTION GENERALE

statistique est un ensemble de méthodes scientifiques basées sur le recueil, l’organisation, la


présentation de données, ainsi que sur la modélisation et la construction de résumé La
numériques. On parle de statistiques descriptive lorsqu’on décrit et analyse un ensemble sans
tirer de conclusion, de statistique inductive lorsqu’on tire des conclusions sur une partie d’un
ensemble et que l’on tente d’étendre ces conclusions sur tout l’ensemble.

La statistique a une origine très anciennes, se réduisant initialement à une collecte


d’observations, notamment le dénombrement des hommes (recensement). On mentionne des
opérations de recensement il y a plus de 4 000 ans en Mésopotamie ou en Egypte. Cependant,
le terme statistique est apparu assez récemment, vers le milieu du XVIIe siècle ; il vient du
latin statisticus, relatif à l’état (status), et est employé alors dans un sens purement descriptif
de recueil ou de collecte de faits chiffrés, la statistique. Le mot employé au singulier avec
l’article défini, la statistique, évoque la méthode utilisé ensuite pour étendre les résultats et
dégager des lois (inférence). La statistique est ainsi un moyen scientifique d’analyse et de
compréhension des phénomènes étudiées ; elle s’applique très largement à l’économie et
toutes les sciences sociales et de la nature.

Le début de la méthodologie statistique peut se situer au XVIIe siècle qui verra l’éclosion de la
théorie des probabilités, qui est l’analyse mathématique des phénomènes dans lesquels le
hasard intervient. Le calcul des probabilités a commencé avec Blaise Pascal, pierre Fermat,
Christian Huygens et Jacques Bernoulli par l’analyse des jeux dits de hasard. Le mot hasard
est d’ailleurs emprunté à l’arabe az-zahr (jeu de dés, alea en latin). La théorie des probabilités
servira ensuite d’outils de base à un ensemble de méthodes ou de règle objectives permettant
d’utiliser des données pour fixer la précision avec laquelle on estime certains paramètres
(théorie de l’estimation) ou on teste certaines hypothèse (théorie des tests).

Dans ce cours, la première partie est dédiée à la statistique descriptive et la seconde partie
réservée au calcul de probabilité.

3
Chapitre 1 : Vocabulaire, définitions et représentations
graphiques

Objectifs pédagogiques :

Lorsqu’un étudiant aura complété l’étude du chapitre 1, il pourra :

1. Mieux saisir l’importance de l’information numérique présentée sous divers formes ;


2. Préciser ce qu’on entend par population, unité statistique, caractères, échantillon,
effectif, fréquence relative ;
3. Distinguer les types de caractères (quantitatif discret, quantitatif continu, qualitatif) ;
4. Dépouiller les données et en établir la distribution de fréquence absolue et relative ;
5. Tracer les principales représentations graphiques associées aux distributions de
fréquence, notamment le graphique en secteurs, le graphique en bandes, le diagramme
en bâtons, le polygone des fréquences, l’histogramme et les courbes de fréquences
cumulées.

1. Populations-Unités statistiques

1.1 Définitions

La statistique est la science qui a pour objet de recueillir un ensemble de données numériques
relatives à tel ou tel phénomène et d’exploiter rationnellement ces données pour établir toutes
relations de causalité par l’analyse et l’interprétation.

Une population est l’ensemble des éléments auxquels se rapportent les données étudiées. En
statistique, le terme « population » s’applique à des ensembles de même nature : étudiants
d’une Faculté, production d’une usine, entreprise d’un secteur donné, poissons d’une rivière,
etc.

La population est donc l’ensemble sur lequel on recueille les données ; on la désigne par Ω.

Exemples

i) Si l’on fait le recensement des Sénégalais, la population est l’ensemble de tous les
Sénégalais.
ii) Si l’on fait une étude sur le chiffre d’affaires des entreprises de la Zone Franche
industrielle de Dakar, la population est l’ensemble de toutes les entreprises de la
« Zone Franche industrielle ».

Remarque

La définition de la population est importante, car elle conditionne l’homogénéité des unités
observées et la fiabilité des résultats.

4
Tout élément de la population étudiée est appelé individu ou unité statistique, terme qui peut
désigner aussi bien une personne (un Sénégalais) qu’un objet (une entreprise).

Ainsi la population Ω désigne l’ensemble de référence c’est-à-dire l’ensemble des unités


statistiques observées.

On désigne par Card Ω le nombre d’éléments de la population Ω.

Généralement Card Ω est trop grand, il n’est pas possible de réaliser toutes les mesures
souhaitées. Ce qui fait qu’on est souvent amené à ne considérer qu’un sous-ensemble E de Ω.
L’ensemble des individus de E est appelé échantillon et Card E s’appelle taille de
l’échantillon et sera noté n.

1.2 Caractères et modalités

1.2.1 Caractères

Un caractère est un aspect particulier de l’individu auquel on s’intéresse (âge, profession,


taille, poids, sexe, situation matrimoniale, religion, ethnie, …). Un caractère peut prendre
deux ou plusieurs modalités.

1.2.2 Modalités

Les modalités d’un caractère sont les différentes valeurs que peut prendre ce caractère sur
l’ensemble de la population.

Les modalités d’un caractère doivent former une partition, c’est-à-dire doivent être
exhaustives et disjointes. A chaque individu, on doit pouvoir associer une modalité et une
seule.

Exemple de modalités

-Le caractère « Sexe » a deux modalités : Masculin et Féminin

-Le caractère « Situation Matrimoniale » a quatre modalités : Marié, Célibataire, Divorcé,


Veuf.

2. Les différents types de caractères

Un caractère peut être quantitatif ou qualitatif. S’il est quantitatif, il peut être discret ou
continu

2.1 Caractères qualitatifs

Un caractère est qualitatif s’il est lié à une observation ne pouvant pas faire l’objet d’une
mesure. Ses diverses modalités sont simplement constatées et repérées par un mot traduisant
son état. Les modalités d’un caractère qualitatif ne sont pas numériques. Ainsi : le sexe, la
situation matrimoniale, la religion, l’ethnie, la région habitée, la nationalité, la catégorie
socio-professionnelle (CSP) sont des caractères qualitatifs

5
2.2 Caractère quantitatifs.

Un caractère est quantitatif si on peut le mesurer ou le compter : ses modalités sont


numériques. On peut effectuer des opérations algébriques (addition, multiplication …) sur un
tel caractère.

On distingue deux types de caractères quantitatifs : d’une part le caractère quantitatif discret,
d’autre part le caractère quantitatif continu.

2.2.1 Caractère quantitatif direct

Un caractère quantitatif est discret (ou discontinu) si ses modalités prennent des valeurs
isolées, discrète. Le nombre d’enfants d’une famille, le nombre de personnes habitant une
résidence, le nombre d’accidents de travail survenus dans un groupe d’entreprises, le nombre
des buts marqués lors d’une rencontre de football, le nombre d’heures de cours de statistique
sont des caractères quantitatifs discrets. Par exemple les modalités du caractère « nombre
d’enfants par ménage » peuvent être 0, 1, 2, 3, 4, … 9, 10 et plus mai non 2,5 ou 3,756

2.2.2 Caractère quantitatif continu

a) Définition

Un caractère quantitatif est dit continu s’il peut prendre toutes les valeurs possibles à
l’intérieur d’un intervalle de R.

Le chiffre d’affaires d’une entreprise, l’âge d’un groupe d’individus exprimé en années, le
poids d’un groupe d’individus exprimé en kg, le revenu, le taux de natalité sont des caractères
quantitatifs continus. La taille d’une personne peut être de 176 centimètres (cm), 1831,3 ou
1781,8343 cm, en fonction de la précision de la mesure.

b) Concept de classe

Comme les variables quantitatives continues possèdent un nombre de valeurs distinctes très
important, on est aminé pour plus de commodité à les regrouper en un certain nombre de
classes. Une classe Ci est un intervalle de R et s’écrit généralement sous la forme : [𝑏𝑖, 𝑏𝑖1[.

Les nombres bis et bi + 1 sont les bornes de la classe. Bi est la borne inférieure et bi + 1 est la
borne supérieure.

La différence ai = bi+1 – bi s’appelle amplitude de la classe.


𝑏𝑖+𝑏𝑖+1
La valeur équidistante des deux bornes s’appelle centre de la classe.
2

𝑛𝑖
On appelle densité de la classe ci la valeur di= , on utilise cette quantité quand les classe
𝑎𝑖
sont d’amplitudes inégales. Dans certains ouvrages, la densité est appelé effectif corrigé.

6
3. Tableaux statistiques associés aux différents types de caractères

3.1 Caractères qualitatifs

Le tableau de distribution statistique ci-dessous décrit une population de n individus sur


laquelle on a observé le caractère X. x1, x2, …, xk sont les modalités de X.

Modalités du caractère X Effectifs ni Fréquences relatives fi


𝑛𝑖
X1 N1 F1 = 𝑛
𝑛2
X2 N2 F2 = 𝑛
⋮ ⋮ ⋮
𝑛𝑖
Xi Ni Fi = 𝑛
⋮ ⋮ ⋮
𝑛𝑘
Xk nk Fk = 𝑛
Total N 1

Effectif ni

On appelle effectif d’une modalité xi le nombre ni d’individus observés ayant pris cette
modalité.

Fréquences fi

On appelle fréquence relative d’une modalité xi l’effectif de cette modalité divisé par l’effectif
total n.
𝑛𝑖
Fi = 𝑛 , n= ∑𝑘𝑖=1 𝑛𝑖

3.2 Caractères quantitatifs

On distingue deux types de tableaux selon que le caractère étudié est discret ou contuni.

3.2.1. Tableau associé à un caractère direct

Modalité du Fréquences relatives Fréquences cumulées


Effectifs ni
caractère X fi croissantes fi
𝑛1
X1 N1 F1 = F1 = f1
𝑛
𝑛2
X2 N2 F2 = F2 = f1 + f2
𝑛
⋮ ⋮ ⋮ ⋮
𝑛𝑖
XI Ni Fi = Fi = f1 + F2 +…+fi
𝑛
⋮ ⋮ ⋮ ⋮

7
𝑛𝑘
XK nk Fk = Fk =1
𝑛
Total N 1

On appelle fréquence relative cumulée d’une modalité xi (ou d’une classe ci) le nombre

Fi =f1 +f2 ...+fi=∑𝑖𝑗=1 𝑓𝑗.

3.2.2 Tableau associé à un caractère continu

Modalités du Centre de classe Effectifs ni Fréquences Fréquences


caractère x en xi relatives fi cumulées
classes croissantes i
[b1, b2 [ 𝑏1+𝑏2 n1 f1= 𝑛1 F1=f1
x1= 𝑛
2
[b2, b3 [ x2= 𝑏2+𝑏3
2
n2 f2= 𝑛2
𝑛
F2=f1+f2
⋮ ⋮ ⋮ ⋮ ⋮
[bi, bi+1 [ 𝑏𝑖+𝑏𝑖+1 ni 𝑛𝑖 Fi= f1 + f2 … fi
xi= fi=
2 𝑛
⋮ ⋮ ⋮ ⋮ ⋮
[bk, bk+1 [ 𝑏𝑘+𝑏𝑘+1 nk 𝑛𝑘 Fk= 1
xk= fk=
2 𝑛

Total N 1

4. Représentations graphiques

4.1 Caractères qualitatifs

Pour représenter graphiquement les distributions statistiques relatives à un caractère qualitatif


on utilise habituellement, soit des graphiques à secteurs (ou diagramme à secteurs), soit des
graphiques à bandes (ou tuyaux d’orgues).

4.1.1 Graphique à secteurs

La population étudiée est représentée graphiquement par une surface circulaire. Cette surface
est découpée en autant de secteurs que de caractère considéré comporte de modalités.

Chaque secteur circulaire a un angle au centre proportionnel à l’effectif de la modalité qu’il


représente.

8
Modalités

Exemple

Le tableau suivant donne la répartition des ménages Sénégalais selon la source


d’approvisionnement en eau.

Source Robinet Robinet Forage Puits Puits


Intérieur Extérieur Pompe Intérieur Extérieur Autre
RI RE FP PI PE
Fréquence
Relative 16.7 27.4 4.6 6.4 37.9 7
(en %)

Source : RGPH/1998, Direction de la prévision et de la Statistique.

Le caractère étudié ici est la source d’approvisionnement en eau, c’est un caractère qualitatif,
ses modalités ne sont pas numériques.

Source Fréquence Relative fi Angle


En % 𝛼𝑖 en degrés Cumul
RI 16.7 60.12 60.12
RE 27.4 98.64 158.76
FP 4.6 16.56 175.32
PI 6.4 23.04 198.36
PE 37.9 136.44 334.80
AUTRE 7 25.20 360
Total 100 360

9
𝛼𝑖 = 360° × fi

Le graphique à secteur associé au tableau statistique de la répartition des ménages Sénégalais


selon la source d’approvisionnement en eau est donné ci-dessous :

Graphique à secteur

PI
FP 6%
5%

PE
38%
RE
27%

Autre
RI 7%
17%

4.1.2. Graphique à (diagramme à bandes)

Dans ce type de graphique les sous populations relatives à chacune des modalités du caractère
étudié sont représentés par des bandes rectangulaires. Les bandes ont une base constante et la
hauteur de chacune d’entre elles est proportionnelle à l’effectif ou à la fréquence de la sous
population correspondante.

Ce système de représentations se prête plus aisément que le précédent aux comparaisons dans
le temps ou dans l’espace.

Effectifs ou fréquences

10
Le graphique à bandes associé au tableau statistique de l’exemple 1 est donné ci-dessous :

Graphique en bandes

40
35
30
25
20
15
10
5
0
RI RE FP PI PE Autre

4.2. Caractère quantitatif direct

4.2.1 Diagramme en bâtons

On porte sur l’axe des abscisses les valeurs discrètes du caractère, et sur l’axe des ordonnées
les effectifs (ou fréquences) associés au proportionnelle aux effectifs (ou fréquences).

Exemple 2

Une enquête effectuée auprès de 100 familles sénégalaises a conduit à la distribution suivante,
selon le nombre d’enfants

xi 0 1 2 3 4 5
ni 6 9 13 16 10 12

xi 6 7 8 9 10 et plus
ni 10 4 3 5 12

Le caractère « nombre d’enfants » qui est ici étudié est un caractère quantitatif discret. Ses
modalités sont au nombre de 11 : 0, 1, 2 …, 9, 10 et plus.

11
La dernière modalité « 10 et plus » sera assimilée à la modalité « exactement 10 »

Diagramme en bâtons et polygone des fréquences.

ni polynôme des fréquences

16

14

12

10

0 1 2 3 4 5 6 7 8 9 10 Xi

4.2.2. Polygone des fréquences

Le diagramme en bâtons étant construit, on peut définir le polygone des fréquences (ou des
effectifs qui a pour but de préciser l’évolution des effectifs.

On trace le polygone des fréquences en joignant les bouts des bâtons. Le polygone des
fréquences de l’exemple 2 est donné dans le graphique précédent.

4.2.3. Courbe cumulative (diagramme cumulatif)

C’est la représentation graphique de ce qu’on appelle la fonction cumulative ou fonction de


répartition de la population selon la variable étudiée.

La fonction cumulative, notée F, d’une population étudiée selon une variable quantitative X,
est une fonction réelle qui à toute valeur x, fait correspondre la proportion F(x) des individus
de la population dont la valeur de la variable est inférieure ou égale à x

12
Cette fonction est définie comme suit :

0 x<x
1

F1 x  x<x
1 2

F2 x  x<x Où
2 3
:
 - les x1 , x 2 , x 3 ,..., x k sont des valeurs
:
F(x)=  différentes de la variable étudiée ;
Fi x  x<x
i i+1 - les F1 , F2 , F3 ,..., Fk-1 sont des fréquences
:
 cumulées.
:

Fk-1 x  x<x
k-1 k
1 x x
 k

Expmle2 : Soit répartition des étudiants enquêtés selon le nombre d’années passé au Lycée
Nombre d’années passé au Lycée Effectif Fréquence(%) Fréquence cumulée(%)

3 31 62 62

4 15 30 92

5 4 8 100

Total 50 100

Interprétation :
La plupart (62%) des étudiants du groupé qui a été enquêté ont affirmé qu’ils ont passé 3 ans au
Lycée. Ce tableau indique également que 92% de ces étudiants ont passé au plus 4 ans au Lycée.

En reprenant le tableau ci-dessus, on peut présenter la répartition de ce groupe d’étudiants


selon le nombre d’années passé au Lycée en utilisant la courbe cumulative comme l’indique
le graphique ci-après.

13
Graphique : répartition étudiants enquêtés selon le nombre d’années passé au Lycée

1,2

0,8

0,6

0,4

0,2

0
0 1 2 3 4 5 6 7 8

4.3. Caractère quantitatif continu

4.3.1 Histogramme (diagramme différentiel)

Histogramme est la représentation graphique de la distribution des effectifs ou des fréquences


d’une variable statistique. Un histogramme est un ensemble de rectangles contigus, chaque
rectangle, associé à chaque classe, a une surface proportionnelle à l’effectif de cette classe.

On peut distinguer deux cas :

a) Classe d’amplitudes égales

Dans le cas où les classes sont d’amplitudes égales, chaque rectangle de histogramme aura
une hauteur proportionnelle à l’effectif de chaque classe

Exemple 3

Soit la répartition des clients d’une société selon le nombre de commandes

Xi Effectif (ni) Fréquence (%)

1000-1500 4 4

1500-2000 20 20

2000-2500 24 24

2500-3000 28 28

3000-3500 22 22

3500-4000 2 2

Total 100

14
La représentation graphique correspond à cette distribution est la suivante :

0,3

0,25

0,2

0,15

0,1

0,05

0
0 500 1000 1500 2000 2500 3000 3500 4000 4500

b) Classes d’amplitudes inégales

Dans ce cas, la hauteur proportionnelle à l’effectif ne permet plus de construire histogramme.


Il faut alors construire des rectangles dont la hauteur est proportionnelle à la densité, ce qui
permet d’assurer une surface proportionnelle à l’effectif.

La densité associée à chaque classe est définie par :


𝑛𝑖
Di = 𝑎𝑖

Où ai est amplitude de la classe d’effectif ni

Exemple 4 : soit la distribution suivante :

Classes ni ai di
[10,20[ 10 10 1
[20,30[ 16 10 1,6
[30,40[ 34 10 3,6
[40,60[ 24 20 1,2
[60,100[ 16 40 0,4
Total 100

15
Histogramme est :

di

3,5

2,5

1,5

0,5

0 10 20 30 40 50 60 70 80 90 100 Xi

4.3.2. Polygone des fréquences (ou polygone des effectifs)

L’histogramme étant construit, on peut définir le polygone des fréquences (ou des effectifs)
qui a pour but de préciser l’évolution des effectifs sur les différentes classes. On trace le
polygone des fréquences en joignant les milieux des segments supérieurs de chaque rectangle
(en ajoutant éventuellement deux classe de même amplitude et d’effectif nul, de chaque côté
de l’histogramme). Ce polygone des fréquences de la distribution de l’exemple 3 est :

0,3

0,25

0,2

0,15

0,1

0,05

0
0 500 1000 1500 2000 2500 3000 3500 4000 4500

Ordonnées Polygône

4.3.3. Courbe des fréquences cumulées croissantes (courbe cumulative)


16
Comme pour les variables discrètes, la courbe cumulative est la représentation graphique de la
fonction cumulative qui est égale à la proportion des observations pour lesquelles la variable
statistique est inférieure à x.

Les observations étant groupées par classe ci, si, ei représente l’extrémité supérieure de chaque
classe, alors la courbe cumulative est la courbe qui passe par les points représentatifs de
F(ei)=Fi.

C’est une courbe monotone non décroissante et on a :

𝐹 = (−∞) = 0
{
𝐹 = (+∞) = 1

Remarque

On peut également tracer une courbe associée aux fréquences cumulées décroissantes. La
représentation graphique de sa fonction cumulatives G=1-F, elle représente le pourcentage des
observations supérieures à x. C’est une courbe monotone non croissante.

Exemple 5

La répartition des employés d’une entreprise en fonction de la prime de fin d’année est la
suivante :

Prime en F ni Fi en % Fi ↗en % Fi ↘en %


[0; 1000[ 18 2,1 2,1 100
[1000; 2000[ 44 5,1 7,2 97,9
[2000; 3000[ 112 13,0 20,2 92,8
[3000; 3500[ 120 14,0 34,2 79,8
[3500; 4000[ 138 16,0 50,2 65,8
[4000; 4500[ 164 19,1 63,3 49,8
[4500; 5000[ 106 12,3 81,6 30,7
[5000; 6000[ 98 11,4 93,0 18,4
[6000; 7000[ 52 6,0 99,0 7
[7000; 8000[ 8 1,0 100,0 1
Total 860 100,0

L’effectif total est : n=∑𝑘𝑖=1 𝑛𝑖 =860 ; oû k=10 est le nombre de classe.


𝑛𝑖
Les fréquences relatives croissantes sont : fi = 𝑛 x100

Les fréquences cumulées croissantes sont les Fi ↗

Les fréquences cumulées décroissantes sont les Fi↘

17
Pour tracer la courbe des fréquences cumulées croissantes, il faut tracer une courbe continue,
car le caractère observé (prime de fin d’année) est un caractère quantitatif continu.

Le cumul se fait pour chaque classe à la limite supérieure de la classe.

Fi
100…………………………………..
90
80
70
60
50
40
30
20
10
0 10 20 30 40 50 60 70 80 90 (en 102 F)

L’interprétation de la courbe des fréquences cumulées croissantes est par exemple : 93% des
employés ont une prime de fin d’année intérieure à 6000F.

On peut aussi tracer la courbe des fréquences cumulées décroissantes

Fi
100…………………………………..
90
80
70
60
50
40
30
20
10
0 10 20 30 40 50 60 70 80 90 (en 102 F)

Son interprétation est par exemple : 92% des employés ont une prime de fin d’année supérieur
à 2000F

18
Chapitre 2 : Série statistique a un caractère

Objectifs pédagogiques :

Lorsque vous aurez complété l’étude du chapitre 2, vous pourrez :

1. Faire la distinction entre les caractéristiques de tendance centrale, de dispersion, de forme


et de concentration ;

2. Calculer avec les différentes formules qui sont présentées les moyennes, les quantiles, le
mode, la variance, l’écart-type et le coefficient de variation et donner la signification concrète
de chacune de ces mesures statistiques ;

3. Manipuler correctement les opérateurs somme et produit et n connaître les principales


propriétés ;

4. Localiser dans une série groupée ou non, la moyenne, les quartiles, les déciles, les centiles
et le mode ;

5. Préciser ce qu’on entend par asymétrie et aplatissement d’une distribution ;

6. Calculer les différentes caractéristiques de concentration

19
1. Caractéristiques de tendance centrale

Dans le paragraphe précédent, nous avons appris à ranger les données et à les présenter à
l’aide de tableaux statistiques. Nous avons également étudié les graphiques qui constituent un
moyen particulièrement adéquat de présentation des résultats. Grâce à eux, on peut se faire
une première idée de l’aspect d’une distribution statistique. Cependant ces constatations
visuelles demeurent imprécises et restent soumises aux dangers d’une appréciation
synthétique forcément subjective. Il faut donc trouver le moyen d’exprimer, autrement que
par un commentaire de graphiques ou de tableaux, les éléments qui particularisent la série
d’observations dont dispose le statisticien. On utilise alors les caractéristiques de tendance
centrale (ou de position) qui sont les moyennes les quantiles et le mode.

1.1. Les moyennes

1.1.1. Moyenne arithmétique

La moyenne arithmétique d’une série statistique {xi} i=1 à n, est égale à la somme des valeurs
observées, divisée par le nombre d’observations.

On la note généralement𝑋̅.
1
Ainsi x̅ = ∑ni=1 xi
𝑛

Dans le cas d’un tableau de distribution, on a


1
x̅ = ∑pi=1 n𝑖x𝑖 = ∑pi=1 f𝑖x𝑖
n

Où x1, x2, …, xp sont les valeurs observées (ou les centres des classes si la distribution est
groupée), n1, n2, …, np sont les effectifs correspondants, f1, f2, …, fp sont les fréquences
correspondantes.
ni p
fi = et n = ∑i=1 ni
n

Propriété

Soit {xi} une série statistique et {yi} la série défini par yi = axi+ b où a et b sont deux réels
quelconques, alors :

y̅ = ax̅ +b

Démonstration
1 p 1
y̅ = n ∑i=1 n𝑖y𝑖 = n ∑𝑝𝑖=1 ni(axi +b)

1 p 1
= a ∙ n ∑𝑖=1 n𝑖x𝑖 + b∙ n ∑𝑝𝑖=1 n𝑖

= a∙ x̅ +b

20
Remarque

Cette formule de changement de variable permet de simplifier le calcul de la moyenne


arithmétique dans certains cas.

Exercice d’application

Un étudiant obtient aux examens les notes suivantes : mathématique 10 (coefficient 2),
économie 14 (coefficient 4), statistique 12 (coefficient2), langues 8 (coefficient 1). Calculer sa
moyenne à l’examen.

Discipline Notes xi Coefficient ni nixi


Mathématique 10 2 20
Economie 14 4 56
Statistique 12 2 24
Langues 8 1 8
Total n=9 108

La note moyenne est


1 108
x̅ = ∑4i=1 n𝑖x𝑖 = = 12
n 9

Remarque

Si toutes les disciplines étaient affectées du même coefficient, la note moyenne serait :

10 + 14 + 12 + 8
x̅ = = 11
4
1.1.2. Moyenne géométrique

La moyenne géométrique d’une série statistique positive {xi}, i=1, …. , n, est la racine nième
du produit des valeurs observées.

On la note généralement G.

Ainsi :
1
n
G = √x1 × x2 × x3 × … × xn = [∏ni=1 x𝑖 ] n

Avec ∏𝑛𝑖=1 𝑥𝑖 =x1 x x2 x x3 x …x xn

Dans le cas d’un tableau de distribution, on a:

G=[∏𝑝𝑖=1 𝑥𝑖 𝑛𝑖 ] 1/n= ∏𝑝𝑖=1 xifi


ni p
Avec fi = n
et n = ∑𝑖=1 ni

21
Le calcul de G peut s’effectuer grâce à la relation
1
Log G = 𝑛 ∑𝑝𝑖=1 𝑛𝑖 log xi

Ɐ i=1, 2, …,p si xi ˃ 0, ou log est le logarithme népérien

Exercice d’application

Calculer la moyenne géométrique de la série suivante :

Xi ni

2 2
16 1
Totale 3

Corrigé

La moyenne géométrique est G = (22 x 161)1/3 = (64)1/3 =4

On peut aussi passer aux logarithmes :


1
log( 𝐺) = log( 64) = 1,38629
3

De la relation précèdent, on tire

G= exp (1,38629) = 4.

1.1.3. Moyenne harmonique

La moyenne harmonique d’une série statistique strictement positive {𝑥𝑖}, i=1,…,n est égale à
l’inverse de la moyenne arithmétique des inverses des values observes. On la note H

Ainsi:
1 n
H=1 1 = 1
∑n ∑n
n i=1 xi i=1xi

1 1 1
Ou = n ∑ni=1 n
H

Dans le cas d’un tableau de distribution, on a:


p
∑𝑖=1 ni 1
H= p ni = p fi
∑i=1 ∑i=1
xi xi

22
Exercice application

Le jour d’un devoir de statistique, un étudiant va de son domicile à la faculté à la vitesse de 3


km/h. Il en revient à la vitesse de 6km/h.

Quelle est sa vitesse moyenne ?

Corrigé

Soit la distance v1 et v2 les vitesses, t1 et t2 les temps de parcours à l’aller et au retour. Le


temps à l’aller est t1 = d/v1 et au retour t2=d/v2.

La vitesse moyenne est :


2𝑑 2𝑑 2
VM= 𝑡1+𝑡2 = 𝑑 𝑑 = 1 1
+ +
𝑣1 𝑣2 𝑣1 𝑣2

La vitesse moyenne est donc ici la moyenne harmonique des vitesses :


2
VM= 1 1 =4km/h
+
3 6

1.1.4. La moyenne quadratique

La moyenne quadratique d’une série statistique positive{𝑥𝑖}, i=1,…,n est la racine carrée de la
moyenne arithmétique des carrés des valeurs observes. On la note Q.

1
Q =√𝑛 ∑𝑛𝑖=1×i2

Dans le cas d’un tableau de distribution, on a:


𝑝
∑𝑖=1 nixi2 1 1
Q =[ 𝑝
∑𝑖=1 𝑛𝑖 2
] [∑𝑝𝑖=𝑛 fixi2 ] 2

Remarque: soit une série pour laquelle les quatre moyennes définies ci-dessus, on a alors:

H˂G˂x˂Q

Exercice d’application

Soit la serie statistique :

1, 2, 5, 7, 10, 13

Calculer les moyennes arithmétiques, géométriques, harmonique, quadratique.

23
Corrigé

1.2. Les quantiles

1.2.1. Définitions

On appelle quantile d’ordre ∝ %, et note Qx , la valeur xi du caractère telle que x% des


valeurs observes soient inférieures strictement à xi

Si F désigne la fonction “fréquences cumulées croissants” alors:

a) La median

Elle correspond au quantile d’ordre 50%. C’est donc la valeur du caractère étudié telle qu’il y
ait autant d’observations qui lui soient supérieures que d’observations qui leur soient
inférieures. La médiane partage donc la série des valeurs observés en deux séries de même
taille. C’est la valeur Me de la variation statistique pour laquelle la fréquence cumulée est
1
égale à 2.

b) Les quartiles

On a 3 quartiles (Q1, Q2, Q3) qui partagent la série en quatre séries de même taille.

Q1 est le premier quartile, c’est donc le quantile d’ordre 25%. C’est qui signifie que 25% des
observations sont inférieures au premier quartile Q1

Q2 est le deuxième quartile, c’est le quartile d’ordre 50%. Q2 est donc confondu avec la
médiane. 50% des observations sont inférieurs au deuxième quartile Q2=Me

Q3 est le troisième quartile, c’est le quantile d’ordre 75%. Ce qui signifie que 75% des
observations sont inférieures au troisième quartile Q3.

F(Q1)=0,25, F(Q2)=0,50, F(Q3)=0,75.

c)Les déciles

On a 9 déciles (D1, D2, D3, …,D9 ) qui partagent la série en 10 série de même taille. Le
premier décile D1 correspond au quantile d’ordre 10%. Le cinquième décile correspond à la
médiane.

Xmin D1 D5 D9 Xmax

24
10% 10

10% des observations sont inférieures à D1

90% des observations sont inférieures au neuvième décile D9.

d) Les centiles

On a 99 centiles (C1, C2,C3, …,C99) qui partagent la série en 100 séries de même taille.

Le premier centile C1 correspond au quantile d’ordre 1%. Le cinquantième centile correspond


à la médiane.

Xmin C1 C2 C3 C96 C99 Xmax

1% 1%

1% des observations sont inférieurs au premier centile C1 ; 99% des observations sont
inférieures à C99.

1.2.2. Détermination d’un quantile d’ordre 𝜶 d’une série groupée

On distingue deux cas :

a) cas direct

La fonction de réparation est une fonction discontinue en escaliers.

Fi

1 ………………………………

F(Xi+1) ………………………

α% ……………………..

F(Xi) ……………..

Xi-1 Xi Xi+1

On convient alors de considérer comme quantile d’ordre ∝%, la valeur observée xi +1 telle que
l’on ait :

F(xi)< 𝛼%< F(xi+1)

On a:

25
Q∝=Xi+1

Exemple d’application

Une enquête effectuée auprès de 100 familles sénégalaises a conduit à la distribution


suivante ; selon le nombre d’enfants.

Xi 0 1 2 3 4 5 6 7 8
Ni 6 9 13 16 10 12 10 4 3

Xi 9 10 et plus
Ni 5 12

Le caractère « nombre d’enfant » qui est ici étudié est un caractère quantitatif discret. Nous
allons déterminés la médiane Me et le quartile Q1 et Q2.

Pour cela, il nous faut calculer les fréquences cumulées.

xi Fi Fi
0 0,06 0,06
1 0,09 0,15
2 0,13 0,28
3 0,16 0,44
4 0,10 0,54
5 0,12 0,66
6 0,10 0,76
7 0,04 0,80
8 0,03 0,83
9 0,05 0,88
10 0,12 1,00

i) Détermination de la médiane

La médiane est le quantile d’ordre 50%.

44%< 50%< 54%

F(xi)<50% < F(xi+1)

F(3)< 50% < F(4)

Le second quartile ou la médiane est : Q2= Me=4

50% des familles ont moins de 4 enfants.

ii) Calcul de Q1

26
Le premier quartile est quantile d’ordre 25%

15%< 25% <28%

F(xi)<25%< F(xi+1)

F(1)< 25%<F(2)

Le premier quartile est : Q1=2

25% des familles ont moins de deux enfants.

iii) Calcul de Q3

Le troisième quartile correspond au quantile d’ordre 75%.

66% < 75% < 76%

F(Xi) < 75% < F(xi+1)

F(5) < 75%< F(6)

Le troisième quartile est Q3 = 6

75% des familles ont moins de six enfants.

b) Cas continu (interpolation linéaire)

Pour déterminer le quantile d’ordre 𝛼%, il faut déterminer la classe dans laquelle les
fréquences cumulées croissantes atteignent 𝛼 %.

Soit [a, b [cette classe ; on note :

a : limite inferieur de la classe

b : limite supérieur de la classe

F(a) : fréquence cumulée croissante au point a

F(b) : fréquence cumulée croissante au point b

Les fréquences cumulées sont en pourcentage :

F(b)

27
F(a)

a Qα b

a < Q𝛼 < b

F(a)< 𝛼 < F(b)


Qα−a α−F(a)
= F(b)−F(b)
b−a

Ou encore :
α−F(a)
Qα = a + (b − a) = F(b)−F(b)

Remarque : Détermination graphique d’un quantile d’ordre 𝜶%

On peut déterminer graphiquement la valeur du quantile d’ordre 𝛼%à l’aide de la courbe des
fréquences cumulées croissantes.

α%

0,5

Me Qα

28
Exemple d’application : calcul de quartiles

La présentation des employés d’une entreprise en fonction de la prime de fin d’année est la
suivante :

Prime en F ni fi en % Fi en %
[0, 1000[ 18 2,1 2,1
[1000, 2000[ 44 5,1 7,2
[200, 3000[ 112 13,0 20,2
[3000, 3500[ 120 14,0 34,2
[3500, 4000[ 138 16,0 50,2
[4000,4500[ 164 19,1 69,3
[4500, 5000[ 106 12,3 81,6
[5000, 6000[ 98 11,4 93,0
[600, 7000[ 52 6,1 99,0
[7000, 8000[ 8 1.0 100

Total 860 100,0

Nous allons calculer les quartiles par interpolation linéaire. En effet le caractère « prime de fin
d’année » est quantitatif continu. On utilise le tableau des fréquences cumulées croissantes :

i) le premier quartile est dans la classe [3000, 3500[, car les fréquences cumulées croissante
dépassent 25%.

3000≤ Q1 < 3500

20,2≤ 25< 34,2


Q1 −3000 25−20,2
= 34,2−20,2
3500−3000

25−20,2
Q1 =3000+500 x34,2−20,2 = 3171,43

25% des employés ont une prime de fin d’année inférieure à 3171,43F.

ii) le deuxième quartile est dans la classe [3500, 4000[, car les fréquences cumulées
croissantes dépasse 50%.

29
3500≤ Q2 < 400

34,2< 50 < 50,2

Q2 − 3500 25 − 20,2
=
3500 − 300 34,2 − 20,2
50−34.2
Q2 = 3500+500 x 50,2−34,2 =3993,75

50% des employés ont une prime de fin d’année inférieure à 3993,75 F.

iii) Le troisième quartile est dans la classe [4500,5000[car les fréquences cumulées croissante
dépasse 75%.

4500% ≤ Q3 <5000

69,3 ≤ 75 < 81,6

Q3 − 4500 75 − 69,3
=
5000 − 4500 81,6 − 69,3
75−69,3
Q3 = 4500+500 x 81,6−69,3 = 4731,70

75% des employés ont une prime de fin d’année inférieure à 4731,70F

1.2.3. Détermination d’un quantile d’ordre ∝ d’une série de données ponctuelles

Dans ce cas, on classe d’abord les données ponctuelles en ordre croissante. Calculer par
exemple le quantile d’ordre 50%, revient à déterminer la valeur du caractère x i telle que 50%
des valeurs observées sont strictement inférieures à xi.

Si le nombre des observations est impair, on a : n = 2p+1.

On convient de considérer comme quantile d’ordre 50%, la (p+1)ième valeur de la série des
valeurs observées.

Si le nombre des observations est pair, on a : n = 2p. Deux cas sont alors possibles :

La pième et la (p+1)iéme valeur de la série, sont égales ; on conviendra de considérer, comme


quantile d’ordre 50%, cette valeur.

La pieme et la (p+1)ieme valeur de la série sont différentes ; on prend comme quantile d’ordre
50%, la (p+1)ieme valeur de la série

On peut procéder de la même manière pour les autres quantiles.

Exemple d’application

Soit une série statistique possédant un nombre impair de termes {7, 9,9, 18, 37, 37, 37, 39, 3,
7, 3}

30
Nous allons déterminer les quartiles de cette série statistique.

Dans un premier temps, nous rangeons par ordre croissant les nombre de cette série d’où on
obtient : {3, 3, 7, 7, 9, 9, 18, 37, 37, 37, 39}

Dans un second temps, nous déterminons les trois quartiles :

i) le second quartile ou médiane Me

Nous savons que la médiane Me ou second quartile est le nombre qui nous partage la série des
valeurs observées en deux séries de même taille.

D’où on obtient :

3 3 3 7 9 9 18 37 37 37 39

↑ ↑ ↑

5 éléments Me 5 éléments

La médiane Me = 9

ii) Le premier quartile

Nous avons ainsi obtenu deux nouvelles séries

S1 = {3, 3, 7, 7, 9} et S2 = {18, 37, 37, 37, 39}

Le premier quartile correspond à la médiane de la nouvelle série S1.

D’où on obtient 3 3 7 7 9

Q1

Le premier quartile est Q1 = 7

iii) Le troisième quartile

Le troisième quartile correspond à la médiane de la nouvelle série S2

D’où on obtient 18 37 37 37 39

Q3

Le troisième quartile est Q3 = 37

1.3. Le mode

1.3.1. Définition

31
Le mode Mo d’une distribution statistique est sa valeur la plus fréquente. C’est la valeur du
caractère qui correspond à l’effectif le plus grand ou à la fréquence la plus importante. Le
mode permet ainsi de connaître la valeur la plus probable du caractère.

1.3.2. Détermination

Deux cas se présentent pour sa détermination pratique.

a) Cas où la variable est discrète

Dans ce cas, le mode est défini avec précision. Il correspond à la valeur qui a l’effectif le plus
élevé.

b) Cas où la variable est continue

Si la distribution est répartie en classe, le mode est indéterminé. Dans ce cas on put seulement
définir la classe modale.

Si les classes de distribution sont d’amplitude égale, la classe modale est la classe d’effectif
maximum. Par contre, si les classes sont d’amplitude inégale, la classe modale est la classe de
densité maximum.

Remarque

Une distribution peut avoir un ou plusieurs modes.

 Si une distribution Statistique possède un seul mode, elle est dite unimodale ;
 Si elle possède deux modes, elle est dite bimodale ;
 Si elle possède plusieurs modes, elle est dite plurimodale.

Exemple d’application : Détermination du mode dans le cas d’une variable discrète

Une enquête effectuée auprès de 100 familles sénégalaises a conduit à la distribution suivante,
selon le nombre d’enfants.

xi 0 1 2 3 4 5
Ni 6 9 13 16 10 12

xi 6 7 8 9 10 et plus
ni 10 4 3 5 12

Ici le mode est Mo = 3 car ni est maximum pour xi =3, la plus part des familles ont trois
enfants.

2. Caractéristiques de dispersion

32
Les paramètres de dispersion sont des nombre qui mesurent la dispersion des valeurs observés
autour d’un paramètre de position (x̅, Me, ….). Ces paramètres permettent de comparer des
séries de même nature.

2.1. Les moments

2.1.1. Moment d’ordre r

On appelle moment d’ordre r, (r ∈ IN) d’une variable x le nombre :


p
∑i=1 nixir p
Mr(x) = = ∑i=1 fixir
n

Avec :
p ni
n = ∑i=1 ni ; fi = n

Remarque

Si l’on dispose de données ponctuelles, alors ni=1 pour tout i ; pour des données groupées, xi

Est le centre de la classe n° i.

2.1.2. Moments centrés d’ordre r

On appelle données centré d’ordre r (r ∈ IN), le nombre :


p
∑𝑖=1 ni(xi−x̅)r
µr (x) = = ∑𝑝𝑖=1 fi (xi-x̅)r
n

Avec :
𝑝
1
x̅ = ∑ nixi
n
𝑖=1

2.1.3. Egalités remarquables

On a :

mo =1

m1 = x̅

m2 = Q (moyenne quadratique)

µo = 1, µ1 = 0

En utilisant la formule du binôme du Newton, on montre les relations suivantes :

µ2= m2 = m12

33
µ3 = m3+ 3m2m1 + 2m13

µ4 = m4 – 4m3m1 + 6m2m12- 3m14

Remarque : Formule du binôme de Newton

Soit a et b deux éléments et n un entier positif. Le développement de (a+b) n est donnée par la
formule du binôme de Newton :

(a+b)n = ∑nk=0 cnk akbn-k

Les cnk s’appellent aussi coefficients binomiaux.

2.1.4. Changements d’origine et d’unité

Soient a et b deux réels quelconques, et les séries statistique :

× = {xi}, i= 1,…, n ; y= {yi}, i = 1,……, n

Telles que :

yi= axi +b

Alors : ∀ r ∈ IN µr (Y) = ar µ(X)

Démonstration

yi-y̅ = axi +b – (ax̅ +b)

= a (xi -x̅)

On a:
1 p
µr (Y) = n ∑i=1 nI (y - ̅)
y

1 p
= n ∑i=n ni [a (xi -x̅)]r

p1
= ar n ∑i=1 ni (xi- x̅ )r

= ar µr(X)

2.2. La variance et l’écart type

2.2.1. La variance

On appelle variance d’une variable X son moment centré d’ordre 2 :


p
∑𝑖=1 ni (xi−x̅) p
Var (X) = = ∑i=1 fi(x-x̅)2
n

Formule développée

34
1 p
Var (X) = n ∑i=1 nixi2 - x̅2

= m2 – m12

Démonstration
1 p
Var (X) = n ∑i=1 ni (xi-x̅)2

1 p
= n ∑i=1 ni (xi2-2x̅xi + x̅2)

1 p 1 p 1 p
= n ∑i=n nixi2 − 2x̅ n ∑i=1 ni xi + x̅ 2 n ∑i=1 ni

1 p
= n ∑i=1 xi2 − 2x̅x̅ + x̅.1

p1
= ∑i=1 nixi2- x̅2
n

Propriété

Soit {xi} une série statistique et {yi} la série définie par yi = axi +b où a et b sont deux réels
quelconques, alors :

Var=(Y) = a2 Var (X)

2.2.2. Ecart Type

De tous les critères de la dispersion, l’écart-type est certainement le plus utilisé. L’écart-type
d’une série est égale à la racine carrée de la variance :

𝜎(X) = √Var(X)

L’écart-type noté 𝜎 (sigma) est une mesure de dispersion absolue, il s’exprime dans la même
unité que les valeurs observées et mesure la dispersion autour de la moyennex̅. Plus l’écart-
type est grand, plus la dispersion autour de la moyenne est importante.

2.3. Le coefficient de variation

Pour faciliter les comparaisons entre séries, on utilise une mesure de dispersion relative
appelée coefficient de variation. Le coefficient de variation CV est le rapport de l’écart type
𝜎 à la moyenne x̅ :
σ
CV = ̅
X

C’est un nombre sans dimension et indépendante des unités choisies. On l’utilise pour
comparer par exemple les distributions de salaires dans différentes pays. Ainsi les salaires des

35
journalistes ont pour coefficient de variation 0,45 alors que les salaires des enseignants ont
pour coefficient de variation 0,75 : le salaire est une variable relativement (c’est-à-dire
compte tenu du rapport des moyennes) plus homogène chez les journalistes que chez les
enseignants.

Dans la pratique, une distribution est dite homogène si son coefficient de variation est
inférieur à 0,30 ; elle sera considérée comme hétérogène si son coefficient de variation est
supérieur ou égal à 0,30.

Exemple d’application

Le tableau ci-dessous représente la distribution des notes obtenues à un devoir de statistique


pour 50 étudiants.

Notes Effectifs
[0,5[ 4
[5,10[ 17
[10,15[ 26
[15,20[ 3
Total 50

Calculer la moyenne, l’écart type et le coefficient de variation de cette distribution.

Corrigé

On dresse le tableau suivant, où xi et ni sont le centre et l’effectif de la classe numéro i,


respectivement.

Notes xi ni nixi nixi2


[0,5[ 2,5 4 10 26
[5, 10[ 7,5 17 127,5 956,25
[10, 15[ 12,5 26 325 4062,5
[15, 20[ 17,5 3 52,5 918,75
Total 50 515 5962,5

a) La moyenne arithmétique :
1 515
x̅ = n ∑4i=1 nixi = = 2,806
50

b) La variance est
1p
Var (X)= ∑i=1 nixi2
n

= 5962,5-(2.806)2

= 13,16

36
c) L’écart-type est

𝜎= √13,6 =3,628

La dispersion des notes autour de la note moyenne est 3,628

d) Le coefficient de variation est :


σ(X) 3,628
CV= = = 0,352
x̅ 10,3

Le coefficient de variation est 35,2%, la distribution des notes est hétérogène, elle est donc
relativement dispersée.

37
Deuxième Partie

CALCUL DES PROBABILITES

Chapitre 1 : ANALYSE COMBINATOIRE

38
Objectifs pédagogiques

Lorsque vous aurez complété l’étude du chapitre 1, vous pourrez :

1. Enoncer ce qu’on entend par un arrangement, une permutation et une combinaison ;

2. Appliquer le principe fondamental

3. Utiliser les principes de l’analyse combinatoire

Introduction

39
Quand on cherche la probabilité d’évènements complexes, l’énumération des cas élémentaires
est souvent difficile, fastidieuse, ou l’un et l’autre.

Pour faciliter la tâche, on utilisera les principes de base de l’analyse combinatoire.

1. Principe fondamental

Lorsqu’un évènement peut se réaliser suivant n1 manières, et qu’immédiatement après, un


autre évènement peut se produire suivant n2 façons, les deux évènements peuvent se produire
dans l’ordre considéré suivant n1 x n2 façons.

Exemple

S’il y a 2 candidats au poste de député et 3 à celui de mairie, les deux fonctions peuvent être
occupées de 2x3= 6 façons.

2. Factorielle

Etant donné un entier positif n, on note n! et on lit factorielle n, le nombre obtenu par le
produit de tous les nombres entier de 1à n.

n!= 1 × 2 × 3 × … .×n = ∏ni=1 j

De même (n+1) ! = (n+1) x (n) !

Par convention 0 ! =1. (Dans toute la suite p ∈ IN, n ∈ IN et p ≤n.).

3. Arrangements

On appelle arrangement p à p des n éléments d’un ensemble E tout sous- ensemble ordonné
de E ayant p éléments.
p
Le nombre total de ces arrangements est noté An , on a :
p n!
An = n (n-1)(n-2)…….(n-p) (n−p)!

C’est également le nombre d’injections d’un ensemble E à p éléments distincts dans un


ensemble F à n éléments.

Exemple 2

Dans une course de 18 chevaux, le nombre de tierces possible dans l’ordre est :

3 18!
𝐴18 = 15! = 18 x 17 x 16 = 4896

4. Permutations

40
On appelle permutation de n élément de l’ensemble E, tout ensemble ordonné formé par ces n
éléments.

Le nombre total de ces permutations est noté np.

Une permutation de n éléments différents pris p à p est un arrangement de p éléments pris


p
parmi les n donnés, dans un ordre bien déterminé. On désignera par Pn le nombre de
permutations de n éléments pris p à p, qui est donné par :
p n!
Pn = n (n-1)(n-2)…..(n-p+1) = (n−p)!

Exemple 3

Les nombres de permutations des lettres a, b, c prises deux à deux est P32 = 3 x 2 x 1 = 6. Ces
permutations sont ab, ba, ac, ca, bc, cb.

Le nombre de permutations de n éléments dont n1 sont identiques, n2 autres identiques, ….


n!
Est : où n = n1 + n2 + ….. + nk
n1!n2!….nk

Exemple 4

Le nombre de permutations des lettres du mot statistiques est :


12!
= 6.652.800
3!3!1!2!1!1!1!

Puisqu’il y a 3s, 3t, 1 à 2 i, 1q, 1u, 1e.

5. Combinaisons

Une combinaison de n élément diffèrent pris p à p est une sélection de p éléments parmi les n
p
donnés, sans ordre déterminé. On désignera par Cn le nombre de combinaisons de n élément
pris p à p. Ce nombre est donné par :

p APn n(n − 1)(n − 2) … . . (n − p + 1) n!


Cn = = =
p! p! p! (n − p)!

Exemple 5

Le nombre de combinaisons que l’on peut former avec les lettres a,b,c prises deux à deux est
3 x 2 x1
C32 = = 3. Ces combinaisons sont ab, ac, bc. Remarquons que ab et ba représentent la
2!
même combinaison, mais pas la même permutation.

Exemple 6

41
5
Dans un jeu de 32 cartes, le nombre de mains de 5 cartes ne comportant des as est C28 =
98280. En effet, il s’agit du nombre de combinaison de 5 cartes choisies parmi les 28 cartes
du jeu autres que les 4 as.

6. Formule du binôme de Newton

Soient a et b deux élément et n un entier positif. Le développement de (a+b)n est donné par la
formule du binôme de Newton.

(a+b)n = ∑nk=0 Cnk ak bn-k

Les Cnk S’appellent aussi coefficients binomiaux.

Preuve

n étant un entier positif,

(a+ b)n = ( a+b) (a+b)…….(a+b) n fois.

Il s’agit d’un polynôme de degré n, homogène en a et b. Le terme de plus haut degré en a est
an puisqu’on l’obtient en prenant a dans chacun des facteurs. D’une manière général, le terme
de degré k s’obtient en choisissant a dans k facteurs et b les n-k facteurs restants. Un tel choix
n
se fait de C𝐾 n k n-k
n façons différentes donc le terme le terme correspondant est ∑k=0 Cn a b

Exemple 7

Pour tout a ∈ IR non nul, on cherche à déterminer le terme constant de


1
(a2 + a)12

Par la formule du binôme de Newton on a :


1
(a² +a)12 = ∑12 k 3(k−4)
k=0 C12 a

Le terme constant de cette expression est obtenu pour k = 4. Il vaut donc :


4
C12 = 495.

Chapitre 2 : Espace probabilisé- probabilités

42
Objectifs pédagogiques

Lorsque vous aurez complété l’étude du chapitre 2, vous pourrez :

1. Préciser ce qu’on entend par expérience aléatoire et évènement aléatoire et les


appliquer dans divers contextes ;
2. Définir la notion de probabilité ;
3. Evaluer correctement les probabilités associées à des évènements ;
4. Appliquer la formule de bayes ;
5. Définir la notion d’indépendance d’évènement

1. expérience aléatoire

. On appelle expérience aléatoire, une expérience 𝜀 conduisant selon le hasard à plusieurs


résultats possible.

. On appelle univers associé à l’expérience aléatoire 𝜀, l’ensemble Ω de tous les résultats


possibles de . Tout élément 𝜔 de Ω est appelé évènement de .

Exemple 1

L’expérience consiste à jouer deux fois à pile ou face. L’univers est :

Ω = {PP, PF, FP, FF}

Il est fini. Il peut être également infini comme nous le constatons dans l’exemple suivant.

Exemple 2

L’expérience consiste à jouer deux fois à pile ou face jusqu’à l’obtention d’un pile. L’univers
est :

Ω = {P, FP, FFP, FFFP, …..}

2. Evènement aléatoire

. On appelle évènement aléatoire, associé à l’expérience 𝜀, tout évènement dont la réalisation


dépend des résultats des résultats de l’expérience 𝜀 . Un évènement aléatoire s’identifie à une
partie de A de Ω.

Exemple 3

Dans l’expérience qui consiste à jouer deux fois à pile ou face on considère l’évènement :

A = ¨On obtient deux faces identique¨ = {PP, FF}

. On appelle évènement certain l’univers Ω et évènement impossible l’ensemble vide ∅.

̅ le complémentaire de A dans Ω :
. On appelle évènement contraire de A, noté A

43
̅ = { 𝜔 ∈ Ω : 𝜔 ∉ A}
A

Il n’est réalisé que si A n’est pas réalisé.

Exemple 4

On lance un dé non pipé. Ω= { 1, 2, 3, 4, 5, 6}. Considérons l’évènement A = ¨ Le résultat


obtenu est pair¨ = {2, 4, 6}. Alors il est clair que l’évènement contraire de A est :

̅ =¨ le résultat obtenu est impaire¨ ={ 1, 3,5 }.


A

Soient A et B deux évènements aléatoires.

Inclusion : La relation A⊂ B (A inclus dans B) exprime le fait que la réalisation de


l’évènement A impliqué celle de B. A ⊂ B signifie que si A est réalisé alors B est réalisé.

Réunion : L’évènement A∪ B est réalisé si A ou B est réalisé. Il s’agit de l’évènement :

A ∪ B = { 𝜔 ∈ Ω : 𝜔 ∈ A ou 𝜔 ∈ B}

Intersection : L’évènement A ∩ B est réalisé si A et B sont réalisés. Il s’agit de


l’évènement :

A ∩ B = { 𝜔 ∈ Ω : 𝜔 ∈ A et 𝜔 ∈ B}

Incompatibilité:

On dit que A et B sont incompatibles (c’est à dire ne peuvent pas se produire simultanément)
̅ sont incompatibles car on a toujours
si A ∩ B = ∅. Il est claire par exemple que A et A

̅= ∅.
A∩A

Propriété des opérateurs logiques

- Commutativité
A∪B=B∪A
A∩B=B∩A
- Associative

A ∪ ( B ∪ 𝐶 )= (A ∪ B) ∪ C=A ∪ 𝐵 ∪ 𝐶
A ∩ (B ∩ C) = (A ∩ B) ∩ 𝐶 = A∩ B ∩ C

- Distributivité

A ∪ ( B ∩ 𝐶 )= (A ∪ B) ∩ (A ∪ 𝐶)
A ∩ (B ∪ C) = (A ∩ B) ∪ (A∩ C)
Lois de Morgan

44
̅̅̅̅̅̅̅̅
A∪B =A ̅∩B
̅
̅̅̅̅̅̅̅
A ∩B = A ̅∪B
̅
Autres propriétés
 A ̿ =A
 A∩∅ = ∅
 A∪∅ =A
 A∩Ω=A
 A∪Ω =Ω
 A∩ A ̅= ∅
 A∪ A ̅=Ω

Ensemble des évènements

Soit @ l’ensemble des évènements que l’on souhaite prendre en compte dans le cadre d’une
expérience aléatoire. La structure de @ doit satisfaire aux conditions suivantes :

i) L’ensemble @ est stable par passa au complémentaire :

̅∈@
Si A∈ @ alors A

ii) l’ensemble @ est stable par réunion dénombrable, pour toute famille (Ai), i ≥ 0
d’évènement aléatoire de @, on a :
+∞

⋃ Ai ∈ @
i=0

On parle de tribu de Ω. Le couple (Ω, @) s’appelle un espace.

3. probabilité

3.1. Définition

Une probabilité sur un espace probabilisable (Ω, @) est une application p de @ dans [0,1] qui
vérifie les axiomes suivants :

i) L’axiome de certitude

La probabilité de l’évènement certain est l’unité

P (Ω) = 1

ii) l’axiome d’additivité

La probabilité associée à l’union de deux évènements incompatibles, est la somme des


probabilités respectivement affectées aux deux évènements.

Si A et B sont deux évènements aléatoires incompatibles, alors P (A∪B) = P(A) +P(B)

i) Pour tout suite (Ai) d’évènements incompatibles deux à deux on a :

45
p(⋃+∞ +∞
i=o Ai) = ∑i=0 P(Ai) 𝜎 additivité.

Le triplet (Ω, @, P) s’appelle un espace probabilisé.

3.2. Propriétés

i) P(Ω) = 1

ii) 0≤ P(A)≤ 1, A ∈ @

̅)= 1- P(A), A ∈ @
iii) P(A

iv) Si A ⊂ B alors P(A) ≤ P (B), A et B 𝜖 @.

v) Formule de poincaré : soient A et B deux évènements aléatoires on a :

P ( A ∪ B ) = P(A) + P(B) – P ( A ∩ B).

En particulier, pour A, B et C trois évènements aléatoires, on :

P( A∪ B ∪ C ) = P(A) + P(B) + P(C) – P(A∩B) – P(A∩C) – P( B∩C) + P(A∩ B ∩ C)

Prevue des proprieties iii), iv) et v)


̅ , avec A et A
a) Ω = A ∪ A ̅ incompatibles

̅), avec P(Ω) = 1.


Donc P(Ω) = P(A) + P(A

̅) = 1- P(A)
On a alors P(A

b) A ⊂ B

̅)
On a B = A ∪ (B∩ A

̅) sont incompatibles on a :
Puisque les évènements A et (B∩ A

̅)
P(B)= + P(A) + P( B∩ A

̅)≥0
P(B)- P(A) = P( B∩ A

Ce qui donne P(A) ≤ P(B)

̅ ) ∪ B et comme ( A ∩ B
c) Puisque A ∪ B = (A ∩ B ̅ ) et B sont incompatible, on a :

̅) + P(B)
P(A ∪ B) = P(A∩ B

46
̅ ) sont également incompatibles.
De plus, A = (A∩B) ∪ (A ∪ ) et comme (A ∩ B) et ( A∩ B

P(A)= P(A∩ B) + P(A ∩ ̅̅̅


B)

̅̅̅ = P(A) - P(A∩ B) et en reposant cette valeur dans la première égalité,


Finalement, P(A ∩ B)
on trouve que :

P(A∪ B)= P(A ) +P(B ) – P(A∩ B)

3.3. Probabilité uniforme

On est en présence de la probabilité uniforme sur Ω si tous évènements élémentaires de Ω


possèdent la même probabilité. Dans ce cas, pour tout évènement aléatoire A on a donc :

Card (A) nombre de cas favorables


P(A )= =
card(Ω) nombre de cas possibles

Exemple 5

On tire deux cartes au hasard dans un jeu de 32 cartes. On cherche la probabilité d’obtenir
deux rois.

On obtient dans le cadre de la probabilité uniforme avec


2
Card (Ω) = C32 = 496

Soit A l’évènement aléatoire A = « on obtient deux rois ». Puisque le jeu comporte 4 rois, le
nombre de cas favorable est

Card (A) = C42 = 6

Finalement on trouve
4
P(A) = 496 = 0.012

4. Probabilité conditionnelles

4.1. Introduction

Un joueur lance successivement deux dés non pipés. On a bien sûr :

Ω = {(1, 1), (1,2), (1, 3) …..(6, 5),(6, 6)}

Et card (Ω) = 36. Tous les évènements élémentaires de Ω sont équiprobables.

On considère l’évènement :

A = « la somme des points supérieur ou égale à 10 ».

On a :

47
A= { ( 4, 6), (5,5), (5,6), (6, 4), (6,5), (6,6)}

Il est claire que :


Card (A) 6 1
P(A)= Card (Ω) = 36 = 6

On considère maintenant les évènements :

Bi = « le résultat du premier dé est égal à i », avec i = 1 …….6.

Par exemple : B5 = { (5, 1), (5, 2), (5, 3), (5, 4), (5, 5), (5, 6)}

Si B1 est réalisé, alors A est irréalisable car la somme des points ne peut pas excéder 7.

On dira que la « probabilité conditionnelle de A sachant B1 », notée P (A/B1 ) est nulle.

4.2. Définition

Soit (Ω, @, P) un espace probabilisé. Soient A et B deux évènements aléatoire avec P(B) ≠ 0.
On appelle probabilité conditionnelle de A sachant B, le nombre réel :
P(A∩B)
P (A/B) = P(B)

Si p(B)= 0 alors la probabilité conditionnelle n’est pas définie.

Remarque : Il s’agit bien d’une probabilité.

1) Pour A dans @, on a :(A∩B), donc P (A∩B)≤ P(B) et


P (A∩B)
= P(A/B) ≤ 1
P(B)

Finalement 0≤ P(A/B)≤1.
P(Ω∩B)
2) P(Ω/B)= =1
P(B)
3) Si A et C sont incompatible alors :
P[(A∪C)∩B]
P(A∪ C/B) = P(B)
P[(A∩B)∪(C∩B)]
= P(B)
P(A∩B)+P(C∩B)
P( A∪ B/C)= P(B)
= P(A/B) + P(C/B)
4) Si (Ai), i ≥0 est une famille d’évènements de deux à deux incompatibles, alors
P(⋃+∞ +∞
i=1 Ai/B) = ∑i=0 P(Ai/B)
Qui généralise la formule Précédente.
Par ailleurs :
P(A̅ / B) = 1- P(A/B)

Exemple 6
48
Mon voisin a deux enfants dont une fille. Quelle est la probabilité que l’autre enfant soit un
garçon ?

Corrigé

L’univers est Ω = {𝐹𝐹, 𝐹𝐺, 𝐺𝐹, 𝐺𝐺}.

Soit A = « mon voisin a deux enfants dont une fille » et B = « l’autre enfant est un garçon ».

On cherche à déterminer :
𝑃(𝐴∩𝐵)
P=(A/B)= 𝑃=(𝐵)

3 1
Il est clair que P(B)=4 et P(A∩ 𝐵) = 2

2
donc : P(A/B)=3 0 ,667

les formules suivantes seront très utiles dans des calculs de probabilité d’événement.

4.3 Formule des probabilités composées.

Soient A et B deux événements aléatoires. Alors on a :

P(A∩B)=P(A)P(B/A) si P=(A)≠0

P(A∩B)=P(B)P(A/B) si P=(B)≠0

Plus généralement si 1, …, An sont des événements tel que que :

P(A1∩A2 … Ak)˃0 A,k=1,…,n-1

La formule des probabilités composées s’écrit :

P(A1∩A2∩ … ,∩ 𝐴𝑛) =P(A1)P(A2/A1)P(A3/A1∩A2)

P=(An/A1∩A2∩…∩An-1)

Par exemple pour trois événements A, B et C, on a:

P(A∩B∩C)=P(A)P(B/A)P(C/A∩B)

Preuve
P(A∩B)
P( B/A) = P(A)

D’où

P(A ∩B) = P(A) P(B/A)

49
P(A∩B∩C)
Puisque P( C/A ∩ B) = , on a:
P(A∩B)

P(A ∩ B ∩ C) = P(A∩B)P(C/A ∩ 𝐵)

= P(A)P(B/A)P(C/A∩ B)

Exemple 7

Une urne contient 10 boules dont 5 rouges, 3 bleues et 2 blanches. On tire sans remise 3
boules de l’urne. Calculer la probabilité d’obtenir dans l’ordre une boule rouge, une boule
bleue et une boule blanche.

Soit A = ¨ La première boule rouge¨

B = ¨ La seconde boule est bleue¨

C = ¨ La troisième boule est blanche¨

On cherche P(A ∩B∩ C).

En utilisant la formule des probabilités composées, on obtient :

P(A ∩ B ∩C) = P(A)P(B/A)P(C /A∩B)

Avec
5 1 3 1 2 1
P(A)= 10 = 2 , P(B/ A) = 9 = 3 et P(C / A∩ B) = 8 = 4 ,

Finalement on a :
1
P(A∩ B ∩C) = 24 = 0,0416.

4.4. Formule des probabilitiés totals

On appelle système complet d’évènements toute famille { A1 ………An} d’évènements deux


à deux incompatibles tels que :

 P(Ai) ˃, i = 1, 2, ……., n
 ∑ni=1 P(Ai) = 1

On dit aussi que les évènements Ai forment une partition de Ω :

 Ω = ⋃i Ai
 Ai ∩ Aj = ∅ pour i ≠ j

Si on décompose un évènement quelconque sur cette partition de Ω, on a :

B=⋃ni=1 Ai ∩ B

D’où on obtient la formule des probabilités totales :

50
∀ B∈ @, P(B) = ∑ni=1 P(Ai)P(B/Ai)

Exemple 8

Une usine dispose de 3 machines qui fabrique respectivement 20, 30 et 50% de la production.
Sachant que la probabilité qu’une ampoule défectueuse ait été fabriqué par A, B, C est :

P(D/A)= 0.05 ; P(D/B)= 0.04 ; P(D/C) = 0,01.

Calculer :

1) La probabilité qu’une ampoule soit défectueuse ;


2) La probabilité qu’une ampoule défectueuse provienne de A
3) La probabilité qu’une ampoule non défectueuse provienne de C.

Corrigé

1) la probabilité pour qu’une ampoule soit défectueuse :

Appelons A, B, C, les évènements l’ampoule a été fabriquée par A, B, C.

P(A) = 0.20 ; P(B) = 0.30 ; P(C) = 0.50

Les évènements A, B et C forment un système complet.

On veut calculer P(D).

On utilise la formule des probabilités totales :

P(D) = P(A) P(D/A)+P(B)P(D/B)+P(C)P(D/C)

=0,01+ 0,012 + 0,05 = 0,027

2) Probabilité pour qu’une ampoule défectueuse provienne de A


P(A∩B) P(A)P(D/A)
P(A/D) = =
𝑃(𝐷) P(D)

0,20 x 0,05
= = 0,37
0,027

̅)
3) On veut calculer P(C/D
̅ ̅ /C)
̅ ) = P(C∩D) =
P(C/D
P(C)P(D
̅)
P(D 1−P(D)

̅ ) = 1- P(D/C) = 1-0.01 = 0.99


P(C/D

D’où

51
̅ ) = 0,05 x 0,99 = 0,51
P(C/D 1−0,027

4.5. Formule de Bayes

Si B est un évènement tel que P(B) > 0 et { A, ……., An }un système complet d’évènements,
la formule de Bayes s’écrit :
P(Ai)P(B/Ai)
P(Ai / B)= ∑n
i=1 P(Ai)P(B/Ai)

Preuve

Il suffit d’utiliser la formule des probabilités totales. On a :


P(Ai∩B) P(Ai)P(B/Ai)
P(Ai/B) = =
𝑃(𝐵) P(B)

La formule de Bayes donne l’expression des probabilités conditionnelles d’un évènement Ai –

du système complet par rapport à un évènement B. Elle donne ainsi la « probabilités des
causes ». P(Ai/B) est la probabilité que B étant réalisé, il soit dû à la cause Ai, la formule de
Bayes (où théorème de Bayes) suppose la connaissance a priori des probabilités des causes
Ai.

Exemple 9

Trois usine A1, A2, A3 fournissent respectivement 25%, 35%, 40% des carreaux nécessaires à
une entreprise de construction. Dans leurs livraisons, il y a une moyenne 5%, 4% et 2% de
carreaux inutilisables. Un carreau est choisi au hasard dans un stock important, ce carreau est
défectueux. Quelles sont les probabilités P(A1/D), P(A2/D), P(A3/D) qu’il provienne des
usines A1, A2 ou A3 ?

Corrigé

Les hypothèses se traduisent par :

P(A1)= 0,25, P(A2) = 0,35, P(A3) = 0,40

P(D/A1) = 0,05 , P(D/A2) =0,04 , P(D/A3) = 0,02

Les probabilités cherchées sont :

P(A1/D) , P(A2/D) et P(A3/ D).

Elles peuvent être calculées en appliquant le théorème de Bayes.

52
P(A1)P(D/A1)
P(A1/D) = D D D
P(A1)P( )+P(A2)P( )P(A3)P( )
A1 A2 A3

125
= 345 = 0,36

P(A2)P(D/A2) 140
P(A2/D) = = 345 = 0,41
P(D)

P(A3)P(D/A3) 80
P(A3/D) = = 345 = 0,23
P(D)

On vérifit bien que :

∑3i=1 P(Ai/D) = 1

5. Indépendance

Soit (Ω, @, P) un espace probabilisé. Soient A et B deux évènements aléatoires. On dit que A
et B sont indépendants si :

P(A∩ B) = P(A) P(B)

 Si A et B sont indépendants avec P(A)≠0. Alors on a :


P(A∩B) P(A)P(B)
P(B/A) = = = P(B)
P(A) P(A)

 ̅ et B, A et B
Si A et B sont indépendants, alors A ̅ et B
̅,A ̅ sont également indépendants.

Exemple 10

Au sein d’une population de 1000 dakarois, on a dénombré 120 atteints d’une maladie M,
les 880 autres étant indemnes de cette maladie.

1) Quelle est la probabilité pour qu’un individu tiré au hasard au sein de cette population soit
atteint de la maladie M ?

2) On observe un petit échantillon de 5 sujets tirés au hasard au sein de cette population.


Quelle est la probabilité que les 5 sujets soient indemnes de la maladie M ?

Corrigé

1) La probabilité pour qu’un individu tiré au hasard au sein de la population soit atteint de la
malade M est
120
P(M) = 1000 = 0,12

53
2) On suppose que le fait d’être atteint de M est indépendant d’un sujet à l’autre. Alors la
probabilité que 5 sujets tirés au hasard soient indemnes de la maladie M s’exprime par

̅ ∩M
P(M ̅ ∩M
̅ ∩M
̅ ∩M
̅ ) = [P(M
̅ )]5 = (1-0,12)5 = 0,528

Exemple 11

On lance deux dés. On considère les évènements :

A= ¨ Le premier dé amène un nombre pair¨ ;

B = ¨ Le second dé amène un nombre pair¨ ;

C = La somme des dés est pair¨ .

Calculer la probabilité de chacun de ces évènements.

Corrigé

On a :
1
P(A) = P(B) = P(C) = 2

1
P(A∩ B) = P(A)P(B) = 4

1
P(A∩ C) = P(A)P(C) = 4

1
P(B∩ C) = P(B)P(C) = 4

1
P(A∩B∩C) = P(A∩ B) = 2 car c⊂ (A ∩ B)

Donc A, B, et C sont deux à deux indépendants mais il ne sont pas indépendants dans leur
ensemble car P(A∩B∩C) ≠ P(A) P(B)P(C) .

Chapitre 3 : Variable aléatoire – lois de probabilité


54
Objectifs pédagogiques

Lorsque vous avez complété l’étude du chapitre 3, vous pourrez :

1. Préciser ce qu’on entend par variable aléatoire et par loi de probabilité ;


2. Distinguer entre variable aléatoire discrète et variable aléatoire continue ;
3. Calculer les principaux paramètres d’une loi de probabilité ;
4. Donner la signification de l’espérance mathématique, de la variance et de l’écart type
d’une variable et de l’écart – type d’une variable aléatoire ;
5. Représenter graphiquement une loi de probabilité.

1. Variables aléatoires discrètes

1.1. Variables aléatoires discrètes.

Exemple introductif

On jette deux fois un dé. L’univers Ω est l’ensemble des couples (a, b) tel que :

a, b ∈ { 1, 2, 3, 4, 5, 6} :

= {(1,1) , (1, 2) , …….(5,6) , (6, 6)}

A chaque évènement élémentaire 𝜔 = (a, b), on peut faire correspondre la somme a + b des
chiffres portés par le dé. On définit ainsi une application :

X:Ω→R

𝜔 → X (𝜔) = a + b

Cette application définie sur Ω est appelée «variable aléatoire ».

Définition

Soit (Ω, @ P) un espace probabilisé. On appelle variable aléatoire réelle (v. a. r), toute
application X définie sur Ω, à valeur dans R telle que, pour tout intervalle I ⊂R, l’ensemble
réciproque :

X-1 (1) = { 𝜔 ∈ Ω : X (𝜔) ∈ 1}

Est un évènement de @. On parle de l’évènement : { X ∈ 1}.

On note par X(Ω) l’ensemble des valeurs prises par X :

X(Ω) = {X(𝜔) pour 𝜔 ∈ Ω}

Définition

On dit qu’une v. a. r est discrète si l’ensemble X(Ω) est dénombrable.

55
Remarque

X (Ω) peut être fini. X(Ω) = {x1 , ………., xn} mais également infini dénombrable :

X(Ω) = {x1 , x2 , ….., xn , ..}

Exemple 1

On considère un univers Ω et la tribu @ = {Ω, ∅}. Soit f une application numérique telle que
𝜔1 et 𝜔2 étaient deux élément distincts de Ω on ait :

f(w1) = x1 et f(w2) = x2 ≠ x1

f est-elle une variable aléatoire sur Ω ?

Corrigé

Notons que x2 ≠ x1 sont deux éléments de R ; si f est une variable aléatoire sur Ω, on a alors

f-1 (x1) qui être un évènement de @ donc soit ∅, soit Ω.

Or

f-1(x1) ≠ ∅ car f-1 (x1) contient 𝜔1

f-1(x1) ≠ Ω car il ne contient pas 𝜔2

L’application f n’est donc pas une variable aléatoire.

1.2. Loi de probabilité.

Définition

Soit x une v.a.r discrète. On appelle lois de probabilité ou distribution de X, l’application p de


x(Ω) dans [0,1] définie par :

∀ x ∈ x(Ω) p(x) = p(X= x)

Propriété

Soit X une v. a. r discrète de loi de probabilité p. Alors on a :

∑ p(x) = 1
x∈X(Ω)

Remarque

Si X(Ω)= {x1 , x2 , ....... , xn , ….} alors


+∞

∑ p(x) = 1
i=1

56
1.3. Fonction de répartition.

Définition

On appelle fonction de répartition d’une v.a.r X, L’application F de R dans [0, 1] définie par :

∀ x ∈ R F (x) = P (X≤ x)

Remarque

Si les valeurs de X sont ordonnées, x(Ω) = {x1, …< Xn < ⋯ } alors, pour tout xn ≤ a < xn+1

F(a) = ∑ni=1 p(xi)

A partir de la définition précédente, on a la propriété suivante.

Propriété

Soit x une v.a.r discrète de fonction de répartition F. Alors on a les propriétés suivantes :

i) F est une fonction en escaliers ;


ii) F est une fonction croissante ;
iii) ∀ a, b ∈ R, si a < b alors :

P(a< X ≤ b )= F(b) – F (a)

iv) lim F(a) = 0 et lim F(a) = 1


a→−∞ 𝑎→+∞

Remarque

La fonction de répartition est définie à partir de la loi de x et réciproquement la loi de x est


entièrement déterminée par la connaissance de sa fonction de répartition.

Exemple 2

On jette successivement et indépendamment sur une table deux dés dont les faces sont
numérotées de 1 à 4. X étant le produit des nombre obtenus.

1) Donner la loi de probabilité de X, son diagramme en bâtons.

2) Donner la fonction de répartition de X et sa courbe cumulative.

Corrigé

1) Loi de probabilité de X et diagramme en bâtons.

Appelons i avec 1≤ i ≤ 4 le nombre obtenu sur le premier dé. Appelons j avec 1 ≤ j ≤ 4 le


nombre obtenu sur le second dé. On donnera la valeur de la variable aléatoire X dans un
tableau à double entrée, on aura : X(i, j) = i .j, ligne i et colonne j .

57
On prendra pour Ω, Ω= {1, 2, 4}2, card Ω = 4² = 16

2eme 1 2 3 4

1er
1 1 2 3 4
2 2 4 6 8
3 3 6 9 12
4 4 8 12 16

La loi de probabilité est donnée par le tableau suivant :

x 1 2 3 4 6 8 9 12 16 Total
1 2 2 3 2 2 1 2 1
P(X=x) 1
16 16 16 16 16 16 16 16 16

Et le diagramme en bâton

P(X=x)

3/16

2/16

58
1/16

0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

2) Fonction de répartition et courbe cumulative

Pour x < 1 F(x) = P(X< 1) = P(∅) = 0


1
1≤ 𝑋 < 2 F(x)= P(X< 2) = P(X=1)= 16

3
2≤ X < 3 F(x) =16

5
3≤ X < 4 F(x) =16

8
4≤ X < 6 F(x) =16

10
6≤ X < 8 F(x) =16

12
8≤ X < 9 F(x) =16

13
9≤ X < 12 F(x) =16

15
12≤ X < 16 F(x) =16

X ≥ 16 F(x) = 1

F(X)

3/4

2/4

1/4

59
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16

1.4. Espérance et variance

1.4.1. Espérance

L’espérance sert à mesurer la tendance centrale d’une variable aléatoire.

Définition

soit X une v.a.r discrète. On appelle espérance de X, notée E(X), le nombre réel, s’il existe,
définie par :

E(X) = ∑x∈X(Ω) x p(x)

Remarque

Il peut arriver que la série ci-dessus soit divergente. Dans ce cas, on dit que X n’a pas
d’espérance.

Si X(Ω) = { x1 , x2 , ….., xn , ….} , alors

E(X) = ∑+∞
i=1 xi p( xi)

Théorème

Soit X une v.a.r discrète et f une fonction définie sur X(Ω), à valeurs réelles. Alors
l’espérance de f(x), si elle existe, est donnée par :

E[f(x)] = ∑x∈X(Ω) f(x)p(x)

Remarque

En particulier on a :

E(x²)= ∑x∈X(Ω) x²p(x)

Propriété

Soit X une v.a.r discrète, a et b deux nombres réels. Alors on a :

E(aX + b) = a E(X) + b

Preuve

on a :

E(aX + b) = ∑x(ax + b) p(x)

= a∑x xp(x) + b∑x p(x)

60
= a E(X) + b

Définition

On dit qu’une variable aléatoire réelle X est centre si E(X) = 0.

Remarque

Pour toute v.a.r X, la v.a.r Y= X-E(X) est centrée.

En effet

E(Y)= E[X-E(X)]= E(X)- E(X)= 0

Nous allons nous intéresser à l’espérance de fonctions particulières de X.

1.4.2. Moments

Définition

Soit k ∈ IN. On appelle moment d’ordre k de X, l’espérance de la v.a.r. Xk , si elle existe,


donnée par :

E(Xk)= ∑x xk p (x)

On appelle moment centré d’ordre k de x, la quantité :

E[X- E(X)]k = ∑x[x − E(X)]k p(x)

Remarque

Si X(Ω) = {x1 , x2 , ….., xn ….} , alors

E(Xk) = ∑+∞ k
i=1 xi p(xi)

1.4.3. Variance

Définition

Soit X une v.a.r discrète. On appelle variance de X, notée var(X), l’espérance si elle existe,
de [X- E(X)]²

Var (x) = E [X- E(X)]²

= ∑x[X − E(X)]² p(x)

Théorème : (Koenig)

Soit X une v.a.r discrète possédant une variance. Alors on a :

61
Var (x) = E [X- E(X)]² = E(X²) – E²( X)

= ∑x 𝑋 2 p(x) − - [∑x x p(x)]²

Preuve

On a :

Var (X) = ∑x[X − E(X)]² p(x)

=∑x[x² − 2xE(X) + E²(X)]p(x)

= ∑x x 2 p(x) − 2[E(X)] ∑x xp(x) + E²(X) ∑x p(x)

= ∑x x²p(x)-2E²(X)+ E²(X)

= E(X²)-E²(X)

Remarque

Il peut arriver que la série définissant la variance soit divergente. Dans ce cas, on dit que X
n’a pas de variance.

Une variance est toujours positive car il s’agit de l’espérance d’une v.a.r. positive. De plus,
var(X) correspond au moment centré d’ordre 2 de X.

Elle mesure la disposition de X autour de son espérance.

Définition

On appelle écart type de X, noté 𝜎(X), la racine carré de sa variance :

𝜎 (X)= √var(x)

Définition

On dit qu’une v.a.r est réduite si var(X)= 1

Propriété

Soit X une v.a.r discrète et soient a et b deux nombre réels. Alors on a :

Var(aX + b) = a² var(x)

Prevue

On a:

Var (aX +b)= ∑x[a x + b − E(a x + b)]²p(x)

= ∑x[ a x – E(a x)]²p(x)

62
= a²∑x[x − E(x)]²p(x)

= a² var (x)

Remarque

Pour toute v.a.r X possédant une variance, la variable aléatoire :


X−E(X)
Y= σ(X)

est centré et réduite.

En effet :
1
 E(Y)= σ(X) E[X-E(x)] = 0, Y est centrée
1 1
 Var(Y) = 𝜎²(𝑋) V[X-E(x)] = 𝜎²(x) x V(X)
V(X)
= V(X) = 1

Y est une variable réduite

Exemple 3

Un grossiste estime que la demande en tonnes de denrées périssables est une variable aléatoire
X de loi :

X 0 1 2 3 4 5
P(x) 0,05 0,15 0,20 0,35 0,15 0,10

1) Calculer la demande moyenne et l’écart- type de X.

2) calculer la probabilité que la demande soit :

a) inférieure à 2 tonnes ;

b) comprise entre 1 et 3 tonnes ;

c) supérieure à 2 tonnes.

3) le stock du grossiste est de 3 tonnes. Il gagne 5000F par tonne vendue et perd 2000F par
tonne invendue. Calculer son bénéfice moyen et l’écart- type associé.

Corrigé

63
1a) Demande moyenne = E(X)

E(X)= ∑5x=0 xp(x)

= [0x0.05] +[1x0.15] + … + [5x0.10]

= 2.7

b) variance de X

Var(X)= ∑5x=0 x 2 p(x) − E²(x)

= [0² x 0.05]+[1²x 0.15]+…+[5²x 0.10]-(2.7)²

=(1.308)²=1.71

D’où 𝜎(x) = 1.308

2.a)

P(x≤ 2) = ∑2x=0 p(x) = p(0) + p(1) + p(2)

=0.05+0.15+0.20

=0.4

b)

P(1 ≤ 𝑋 ≤ 3) = ∑3x=1 p(x)= p(1) + P(2) +P(3)

= 0.15+ 0.20 + 0.35

= 0.70

P(𝑋 > 2) = 1-p(x)≤ 2

= 1-0.40= 0.60

3) soit Y la variable aléatoire représentant le nombre de tonnes vendues

Le stock initial étant de 3 tonnes, il est claire que :

Y(Ω) = {0, 1 , 2 , 3}

Le bénéfice est alors la variable aléatoire Z donnée par :

Z = 5000Y – 2000(3-Y)

= 7000y -6000

Pour linéarité de l’espérance, on a :

E(Z) = 7000 E(Y) -6000

64
𝜎(𝑍) = 7000 𝜎(𝑌)

Il nous faut déterminer la loi de Y :

P(Y=0) = p(X=0) = 0.05

P(Y=1) = p(X=1) = 0.15

P(Y=2) = p(X=2) = 0.20

P(Y=3) = p(X≥3) = 0.60

D’où E(Y) = 0.15 + 0.40 + 1.8 = 2.35

V(Y) = 0.15 + 4x 0.20 + 9 x 0.60 – (2.35)²

= 6.35 – (2.35)² = 0.8275

Il en découle que

 E(Z) = 7000 x 2.35 -6000 = 10450F


 𝜎(Z)= 7000x √0.8275 = 6367,692

2. Variables aléatoires continues

2.1. Variables aléatoires continues

Définition

On dit qu’une v.a.r X définie sur l’espace de probabilité (Ω, @, P), est continue si X(Ω)
contient au moins un intervalle de R .

Remarque

On ne rencontrera dans la suite que des v.a.r X absolument continues pour lesquelles, ∀ X ∈
𝑅 , P(X= x) = 0. Les évènements de probabilités non nuls serons donc les intervalles [a , b ]
de R.

Dans le cas d’une v.a.r continu, l’ensemble X(Ω) n’est pas dénombrable. Il nous fait donc
abandonner le signe somme ∑. que l’on remplacera par le signe ∫.

2.2. Densité de probabilité

Définition

Soit X une v.a.r continue. On appelle densité de pro

65
babilité de X, la fonction f définie sur IR tel que tout intervalle [a , b] de R :
𝑏
P(a≤ X ≤ b) = ∫𝑎 f(x)dx

Exemple 4

Soit X une v.a.r continue de densité f définie sur IR par :

𝑒 𝑥 si x ≥ 0
f(x)= {
0 si non
f est positive, continue sur IR sauf en 0 et :
+∞ +∞ −𝑥
∫−∞ f(x)dx = ∫0 𝑒 𝑑𝑥 = [ -𝑒 −𝑥 ]+∞
0 =1

On peut calculer par exemple :


1 1
P(-2≤ x≤ ¼ ) = ∫04 𝑒 −𝑥 𝑑𝑥 = [ -𝑒 −𝑥 ]40
1
= 1-𝑒 −4 = 0.22

Propriété

Soit une v.a.r continue de densité de probabilité f. Alors on a :

i)∀x ∈ R, f(x) ≥ 0

ii) f est une fonction continue sur R sauf en un nombre fini de points.

iii) on a toujours :
−∞
∫+∞ f(x)dx = 1

2.3 Fonction de réparation

Définition

Soit X une v.a.r continue. On appelle fonction de réparation de X, la fonction F définie ∀x ∈


R par:

F(x) = p(x≤ x)

Exemple

Soit X une v.a.r continue de fonction de réparation F définie sur R par :

0 si x ≤ 0
x
F(x) ={2 𝑠𝑖 0 ≤ x ≤ 2
1 si x ≥ 2

66
F est continue et croissante. On peut calculer par exemple :
1
P (-1≤ x ≤ 1) = F(1)-F(-1)=2

Propriété

Soit x une v.a.r continue de fonction de répartition F. Alors, on a :

i) F est une fonction continue sur R

ii) F est à valeurs dans [0, 1] lim F(x) = 0 et lim F(x) = 1


𝑥→−∞ x→+∞

iii) F est une fonction croissante. Précisément, ∀ a, b ∈ IR avec a< 𝑏

P(a≤ x ≤ b) = F(b)-F(a)

Remarque

Pour la propriété iii), on peut écrire a < x < b, a ≤ x < b ou a < x ≤ b sans changer le
résultat final.

Proposition

Soit X une v.a.r continue de densité f et de fonction de répartition F. Alors, ∀ x ∈ IR on a :


x
F(x) = ∫−∞ f(t)dt

F’ = f(x), est la Dérivé premier de F(x)

Remarque

Ainsi à partir de la densité f on peut déterminer la fonction de répartition F. Dans l’exemple


4, ∀ x ∈ 𝑅, x ≤ 0, F(x) = 0 et si x > 0,
x x
F(x)= ∫−∞ f(t)dt = ∫0 e−t 𝑑𝑡 = [−e−𝑡 ]x0

= 1-e-x

Réciproquement, à partir de la fonction de répartition F, on peut déterminer la densité f.

Dans l’exemple 5, on a :

0 si x ≤ 0
1
f(x) = {2 si 0 ≤ x ≤ 2
0 si x ≥ 2

2.4. Espérance et variance

2.4.1. Espérance

Définition

67
Soit x une v.a.r continue de densité de probabilité f. On appelle espérance de X, notée E(x), le
nombre réel, s’il existe, défini par :
+∞
E(x)= ∫−∞ xf(x)dx

Remarque

Il peut arriver que l’intégrale ci-dessus soit divergente. Dans ce cas, on dit que X n’a pas
d’espérance.

Théorème

Soit X une v.a.r continue de densité de probabilité f. Soit h une fonction définie sur X(Ω) à
valeurs réelles.

Alors, l’espérance de h(X), si elle existe, est donnée par :


+∞
E[h(x)] = ∫−∞ h(x)f(x)𝑑x

On a en particulier :
+∞
 E(X²) = ∫−∞ x 2 f(x)dx
+∞
 E(LogX) = ∫−∞ Logx f(x)dx

2.4.2. Moments

Définition

Soit X une v.a.r continue de densité de probabilité f. pour k∈IN, on appelle moment d’ordre k
de X, l’espérance de la v.a.r Xk, si elle existe, donnée par :
+∞
E(Xk) = ∫−∞ Xkf(x)d(x)

On appelle moment centré d’ordre k la quantité


+∞
E[X-E(X)]k = ∫−∞ [X − E(X)]k f(x) dx

2.4.3. Variance

Définition

Soit X une v.a.r continue de densité de probabilité f. On appelle variance de X, notée var(X),
l’espérance, si elle existe, de [X- E(X)]2.
+∞
Var(X) = ∫−∞ [x − E(X)]2 f(x) dx

= E(X²)- E²(X)
+∞
=∫−∞ x²f(x) dx –E²(X)

68
Propriété

Soit X une v.a.r continue, a et b deux nombres réels ; alors on a :

 E(aX + b) = a E(x) + b
 Var (aX + b) = a² var(x)

Définition

On appelle écart – type de X, note 𝜎 (X), la racine carrée de sa variance :

√var(X)

Exemple 6

Soit a ∈ 𝑅, a> 0 et soit X la variable aléatoire continue de densité de probabilité f avec :

(4 − x) si 0 ≤ x ≤ 4
f(x) = {a x
0 sinon
1) Trouver a afin que X suive bien une loi de probabilité.

2) Déterminer le mode de X

3) Calculer l’espérance et la variance de X.

4) Déterminer la fonction de répartition de X.

5) Calculer les probabilités suivantes :

P(X=2) ; P(X= < 2) ; P(2< 𝑋 < 3)

Corrigé

1) on a toujours :
+∞
∫−∞ f(x) dx = 1
4 1
= ∫0 a x (4-x) dx = a[2x² - x 3 ]40
3

32
= a=1
3

3
Il en découle que a= 32.

2) Déterminons le mode de X

Nous savons que le mode de X, noté M0 (X), est la valeur de IR qui maximise la densité f(x)
12 6 3 3
f’(x)= 32 - 32 x = - 16 x + 8

69
3 3
f’(x)= 0 ⇔ - 16 x + 8 = 0 ⇒ x = 2

3
On a f’’(x) = - <0
16

Le mode de la variable aléatoire X est M0 (x)= 2

3.a) Calcule de E(X)


4
E(X)= ∫0 x f(x) dx

4 4 1
= ∫0 ax² (4- x)dx = a[3x3- 4 x4]40

64 64 3
E(X) = a = x =2
3 3 32

b) Calcul de var (X)

par le théorème de koening, on a :

var(X) = E(X²) – E²(x)


4
E(X²) = ∫0 x² f(x) dx

4 1
= ∫0 a x3(4-x) dx = a[x4- 5 x 4 ]40

256 256 3 24
E(X²) = a= x 32 =
5 5 5

Finalement:
24 4
Var(X)= –4=5
5

4) Si F est la fonction de répartition de x, on a pour tout x ∈ R,


𝑋 3 x
F(x) = P(X≤ x)= ∫0 f(t)dt = 32 ∫0 (4t – t²) dt.

3 1 3 X3
=32 [ 2t² -3t3]x0 = 32 (2x² − )
3

Par suite :

0 𝑠𝑖 X ≤ 0
3 X3
F(X)= { 32 (2x² − ) si 0≤ x ≤ 4
3
1 𝑠𝑖 x ≥ 4

5.a) probabilité que (X= 2)

P(X = 2) = 0

En effet pour une variable aléatoire continue, la densité de probabilité en un point est nulle.

70
b) probabilité que (X< 2)
3 8 3 16
P(X< 2) = F(2) = 32 (8 − 3) = 32 x = 0,5
3

C ) Probabilité que (2< x < 3)


3 27 1
P (2< x < 3) = F(3) – F(2)= 32 (18 − )-2
3

27 1 11
= 32 - 2 = 32 = 0, 344

2.5. Fonction de variables aléatoires continues

Soit X une v.a.r continue de densité de probabilité f et h une fonction définie sur X(Ω) à
valeur réelles.

Le problème consiste à déterminer la densité de la v.a.r Y= h(x) à partir de f. On a :

P(Y≤y) = P[h( x ) ≤ y]

= P(h(X) ∈ ] -∞, y] )

Notons D= {X ∈ 𝑋(Ω): h(x) ∈] − ∞, y]}

Alors on a : P(Y≤ y) = P(X∈ D) = ∫𝐷 f(x)dx

Exemple 7

Soit a, b ∈ R avec a et b strictement positifs. Soit X la variable aléatoire continue de densité f


avec :

f(x)= b exp (-a |x|)

1) Trouver a et b en fonction de a afin que X suive bien une loi de probabilité.

2) Calculer l’espérance et la variance de X.

3) Déterminer la loi de y= X².

4) En déduire l’espérance et la variance de Y.

Corrigé
+∞ +∞
1)∫−∞ f(x)dx = b ∫−∞ exp( -a |x|)dx
+∞ −ax
= 2b ∫0 e dx

1 2b
= 2b [-a e−ax ]+∞
0 = a

71
=1
a
Il en découle que b= 2

2.a) Calcul de l’espérance mathématique de X : E(X)


+∞
On a : E(X) = ∫−∞ xf(x)dx = 0

Car c’est l’intégrale d’une fonction impaire sur IR ( f est une fonction paire).

b) Calcul de la variance de X
+∞
var (x) = E(X²) = b ∫−∞ x² e−ax dx
+∞
= a∫−∞ x² e−ax

2
= a²

Par intégration par parties.

3) Détermination de la loi de Y= X².

Si y< 0, F(y) = 0.

D’autre part, si y ≥ 0

F(y) = P(Y≤ y) = P(X² ≤ y)

= P (−√y ≤ X ≤ √−𝑦 )

√y √y
= ∫−√y b e−a|x| dx = 2b. ∫0 e−ax dx

𝑦 √y
= a ∫0√ e−ax dx = -[ e−ax ]0

F(y) = 1-e− a√y


Si f est la densité de Y, on trouve f en dérivant la fonction de répartition F :
a
e−a√y
{ 2√y si y ≥ 0
0 Sinon
4.
a) calcul de l’espérance mathématique de Y
2
E(Y) = E (Y²) = a²

b) calcul de la variance de Y

72
Var (Y) = E(Y²) – E² (Y)
+∞
E(Y²) = E(X4) = ∫−∞ X 4 f(x) dx
+∞
= a ∫0 X 4 e−ax dx
24
= a4

Par intégration par parties.


Finalement on trouve que :
24 4 20
Var (Y) = a4 - a4 = a4

Chapitre 4 : LOIS DE PROBABILITES

Objectifs Pédagogiques :

Lorsque vous aurez complété l’étude du chapitre 4, vous pourrez :

1. Maîtriser les définitions et les expressions des principales lois de probabilité


2. Utiliser correctement les tables de probabilités binomiales, normales et de poisson
3. Utiliser selon les conditions d’application, la loi de poisson comme loi approchée de la
loi binomiale
4. Utiliser selon les conditions d’application, la loi normale comme loi approchée de la
loi binomiale
5. Appliquer les différentes lois de probabilité à différentes situations concrètes.

I. Lois Discrètes

1. Loi de Bernoulli

1.1. Définition

Une variable aléatoire X est bernoullienne, de paramètre p, (0< p < 1) si :

P(X= 1)=p, p(X= 0)= 1-p = q X(Ω) = {0, 1 }

1.2. Valeurs caractéristiques

 E(X) = ∑k kP[X= k]= 0 x (1-p) + 1xp= p


 Var (X) = E(X²) – E² (X)
E(X²)= ∑k k 2 P[X = k] = p

Var (x) = p-p² = p(1-p) = pq

73
Exemple 1

On jette un dé équilibré de 6 faces numérotées de 1 à 6. On appelle succès le fait que le 5 ou


le 6 sortes. En cas de succès on marque un point.

Soit X la variable aléatoire prenant la valeur 1 en cas de succès et 0 sinon. La loi de X est une
1
loi de Bernoulli de paramètre 3 loi de x :

K 0 1
2 1
P(X=k)
3 3
1
P=3

2 1 2
q= 3 , E(X) = 3 var (x) = 9

La loi de Bernoulli joue un rôle fondamental en théorie des probabilités et en Statistique, car
elle sert de modèle à toute expérience aléatoire dont les issues appartiennent à deux classes
mutuellement exclusives.

2. loi binomiale

2.1. Définition

Soit P la probabilité de réalisation d’un évènement quelconque, lors d’une certaine épreuve
(p : probabilité de succès).

Soit q= 1-p la probabilité de non – réalisation du même évènement, lors de la même épreuve
(q : probabilité d’échec).

La probabilité de k réalisations (succès) de cet évènement, lors de n répétitions successives


indépendantes de la même épreuve, est fournie par la loi de probabilité binomiale :

P(X= k) = Cnk pkqn-k

X(Ω) = {0, 1 ,….. n }

On résume cette loi par la notation B(n, p).

2.2. Valeurs Caractéristiques

L’espérance mathématique de la loi binomiale est np et la variance est npq.

Démontration

.E(X)= ∑nk=0 kP(X= k) = ∑nk=0 Cnk pk(1-p)n-k


kn! n(n−1)! k−1
Or ∀ k ∈ IN*, kCnk = k!(n−k)! = (k−1)!(n−1−(k−1))! = nCn−1

74
n k−1
(On peut aussi savoir que Cnk = Cn−1 )
k

Donc :

E(X) = n∑nk=1 Cn−1


k−1
ppk−1 (1 − p)n−1(k−1)

= np∑n−1 k k
k=0 Cn p (1 − p)
n−1−k
(Changement k← k − 1)

= np[p+(1-p)]n−1= np

. var(x)= E(X²)- E²(x)

E(x²)= ∑nk=0 k²P(X=k)

=∑n𝑘=2 k(k-1)Cnk pk(1-p)n-k+ ∑nk=1 kp(X = k)


k(k−1)n! n(n−1)(n−2)
Or ∀ k ≥2; k (k-1) Cnk = = (k−2)!(n−2−(k−2))!
k!(n−k)!

k−2
= n(n-1)Cn−2

Donc:

E(X)= ∑nk=2 n(n-1)Cn−2


k−2 2 k-2
p p (1-p)n-2-(k-2)+ np

= n(n-1)p²∑n−2 k k
k=0 Cn−2 p (1-p)
n-2-k
(Changement k← 𝑘 − 2)

= n(n-1)p²[p+ (1-p)]n-2 + np

= n(n-1)p² + np

D’où Var(X) = n(n-1)p² + np –n² p² = np- np² = np(1-p)

Cette loi est un modèle de n épreuves indépendante de Bernoulli : si yk, k= 1 , 2 , … , n sont


des variables indépendantes de Bernoulli de paramètre p, la variable aléatoire :

X= ∑nk=1 Yk est binomiale

 E(X)= E (∑nk=1 Yk ) = n E(Y) = np


 Var (X) = var (∑nk=1 Yk ) = n var(Y)= npq

On retrouve ainsi les résultats établis précédemment.

Exemple 2

La loi binomiale est par exemple la loi du nombre de filles dans une famille de n enfants. X
=B(n, p) où p est la probabilité de naissance d’une fille. P = 0,5 si on suppose que la
probabilité de naissance d’une fille est égale à la probabilité de naissance d’un Garçon pour
un couple de 10 enfants, la probabilité qu’il y ait 4 filles est donnés par :

4 1 1 4 1
P(X=4) = C10 (2)4 (2)6 = C10 (2)10

75
210
= 1024 = 0,205

2.3. Calcul pratique des probabilités. Tables de la loi binomiale

Le calcul de la valeur numérique de la probabilité attachée à chaque valeur de X :

P(X= k) = Cnk pkqn-k

devient fastidieux dès que n dépasse quelques unités. Pour éviter ces calculs, des tables de loi
binomiale ont été établies. Ces tables sont volumineuses, donc peu commodes.

Mais fort heureusement, comme nous le verrons, sous certaines conditions, afin de faciliter
des calculs, on peut approximer cette loi par la loi de poisson, ou par la loi normale, dont il
existe des tables d’usage plus commode.

3. loi multinomial

3.1. Définition

Il s’agit d’une génération de loi binomiale. On fait n épreuves indépendantes avec k issues
possibles.

A1 avec la probabilité p1

A2 avec la probabilité p2

Ak avec la probabilité Pk

(avec p1 + p2 + … pk = 1)

Alors la probabilité d’avoir

n1 résultats A1

n2 résultats A2

nk résultats Ak

(avec n1 + n2+ ….+ nk = n)

Est :
n!
P=n p1 n1 p2 n2 ⋯ pk nk
1! n2! ⋯ n
k

On résume cette loi par la notion M(n, p1, … pk).

On l’appelle loi multinomiale card p est le terme du développement de ( p1 + p2 … + pk)n.

76
3.2. Exemple d’application

Une roulette de casino comporte 16 numéros de couleur rouge, 16 numéros de couleur noire,
1 numéro de couleur verte.

A la fin de 10 de parties consécutives, le rouge est sorti 7 fois, le noir deux fois, le vert une
fois. La probabilité de cet évènement est :
10!
P= p[(7R)∩ (2N) ∩ (1v)] = 7!2!1! [p(R)]7[P(N)]2[(P(v)1

Avec
16
R l’évènement « il sort un rouge » : P(R)= 33

16
N l’évènement « il sort noir » : P(N) = 33

1
V l’évènement « il sort vert » : P(V) =33

Avec card Ω = 33. Ω est l’ensemble des 33 numéros possibles.

Finalement la probabilité cherchée est :


10! 16 16 1
P= 7!2!1! [33]7 x [33]2 x [33]1= 0,016.

4. loi hypergéométrique

4.1. Définition

Considérons une urne contenant N boule, dont :

-Np sont blanches ( p : proportion de boule blanche ) ;

-Nq sont noires (q : proportion de boule noire).

Prélevons par tirage sans remise un échantillon de n boules. La composition de l’urne varie
ainsi à chaque tirage. Les tirages ne sont pas indépendants. Soit X le nombre de boules
blanches contenues dans l’échantillon. X est une variable aléatoire. La probabilité que
l’échantillon de n boules, tiré, sans remise, dans une urne de N boule, contienne k boules
blanches, est :
𝑘
𝐶𝑁 𝐶 𝑛−𝑘
𝑝 𝑁𝑞
P(X=k) 𝑛
𝐶𝑁

On résume cette loi par la notion :H(N ,n,p) .

77
La loi hypergéométrique dépend donc de trois paramètres ;la taille de l’urne ,la taille de
l’échantillon et la composition de l’urne , à la différence de la loi binomiale qui ne dépend que
des deux paramètres.

Les valeurs possibles de k sont comprises entre

max (0, n - Nq)≤ k ≤ min (n, N, p)

4.2. Valeurs caractéristiques

L’espérance mathématique de la loi hypergéométrique est :

E(X)= np

Sa variance est :
N−n
Var(X)= npq. N−1

N−n
La quantité N−1 s’appelle facteur d’exhaustivité

N−n
Dès que l’on effectue plus d’un tirage le coefficient est inférieur à un. Cette variance est
N−1
donc inférieure à celle de la loi binomiale qui est égale à npq.

Cependant, lorsque l’effectif N de la population est grand par rapport à la taille n de


l’échantillon, le Coefficient est différent de 1 :
N−n
→ 1 quand N→ ∞
N−1

Les deux modes de tirage de l’échantillon, exhaustif (loi hypergéométrique) et avec remise (
loi binomial) sont alors équivalents.

4.3. Approximation de la loi hypergéométrique par la loi binomiale

Dans la pratique, si n /N < 10% , il est souhaitable de remplacer la loi hypergéométrique par
n
la loi binomiale B(n, p,) la loi à deux paramètres. N est appelée taux de sondage. Ce résultat
est valable dès que la population est 10 fois plus grande que l’échantillon, ce qui arrive
fréquemment en matière de sondage.

Application

Un échantillon de 2000 individus conviendra aussi bien pour faire un sondage dans une ville
de 200 000 habitants que dans une ville de 2 000 000 d’habitant

Exemple 3

Dans une PME, sont employés 6 ouvriers et 5 employés. Le PDG, souhaitant prendre la vie de
son personnel, interroge cette personne choisi au hasard parmi ces 11 personnes. Soit X la
variable aléatoire : « nombre d’ouvrier interrogés ».

78
a) Quelle sont les valeurs prises par X ?

b) Quelle est sa probabilité ?

c) Calculer la probabilité d’interroger 4 ouvriers.

d) Calculer E(X) et var (X ).

Corrigé

a) le tirage est sans remise, donc la variable suit une loi hypergéométrique H(N, n , p) avec N
6 5
=11, n = 7. P=11 et q= 11. Les valeurs prises par X sont comprise entre :

max(0, n-Nq) et min (n, Np)

On a n-Nq= 7 -5 = 2 ; Np = 6 ; max (0, 2) = 2 ; min (7, 6) = 6

Donc X prend des valeurs entières entre 2 et 6.

b) Loi de probabilité
7−k
Ck
6 C5
P(X= k)= ; k= 2, 3 ; …. ; 6
C711

k 2 3 4 5 6
15 100 150 60 5
P(X= k)
330 330 330 330 330
0,045 0,303 0,455 0,182 0,015

C46 C35 15 X10 15


c) P(X=4) = = = = 0, 455
C711 330 33

42 N−n 84
d) E(X) = np = 11 = 3,818 ; var (X)= npq N−1 = 121 = 0,654

5. Loi géométrique

5.1. Définition

On dit qu’une variable aléatoire X admet une loi géométrique de paramètre p (0< p < 1) si :

P(X= k) = p(1-p)k , k = 0, 1, 2,….., X(Ω) = IN

5.2. Valeurs caractéritiques

L’espérance mathématique et la variance de la loi géométrique sont respectivement :


1−p q
E(X) = = .q = 1 − p
p p

1−p q
Var(X) = =
p² p²

79
Démonstration

E(X)= ∑+∞ k +∞
k=1 k. pq = pq ∑k=1 kq
k−1

d d 1
= pq x dq (∑+∞ k
k=0 q ) = pq x dq (1−q)

1 pq q
E(X)= pq x (1−q)2 = =
p² p

Var(X)= ∑+∞ k
k=1 𝑘²pq – E² (X)

∑+∞ k +∞
k=1 k²pq = ∑k=1[k(k-1)+ k]pq
k

= ∑+∞ k
k=1[k (k-1)]pq + E(X)

q
= pq² ∑+∞
k=2[k(k-1)]pq
k-2
p

d² 2 q
= pq² x (∑+∞ k
k=0 q ) = pq² x +
dq² (1−q)3 p

2𝑞² q
= +
p² p

Finalement
2q2 q q2 2q2 +qp−q2 q2 +qp
Var (X) = + − = =
p2 p p2 p2 p2

q(q+p) q
= =
p² p²

Cette loi décrie le nombre d’épreuve de Bernoulli nécessaire pour obtenir la valeur 1
exactement une fois.

La loi géométrique est importante par sa propriété dite de non- vieillissement : Pour tous m.

n ≥0.

P(X = m + n/ X ≥ m ) = P(X ≥ n)

Exemple 4

Dans une grande assemblée, des personnes jouent au jeu suivant : Chaque personne lance à
son tour un dé équilibré à 6 faces numérotées de 1à6, le premier qui obtient un 6 paye la
tournée à ses amis.

Quelle est la probabilité que le premier joueur A paye la tournée ? Même question pour le
deuxième joueur B, le troisième joueur C, le quatrième joueur D.

Corrigé

80
On a donc une loi géométrique où le succès est le fait d’obtenir 6 et l’échec le fait d’obtenir 1
…, 5.

Avec P(X= k) = p(1-p)k-1 , k = 1, 2 , …..


1 5
P= 6 , q= 1-p = 6

1
P(A) = P(X= 1) = p = 6 = 0,167

1 5
P(B) = P(X= 2) = pq = 6 x = 0,139
6

1 5
P(D) = P(X= 4) = pq3 = x ( )3 = 0,097
6 6

6. Loi binomiale négative (loi de pascal)

6.1. Définition

Une variable aléatoire x est une variable de pascal, de paramètres (r, p)

Si :
k
P(X=k) = Cr+k−1 pr(1-p)k , k= 0, 1, 2, …. X(Ω) = IN

6.2. Valeurs caractéristiques

L’espérance mathématique de la loi de pascal est :


r(1−p)
E(X) = p

La variance de la loi de pascal est :


r(1−p)
Var(X) = p2

Si r est naturel, la loi de pascal décrit le nombre d’épreuves de Bernoulli nécessaires pour
obtenir la valeur 1 très exactement r fois.

Si r = 1, on retrouve donc la loi géométrique.

La loi de pascal trouve des applications en statistique des accidents et des maladies, ans les
problèmes liés au nombre d’individus d’une espèce dans les les échantillons de populations
biologiques, etc.

7. Loi de poisson

7.1. Définition

Soit ℷ un réel strictement positif. On appelle loi de poisson de paramètre ℷ noté P(ℷ) la loi de
la variable X telle que :

81
𝑒 −𝜆 𝜆𝑘
P(X= k) = , k = 0, 1,… , X(Ω) = IN
k!

On vérifie que la somme des probabilités est égale à l’unité:


+∞ +∞
e−𝜆 𝜆k x e𝜆
∑ p(X = k) = ∑ = 𝑒 −𝜆 =1
k!
𝑘=0 k=0

En effet, 𝑒 −𝜆 se met en facteur et l’on reconnaît la série :

𝜆k 𝜆 𝜆² 𝜆k
∑+∞
k=0 = 1 + 1! + + ⋯+ + ⋯ Qui est égale à 𝑒 𝜆 .
k! 2! k!

82

Vous aimerez peut-être aussi