Vous êtes sur la page 1sur 124

Page 1 sur 124

Table des matières


INTRODUCTION GENERALE ...................................................................................................................................... 4

CHAPITRE I. ELABORATION ET PRESENTATION DES DONNEES STATISTIQUES. .......................................................... 6


I.1. Méthodes de collecte des données. ....................................................................................................................... 6
I.1.1. Concepts de base en échantillonnage. ............................................................................................................ 6
I.1.2. Méthodes d’échantillonnage. ......................................................................................................................... 7
I.1.3. Taille de l’échantillon................................................................................................................................... 10
I.2. Tableaux statistiques. ........................................................................................................................................... 10
I.3. Représentation graphique des données................................................................................................................ 16
I.3.1.Cas d’une variable discrète ............................................................................................................................ 16
I.3.2.Cas d’une variable continue. ......................................................................................................................... 16

EXERCICES .............................................................................................................................................................. 18

CHAPITRE II. ETUDE DES VALEURS TYPIQUES DES SERIES STATISTIQUES UNIVARIEES. ........................................... 20
II.1. Paramètres de tendance centrale (ou de position) .............................................................................................. 20
II.2. Paramètres de dispersion ................................................................................................................................... 27
II.3. Les paramètres de forme.................................................................................................................................... 30

EXERCICES .............................................................................................................................................................. 32

CHAPITRE III. REGRESSION ET CORRELATION. ........................................................................................................ 38


III.1. REGRESSION ................................................................................................................................................. 38
III.1.1. Procédés d’ajustement............................................................................................................................... 38
III.2. CORRELATION ............................................................................................................................................ 40

EXERCICES .............................................................................................................................................................. 43

CHAPITRE IV LE MODELE PROBABILISTE ............................................................................................................... 46

INTRODUCTION ...................................................................................................................................................... 46
IV.1. EVÉNEMENT ALÉATOIRE ......................................................................................................................... 46

IV.1.1 Expérience aléatoire (ε) ................................................................................................................................. 47


IV.1.2 Evénement aléatoire ....................................................................................................................................... 47
IV.1.3 Opérations sur les événements aléatoires ...................................................................................................... 48
IV.2. LOI DE PROBABILITÉ – ESPACE DE PROBABILITÉ ............................................................................... 49
IV.3. PROBABILITÉ SUR UN ENSEMBLE FINI .................................................................................................. 51

EXERCICES .............................................................................................................................................................. 53

CHAPITRE V. PROBABILITÉS CONDITIONNELLES .................................................................................................... 57


V.1 PROBABILITÉ CONDITIONNELLE.................................................................................................................... 57
V.2 MULTIPLICATION DES PROBABILITÉS ........................................................................................................... 58
V.3 FORMULE DES PROBABILITÉS TOTALES ....................................................................................................... 59
V.4 SYSTÈME COMPLET D’ÉVÉNEMENTS : ........................................................................................................... 60
Page 2 sur 124

V.5 EVÉNEMENTS INDÉPENDANTS ...................................................................................................................... 62


V.6 NOTION DE SYMÉTRIE MUTUELLE ................................................................................................................. 63

CHAPITRE VI VARIABLES ALEATOIRES ................................................................................................................... 69


VI.1 VARIABLES ALÉATOIRES ................................................................................................................................ 69
VI.2 VARIABLES ALÉATOIRES DISCRÈTES, VARIABLES ALÉATOIRES À DENSITÉ .......................................... 69
VI.2.1 Variables aléatoires discrètes .................................................................................................................. 69
VI.2.2 Variables aléatoires continues ................................................................................................................ 71
VI.3 VARIABLES ALÉATOIRES INDÉPENDANTES ................................................................................................. 72

EXERCICES .............................................................................................................................................................. 74

CHAPITRE VII. CARACTÉRISTIQUES NUMÉRIQUES DES VARIABLES ALÉATOIRES ................................................... 76


VII.1 ESPÉRANCE ..................................................................................................................................................... 76
VII.2 VARIANCE ET ÉCART-TYPE D’UNE VARIABLE ALÉATOIRE. ................................................................. 77
VII.3 COVARIANCE ET COEFFICIENT DE CORRÉLATION ............................................................................... 78
VII.4 VARIABLES ALÉATOIRES INDÉPENDANTES .......................................................................................... 79

CHAPITRE VIII. DISTRIBUTIONS DE PROBABILITES USUELLES ................................................................................. 81


VIII.1 DISTRIBUTIONS DE PROBABILITÉS DISCRÈTES ................................................................................... 81

VIII.2.1 Distribution normale (ou Laplace – Gauss) ......................................................................................... 89


VIII.2 DISTRIBUTIONS DE PROBABILITÉ CONTINUES. .................................................................................. 89

VIII.2.2 Loi de Student (ou de Gosset) ............................................................................................................... 90


VIII.2.3 Distribution de Chi-carré (χ²) ............................................................................................................. 91

EXERCICES .............................................................................................................................................................. 93

CHAPITRE IX. ESTIMATION .................................................................................................................................... 97


IX.1 Estimation ponctuelle ................................................................................................................................. 97
IX.2 Estimation par intervalle ............................................................................................................................ 97

EXERCICES ............................................................................................................................................................ 102

CHAPITRE X TESTS D’HYPOTHÈSES PARAMÉTRIQUES .......................................................................................... 104


Introduction ........................................................................................................................................................... 104
X.1 ETAPES D’UN TEST D’HYPOTHÈSE ........................................................................................................... 104
X.2 QUELQUES TESTS D’HYPOTHÈSES ........................................................................................................... 105
X.2.1 Test de comparaison de 2 moyennes ..................................................................................................... 105

X.2.3 Test de comparaison de deux proportions. ........................................................................................... 109


X.2.2 Test de comparaison d’une moyenne théorique à une moyenne observée ....................................... 108

X.2.4 Test de comparaison d’une proportion théorique P à une proportion observée P0........................... 110
X.2.5 Comparaison de données appariées. ...................................................................................................... 111
X.2.6 Test d’existence d’une liaison statistique linéaire. ............................................................................... 112

EXERCICES ............................................................................................................................................................ 113

CHAPITRE XI. TESTS D’HYPOTHESES NON PARAMETRIQUES................................................................................. 117


XI.1 Introduction .................................................................................................................................................... 117
XI.2 QUELQUES TESTS D’HYPOTHÈSES NON PARAMÉTRIQUES ...................................................................... 118
XI.2.1 Test d’indépendance. ............................................................................................................................. 118
XI.2.2 Test d’homogénéité. ............................................................................................................................... 119
XI.2.3 Test d’ajustement. .................................................................................................................................. 120
Page 3 sur 124

EXERCICES ............................................................................................................................................................ 122

Comment faire un bon travail statistique ? .......................................................................................................... 124


Page 4 sur 124

INTRODUCTION GENERALE

Ce cours est destiné à faire acquérir à l’étudiant ingénieur les notions


essentielles de la probabilité et de la statistique et lui donner ainsi des
outils lui permettant de décrire de façon claire et concise l'information
apportée par des observations nombreuses et variées sur un phénomène
aléatoire donné, d’interpréter des résultats obtenus et d’en faire
l’extrapolation éventuelle à un ensemble plus vaste afin de prendre des
décisions.

La théorie des probabilités est une science mathématique étudiant les


lois régissant les phénomènes aléatoires ou non déterministes. Tandis que
la statistique permet de confronter les modèles probabilistes avec la
réalité observée afin de les valider ou de les invalider. Par exemple, sur les
n objets prélevés en sortie de chaînes dans une production, k objets sont
défectueux. Peut-on en déduire quelque chose sur la qualité de la
production globale ?

Dans des domaines très divers, on prélève des statistiques. En


météorologie, on construit des séries chronologiques et on calcule des
moyennes annuelles à partir de nombreuses mesures provenant de
relevés de précipitations et de températures sur un grand nombre
d’années. Dans une entreprise, on peut noter chaque semaine le chiffre
d’affaires, le nombre de commandes, le nombre de pièces défectueuses, le
nombre de nouveaux clients, les performances de machines etc. Il s’agit là
des statistiques (ou des données statistiques) c’est-à-dire un ensemble de
mesures ou d’observations concernant l’état ou l’évolution d’un
phénomène.

La Statistique comprend deux grandes parties essentielles: la Statistique


descriptive (ou Statistique déductive) et la Statistique Inférentielle (ou
Statistique inductive ou Statistique mathématique ou Inférence
Statistique). La Statistique descriptive est l'ensemble des méthodes et
techniques mathématiques permettant de présenter, décrire, résumer de
telles données. Son but n’est pas d’expliquer mais simplement de décrire
Page 5 sur 124

avec des outils appropriés, de dégager l’essentiel, de réaliser des


synthèses en opérant des mesures. L'interprétation des résumés obtenus,
leur extrapolation éventuelle à un ensemble plus vaste, et leur utilisation
afin d'étendre les propriétés des données décrites sur un échantillon à
une population entière, et d’infirmer ou de confirmer des hypothèses sur
le phénomène décrit afin de prendre des décisions sur la population
entière à partir de l’échantillon constituent un autre domaine de la
Statistique, la Statistique
Statistique inférentielle.
inférentielle
Page 6 sur 124

CHAPITRE I. ELABORATION ET PRESENTATION DES


DONNEES STATISTIQUES.

I.1. Méthodes de collecte des données.

Une opération de collecte des données peut porter sur l’ensemble des
unités statistiques (population) ou sur une partie de ces unités
statistiques (ou échantillon). Par ailleurs, tout travail de collecte des
données se heurte à certaines contraintes : le coût, la main-d’œuvre et le
matériel, le délai d’exploitation et la qualité des résultats.
Dans cette section, nous allons répondre à deux questions fondamentales :
Comment choisir les unités statistiques à examiner ?
Quel nombre d’unités statistiques faut-il interroger en vue d’obtenir
l’information recherchée.

I.1.1. Concepts de base en échantillonnage.

a). Base de sondage : c’est la liste exhaustive d’étude.


b). Taille de la population (N) et taille de l’échantillon (n) : c’est le nombre
de sujets composant la population (resp. l’échantillon).
c). Taux de sondage (f) :
taille de l ' échantillon n
f = =
taille de la population N

d) Raison (r) ou pas de sondage : c’est l’inverse du taux de sondage


N
r=

e). Plan expérimental : c’est l’exposé des méthodes d’échantillonnage et


n

des problèmes qui s’y rattachent.


f). Représentativité d’un échantillon.
Un échantillon est dit représentatif s’il renferme toutes les
caractéristiques d’une population. Ce qui revient à considérer que chaque
élément de la population a une même chance d’appartenir à un même
Page 7 sur 124

échantillon. Les unités statistiques doivent être tirées au hasard (éch.


aléatoire).
NOTA : pour obtenir un éch. aléatoire, on procède comme suit :
• Assigner un numéro à chaque individu de la population ;
• Inscrire ces numéros sur de bouts de papier à placer dans une urne ;
• Procéder à un tirage dans l’urne en prenant soin de brasser tous les
papiers avant de les tirer.

I.1.2. Méthodes d’échantillonnage.

Il existe deux types de méthodes :


• Les méthodes d’échantillonnages aléatoires ou probabilistes ;
• Les méthodes non aléatoires ou à choix raisonné.

probabilistes.
1. Les méthodes d’échantillonnages aléatoires ou probabil istes.
Elles consistent à analyser une fraction de la population supposée
représentative de la population d’étude et tirée de façon aléatoire.

Cas où la population est homogène

1.1. Méthode d’échantillonnage aléatoire simple.


Les unités statistiques constituant l’échantillon sont désignées au hasard.
D’où la nécessité de disposer d’une base de sondage.

On distingue :
- l’échantillon aléatoire avec remise ;
- l’échantillon aléatoire sans remise.
Procédé du tirage.
- identifier tous les N individus de la population et les ranger suivant
un critère déterminé ;
- attribuer un numéro à chaque individu ;
Page 8 sur 124

- inscrire ces numéros sur des bouts de papier à placer dans une
urne ;
- opérer le tirage l’un après l’autre jusqu’à n.

1.2. Méthode d’échantillonnage aléatoire systématique.

Le tirage aléatoire simple implique un effort énorme car chaque nombre


doit être tiré de façon aléatoire. Dans l’échantillon aléatoire systématique,
seul le premier nombre est tiré au hasard. Dans la suite, on tire
successivement des nombres à intervalle fixe.
Procédé du tirage.
- dresser la base du sondage et ordonner suivant un critère
déterminé ;
- attribuer un numéro à chaque individu de l’univers de 1 à N ;
- calculer le pas de sondage ou raison r ;
- prendre au hasard une base : nombre compris entre 1 et r ;
- ajouter à la base la raison et ainsi de suite.

Cas où la population est hétérogène

1.3. Méthode de stratification


Lorsque la population est hétérogène face au caractère faisant l’objet
de l’étude statistique, on recourt à la méthode de stratification.

Description
Description de la méthode
- La population est subdivisée (partitionnée) en k classes : C1, C2, …,
Ck plus ou moins homogènes face au caractère faisant l’objet de
l’étude statistique. Cette partition est obtenue en faisant une étude
préalable socio-économico-démographique et sanitaire.
- Le nombre d’individu appartenant à chaque strate et qui devra faire
parti de l’échantillon est donné par la formule suivante :
Page 9 sur 124

 Ni 
ni où ni = nombre d’individu à tirer dans la
 N × n
≅
strate

Ni = taille de la strate

n = taille de l’échantillon

N = taille de la population.

- Le choix des ni individus se fait par une méthode aléatoire dans


chaque strate.

NOTA : La strate, pris dans son ensemble, doit :


o couvrir toute la zone d’enquête sans rien omettre
k
U Ni = N

o ne pas se chevaucher (empiètement). Chaque unité statistique fait


i =1

partie d’une strate et une seule.

Ni ∩ Nj = Ø ∀i ≠ j.

2. Les méthodes non aléatoires ou à choix raisonné.

L’échantillon obtenu par choix raisonné est constitué d’unités


statistiques qui n’ont pas été tirés au hasard. De ce fait, elles n’ont pas
la même chance d’appartenir à un échantillon.

2.1. Méthode des quotas (utilisée surtout dans les sondages).


On constitue un échantillon de manière à ce que certaines proportions
observées dans la population se retrouvent dans l’échantillon. Dans les
limites qui lui seront fixées, l’enquêteur reste libre d’interroger les unités
statistiques qu’il veut. Il devra respecter les quotas qui lui sont imposés.
Page 10 sur 124

I.1.3. Taille de l’échantillon.

Elle est déterminée à l’aide de la formule suivante :


z² pq
n =

Où z : écart-réduit, fixé en général à (1,96), qui correspond à un degré de


confiance de 95% ;
p : proportion de la population ayant une caractéristique donnée. Si
aucune estimation n’existe, on prendra p = 0,50 ;
q = 1-p ;
d : degré de précision voulu. En général, d=0,05, parfois 0,01.

I.2. Tableaux statistiques.

1. Tableau du premier ordre.


Ce type de tableau comprend une seule variable.
Tableau n°1.1 : Causes de décès chez les malades hospitalisés dans un
centre hospitalier :
N° Causes de décès Nombre de décès
1. Rougeole 20
2. Gastro-entérite 18
3. Tuberculose 15
4. Malaria 14
5. Accouchement dystocique 10
6. Malnutrition 9
7. Tétanos 9
8. Hernie étranglée 8
9. Trypanosomiase 7
10. Accident de circulation 6
11. Malformation congénitale 3
12. Autres causes 16
Total 129
Page 11 sur 124

2. Tableau du deuxième ordre ou tableau à double entrée.


C’est un tableau comprenant deux variables.
Tableau n°1.2. Distribution par âge et par sexe des cas de cancer de
poumons au cours d’une année dans les hôpitaux de Kindu.
Age (ans) Sexe Total
Masculin Féminin
1-5 14 5 19
6-10 15 17 32
11-15 24 23 47
16-20 42 18 60
21 et plus 43 36 79
Total 138 99 237

3. Tableau du troisième ordre ou tableau à triple entrée.


C’est un tableau contenant les données relatives à trois variables.

Tableau n°1.3. Répartition par âge, par sexe et par groupe de maladie
des patients ayant reçu des soins ambulatoires dans un Centre
de Santé.

Tranches d’âges
0-15 16-45 >45 Tot
M F M F M F al
Maladies 10 20 12 13 16 2 73
infectieuses
Troubles 22 25 40 10 15 8 120
nutritionnelles
Traumatisme 30 25 11 14 18 16 114
Autres affections 12 10 13 15 6 15 71
Total 74 80 76 52 55 41 378
Page 12 sur 124

4. Tableau de contingence.

C’est un tableau où sont présentées 2 variables comportant chacune un


certain nombre des classes.
Tableau n°1.4. Etat nutritionnel et résultats scolaires de 70 élèves d’une
école secondaire de Kinshasa.
Résultats scolaires Etat nutritionnel Total
Bon Médiocre
Bons 11 15 26
Médiocres 8 26 34
Total 19 41 70

5. Tableau de distribution des fréquences.

C’est un tableau comprenant des observations groupées selon leur


fréquence. On l’enrichit parfois avec des fréquences cumulées, des
fréquences relatives et des fréquences relatives cumulées.

a. Tableau de distribution des fréquences d’une variable discrète.

Le tableau est construit en mettant dans la première colonne les


diverses valeurs (x1, x2, …, xn) que prend la variable, en ordre croissant ;
et dans la seconde colonne, les effectifs correspondants (ou fréquences).
Page 13 sur 124

Tableau n°1.5 : Distribution des fréquences du personnel d’un centre de


santé d’après le nombre d’enfants en charge.
Nombre d’enfants en charge xi Effectif ni
0 5
1 17
2 31
3 20
4 11
5 4
6 1
∑ ni P n P 89

b. Tableau de distribution des fréquences d’une variable continue.


Dans le cas d’une variable continue, la présentation sous forme de
tableau requiert de longs calculs car le nombre de valeur est élevé.
On évite cette situation en effectuant un groupement des données en
classes.
Tableau n°1.6 : Distribution des fréquences des ouvriers d’une clinique
suivant leur âge :
Age Effectif ni Centre Effectif Fréquence
(classes) de cumulé Ni relative cumulée Fi
classe
[20,25[ 9 22,5 9 9/150
[25,30[ 27 27,5 36 36/150
[30,35[ 36 32,5 72 72/150
[35,40[ 45 37,5 117 117/150
[40,45[ 18 42,5 135 135/150
[45,50[ 9 47,5 144 144/150
[50,55[ 6 52,5 150 150/150

∑ ni P 150
Page 14 sur 124

Détermination du nombre de classes

La formule de Sturges donne le nombre de classes k à considérer :


k = 1 + 3,3 × log10 n où n est la taille de l’échantillon.

k peut être donné à l’avance.


L’intervalle ou l’amplitude d’une classe est donnée par le rapport
entre l’étendue du domaine de variation et le nombre de classes :

où I est l’intervalle ou l’amplitude d’une classe.


Etendue
I=
k

Centre de classe

C’est la valeur centrale d’une classe. En d’autres termes, c’est la


moyenne arithmétique des valeurs extrêmes d’une classe.
bi −1 + bi 25 + 20
xi = = = 22,5
2 2

c. Tableau des effectifs cumulés (Distribution des effectifs cumulés)


- Cas d’une valeur discrète

Les effectifs cumulés sont les nombres d’observations inférieures ou


égales à une valeur donnée de la variable.

- Cas d’une variable continue

Les effectifs cumulés sont les nombres d’observations inférieures ou


égales aux limites supérieures d’une classe.
La distribution cumulée des effectifs correspondant aux cas discret et
continue se présente de la manière suivante :
Page 15 sur 124

Centre de classes Fréquences relatives cumulées fi


x1 F1 =
N1
= f1
n
N2
x2 F2 = = f1 + f2
n
N3
F3 = = f1 + f2 + f3
n
x3
.
Nk
.
Fk = = f1 + f2 + …+ fk
n
.

xk

Les Ni sont les effectifs cumulés ou fréquence absolue cumulée.


Tableau n°1.7. Tableau statistique général de présentation des données

Centre Fréquences ou Fréquences Fréquences relatives


de classe effectifs (ni) relatives (fi) cumulées (Fi)
x1 n1 f1 = n1
F1 = f1 = N1
n n
n2 n1 + n2 N2
x2 n2 f2 = F2 = f1 + f2 = =
n n n
n3
f3 =
n
x3 n3 F3 = f1 + f2 + f3 = N3
nk n
. . fk =
n
Nk
. . Fk = f1 + f2 + …+ fk =
n
xk nk
Page 16 sur 124

I.3. Représentation graphique des données

I.3.1.Cas d’une variable discrète

a).
a). Le diagramme en bâtonnets
Nombre de personnes
Nombre
ayant ce nombre
d'enfants
d'enfants
0 103
1 115
2 95
3 35
4 10
5 2

b). Polygone des fréquences.


On l’obtient en reliant les sommets successifs du diagramme en bâtons.
I.3.2.Cas d’une variable continue.

a) Histogramme des effectifs

Nombre de
Age (ans) personnes dans
cette tranche
d'âge
20 à 30 100
30 à 40 150
40 à 50 90
50 à 65 20
Page 17 sur 124

Reprenons l’exemple portant sur l’âge des ouvriers d’une clinique.


Prenons un repère cartésien orthogonal sur l’axe des abscisses. Plaçons
les points aux limites de chaque classe, point qui détermine ici le segment
d’égale longueur. Sur chacun de ces segments,
segments, construisons des rectangles
de hauteur proportionnelle à l’effectif de la classe considérée.

b) Polygone statistique des effectifs


En joignant par des segments de droite les milieux des côtés
supérieurs des rectangles constituant l’histogramme, On obtient le
polygone statistique.
Autres représentations graphiques

a) Graphique circulaire ou à secteurs circulaires

Nombre de
Age (ans) personnes dans
cette tranche d'âge
20 à 30 120
30 à 40 150 Graphique à secteurs circulaires
40 à 50 80
50 à 65 10
a)
b) Diagramme à colonnes (voir TP).
Page 18 sur 124

EXERCICES

1) Un étudiant mène une enquête sur l’utilisation de l’Internet en milieu


estudiantin à Kinshasa. Aussi, il désire constituer un échantillon
représentatif de 100 étudiants. Le tableau suivant donne l’effectif
d’étudiants par universités et instituts.
Université/Institut Supérieur Effectif
Unikin 20 000
Isc 9600
Ista 7000
Inbtp 6200
Faculté protestante 3500
Autres 8900

Comment va- t- il constituer son échantillon représentatif ?


2) L’administration publique d’un certain pays africain veut informatiser
ses services, un lot de 1.000 ordinateurs de même performance est
commandé aux usines IBM. Afin de tester le bon fonctionnement des
ordinateurs, l’agent gouvernemental envoyé aux usines IBM propose
de tirer un échantillon représentatif constitué de 30 ordinateurs.
Comment va-t-il procéder ?
3) Un lot de 100.000 vaccins anti-rougeoles arrive à MATADI en
provenance des laboratoires SHALINA. Afin de tester si le lot répond
aux critères internationaux recommandés par l’OMS, Les services de
l’OCC veulent constituer un échantillon représentatif de 100 vaccins. Si
les vaccins sont numérotés de 1 à 100.000, comment vont-ils
procéder ?
Page 19 sur 124

4) Considérer une population hétérogène de N = 2.500 individus et


décomposable en 5 Strates C1 ,C2 ,…,C5 respectivement de N1 = 600 ,
5) N2 = 450 ,N3 = 900 ,N4 = 170 et N5 = 380 individus. On souhaite en
extraire un échantillon représentatif de taille n=250 individus.
Comment procéder ?
Page 20 sur 124

CHAPITRE II. ETUDE DES VALEURS TYPIQUES DES


SERIES STATISTIQUES UNIVARIEES.

Objectif : Résumer l’information contenue dans une série statistique. Pour


se faire, on calcule des valeurs statistiques ou des statistiques.

- Paramètres de tendance centrale ou de position.


Paramètres qui ont tendance à se positionner au centre d’une distribution
statistique (moyenne arithmétique, mode, médiane, quartiles,…)

- Paramètres de dispersion
Donnent les écarts entre les différentes valeurs et la moyenne
arithmétique (Etendue, variance, écart-type, coefficient de variation,…)
- Paramètres de forme
Caractérisent la forme de la courbe de fréquence (symétrie, asymétrie)

II.1. Paramètres de tendance centrale (ou de position)

1. La moyenne arithmétique ( x ) ou moyenne


Définition
C’est une valeur représentative d’un ensemble de données, qui a tendance
à se situer au milieu de cet ensemble.

a) Calcul de la moyenne arithmétique d’une distribution discrète


Soit x1, x2,… xn n valeurs observées d’une série statistique
x1 + x2 +...+ xn
x=
n
Ou encore, sous forme condensée
− 1 n
x = ∑ xi (formule simple)
n i =1
Exemple
Page 21 sur 124

Soit la série suivante :


− 5 + 8 + 4 + 5 + 2 +10 34
5 ;8 ;4 ;5 ;2 ;10 n =6 x= = = 5,6
6 6
Si les valeurs observées xi ont des fréquences absolues ni.
On utilise la moyenne arithmétique pondérée donnée par :

− n1 x1 + n2 x2 + ... + nk xk
x=
n
ou encore
n
x=1
n
∑nx i i (formule pondérée)
i =1

Exemple (cfr. Ex. précédent)


xi ni nixi
2 1 2
4 1 4
5 2 10
8 1 8
10 1 10
N=6 34

x = 34/6=5,6

b) Calcul de la moyenne arithmétique d’une distribution continue

On calcul d’abord des centres des classes (xi), puis on applique la formule
pondérée.
Page 22 sur 124

Tableau 2.1 : Exemple d’une distribution d’âges

Age (ans) Fréq. ab.ni Centre xi ni xi


20-25 9 22,5 202,5
25-30 27 27,5 742,5
30-35 36 32,5 1170
35-40 45 37,5 1687,5
40-45 18 42,5 427,5
45-50 9 47,5 157,5
50-55 3 52,5 172,5
55-60 3 57,5 5325
N=150
x = 5325/150= 35,5 ans

1.2.
1.2. La moyenne géométrique (G)
Elle est définie, pour une série de n termes positifs xi, par la racine nième
du produit de ces termes :
G= n x1 .x 2 ... x n

1.3.
1.3. La moyenne harmonique (H)
Considérons une série statistique x1, x2, …, xn de séries à termes positifs.
La moyenne harmonique est définie comme étant l’inverse de la moyenne
arithmétique des inverses des éléments de la série considérée :
1
H= n
1 1

n i =1 xi

1.4.
1.4. La moyenne quadratique (Q)
La moyenne quadratique d’une série de n termes est la racine carrée de la
moyenne des carrés de ses termes :
Page 23 sur 124

x12 + x22 + ... + xn2


Q=
n
2. Mode (Mo)

2.1. Définition.
C’est la valeur observée dont la fréquence absolue est la plus grande.

2.2. Remarques
Mo n’existe pas toujours,
Lorsque le mode existe, il peut ne pas être unique. D’où on peut
trouver :
• Une distribution unimodale
• Une distribution multimodale

2.3. Détermination du mode


a) Cas d’une distribution discrète
La détermination est immédiate
Ex1. 15 ;12 ;10 ;12 ;15 ;18 ;15
-Mo= 15
Ex2. : 11 ;15 ;12 ;11 ;15 ;11 ;10 ;15
Mo1=11 ; Mo2=15
b) Cas d’une distribution continue
Procédure
b.1. Déterminer la classe, celle qui admet la plus grande fréquence
absolue.
b.2. Utiliser la formule d’interpolation suivante :
∆1
M o = li + h
∆1 + ∆ 2

Où : l i est la limite inférieure de la classe modale


h est l’amplitude
Page 24 sur 124

∆1
= fréquence classe modale – fréquence classe précédente
∆2
= fréquence classe modale – fréquence classe suivante.

Tableau 2.2. Exemple de calcul du mode.

Age (ans) Fréq. Ab. ni li = 35


h = 40-35=5
20-25 9
∆1 = 45-36= 9
25-30 28
∆ 2 = 45-18= 27
30-35 36
35-40 45
Mo = 35 + 5 ( 9/ 9+27)
40-45 18
= 35 + 45/36
45-50 9 = 36,25 ans = 36 ans
50-55 3
55-60 3
n= 150

3. Médiane ( Me ou x1/2)

3.1. Définition
C’est la valeur observée se situant au milieu d’une série statistique rangée
par ordre croissant. Elle est telle qu’il y ait 50 % d’observations à sa
gauche et 50 % à sa droite.

3.2. Détermination de la Médiane


a. Cas d’une distribution discrète

On examine la parité de n ( n= taille de l’échantillon).


On a 2 cas :

Si n est impair :
M e = x n +1
2
Page 25 sur 124

Si n est pair :
1
Me = (xn + xn )
2 2 2 +1
Exemples
Ex1. 10 ;12 ;13 ;14 ;18

Avec (n=5) impair nous utilisons la formule


M e = x n +1
2

= = 3è
_`a c`a
b b

Donc Me = 13

Ex2. 10 ;12 ;13 ;14 ;18 ;20


Avec (n=6) pair nous utilisons la formule Me = ( xn + xn +1 )
1
2

n/2= 3e
2 2

(n/2) + 1= 4e
Me = (3e +4e ) /2 = (13+14)/2= 13,5(valeur fictive)

b. Cas d’une distribution continue


Procédure
b.1. Calculer les fréquences absolues cumulées (Ni)
b.2. Déterminer la classe médiane (= classe contenant l’observation de
rang n/2)
b3. Utiliser la formule d’interpolation suivante :
n
− Ni −1
Me = li + h( 2 )
ni


li est la limite inférieure de la classe médiane
h est l’amplitude de la classe médiane
ni est la fréquence absolue de la classe médiane
n est la taille de l’échantillon
Ni-1 est la fréquence absolue cumulée de la classe
Page 26 sur 124

précédant la classe médiane

Tableau 2.3. Exemple de calcul de la médiane.


Age ( ans) Fréq.ab. ni Fréq. ab.cum Ni Marquage
20-25 9 9 1e ;2e ;…9e
25-30 27 36 10e….36e
30-35 36 72 37e …..72e
35-40 45 117 73e …117e
40-45 18 135 118e …135e
45-50 9 144 136e …144e
50-55 3 147 145e …147e
55-60 3 150 148e …150e

n= 150
n/2 =150/2=75e
li= 35 ;
h= 5
Ni-1= 72
ni= 45
Me = 35 + 5 (75-72/45) = 35 +3/9 = 35 + 1/3= 35,3 ans
Me= 35 ans 3mois 18 jours
4. Les quartiles (Q1, Q2, Q3).
Ce sont des valeurs observées qui divisent la série statistique en quatre
parties égales. Elles sont déterminées à partir des formules suivantes :

n 
 4 − N i −1 
Q1 = l i + h  
 ni 
 
Page 27 sur 124


ℓi est la limite inférieure de la classe
contenant le premier quartile ;
h l’amplitude de la classe ;
ni est la fréquence absolue de la classe ;
Ni-1 est fréquence absolue cumulée de la classe ;
n 
 2 − N i −1 
Q2 = l i + h   = Me
 ni 
 

 3n 
 4 − N i −1 
Q3 = l i + h  
 ni 
 

5. Les Déciles (D1, D2,…, D10).


Ce sont des valeurs observées qui divisent la série statistique en dix
parties égales. Elles sont calculées à partir des formules suivantes :
 in 
 10 − N i −1 
Di = l i + h  
 ni 
 

Où i varie de 1 à 9.
NOTA :
On peut définir de manière similaire les centiles.
II.2. Paramètres de dispersion

Rôle : déterminer les écarts des différentes valeurs de la série statistique


vis-à-vis de la moyenne.
1. Etendue ( E )

E = Val. Max – Valeur min.


Page 28 sur 124

Avantage : calcul simple


Inconvénient : ne tient compte que de 2 valeurs extrêmes.

2. Variance ( s²)

Déf.
C’est la moyenne des carrés des écarts de diverses valeurs de la
série statistique vis-à-vis de la moyenne arithmétique.
Formule simple :
( ) ( ) ( )
2 2 2

x1 − x 2 + x2− x + .. xn+ x
s² =
n

( xi − x )
2

Ou encore

n
i =1
s² =

s² est dit variance simple.


n

Formule pondérée

( ) ( ) ( )
2 2 2

n1 x1 − x + n2 x2 − x + ...nk xk − x
s² =
n

Avantage : s² tient compte de toutes les valeurs


Inconvénient : l’unité de s² est le carré de l’unité des données initiales

3. Ecart- type (s ) ( Standard déviation)


s=+
2
s
* Avantage
- Tient compte de toutes les valeurs
- Comporte la même unité que les données initiales
Page 29 sur 124

4. Cœfficient de variation (C.V.)

s
C .V . = −
× 100

- s’exprime en % (c’est un nombre abstrait)


x

N.B. Si C.V. <17 %, on parle d’une dispersion faible


Si C.V. ≥ 17 %, on parle d’une dispersion forte

Tableau 2.4. Exemple de calcul de la variance, l’écart-type et le coefficient


de variation.

Age ( ans) Fréq. ni Centre xi ni.xi xi − x


− −
( xi − x)²

ni ( xi − x)²

20-25 9 22,5 205,5 -13 169 1521


25-30 27 27,5 742,5 -8 64 1728
30-35 36 32,5 1170 -3 9 324
35-40 45 37,5 7687,5 2 4 180
40-45 18 42,5 765 7 49 882
45-50 9 47,5 427,5 12 144 1296
50-55 3 52,5 157,5 17 289 867
55-60 3 57,5 172,5 22 484 1452
n= 150 5325 8250

a) Variance
s² =
1
n
( )
∑ ni xi − x ²
= 8250/150= 55 ( ans) ²

b) Ecart-type s= + s = 7,4 ≈ 7ans.


2

c) Coefficient de variation ( C.V)


s
CV = x 100= 7,4/35,5 x 100 = 20,8 %
x
Page 30 sur 124

Nous sommes en présence d’une dispersion forte.

II.3. Les paramètres de forme

Ils permettent d’étudier l’asymétrie et l’aplatissement.

Coefficients d’asymétrie.

1.1. Coefficient d’Asymétrie de SKEWNESS

x − Mode
.
SK =
S

Si SK = 0, la distribution est symétrique

Si SK > 0, la distribution est dissymétrique à gauche

Si SK < 0, la distribution est dissymétrique à droite.

NOTA : Le coefficient de SKEWNESS est empirique.

1.2. Le coefficient de FISHER


i
h i = jk ∑lnra mn (on − o̅ )b s
3 n a
l
m 1
g1 =
S3
avec m3 = ∑
n i =1
ni xi 3 .où

Si g1 = 0, il y a symétrie

Si g1 > 0, il y a dissymétrie à gauche

Si g1 < 0, il y a dissymétrie à droite.


Page 31 sur 124

2. Coefficients d’aplatissement

Selon le degré d’aplatissement, on peut classer la courbe en :

- Leptokurtique, si elles sont aiguës.


- Platykurtique, si elle est aplatie
- Mésokurtique, si elle est normale.

Coefficient de FISHER

;
m4
b2 =
S4

u
S u = jk ∑_vra nv (xv − xw)b s

où et
1 n
∑ i i )4 . a
m4 = n ( x − x
_
n i =1

Si b2 = 3, la courbe est normale (mésocurtique)


Si b2 > 3, la courbe est normale leptocurtique
Si b2 < 3, la courbe est normale platycurtique.
Page 32 sur 124

EXERCICES

1) Le rapport du prix du litre de lait au prix de la baguette de pain durant


une certaine année est égal à 3, tandis que ce même rapport est, pendant
l’année suivante, égal à 2.
a) calculer la moyenne arithmétique de ces rapports pour la
période de deux ans considérée.
b) calculer la moyenne arithmétique du rapport du prix du pain au
prix du lait sur la même période de deux ans.

2) Durant quatre années un propriétaire a acheté du mazout pour son


chauffage aux prix successifs de 16,18,21 et 25 centimes par litre. Quel est
le prix moyen du mazout sur cette période de 4 ans.

3) Un homme parcourt le trajet AB à la vitesse moyenne de 30km/h et le


trajet BA à la vitesse moyenne de 60km/h. Calculer la vitesse moyenne
sur le trajet total.

4) Le tableau suivant donne la durée de construction, en jours, de 60


habitations ; On suppose que ces données peuvent être distribuées en
k=10 classes de même amplitude
142 87 193 120 194 147 170 149 132 180
262 156 197 172 162 214 176 181 159 186
102 182 170 216 183 173 126 114 169 197
222 186 148 222 176 177 175 201 63 176
194 159 260 172 171 190 146 206 169 126
119 204 107 208 143 206 182 198 159 189
Page 33 sur 124

a) Etablir la distribution des effectifs;


b) Déterminer le nombre d’habitations dont la durée de
construction est inférieur à 163 jours
c) Construire un histogramme et un polygone de fréquence
pour la distribution observée des effectifs.
d) Calculer la durée moyenne, médiane et modale

5) Pour tester le fonctionnement de 50 ordinateurs, on a prélevé des


mesures de consommation de courant [exprimées en milliampères mA]
Le tableau ci-dessous en donne la répartition en 5 classes.

Classe Effectif
30 – 60 7
60 – 90 11
90 – 120 14
120 – 150 11
150 - 180 7

a) Tracer l’histogramme et le polygone statistique des effectifs.


b) Calculer les valeurs – typiques de position.
c) Calculer les valeurs – typiques de dispersion.
d) Le polygone statistique des effectifs ressemble à quelle distribution
théorique ? Justifier
6) Le tableau suivant donne le diamètre(en cm) d’un échantillon de 30
pièces d’un atelier de fabrication d’engrenage de la ville de Kinshasa.

1,47 1,7 2,01 1,12 1,85 1,01 1,58 2,01 1,31 0,77
1,2 1,93 1,47 1,97 2,59 2,94 1,19 1,89 0,75 1,2
1,13 1,2 0,8 1,31 2,01 1,47 0,87 1,31 1,19 0,76
Page 34 sur 124

a) Calculer le diamètre moyen.


b) Calculer le diamètre médian.
c) Déterminer le coefficient de variation de ces données.
d) Discuter sur le degré d’asymétrie et d’aplatissement de cette
distribution.

7) On considère la distribution en tonnes des charges maximales


supportées par les câbles que fabrique une certaine usine.
Charge Nombre de
maximale câbles
(tonne)
40 à <45 8
45 à <50 11
50 à <55 31
55 à <60 61
60 à <65 54
65 à<70 58
70 à <75 43
75 à <80 25
80 à <85 17
85 à <90 7

a) Tracer la courbe des fréquences cumulées


b) Calculer la valeur de la médiane de cette série. Contrôler le
résultat au moyen du graphique.
c) Calculer, à partir de cette série, la charge moyenne supportée
par un câble.
8) On a effectué des mesures des diamètres de tetes de vis fabriqués par
un atelier. Les mesures, en centimètres, sont classées dans des
intervalles de 0.7 cm, conduisant au tableau ci-dessous :
Page 35 sur 124

Intervalles : 24,7 25,4 26,1 26,8


Nombre de vis : 1 3 8
Intervalles : 26,8 27,5 28,2 28,9
Nombre de vis : 11 18 20
Intervalles : 28,9 29,6 30,3 31,0
Nombre de vis : 21 12 12
Intervalles : 31,0 31,7 32,4 33,1 33.8
Nombre de vis : 8 2 0 1
a) Calculer le diamètre moyen.
b) A partir de la courbe des effectifs croissants, déterminer la
médiane et les quartiles, vérifier par les calculs la coïncidence des
résultats.
9) Dans la promotion de G1 à l’INBTP, on donne les notes d’algèbre
obtenues par les étudiants à l’examen de la première session, dans un
échantillon de 100 étudiants :
6,5 8,5 10 8 8 10 9,5 6,5 10,5 11
6,5 8,5 10 8 8 10 9 7,5 10,5 10,5
7,0 8,5 10 8 8 9 9 8 10,5 10,5
7,0 9 7 8,5 7,5 9 9 8,5 10,5 10,5
7,0 9 7 8,5 7,5 9 9 8,5 10,5 9,5
7,5 9,5 7 8,5 7,5 9 9 8,5 11 9,5
7,5 9,5 7 8,5 9,5 11 7 8,5 11 9,5
7,5 9,5 7 8,5 9,5 11 7 8,5 10 9
8,0 9,5 8 7,5 9,5 11 7 9 10 9
8,0 10 8 7,5 9,5 9 7 9 11 9

a) Regrouper ces données observées en k=5 classes de même


amplitude et de la forme [li-1 ; li[ , (i=1,2,3,4,5) , avec l0 =6,5 et l5
=11,5.
b) Tracer l’histogramme et le polygone statistique des effectifs.
c) Calculer la note moyenne, médiane et modale.
Page 36 sur 124

Comparer et commenter les résultats calculés.


d) Que vaut l’écart quadratique moyen (variance) : s2 ?
e) La distribution observée est- elle symétrique ? Justifier.

10) Le tableau ci-dessous indique le quotient intellectuel(QI), âge mental


/ âge exact exprimé en pourcentage, de 480 enfants d’une école
maternelle.
Centre de 70 74 78 82 86 90 94 98 102 106 110 114 118 122 126

classe
effectifs 4 9 16 28 45 66 85 72 54 38 27 18 11 5 2

Trouver :
a) le QI moyen pour cette école
b) l’écart type de la distribution.

11) En 2004, la répartition en pourcentages de 40 ménages d’un quartier


de Kinshasa suivant le critère de leur revenu annuel s’établissait
comme suit :
Revenu 0-300 300-600 600-900 900-1200 1200-1500
Annuel($)
Fréquences 20 45 60 90 100
Cumulées(%)

a) Déterminer le nombre des ménages dont le revenu annuel maximal


est < 900$
b) Calculer la moyenne et l’écart - type par la méthode de changement
d’origine et d’unité x’=(x-a) / h (suggestion : prendre a=1050 et
h=300).
c)Déterminer les quartiles Q1 ,Q2 (médiane) et Q3 par la méthode
numérique et graphique (Représenter sur une même courbe Q1 ,Q2 et
Q3 )
Page 37 sur 124

12). On considère la série statistique suivante :


0 0 0 1 2 1 4 6 3 3 7 8 9
2 3 3 4 2 5 0 11 2 10 9 0 1
a) Tracer le diagramme en bâtonnets et le polygone des effectifs.
b) Calculer les valeurs – typiques de position.
c) Calculer les valeurs – typiques de dispersion.
d) Le polygone des effectifs ressemble t-il à une distribution normale?
Justifier
Page 38 sur 124

CHAPITRE III. REGRESSION ET CORRELATION.

Dans les chapitres précédents, les séries étudiées portent une seule
variable ; or il est possible d’étudier sur une même unité statistique deux
ou plusieurs variables comme par exemple la taille et le poids des
étudiants de l’INBTP, l’âge etc.

III.1. REGRESSION

Construction de la droite de régression de y par rapport à x.


La première étape consiste à déterminer la forme de la courbe, la seconde
étape est celle de trouver l’équation de cette courbe.
y = f(x)
y est appelé la variable expliquée, x est appelé la variable explicative.

III.1.1. Procédés d’ajustement

Il y a trois procédés d’ajustement


a) Ajustement graphique

Il consiste à tracer sur un graphique, à mains levées, une courbe


simple et régulière telle que les écarts positifs et négatifs des points à la
courbe se compensent.
y

x
b) Ajustement mécanique
Il y a plusieurs méthodes mécaniques :
Page 39 sur 124

- Méthode de moyenne mobile


- Méthode de moyenne échelonnée.

c) Ajustement analytique
Le problème d’ajustement analytique est de trouver le meilleur
ajustement des données c’est-à-dire une fonction qui doit s’adapter de la
façon la plus satisfaisante aux observations faites et conduire à une
courbe d’ajustement aussi simple que possible.
Cette fonction est notée f(x).

Des divers procédés permettant de trouver les paramètres, nous


retiendrons le principe ou la méthode des moindres carrés.

Méthode des moindres carrés


Considérons le tableau des fréquences supposées déjà calculées à l’aide de
la fonction d’ajustement y = f(x), les fréquences ajustées y1, y2, …, yn.
Calculons les écarts yi – yi’. Certains sont positifs, d’autres négatifs. En les
élevant au carré, on fait disparaître leurs signes. La fonction f(x) dépend
des paramètres a et b ; des valeurs différentes de ces paramètres donnent
des fonctions y = f(x) différentes.
On retiendra la fonction y = f(x) qui rend la plus faible possible la somme
des carrés des écarts yi – yi’.
En conclusion, on cherche la fonction y = f(x) qui permet de calculer
des yi tels que ∑ (yi – yi’)2 soit minimum.

Nous distinguons :
Ajustement linéaire (droite des moindres carrés)
Ajustement parabolique
Ajustement à l’aide d’une fonction exponentielle
Ajustement à l’aide d’une fonction des puissances.
Page 40 sur 124

Ajustement linéaire (Droite des moindres carrés)

Si la représentation graphique d’une série a montré qu’il était


légitime d’ajuster par une droite y = ax + b, il faut déterminer les

∑ (y )
n
2
− yi'
paramètres a et b tels que soit minimum.
i
i =1

Les formules ci-dessous permettent d’obtenir a et b :

∑( x − x)( y − y)
n

i i
COV ( x, y)
a= i =1
=
∑( x − x)
n 2 Varx (1)
i
i =1

b = y − ax (2)
NOTA : (1) peut encore s’écrire :
n
1 n n

∑ xi yi − ∑ i ∑ yi
x
n i =1 i =1
a= i =1
2
n
1 n 

i =1
x − 2
∑ xi
n  i =1 
i

III.2. CORRELATION

1. Existence
Existence d’une liaison statistique entre deux variables

La corrélation statistique relie les variations réciproques de deux


caractères statistiques sur une même unité statistique.
Il s’agit d’une relation beaucoup moins rigide que la relation fonctionnelle
y = f(x) où la connaissance de l’une de ses variables suffit pour
déterminer complètement la valeur correspondante de l’autre variable.
Les variables statistiques sont soumises à des fluctuations
Page 41 sur 124

c’est – à – dire à une valeur donnée d’une des variables il correspond non
pas une seule, mais toute une distribution des valeurs de l’autre variable.
Et inversement.
On ne saurait dire, par exemple, que le poids est une fonction de la taille
au sens mathématique de ce terme, ou inversement.
Pour une valeur donnée de la taille, dans un groupe de sujets dont on
étudie la taille et le poids, on trouvera toute une série de sujets ayant cette
taille, mais différents entr’eux par le poids. Inversement, pour une valeur
donnée du poids on trouvera toute une série de sujets différents entr’eux
par taille.
y y y

(1) x (2) x (3) x

Quand le nuage des points se présente sous la forme (1) ou (2),


on dit que les variables X et Y sont liées (ou qu’il existe une liaison entre X
et Y).
Pour (1), la liaison est appelée corrélation linéaire positive (car X et Y
croît ou décroît au même moment).
Pour (2), la liaison est appelée corrélation linéaire négative (car si X croît,
Y décroît et vice versa).

2. Intensité de la liaison : Coefficient de corrélation


Après avoir décelé graphiquement la corrélation entre deux
variables, on va en mesurer l’intensité grâce au coefficient de corrélation.

Formule permettant de calculer le coefficient de corrélation r :


Page 42 sur 124

∑( x − x)( y − y)
n

i i
COV ( X ,Y ) COV ( X ,Y )
r= i =1
= = (1)
Varx ×Vary
∑( x − x) ∑( y − y)
n 2 n 2 Sx SY
i i

Calcul rapide de r :
i =1 i =1

n
1 n n

∑ xi yi − ∑ xi ∑ yi
(1) est équivalent à : r =
i =1 n i=1 i=1
 n 2 1  n 2  n 2 1  n 2 
 ∑ xi −  ∑ xi   ∑ yi −  ∑ yi  
 i=1  i=1
n  i=1   n  i=1  

3. Propriétés de r

• r est un nombre pur c’est-à-dire qui n’a pas d’unités


• -1≤ r ≤ 1 c’est-à-dire r se situe entre -1 et 1
• Si r = ± 1, on dit que la corrélation est parfaite (r = 1 ou r = -1)
• Si |r| > 0.75, on dit que la liaison statistique entre les deux variables
est significative, on dit aussi que les deux variables sont fortement
corrélées
• Si |r| < 0.75, on dit que les deux variables sont faiblement corrélées.
NOTA : En pratique, cette conclusion est obtenue en procédant à la
lecture de la table statistique du coefficient de corrélation (test du
coefficient de corrélation).
• Si r > 0, la corrélation est positive. Voir figure (1) ci-dessus
• Si r < 0, la corrélation est négative Voir figure (2) ci-dessus
Si r = 0, il n’y a pas de corrélation. Voir figure (3) ci-dessus
Page 43 sur 124

EXERCICES

1) Le tableau suivant représente les recettes mensuelles de ventes R (en


millions de Francs Congolais) et P les dépenses de publicité (en
millions de Francs Congolais) pendant 6 mois chez Bralima.
P 2 1 4 5 7 6
R 10 4 8 12 13 12
a) Existe-il une liaison linéaire entre les deux variables ?
Quelle en est l’intensité ?
b) Calculer la droite de régression de R en P (droite des moindres
carrés).
c) Prédire les recettes de ventes le mois où les dépenses s’élèveraient
à 10 millions de Francs Congolais.
2) Existe-t-il une liaison entre la quantité de protéines solubles dans
l’azote (X) et la quantité de Chlorophylle (Y) rencontrée dans les
feuilles de la variété de riz IR22 ?

N° feuille x (en y(en


mg/feuille) mg/feuille)
1 0,60 0,44
2 1,12 0,96
3 2,10 1,90
4 1,16 1,51
5 0,70 0,46
6 0,80 0,44
7 0,32 0,04

a) Discuter sur le degré de signification de ce lien ;


b) Trouver l’expression mathématique de cette relation ;
Page 44 sur 124

c) Estimer la quantité de chlorophylle attendue pour une feuille


admettant une quantité de protéines solubles dans l’azote de 3mg.
3) Le tableau suivant donne la distribution des notes moyennes en
mathématique et en physique des étudiants de G1 de l’INBTP pour la
période allant de 1992 à 2000.
ANNEE 1992 1993 1994 1995 1996 1997 1998 1999 2000
mathématique 15 18 12 11 13 5 11 10 13
physique 16 15 14 19 14 6 14 13 15
a) Existe-il un lien significatif entre les notes moyennes en
mathématique et en physique ? justifier votre réponse.
b) Evaluer, si possible, la note en mathématique de l’année 2006 si l’on
suppose que la note en physique est de 10.
4) on indique sur le tableau suivant, pour 16 etudiants, leur classements
respectif en travaux pratiques et en questions de quatre cours :
cours 1 2 3 4
7 4 1 2
Travaux pratique 8 5 3 1
(sur 20) 6 6 3 2
5 3 2 2

a) Représenter graphiquement le nuage des points observés ;


b) Montrer en calculant le coefficient de corrélation linéaire r qu’il
existe une liaison statistique significative entre les notes obtenues et
les cours
c) Calculer et représenter graphiquement la droite de régression de Y
en x qui s’ajuste « au mieux » sur ce nuage de points observés.

5) On considère que la teneur en eau d’un certain mélange d’un produit à


un effet sur la densité du produit fini. la teneur en eau et la densité
ont été mesurées sur 12 échantillons repris dans le tableau suivant :
Page 45 sur 124

TENEUR 4,7 5,0 5,2 5,3 5,6 5,9


EN EAU
3 3 4 7 6 9
DENSITE 2 4 5 6
3 10
a) Peut-on affirmer qu’il existe une liaison significative entre les deux
variables ?
b) Déterminer, si possible, la nature d’un tel lien ;
c) Estimer la densité attendue si la teneur en eau du mélange vaut 6,1.

6) On effectue un dosage, par deux méthodes A et B, sur les mêmes 10


sujets :

Sujet Méthode A Méthode B


1 0,60 0,60
2 0,65 0,60
3 0,65 0,65
4 0,70 0,60
5 0,70 0,65
6 0,70 0,70
7 0,70 0,60
8 0,75 0,75
9 0,80 0,80
10 0,80 0,70

a) Les résultats des deux méthodes sont-ils corrélés ?


b) Peut-on estimer quel sera le résultat par la méthode B à partir du
résultat obtenu par la méthode A ? Justifier.
c) Y a-t-il une corrélation significative entre les résultats fournis par les
deux méthodes ?
Page 46 sur 124

CHAPITRE IV LE MODELE PROBABILISTE

INTRODUCTION

La théorie des probabilités est une science mathématique étudiant les


lois régissant les phénomènes aléatoires ou non déterministes. Un
phénomène est dit aléatoire si reproduites maintes fois il se déroule
chaque fois un peu différemment de sorte que le résultat de l’expérience
change d’une fois à l’autre de manière imprévisible, aléatoire.

L’usage du mot expérience sous entend que le phénomène aléatoire est


observé par le biais d’un critère bien défini et que le résultat de cette
observation peut être décrit sans ambigüité. Dans un jeu de hasard
comme le jeu de dés, on peut prédire les fréquences d’apparition
d’événements comme le nombre de fois que l’on obtient une valeur paire
en jetant un dé un grand nombre de fois. Lorsqu’on jette un dé, on est
certain qu’il va tomber sur la table ou le sol (phénomène déterministe),
mais on n’est pas capable de prédire la valeur qui va sortir (phénomène
aléatoire). Après plusieurs répétitions, on observe les résultats avec une
certaine fréquence dont la valeur se stabilise au fur et à mesure que l’on
répète l’expérience.

Un phénomène déterministe est un phénomène dont on peut prévoir le


résultat. Les lois de la physique classique sont des modèles permettant de
prédire le résultat d’une expérience donnée. La loi d’Ohm, par exemple,
permet de prédire la valeur de l’intensité du courant connaissant la
résistance et la tension aux bornes.

La théorie de probabilité permet de construire des modèles de


phénomènes aléatoires connus sous le nom des modèles probabilistes.
Dans le premier chapitre on définit le cadre formel des modèles
probabilistes.

IV.1. EVÉNEMENT ALÉATOIRE


Page 47 sur 124

IV.1.1 Expérience aléatoire (ε)

Définition
Une expérience aléatoire est une expérience dont le résultat est
imprévisible.

Exemple
Un lancer de dé est une expérience aléatoire.

IV.1.2 Evénement aléatoire

Définition
On appelle événement un ensemble d’événements élémentaires.

Il est possible qu’un événement ne soit constitué que par un seul


événement élémentaire.

Définition
Etant donnée une expérience aléatoire. On appelle espace fondamental ou
univers, noté Ω, l’ensemble de tous les événements élémentaires
possibles.

Ω est l’événement certain et l’ensemble vide ∅ qui ne contient aucun des


résultats possibles est appelé événement impossible.

Chaque événement peut ainsi être vu comme un sous-ensemble de Ω


qu’on nommera avec une lettre majuscule A, B, C, D, E, F, G…

Un sous ensemble A de Ω est un événement c’est-à-dire un ensemble de


résultats.
Un singleton {a} de Ω est appelé événement élémentaire.
élémentai
Chaque résultat d’expérience est un élément de Ω.
Remarque
Si Ω est fini ou infini dénombrable, tout sous-ensemble de Ω est un
événement ; ce n’est pas vrai si Ω est non dénombrable.
Page 48 sur 124

Exemple

On jette un dé et on observe le résultat obtenu. L’ensemble fondamental


est formé par les 6 résultats possibles : Ω = {1, 2, 3, 4, 5, 6}
L’événement correspondant à l’apparition d’un nombre pair est A = {2, 4,
6}, qui est bien un sous ensemble de Ω. L’événement correspondant à
l’apparition d’un nombre premier est B = {1, 2, 3, 5}, et l’événement
correspondant à l’apparition d’un 3 est C = {3}.

Remarque
Dans cet exemple Ω est fini et donc dénombrable. Mais Ω peut être infini
dénombrable comme dans le cas suivant : on jette une pièce de monnaie
jusqu’à ce qu’on obtienne pile ; l’ensemble fondamental correspondant est
la suite des nombres entiers Ω = {1, 2, 3, ..., n, ...} puisqu’on peut avoir une
pile au bout d’un jet, de 2 jets, de n jets, n étant aussi grand que l’on veut.

IV.1.3 Opérations sur les événements aléatoires

Soit A et B sont deux événements quelconques, on définit les opérations


suivantes :

1. L’intersection de deux événements A et B, notée A ∩ B est l’événement


qui se produit si les événements A et B se réalisent simultanément.

2. L’union de deux événements A et B, notée A ∪ B est l’événement qui se


produit si A ou B (ou les deux) se réalise.
‰, est l’événement qui se
3. L’événement complémentaire de A, noté Cˆ ou A
produit si A n’est pas réalisé.
Page 49 sur 124

A et B sont des événements disjoints ou exclusifs ou incompatibles si


A∩B=∅.

Exemple
Soit ε "jet d’un dé homogène une fois". Les événements A "obtenir un
chiffre pair" et B "obtenir un chiffre impair" sont disjoints.

Définition
Soit E un ensemble fini, on appelle cardinal de E, noté Card(E)ou |E|, le
nombre d’éléments de E.

Propriété
Pour deux ensembles finis E et F, on a la formule :
Card(E ∪ F) = Card(E) + Card(F) − Card(E ∩ F):

IV.2. LOI DE PROBABILITÉ – ESPACE DE PROBABILITÉ

Définition

Soit Œ un ensemble. Une loi de probabilité ℙ sur Œ est une fonction qui à
tout événement A associe un réel ℙ(Ž) , et qui a les trois propriétés
suivantes :

a) 0 ≤ ℙ(•) ≤ 1
b) ℙ(•) = 1
c) Pour toute famille finie ou dénombrable (A_ )_‘’ d’événements
disjoints, on a

ℙ “” A_ • = – ℙ(A_ )
_‘’ _‘’

(Ω, ℙ) est appelé espace de probabilité

Propriétés

Soit A et B sont deux événements quelconques, on a


‰ L’événement complémentaire de A, ℙ( A
1) Soit A ‰) = 1 − ℙ(A)
2) P(∅) = 0
Page 50 sur 124

3) Si A et B sont incompatibles, alors ℙ(A ∩ B) = 0.


4) Si A ⊆ B alors ℙ(A) ≤ ℙ(B)
5) ℙ(A ∪ B) = ℙ(A) + ℙ(B) − ℙ(A ∩ B)

Preuve

1) On sait que Ω = A ∪ A ‰, où les événements A et A sont


incompatibles.
Par définition d’une probabilité, ℙ(Ω) = ℙ(A) + ℙ(A‰ ) = 1.
Donc ℙ(A‰ ) = 1 − ℙ(A)

2) On utilise le résultat (1) en prenant A= Ω, alors


ℙ(∅) = 1 − ℙ(Ω) = 0

3) ℙ(A ∩ B) = ℙ(∅) = 0

4) Si A ⊆ B alors B = A ∪ (B\A).

Ceci implique ℙ(B) = ℙ(A) + ℙ(B\A) ≥ ℙ(A) car A et B\A sont


disjoints

5) ℙ(A) = ℙ(A\B) + ℙ(A ∩ B) et ℙ(B) = ℙ(B\A) + ℙ(A ∩ B)

Donc ℙ(A ∪ B) = ℙ(A) + ℙ(B) − ℙ(A ∩ B)

Proposition
(1) Pour toute famille finie ou dénombrable (A_ )_∈’
d’événements

ℙ ›” A_ œ ≤ – A_
_∈’ _∈’

(2) Si (A_ )_∈’ d’événements est une suite croissante


d’évènements alors
Page 51 sur 124

ℙ ›” A_ œ = lim A_
_→Ÿ
_∈•

(3) Si (A_ )_∈’ est une suite décroissante d’événements,

ℙ“ A_ • = lim A_
_→Ÿ
_∈•

IV.3. PROBABILITÉ SUR UN ENSEMBLE FINI

Soit (•, ¡) l’espace de probabilité correspondant à une expérience


aléatoire dont l’ensemble des résultats possibles est fini :
Ω = {ωa , ωb , ⋯ , ω_ }. Définir une loi de probabilité ℙ sur Ω revient à se
donner n réels positifs ou nuls pa , pb , pi , ⋯ , p_ tels que
¦

– ¤¥ = §
¥r§

Dans ce cas, La loi de probabilité sur Ω est alors complètement déterminé


car étant donné un événement A, ℙ(A) est calculable en additionnant les
probabilités pk de chacun des événements élémentaires {ω¨ } qui compose
A.

si A est dénombrable, les sommes finies sont remplacées par les sommes
de séries.

Cas particulier: le cas où les événements élémentaires sont équiprobables

Supposons que chaque résultat a autant de chances d’être réalisé qu’un


autre ℙ est telle que ℙ(©§ ) = ℙ(©ª ) = ⋯ = ℙ(©« ) = .
§
«
Soit A un événement, alors on a
-®¯°(Ž) -®¯°(Ž)
ℙ(Ž) = – ℙ(©¬ ) = =
« -®¯°(Œ)
¬/©¬±Ž

Cette loi est souvent appelée la loi uniforme sur Œ.

On retrouve alors la définition d’une probabilité comme étant le quotient :


Page 52 sur 124

nombre de cas favorables


P(A) =
nombre de cas possibles
Exemple
Exemple

On lance un dé et on observe la face du dessus.


On pose Ω = „1,2, 3, 4,5,6… et on suppose que le dé est parfaitement
équilibré. Dans ce cas, la probabilité de chaque événement est la même :
ℙ(„1…) = ℙ(„2…) = ℙ(„3…) = ℙ(„4…) = ℙ(„5…) = ℙ(„6…) =
a
²

Ceci implique

ℙ„1, 2 , 3, 4 … = ℙ(„1… ∪ „2… ∪ „3… ∪ „4…)


4 2
= ℙ(„1…) + P(„2…) + P(„3…) + P(„4…) = =
6 3


Page 53 sur 124

EXERCICES
1. Soient A et B deux événements élémentaires. Donner une expression et
représenter le diagramme de Venn de l’événement tel que : (i) A est
réalisé mais non B, c.à.d. que seulement A se réalise ; (ii) soit A, soit B,
se réalise, mais pas les deux en même temps ; c.à.d. qu’exactement un
seul des deux événements se produit.
2. Soient A, B et C des événements élémentaires. Trouver une expression
et représenter le diagrame de Venn de l’événement tel que (i) A et B
mais non C se réalise ; (ii) A seulement se réalise.
3. On jette en l’air une pièce de monnaie et un dé, et l’on suppose que
l’ensemble fondamental S se compose des 12 éléments :
S = { F1, F2, F3, F4, F5, F6, P1, P2, P3, P4, P5, P6 }
(i) Exprimer d’une façon explicite les événements suivants : A = {
face et un nombre pair apparaissent}, B = { un nombre premier
apparaît }, C = { pile et un nombre impair apparaissent }.
(ii) Exprimer d’une façon explicite l’événement : (a) A ou B est
réalisé, (b) B et C est réalisé, (c) B seulement est réalisé.
(iii) Lesquels des événements A, B et C s’excluent mutuellement ?
4. On suppose qu’un ensemble fondamental S est formé de 4 éléments :
S = {a1, a2, a3, a4}.
Laquelle des fonctions suivantes définit une probabilité sur S ?
(i) P(a1) = ½, P(a2) = 1/3, P(a3)= ¼, P(a4)= 1/5.
(ii) P(a1) = ½, P(a2) = ¼, P(a3)= - ¼, P(a4)= 1/2.
(iii) P(a1) = ½, P(a2) = ¼, P(a3)= 1/8, P(a4)= 1/8.
(iv) P(a1) = ½, P(a2) = ¼, P(a3)= ¼, P(a4)= 0.
5. On pipe une pièce de monnaie de telle sorte que face apparaisse deux
fois plus que pile. Calculer P(P) et P(F).
6. Deux hommes h1 et h2, et trios femmes, f1, f2 et f3 participent à un
tournoi d’échecs. Les individus de même sexe ont des chances égales de
gagner, mais un homme à deux fois plus de chances de gagner qu’une
femme. (i) Calculer la probabilité pour qu’une femme gagne le tournoi.
(ii) Si h1 et f1 sont mariés, calculer la probabilité pour que l’un d’eux
gagne le tournoi.
Page 54 sur 124

7. On pipe un dé de telle sorte que la probabilité du résultat obtenu quand


on jette le dé soit proportionnelle au résultat (par exemple, 6 a une
probabilité deux fois plus grande que 3).
Soit A = { nombre pair }, B= {nombre premier }, C={nombre impair}.
(i) Donner la probabilité de chaque résultat possible.
(ii) Calculer P(A), P(B), et P(C).
(iii) Calculer la probabilité pour que : (a) on obtienne un nombre pair ou
un nombre premier. (b) on obtienne un nombre premier impair ; (c) A
mais non B se réalise.
8. Calculer la probabilité p de chacun des événements suivants :
(i) Un nombre pair apparaît quand on jette un dé bien équilibré ;
(ii) Un roi apparaît quant on tire une seule carte d’un jeu de cartes
ordinaire de 52 cartes ;
(iii) Pile apparaît au moins une fois quand on jette trois pièces de
monnaie bien équilibrées ;
(iv) On obtient une bille blanche en tirant une seule bille dans une urne
contenant 4 billes blanches, 3 billes rouges et 5 billes bleues.
9. Une classe comporte 10 garçons dont la moitié a les yeux marron et 20
filles dont la moitié a également les yeux marron. Calculer la
probabilité p pour qu’une personne tire au hasard soit un garçon ou ait
les yeux marron.
10. On choisit un point au hasard à l’intérieur d’un cercle. Calculer la
probabilité p pour que le point soit plus près du centre du cercle que
de sa circonférence.
11. On considère le plan cartésien IR2 et l’ensemble X des points dont
les deux coordonnées sont des entiers. On jette au hasard dans le plan
une pièce de monnaie de diamètre égal à 1/2. Calculer la probabilité p
pour que la pièce recouvre un point de X.
On choisit au hasard trois points a, b et c sur la circonférence d’un
cercle. Calculer la probabilité p pour que les points se trouvent sur la
même demi-circonférence.
Page 55 sur 124

12. On jette un dé 100 fois. Le tableau suivant donne les six résultats
possibles, ainsi que leur fréquence d’apparition :
Nombre 1 2 3 4 5 6
Fréquence 14 17 20 18 15 16
Calculer la fréquence relative f des événements suivants
(a) Un 3 apparait
(b) Un 5 apparait
(c) Un nombre pair apparait
(d) Un nombre premier apparait
13. Un dé est lancé une fois. On demande :
a) La probabilité d’obtenir le point 2 comme face supérieure du dé ?
b) La probabilité d’obtenir un point pair comme face supérieure du
dé ?

14. On jette une paire de dés bien équilibrés. Sachant que la somme des
valeurs obtenues est de 6.
Calculez la probabilité pour que l’un des dés ait donné un chiffre 5

15. Si ℙ(A)=1/2 ; ℙ(B)=3/4 et ℙ(A∪B)=11/12 ;calculer ℙ(A∩B) et


ℙ (A/B)

16. Si A et B sont des événements indépendants tels que ℙ(A)=1/3 et


ℙ(B)=3/4, calculer ℙ(A∪B).
17. Soient A et B deux événements élémentaires. Donner une expression
et représenter le diagramme de Venn de l’événement tel que :
i. A est réalisé mais non B
ii. Soit A, soit B, se réalise, mais pas les deux en même temps

18. On suppose qu’un ensemble fondamental S est formé de 4 éléments :


S = {aa , ab , ai , au } .
Laquelle des fonctions suivantes définit une probabilité sur S ?
(a) ℙ(aa ) = , ℙ(ab ) = , ℙ(ai ) = , ℙ(au ) =
a a a a
b i u c
(b) ℙ(aa ) = , ℙ(ab ) = , ℙ(ai ) = − , ℙ(au ) =
a a a a
b u u b
(c) ℙ(aa ) = , ℙ(ab ) = , ℙ(ai ) = , ℙ(au ) =
a a a a
b u µ µ
Page 56 sur 124

(d) ℙ(aa ) = , ℙ(ab ) = , ℙ(ai ) = , ℙ(au ) = 0


a a a
b u u

19. On pipe un dé de telle sorte que la probabilité du résultat obtenu


quand on jette le dé soit proportionnelle au résultat .
Soient les événements : A : « est un nombre pair »,B : « est un nombre
premier » et C : « est un nombre impair ».
(a) Calculer ℙ(A), ℙ(B) et ℙ(C)
(b) Calculer la probabilité pour qu’on obtienne un nombre pair ou
un nombre premier ;
(c) Calculer la probabilité pour qu’on obtienne un nombre
premier impair ;
(d) Calculer la probabilité pour que A mais non B se réalise.

20. On tire au hasard deux cartes d’un jeu ordinaire de 52 cartes. Calculer
la probabilité pour que
(a) Les deux cartes soient des piques ;
(b) Une carte soit un pique et l’autre soit un cœur.

21. On prend au hasard trois ampoules électriques d’un lot de 15


ampoules dont 5 sont défectueuses. Calculer la probabilité pour que
(a) Aucune ampoule ne soit défectueuse ;
(b) Exactement une ampoule soit défectueuse ;
(c) Au moins une ampoule soit défectueuse.
Page 57 sur 124

CHAPITRE V. PROBABILITÉS CONDITIONNELLES

V.1 PROBABILITÉ CONDITIONNELLE

Lorsque l’on lance un dé parfaitement équilibré, un bon modèle


probabiliste est donné par (•, ℙ) avec Ω = {1,2, 3, 4,5,6} et ℙ une loi
uniforme. Soit A l’événement « le dé donne au moins 4 points » et B
l’événement « le résultat est impair ». Supposons qu’on retienne le
résultat du lancer que s’il est dans B. dans cette expérience, l’événement
A est réalisé lorsqu’on obtient un 5 et c’est avec la probabilité relative

= = .
¶({c}) a/² a
¡({a,·,,¸ }) i/² i

Plus généralement, on a

Définition

Soit (•, ℙ) un espace de probabilité et B un événement tel que ℙ(B) ≠ 0.


La probabilité de A sachant que l’événement B est réalisé, notée
ℙ(A|B)est donnée par

ℙ(A ∩ B)
ℙ(A|B) =
ℙ(B)

Exemples
Exemples

1. On jette une paire de dés bien équilibrés (espace équiprobable). On


observe une réalisation de l’événement {somme de deux dés = 6}.
Quelle est la probabilité pour qu’un des deux dés ait donné le résultat 2 ?
Solution
B = {somme des deux dés = 6}= {(2, 4), (4, 2), (1, 5), (5, 1), (3, 3)}
A = {au moins un des deux dés donne 2}
Nombre de réalisations de (A ∩ B)= {(2, 4), (4, 2)} = 2

ℙ(A ∩ B) |A ∩ B| 2
Donc ℙ(A|B) = = =
ℙ(B) |B| 5

2. On jette une paire de dés bien équilibrés (espace équiprobable).


Page 58 sur 124

On observe une réalisation de l’événement


{somme(X) de deux dés = impair }. Quelle est la probabilité ℙ(X < 8) ?

B = {somme(X) de deux dés = impair }


A = {X < 8 }
nombre de réalisations de B = {(1, 2), (2, 1), (2, 3) , (3, 2) (1, 4), (4, 1),
(3, 4) (4, 3), (2 , 5),(5,2)(1,6),(6,1)(3,6)(6,3),(4,5),(5,4),(5,6),(6,5)}=18
les valeurs possibles de A ∩ B = {(1, 2), (2, 1), (2, 3) , (3, 2) (1, 4),
(4, 1), (3, 4) (4, 3), (2 , 5), (5,2)(1,6), (6,1)} = 12
D’où, on a ℙ(B) = et ℙ(A ∩ B) =
aµ ab
i² i²
Donc
ℙ(A ∩ B) 12/36 2
ℙ(A|B) = = =
ℙ(B) 18/36 3
V.2 MULTIPLICATION DES PROBABILITÉS

De ce qui précède, on peut utiliser la probabilité conditionnelle pour


calculer la probabilité des intersections

ℙ(Ž ∩ º) = ℙ(Ž|º). »(º) = ℙ(º|Ž). ℙ(Ž) = ℙ(º ∩ Ž)

Donc
ℙ(Ž ∩ º) = ℙ(º|Ž). ℙ(Ž)

Exemple

Une urne contient deux boules blanches et une boule noire. Une personne
tire une boule et la garde, une deuxième tire une boule. Avec quelle
probabilité les deux boules tirées sont-elles blanches ?

Solution

Notons par A l’événement « la première personne a tiré une boule


blanche » et par B l’événement « la deuxième personne a tiré une boule
blanche ».On peut utiliser la formule probabilité conditionnelle à l’envers

ℙ(A ∩ B) = ℙ(B|A). ℙ(A)


Par le calcul, on a
ℙ(A) = et ℙ(B|A) =
b a
i b
Page 59 sur 124

Donc
2 1 1
ℙ(A et B) = ℙ(B|A). ℙ(A) = × =
3 2 3

On a la généralisation suivante :

Proposition (Probabilités
(Probabilités composées)
composées)

Soit (•, ℙ)un espace de probabilité et soit A1, A2,…, An des événements.
Alors on a
ℙ (An et An-1et… et A1) = ℙ(A|B_ )ℙ(A|B_ )ℙ(A|B_ ) ⋯ ℙ(A|B_ )

V.3 FORMULE DES PROBABILITÉS TOTALES

Proposition

Soit (•, ℙ)un espace de probabilité. Si l’événement A ne peut se réaliser


que si l’un des événements B1, B2,…, Bn formant un système complet
d’événements est réalisé, alors la probabilité de l’événement A est donnée
par la formule :
ℙ (A) = ℙ (B1). ℙ(A|Ba ) + ℙ (B2). ℙ(A|Bb ) +…+ ℙ (Bn). ℙ(A|B_ )
Ou encore
_

ℙ(A) = – ℙ(Bv ). ℙ(A|Bv )


vra

Exemple
Trois coups sont tirés à la file sur une même cible. La Probabilité
d’atteinte de la cible est respectivement égale à pa = 0.3 au premier coup,
pb = 0.6 au 2nd coup et pi = 0.8 au 3è coup. La Probabilité de destruction
de la cible est respectivement égale à ta = 0.4 quand elle est touchée une
fois, t b = 0.7 quand elle est touchée deux fois t i = 1 quand elle est
touchée trois fois. Quelle est la ℙ de détruire la cible quand 3 coups sont
tirés

Solution
Soit A l’événement "détruire la cible quand 3 coups sont tirés"
Page 60 sur 124

Ba ≡ "détruire la cible après une atteinte"


Bb ≡ "détruire la cible après deux atteintes"
Bi ≡ "détruire la cible après trois atteintes"
Bu ≡ "manque la cible "
Le nombre d’atteintes de la cible est ≤ au nombre de coups tirés.
Après 3 coups tirés, on peut avoir une, deux ou trois atteintes.
La probabilité de manquer la cible est de : 1 − pa au 1er coup ; 1 − pbau 2è
coup et 1 − pi au 3è coup.
ℙ(Ba ) = pa (1 − pb )(1 − pi ) + (1 − pa )pb (1 − pi ) + (1 − pa )(1 − pb )pi =
0.332
ℙ (Bb ) = pa pb (1 − pi ) + pa (1 − pb )pi + (1 − pa )pb pi = 0.468
ℙ (Bi ) = pa pb pi = 0.144
ℙ (Bu ) = (1 − pa )(1 − pb )(1 − pi ) = 0.056

Les probabilités conditionnelles de détruire la cible quand elle est touchée


sont: t1= ℙ (A│B1 ) = 0.4; t2 = ℙ (A│B2 )= 0.7; t3 = ℙ (A│B3 )=1;
ℙ (A│B4 ) = 0 .
La Probabilité de détruire la cible quand 3 coups sont tirés est :
u

ℙ(A) = – ℙ(Bv ). ℙ(A|Bv ) = 0.6044


vra


V.4 SYSTÈME COMPLET D’ÉVÉNEMENTS
.4 SYSTÈME COMPLET D’ÉVÉNEMENTS
SYSTÈME COMPLET D’ÉVÉNEMENTS :

Les événements A1, A2, ..., An forment un système complet si les Ai
constituent une partition de Ω, c’est-à-dire si :
a) les événements sont deux à deux disjoints : ∀(i ≠ j), ÀAv ∩ AÁ = ∅Â
b) ils couvrent tout l’espace : ⋃_vra Av = Ω


Page 61 sur 124

Proposition

Soient (•, P) un espace de probabilité et B1, B2,…, Bn un système


complet d’événements et A un événement. Alors A = (A ∩ Ba ) ∪
(A ∩ Bb ) ⋯ (A ∩ B_ ) avec
(A ∩ Ba ), (A ∩ Bb ), ⋯ , (A ∩ B_ ) deux à deux disjoints et

ℙ(A) = ℙ(A ∩ Ba ) + ℙ(A ∩ Bb ) + ⋯ + ℙ(A ∩ B_ )

Théorème de Bayes ou Probabilités de causes

Proposition (théorème
(théorème de Bayes)
Soient (•, P) un espace de probabilité et B1, B2,…, Bn le système complet
d’événements et l’événement A qui ne peut se réaliser que conjointement
avec l’un des événements B1, B2,…, Bn que nous appelons des causes.
En vertu du théorème des probabilités totales,
_

ℙ(A) = – ℙ(Bv ). ℙ(A|Bv )


vra

Si A se réalise, déterminons alors les probabilités conditionnelles ℙ(Bv |A).


En effet, ℙ(A ∩ Bv ) = ℙ(Bv ). ℙ(A|Bv ) = ℙ(A). ℙ(Bv |A) = ℙ(Bv ∩ A)

ℙ(Bv ). ℙ(A|Bv )
Dés lors, ℙ(Bv |A) =
ℙ(A)

ℙ(Bv ). ℙ(A|Bv )
Donc, ℙ(Bv |A) =
∑_vra ℙ(Bv ). ℙ(A|Bv )

Le théorème de Bayes montre comment les probabilités des causes sont


modifiées lorsque l’événement qu’elles occasionnent est réalisé.

Exemple

L’événement A dont les causes équiprobables B1, B2, B3, B4 sont telles que
ℙ(A|Ba ) = 0.7 ; ℙ(A|Bb ) = 0.1 ;ℙ(A|Bi ) = 0.1 ;ℙ(A|Bu ) = 0.02 .
On donne
Page 62 sur 124

ℙ(Ba ) = ℙ(Bb ) = ℙ(Bi ) = ℙ(Bu ) = 0.25

Que deviennent les causes si l’événement A est réalisé ?


u

ℙ(A) = – ℙ(Bv ). ℙ(A|Bv ) = 0.23


vra
ℙ(Ba ). ℙ(A|Ba ) ℙ(Bb ). ℙ(A|Bb )
ℙ(Ba |A) = = 0.76; ℙ(Bb |A) = = 0.11
ℙ (A) ℙ (A)

ℙ(Bi ). ℙ(A|Bi ) ℙ(Bu ). ℙ(A|Bu )
ℙ(Bi |A) = = 0.11; ℙ(Bu |A) = = 0.002
ℙ (A) ℙ (A)

V.5 EVÉNEMENTS INDÉPENDANTS
.5 EVÉNEMENTS INDÉPENDANTS
EVÉNEMENTS INDÉPENDANTS

Définition
Définition
Soit (•, ℙ) un espace de probabilité et soit(Av )v∈’ une famille
d’événements.
Ces événements sont dits indépendants dans leur ensemble si quelle
que soit la partie finie J de I , on a

ℙ› Av œ = Å ℙ(Av )
v∈Ä v∈Ä


Cas particuliers
Cas particuliers
- Deux événements A et B sont dits indépendants
ssi ℙ(A ∩ B) = ℙ(A). ℙ(B) ssi ℙ(B|A) = ℙ(B).
Dire que deux événements sont indépendants revient à que la
connaissance de l’un n’influence pas l’autre.

- Trois événements A, B et C sont dits indépendants si
II.0. ils sont 2 à 2 indépendants
III.0. et ℙ(A ∩ B ∩ C) = ℙ(A). ℙ(B). ℙ(C)


Page 63 sur 124

V.6 NOTION DE SYMÉTRIE MUTUELLE

Une expérience aléatoire admet la symétrie mutuelle si tous les cas


possibles a priori ont la même chance de se réaliser.

Exemple

On suppose qu’avant la naissance, garçon et fille ont la même chance de


naitre.
Page 64 sur 124

EXERCICES

1. On jette une paire de dés bien équilibrés. Calculer la probabilité p


pour que la somme obtenue soit supérieure ou égale à 10, sachant
que (i) le premier dé a donné 5, (ii) au moins l’un des dés a donné 5.
2. On jette trois pièces de monnaie bien équilibrées. Calculer la
probabilité p pour que toutes les trois donnent face, sachant que (i)
la première pièce donne face à priori, (ii) l’une de pièces donne face à
priori.
3. On lance une paire de dés bien équilibrés. Sachant que les deux
chiffres obtenus sont différents, calculer la probabilité p pour que (i)
la somme obtenue soit six, (ii) un 1 apparaisse, (iii) la somme
obtenue soit inférieure ou égale à 4.
4. On tire au hasard deux des chiffres de 1 à 9. Sachant que la somme
obtenue est paire, calculer la probabilité p pour que les deux chiffres
soient impairs.
5. Un joueur possède 4 piques tirés d’un jeu de 52 cartes. Si on lui
donne trois cartes de plus, quelle est la probabilité p pour qu’au
moins l’une des cartes supplémentaires soit aussi une pique ?
6. Quatre joueurs que l’on appellera Nord, Sud, Est et Ouest, ont chacun
13 cartes d’un jeu de 52 cartes.
(i) Sachant que Sud n’a pas d’as, calculer la probabilité p pour que
son partenaire Nord ait exactement deux as.
(ii) Sachant que Nord et Sud ensemble ont 9 cœurs, calculer la
probabilité p pour que Est et Ouest aient chacun deux cœurs.
7. Une classe contient 12 garçons et 4 filles. Si l’on choisit trois élèves
de la classe au hasard, quelle est la probabilité p pour que tous soient
des garçons ?
8. Un joueur obtient l’une après l’autre 5 cartes d’un jeu de 52 cartes.
Quelle est la probabilité p pour qu’elles soient toutes des piques ?
9. Une urne contient 7 billes rouges et 3 billes blanches. On tire trois
billes de l’urne, l’une après l’autre. Calculer la probabilité p pour que
les deux premières billes soient rouges et la troisième soit blanche.
10. Les élèves d’une classe sont choisis au hasard l’un après l’autre pour
subir un examen. Calculer la probabilité p pour que l’on ait
Page 65 sur 124

alternativement un garçon et une fille, sachant que (i) la classe est


composée de 4 garçons et 3 filles, (ii) la classe est composée de 3
garçons et 3 filles.
11. Dans un lycée du Quartier Latin, 25% des élèves échouent en
mathématique, 15% échoue en chimie, et 10% échouent à la fois en
athématiques et en chimie. On choisit un élève au hasard.
(i) Si l’élève a échoué en chimie, quelle est la probabilité pour
qu’il ait aussi échoué en mathématiques ?
(ii) Si l’élève a échoué en mathématiques, quelle est la
probabilité pour qu’il ait aussi échoué en chimie ?
(iii) Quelle est la probabilité pour qu’il ait échoué en
mathématiques ou en chimie ?
12. On considère deux événements A et B tels que
P(A) = , P(B) = et P(A ∩ B) = . Calculer
a a a
b i u
(i)P(A|B), (ii)P(B|A), (iii)P(A ∪ B), (iv)P(∁A|∁B), (v) P(∁B|∁A).
13. On considère deux événements A et B tels que P(A)=3/8, P(B)=5/8
et P(A ∩ B) = . Calculer P(A|B) et P(B|A).
i
u
14. Soit A= l’événement tel qu’une famille a des enfants des deux sexes,
et B= l’événement tel qu’une famille a au plus un garçon, (i) Montrer
que A et B sont des événements indépendants si une famille a trois
enfants. (ii) Montrer que A et B sont des événements dépendants si
une famille a deux enfants.
15. Montrer que si A et B sont des événements dépendants, alors CA et C
B sont des événements indépendants.
16. La probabilité pour qu’un homme vive encore 10 ans est 1/4, et la
probabilité pour que sa femme vive encore 10 ans est 1/3. Calculer la
probabilité pour que (i) tous les deux vivent encore dans 10 ans, (ii)
l’un d’eux au moins vive encore dans 10 ans, (iii) aucun d’eux ne vive
encore dans 10 ans, (iv) seulement la femme vive encore dans 10
ans.
17. Un certain modèle de missile atteint sa cible avec la probabilité 0,3,
Combien de missiles faut-il mettre à feu pour qu’il y ait une
probabilité d’au moins 80% d’atteindre une cible.
18. Une certaine équipe de football possède une probabilité de 0,6 de
remporter une victoire (V), une probabilité de 0,3 de subir une
Page 66 sur 124

défaite (D), et une probabilité de 0,1 de faire match nul (N). l’équipe
joue trois matches pendant le week-end. (i) Déterminer les éléments
de l’événement A tel que l’équipe gagne au moins deux fois et ne
perde pas, et calculer P(A). (ii) Déterminer les éléments de
l’événement B tel que l’équipe gagne, perde et fasse match nul, et
calculer P(B).
19. Soit S un ensemble fini probabilisé et soit T l’ensemble probabilisé
de n épreuves indépendantes dans S. Montrer que T est bien défini,
c’est-à-dire que (i) la probabilité de chaque élément de T est positive
ou nulle et (ii) la somme des probabilités de tous les éléments est
égale à 1.
20. Calculer l’espérance mathématique µ, la variance σ2 et l’écart-type σ
de chacune des lois de probabilité suivants :
(i)
xv 2 3 11
f(xv ) 1/3 1/2 1/6
(ii)
xv -5 -4 1 2
f(xv ) ¼ 1/8 ½ 1/8
(iii)
xv 1 3 4 5
f(xv ) 0,4 0,1 0,2 0,3

21. On jette un d bien équilibré. Soit X la variable représentant le double


du nombre obtenu et Y une variable prenant les valeurs 1 ou 3
suivant que l’on obtient soit un nombre impair soit un nombre pair.
Calculer la distribution, l’espérance, la variance et l’écart-type de (i)
X, (ii) Y, (iii) X+Y, (iv) XY.
22. On trace des cercles concentriques de rayon 1 et 3 mètres sur une
cible ayant pour rayon 5 mètres. Un tireur obtient 10, ou 5 ou 3
points selon qu’il atteint la cible dans respectivement le plus petit
cercle, dans le cercle intermédiaire ou dans le cercle extérieur. On
suppose que la cible est atteinte avec la probabilité ½ et que le tireur
a la même chance d’atteindre un point ou un autre de la cible.
Calculer l’espérance mathématique E des points obtenus chaque fois
qu’il tire.
Page 67 sur 124

23. Un joueur lance deux pièces de monnaie bien équilibrées. Il gagne 1


F ou 2 F selon qu’il obtient 1 ou 2 faces. Par contre, il perd 5 F s’il
n’obtient aucune face. Calculer l’espérance mathématique E de la
partie et dire si le jeu est favorable au joueur.
24. Un joueur lance deux pièces de monnaie parfaitement équilibrées. Il
gagne 5 F s’il obtient 2 faces, 2 F s’il obtient 1 fois face et 1 F s’il
n’obtient aucune face. (i) calculer l’espérance de ses gains. (ii)
combien doit-il payer pour jouer si le jeu doit être équitable ?
25. Deux urnes contiennent chacune 5 boules blanches et 7 boules noires.
On tire de chaque urne une boule (simultanément).
Trouver la probabilité P pour que les deux boules obtenues soient
blanches.

26. Quelle est la probabilité d’obtenir exactement 2 faces avec 6 jets d’une
pièce de monnaie parfaitement équilibrée.

27. Un joueur possède 4 piques tirés d’un jeu de 52 cartes. Si on lui donne
trois cartes de plus, quelle est la probabilité pour qu’au moins l’une
des cartes supplémentaires soit aussi un pique ?

28. Une classe contient 12 garçons et 4 filles. Si l’on choisit trois élèves de
la classe au hasard, quelle est la probabilité pour que tous soient des
garçons ?

29. Les élèves d’une classe sont choisis au hasard l’un âpres l’autre pour
subir un examen. Calculer la probabilité pour que l’on ait
alternativement un garçon et une fille, sachant que

(a) La classe est composée de 4 garçons et 3 filles


(b) La classe est composée de 3 garçons et 3 filles

30. Soit A : « l’événement tel qu’une famille a des enfants des deux sexes »,
et B : « l’événement tel qu’une famille a au plus un garçon ».
a) montrer que A et B sont des événements indépendants si une famille
a trois enfants
Page 68 sur 124

b) montrer que A et B sont des événements dépendants si une famille a


deux enfants

31. La probabilité pour qu’un homme vive encore 10 as est ¼, et la


probabilité pour que sa femme vive encore 10 ans est 1/3 . Calculer la
probabilité pour que
(a) Tous les deux vivent encore dans 10 ans
(b) L’un d’eux au moins vive encore dans 10 ans
(c) Aucun d’eux ne vive encore dans 10 ans
(d) Seulement la femme vive encore dans 10 ans

32. Une boite A contient 8 pièces détachées dont 3 sont défectueuses, et


une boite B contient 5 pièces détachées dont 2 sont défectueuses. On
tire au hasard une pièce détachée dans chaque boite :
(a) Quelle est la probabilité pour que les deux pièces détachées ne
soient pas défectueuses
(b) Quelle est la probabilité pour que l’une des pièces soit
défectueuse et l’autre ne le soit pas
(c) Si l’une des pièces est défectueuse et l’autre ne l’est pas, quelle
est la probabilité pour que la pièce détachée défectueuse
provienne de la boite A
33. Un certain modèle de missile atteint sa cible avec la probabilité 0.3,
combien de missiles faut – il mettre à feu pour qu’il y ait une
probabilité d’au moins 80% d’atteindre une cible ?
34. Une certaine équipe de football possède une probabilité de 0.6 de
remporter une victoire, une probabilité de 0.3 de subir une défaite, et
une probabilité de 0.1 de faire match nul. L’équipe joue trois matches
pendant le week end.
(a) Soit A « l’événement que l’équipe gagne au moins deux fois et
ne perde pas ». Calculer la probabilité de A.
(b) Soit B « l’événement que l’équipe gagne, perde et fasse match
nul ». Calculer la probabilité de B.
Page 69 sur 124

CHAPITRE VI VARIABLES ALEATOIRES

VI.1 VARIABLES
VARIABLES ALÉATOIRES

Considérons un ensemble fondamental Ω correspondant à une


expérience aléatoire ε. Les éléments du résultat possible de l’expérience
ne nous intéresse pas mais seulement une valeur numérique. Par
exemple, on peut s’intéresse le nombre de pannes d’une machine sur une
durée d’un an sans être intéressé par les dates auxquelles ont eu les
pannes. Il est cependant utile de faire correspondre un nombre à chaque
élément de Ω, en vue de faire ensuite des calculs.

Définitions
Définitions
- Une variable aléatoire est une application X de Ω dans ℝ, Ë ∶ Œ ⟶ ℝ
telle qu’à tout résultat possible de l’expérience (à tout élément de Ω), la
variable aléatoire X fait correspondre un nombre réel.
- La fonction de répartition F d’une variable aléatoire X est la fonction de
R dans R définie par : pour tout réel x, Î(Ï) = ℙ({Ë ≤ Ï})

Remarque
Lorsque Ω est fini ou infini dénombrable, toute application de Ω dans ℝ
est une variable aléatoire, puisque la définition rigoureuse d’une
variable aléatoire X impose que tout intervalle de ℝ soit l’image d’une
partie de Ω par l’application X. Or toute partie de Ω est un événement
aléatoire.

VI.2 VARIABLES ALÉATOIRES DISCRÈTES, VARIABLES ALÉATOIRES À


DENSITÉ

VI.2.1 Variables aléatoires discrètes

Définition

Une variable aléatoire X qui prend ses valeurs dans un sous-ensemble fini
ou dénombrable {ÏÐ : Ð ∈ Ñ} est appelée variable aléatoire discrète.
Page 70 sur 124

Soit X une variable aléatoire sur un ensemble fondamental Ω à valeurs


finies: X(Ω) = {x1, x2, ..., xn}. X(Ω) devient un ensemble probabilisé si l’on
définit la probabilité ℙ(X = xi) pour chaque xi, que l’on note pi. L’ensemble
des valeurs pi = ℙ (X = xi) définit distribution ou loi de probabilité de X.
Puisque les pi sont des probabilités sur les événements
{X=x1, X=x2, ..., X=xn}, on a :
_

(∀i), pv ≥ 0 et – pv = 1
vra

La distribution de probabilités de la v.a.d est représentée

a) sous forme d’un tableau :

xi x1 x2 x3 x4 … xn
pi p1 p2 p3 p4 … pn

b) sous forme d’un diagramme en bâtons :


pi

xi
x1 x2 x3 x4 xn

La fonction de répartition F est définie par F(x) = ℙ (X ≤ x) pour tout


x ∈ ℝ.
Pour X une variable aléatoire discrète, on a:
F(x) P – ℙ(X P xv ) P – pv
FX(x) ÒÓ ÔÒ ÒÓ ÔÒ

x
0 xi
Page 71 sur 124

La fonction de répartition est une fonction en escalier. Les discontinuités


se produisent pour les valeurs xi possédant des probabilités non nulles.
Pour chacune de ces valeurs de xi, la hauteur d’une discontinuité est la
probabilité de X=xi.

Dans tous les cas, F(x) est une fonction monotone croissante, c’est-à-dire
F(a) ≥ F(b) si a ≥ b. De plus limÒ→ÕŸ F(x) = 0 et limÒ→`Ÿ F(x) = 1

VI.2.2 Variables aléatoires continues

Définition
On dit qu’une variable aléatoire X est dite continue s’il existe une fonction
f de ℝ dans ℝ positive ou nulle telle que pour tout sous ensemble de ℝ ,
on a

ℙ(X ∈ B) = Ö f(x)dx
×
La fonction f est appelée la fonction de densité de probabilité de la
variable aléatoire X.
Les propriétés de la fonction de répartition F sont telle que :

- F fonctions monotone croissante, partant de 0 pour x→-∞ et atteignant


1 pour x→^∞. Ceci implique

Ö f(x)dx = 1
ÕŸ
Ú
De plus, quels que soient a et b (a<b), on a F(a) = ÙÕŸ f(x)dx
- ℙ(a < Û < Ü) = ℙ(a ≤ X < Ü) = ℙ(a < Û ≤ Ü) = ℙ(a ≤ X ≤ b) =
Ý
ÙÚ f(x)dx = F(b) − F(a)
- ℙ(X = a) = 0
- Si f est donnée, la probabilité ℙ(a ≤ X ≤ b) est la surface sous la
courbe entre a et b
Page 72 sur 124

f(x)

â (ã ≤ Û ≤ Ü )

x
a b

Couples de variables aléatoires

Soit (Ω , ℙ) un espace de probabilité, et soient X et Y deux variables


aléatoires définis sur cet espace . Le couple (X, Y) définit ce que l’on peut
appeler une variable aléatoire à valeurs dans Rb : à tout ω de Ω , il associe
le vecteur (X(ω), Y(ω)). La loi de (X, Y), souvent appelée loi conjointe de
(X, Y), est déterminée par la donnée pour tout sous ensemble de C de Rb
de la probabilité ℙ ({(X, Y)∈ C}). Et la fonction de repartition F du couple
de variables aléatoires (X, Y) est donnée par
F(x, y) = ℙ({ X ≤ x et Y ≤ y }), pour tous (x, y) ∈ ℝb ,
Si la loi conjointe de (X, Y) est donnée par
ℙ( X ∈ A et Y ∈ B) . pour tous (x, y) ∈ ℝb ,

On peut en déduire les lois de X et de Y appelées lois marginales. En effet,


pour tout ensemble A de ℝ, on a
{Þ ∈ • } = {Þ ∈ • ßà á ∈ ℝ} = {(Þ, á) ∈ • × ℝ}
Ceci implique
ℙ ({Þ ∈ • }) = ℙ((Þ, á) ∈ • × ℝ)

VI.3 VARIABLES ALÉATOIRES INDÉPENDANTES

Définition
Soient X et Y deux variables aléatoires définies sur un espace de
probabilité (Ω ℙ).
Page 73 sur 124

On dit qu'elles sont indépendantes si pour tout couple (A, B) de sous-


ensembles de ℝ, les évènements { X∈ A } et { Y ∈ B} sont indépendants,
c'est-à-dire si :
ℙ( x ∈ A et y ∈ B) = ℙ( x ∈ A )ℙ( y ∈ B)

Dans le cas général, on a

Proposition

Soient X et Y deux variables aléatoires définies sur un espace de


probabilité (Ω , ℙ ) de fonctions de répartitions Fä et Få . X et Y sont
indépendantes si et seulement si, pour tout couple (x, y) de réels :
ℙ( x ≤ A et y ≤ B) = Fä ( x )Få ( y )

Le résultat suivant est utile :

Proposition

Soient X et Y deux variables aléatoires définies sur un espace de


probabilité ( Ω , ℙ ).
Soient ϕ et ψ deux applications de ℝ dans ℝ . Si X et Y sont
indépendantes alors ϕ (X)et ψ(Y) sont des variables aléatoires
indépendantes.
Page 74 sur 124

EXERCICES

1. Calculer l’espérance mathématique, la variance et l’écart type de


chacune des lois de probabilité suivantes :
xv 2 3 11

f(x v ) 1 1 1
3 2 6

xv -5 -4 1 2

f(x v ) 1 1 1 1
4 8 2 8

2. On jette trois fois une pièce de monnaie mal équilibrée et telle que
ℙ(F) = et ℙ(P) = . Soit X la variable aléatoire représentant la plus
i a
u u
grande succession de faces que l’on obtient. Calculer la distribution de
probabilité, espérance mathématique, la variance et l’écart type de X.
3. On lance trois fois une pièce de monnaie parfaitement équilibrée. X
est une variable aléatoire prenant respectivement les valeurs 0 et 1
selon que le premier jet donne face ou pile. Y désigne le nombre de
faces obtenu. Calculer (i) la loi de probabilité de X et Y, (ii) la loi de
probabilité produit h de X et Y, (iii) Cov (X, Y).
4. Soit X une variable aléatoire de moyenne µ et d’écart-type σ ˃ 0 ; soit
X* la variable aléatoire centrée réduite correspondant à X, c-à-d. X* =
(X - µ)/σ. Montrer que E(X*) = 0 et Var (X*)=1 (D’où σX* = 1).
5. Soit X une variable aléatoire ayant une distribution f. on définit le
moment Mr d’ordre r de X par
Mé = E(X é ) = – xvé f(xv )
Calculer les cinq premiers moments de X sachant que X a la distribution
suivante :
xv -2 1 3
f(xv ) ½ ¼ ¼
Page 75 sur 124

(Remarquons que M1 est la moyenne de X, et que M2 permet de calculer la


variance et l’écart-type de X).
Page 76 sur 124

CHAPITRE VII. CARACTÉRISTIQUES NUMÉRIQUES DES


VARIABLES ALÉATOIRES
VII.1
II.1 ESPÉRANCE

Soit X une variable aléatoire sur un espace de probabilité (Ω, ℙ).


L’espérance E(X) de X est la valeur moyenne des valeurs prises par X,
pondérées par leur probabilité de réalisation.

μ = E(X) = Ö X(ω)dP(ω)
ë

Si Ω est fini ou dénombrable, cette intégrale est simplement la somme

μ = E(X) = – X(ω)ℙ(ω)
ì‘ë

mais le cas général est plus complexe.


Ici, nous nous restreignons aux deux cas particuliers des variables
aléatoires discrètes ou continues
- Si X est discrète et prend ses valeurs dans un sous-ensemble fini ou
dénombrable {í ¥ : ¥ ∈ î} alors

μ = E(X) = – xv . pv
v∈’
- Si X est une variable aléatoire continue alors

μ = E(X) = Ö xf(x)dx
ÕŸ
Proposition
Soit X une variable aléatoire et une fonction ϕ de ℝ dans ℝ.

- Si X est discrète et prend ses valeurs dans un sous-ensemble fini ou


dénombrable {xv : i ∈ I} alors
Page 77 sur 124

μ = E(ϕ(X)) = – ϕ(xv ). pv
v∈’

- Si X est continue alors on a

μ = E(ϕ(X)) = Ö ϕ(x)f(x)dx
ÕŸ
Proposition
Soient X et Y deux variables aléatoires sur un espace de probabilité (Ω, P)
et soient at b des réels alors on a
a) E(aX + b) = aE(X) + b
b) E(X + Y) = E(X) + E(Y)

VII.2 VARIANCE ET ÉCART-TYPE D’UNE VARIABLE ALÉATOIRE.

Définition

Soient X et Y deux variables aléatoires sur un espace de


probabilité (Œ, ℙ).
La variance ï(Ë)de X est donnée par
ï(Ë) = ð[(Ë − ð(Ë))ª ]
L’écart-type est donné par
σ(X) = ñν(X)

De l’égalité,
[X − E(x)]b = X b − 2E(X)X + [E(X)]b
On déduit
ν(X) = E[X b − 2E(X)X + [E(X)]b ] = E(X b ) − 2E(X)E(X) + [E(X)]b
Donc
ν(X) = E(X b ) − [E(X)]b

Cette égalité est souvent utile dans le calcul des effectifs des variances.
Page 78 sur 124

Proposition
Proposition
Soit X une variable aléatoire.
a) La variance de X est nulle si et seulement s’il existe un réel c tel que
ℙ (X=c)=1.
On dit alors que X est presque surement constante.
b) soient a et b des réels alors on a
υ(aX + b) = ab υ(X)
σ(aX + b) = aσ(X)

Dans le cas où X n’est pas presque surement constante, on remarquera


que la variable aléatoire a son espérance nulle, et un écart-type
äÕô(ä)
õ(ä)
égal à 1 connue sous le nom de la variable aléatoire centrée réduite
associée à X. Noter que l’expression de la variable aléatoire n’est pas
linéaire. De fait, si X et Y sont deux variables aléatoires sur (Ω, ℙ), alors la
variance de la somme n’est pas égale à la somme des variances de X et de
Y.
Soit X une variable aléatoire de variance non nulle càd qui n’est pas
presque sûrement constante.
On a E(X+(-X))= E(0) et E(X)+E(-X)=2 E(X).
Comme (X+Y)E(X+Y)=((X-E(X)+ (Y-E(Y)), alors on a
[(X + Y) − E(X + Y)]b = ([(X − E(X)]b + [ (Y − E(Y))]b + 2[ (Y − E(Y))](Y − E(Y))
D’où, on a
E(X + Y) = E(X) + E(Y) + 2[ (Y − E(Y))](Y − E(Y)) ( ∗)

VII.3 COVARIANCE ET COEFFICIENT DE CORRÉLATION

Définition
Soit X et Y deux variables aléatoires. On appelle covariance de X et Y ,
l’expression
cov(X, Y) = (Y − E(Y))(Y − E(Y))

Remarques
(a) La formule ( ∗) devient
E(X + Y) = E(X) + E(Y) + 2 cov (X, Y)
Page 79 sur 124

(b) La covariance de deux variables aléatoires n’est en général pas


nulle. Elle est nulle si les variables aléatoires sont indépendantes. De ce
fait, la covariance donne leur degré d’indépendance.

Une caractéristique souvent utilisée en statistiques est le coefficient de


corrélation de deux variables aléatoires X et Y.

Définition
Le coefficient de corrélation de deux variables aléatoires X et Y est
donnée
cov(X, Y) cov(X, Y)
ρ= =
ñvar(X)var(y) σ(X)σ(Y)
Remarques
1) C’est un coefficient sans dimension.
2) On peut montrer par des méthodes classiques en analyse que :
−1 < ø(X, Y) < 1
3) ρ (X, Y) = 1 si et seulement si il existe a > 0 et b réel tel que
Y = aX + b
4) ρ (X, Y) = −1 si et seulement si il existe a < 0 et b réel tel
que Y = aX + b

VII.4 VARIABLES ALÉATOIRES INDÉPENDANTES

Nous ne traitons que le cas de deux variables aléatoires discrètes.

Définition
Soient X et Y deux variables aléatoires sur un même espace fondamental
Ω. X et Y sont indépendantes si tous les événements X = xi et Y = yj sont
indépendants :
ℙÀ[X = xv ] ∩ [Y = yÁ ]Â = ℙ(X = xv ). ℙÀY = yÁ Â ∀ les couples (i, j)
Page 80 sur 124

Proposition

Soit X et Y deux variables indépendantes sur l’espace de probabilité


(•, ℙ), alors on a

a) E(XY) = E(X). E(Y)


b) var(X + Y) = var(X) + var(Y)
c) cov(X, Y) = 0
Remarque
Le fait que le coefficient de corrélation de X et Y est nul ne signifie pas du
tout que X et Y sont indépendantes (…qu'il n'y a pas de corrélation entre X
et Y…). Prenons par exemple, une variable X de loi symétrique par
rapport à 0 (par exemple de loi uniforme sur [-1, 1]), et posons Y = X b .
La loi de XY = X i est aussi symétrique par rapport à 0.
Ainsi, E(XY) = 0 = E(X) E(Y), et donc (X, Y) = 0. Pourtant, X et Y
ne sont pas (du tout) indépendantes, puisqu'au contraire, la donnée de la
valeur prise par X détermine complètement la valeur prise par Y.
Page 81 sur 124

CHAPITRE VIII. DISTRIBUTIONS DE PROBABILITES


USUELLES

VIII.1 DISTRIBUTIONS DE PROBABILITÉS DISCRÈTES

1. Loi de Bernoulli

Modèle : on effectue n tirages avec remise dans une urne contenant des
boules blanches et noires, les premiers en proportion p, les secondes en
proportion q= 1- p. Soit X le nombre de boules blanches tirées.

Définition

Soit A un événement de probabilité p. une variable aléatoire telle que


1 si ω ∈ Aú
X(ω) = ù
0 ailleurs
On dit que X suit la loi de Bernoulli de paramètre p.

Plus généralement, on dit qu’une variable aléatoire discrète X suit la loi de


Bernoulli si elle ne prend que les valeurs 1 et 0 avec les probabilités
respectives p et q = 1- p Dans ce cas, X est appelée variable de
BERNOULLI.

Proposition
Si X suit une loi de Bernoulli de paramètre p, i.e. X ∼ Bern(p), alors
E(X) = p et Var (X) = p(1 − p).

Remarque :
On utilisera une variable de Bernoulli lorsqu’on effectue une épreuve qui
n’a que deux issues : le succès ou l’échec. Une telle expérience est alors
appelée épreuve de Bernoulli.
Bernoulli On affecte alors 1 à la variable en cas de
succès et 0 en cas d’échec

Exemple
Une urne contient deux boules rouges et trois boules vertes. On tire une
boule de l’urne. La variable aléatoire X = nombre de boules rouges tirées
est une variable de Bernoulli.
Page 82 sur 124

Solution

ℙ (X = 1) = 2/5 = p et ℙ (X = 0) = 3/5 = q

2. Loi binomiale B(n, p)

Noter que la loi binomiale B(n, p) est la loi d'une somme X de n variables
aléatoires indépendantes suivant chacune la même loi de Bernoulli (p).
C'est aussi le nombre de réalisations d'un évènement A lors de l'exécution
de n expériences aléatoires indépendantes, le résultat de chacune
réalisant A avec la probabilité p. En effet, soit Xi i=1, .., n la variable de
Bernoulli associée à la ième épreuve. Si la ième épreuve donne un succès Xi
vaut 1 alors dans le cas contraire Xi vaut 0. La somme de ces n variables
comptabilise donc le nombre de succès au cours des n épreuves.
On a donc : X = X1 + X2 + ..... + Xn . X peut prendre (n + 1) valeurs :
0,1,.....,n.
La probabilité ℙ(X = k ) d'avoir k succès suivis de (n-k) échecs est
p¨ q_Õ¨ , car ces résultats sont indépendants les uns des autres. La
probabilité d'avoir k succès et n − k échecs dans un autre ordre de
réalisation est toujours p¨ q_Õ¨ .
Donc tous les événements élémentaires qui composent l’événement
(X =k) ont même probabilité.
Combien y en a-t-il? Autant que de façons d’ordonner les k succès par
rapport aux (n-k) échecs ? Il suffit de choisir les k places des succès parmi
les n possibles et les(n-k) échecs prendront les places restantes. Or il y a
Cnk manières de choisir k places parmi n.
Finalement, on obtient pour 0 ≤ k ≤ n : ℙ(X = k) = Cnk p¨ q_Õ¨

Définition
On dit qu’une variable aléatoire X à valeurs dans {0, … , m } suit une loi
binomiale de paramètre (n, p) avec n ≥ 1 et 0 ≤ p ≤ 1 si
ℙ(X = k) = Cn p¨ q_Õ¨
k

pour 0 ≤ k ≤ n
Page 83 sur 124

Remarque
L'adjectif binomial vient du fait que lorsqu'on somme toutes ces
probabilités, on retrouve le développement du binôme de Newton :
n n

∑ P( X = k ) = ∑ Cnk p k q n−k = ( p + q) n = 1
k =0 k =0

Proposition

X suit la loi binomiale B(n, p) si et seulement si X est une somme de n


variables aléatoires indépendantes et de Bernoulli de paramètre p.

Ceci permet de calculer très facilement l’espérance et la variance d’une loi


binomiale en utilisant les propriétés de l’espérance et de la variance de
variables aléatoires indépendantes.

Proposition

X suit la loi binomiale de paramètres n et p i.e. X ∼ B(n, p), alors


E(X) = np et Var (X) = n p(1 − p).

Exemple
Dans un atelier de fabrication de barre de fer, 30% de barres de fer sont
des bonnes qualités. Quelle est la probabilité pour qu’il y ait, dans un
échantillon aléatoire de 10 barres de fer tirées de cette population,
exactement 4 barres de fer de bonnes qualités ?

Solution
p=0,30 ; q=0,70 ; n=10 ; k=4
P4 = C104 ( 0,30 ) 4 ( 0,70 )10 − 4 = 0, 20

3. Loi de Poisson (λ)

Définition

Soit λ un paramètre strictement positif. On dit que X suit la loi de Poisson


λ si X prend ses valeurs dans N et
P(X = k) = Pk = , k=0, 1, 2, ….
λk e − λ
k!
Page 84 sur 124

Cette loi décrit le nombre d’évènements intervenant dans un intervalle de


temps de longueur l, lorsque les laps de temps séparant deux évènements
sont indépendants et de même loi exponentielle de paramètre.
Notation X ≈ ℙ (λ)

Remarque
La loi de Poisson est la loi des phénomènes rares, de petite probabilité. On
peut considérer la loi de Poisson de paramètre λ comme la loi limite d’une
loi binomiale B(n, α t ) lorsque n tend vers l’infini, le produit des

paramètres nα t restant toujours constant égal à αt = λ et α t devenant


n

de plus en plus petit.


n n

Notation X ≈ ℙ (λ)

Paramètres caractéristiques
a) Moyenne : E( X) = λ
b) Variance : Var(X) = λ
c) Ecart-type : σ(X) = λ

Exemple.
Exemple

Soit X la variable aléatoire du nombre de personnes réservant un billet


d'avion pour Berlin le 6 février à 9H30. X suit en théorie une loi binomiale
dont l'effectif est très grand (tous les clients potentiels, des millions), et le
paramètre p est infinitésimal (la probabilité pour qu'un individu lambda
ait envie de se rendre à Berlin le 6 février par le vol de 9H30). On
approxime en général la loi de X par la loi de Poisson de paramètre np.

Solution
Dans une grande usine, le nombre moyen d’accidents sérieux est de 5 par
an. Si le nombre d’employés reste constant, quelle est la probabilité pour
que dans l’année en cours il y ait exactement 7 accidents ?
57 (2, 718)−5
p7 = = 0,104
7!
Page 85 sur 124

Nota :
A mesure que λ augmente, la forme de la distribution tend à devenir
symétrique et s’approche de celle de la loi normale. Cela est vérifié pour
λ≥10 et même acceptable pour λ≥5.

La loi binomiale dépend de deux paramètres n et p. La loi de Poisson ne


dépend que d’un paramètre, ce qui la rend donc plus pratique. Il faut donc
avoir toujours présent à l’esprit que, lorsque les conditions le permettent,
on peut avoir intérêt à remplacer une loi binomiale par une loi de Poisson.

Lorsque n est grand et p petit, de telle façon que le produit np = λ reste


petit par rapport à n, la loi binomiale B(n, p) peut être approchée par la loi
de Poisson P(λ).
Cette approximation s’appliquant lorsque p est petit, la loi de Poisson est
appelée la loi des événements rares. En pratique, l'approximation est
valable si : n>20 et p≤0.1 et np≤5.

On approche la loi de Poisson P(λ) par la loi normale N(λ, λ ) dès que
λ≥16.

4. Loi hypergéométrique

Définitions

La distribution hyperggéométrique est une distribution de probabilité


discrète donnant la probabilité de k succès dans une séquence n essais
(sans remplacement) pour une population finie de taille N qui contient N1
succès.

La fonction de densité de probabilité pour une distribution


hypergéométrique :

ℙ (X=k) = Pk = CkN1 CnN−−k N1


CnN

C'est la loi qu'on rencontre lors d'un échantillonnage sans remise.


Page 86 sur 124

Exemple

Si une urne contient 3 balles rouges et 3 balles vertes, la probabilité que


deux balles rouges soient sélectionnées après trois essais sans
remplacement est 27/60 = 0,45.

Paramètres caractéristiques
caractéristiques

a) Contraintes sur k

Le nombre k de succès dans l'échantillon est soumis à la contrainte


suivante max (0, n – N2) ≤ k ≤ min (N1, n) où N2=N-N1

b) Moyenne
Nous montrerons que la moyenne µ de la distribution hypergéométrique
est

N1
µ=n

Si l'on note p la proportion initiale de succès dans la population, cette


N

expression s'écrit
µ = np

Autrement dit, la moyenne du nombre de succès dans l'échantillon est


simplement égal au nombre de succès dans l'échantillon multiplié par la
probabilité pour que le premier essai soit un succès.

Ce résultat serait évident si les essais se faisaient avec remplacement : à


chaque essais, la probabilité d’avoir un succès serait égale à N1/N, et k
aurait alors simplement la distribution binomiale B(N, N1/N).

Mais dans le cas de la distribution hypergéométrique, l’essai se fait sans


remplacement, et par conséquent la probabilité pour chacun des n essais
de produire un succès dépend de la composition de l'échantillon partiel
déjà tiré, et donc de l'historique des essais. Malgré cette différence
fondamentale, les cas "avec remplacement" et "sans remplacement"
conduisent au même résultat.
Page 87 sur 124

c) Variance

L'absence de remplacement après essais rend le calcul de la variance


σ² de la distribution hypergéométrique encore plus délicat. Nous
montrerons cependant que :

N1 ( N − N1 ) n −1
σ2 =n (1 − )
N 2
N −1

Si l'on note p = N1/N la proportion initiale de succès dans la population,


cette expression s'écrit :

σ² = np(1 - p)(1 - (n - 1)/(N - 1))

Remarquez que, pour une valeur de p donnée, σ² converge vers np(1 - p),
la variance de la distribution binomiale de paramètres (n, p), quand la
taille de la population N tend vers l'infini. Ce résultat s'explique
naturellement par la convergence de la distribution hypergéométrique
vers la distribution binomiale que nous décrivons maintenant.

d) Convergence de la distribution hypergéométrique vers une distribution


binomiale

Il existe manifestement un lien entre "distribution binomiale" et


"distribution hypergéométrique" : la distribution hypergéométrique peut
s'interpréter comme une variante de la distribution binomiale avec tirage
sans remise depuis une population finie.

Ce lien est mis en évidence par les comportements asymptotiques de la


distribution hypergéométrique, c'est à dire lorsque le nombre total de
boules dans l'urne tend vers l'infini.

- Taille d'échantillon fixe, proportion de succès tend vers une limite

Supposons que la taille de la population N tende vers l'infini d'une façon


telle que la proportion N1/N de succès tende vers une limite p, la taille
n de l'échantillon étant maintenue constante.
Page 88 sur 124

Nous montrerons qu'alors la distribution hypergéométrique H(N,


N1,n) tend vers la distribution binomiale B(n, p). Ce résultat est intuitif
puisque lorsque N augmente dans les conditions décrites ci-dessus,
l'influence de l'absence de remplacement de chaque succès devient
progressivement négligeable.

- Nombre de succès fixe

Nous établirons également le résultat suivant, moins intuitif.

- La taille de la population N tend vers l'infini, mais on maintient


constant le nombre N1 de succès. Le nombre de N-N1 tend donc lui
aussi vers l'infini, et la proportion de succès dans la population tend
vers 0.
- Pour compenser cette raréfaction relative des succès, on fait croître la
taille n de l'échantillon de façon à ce que la proportion n/N des essais
dans la population tende vers une limite p. Bien entendu, la
proportion de succès dans l'échantillon tend alors vers 0.

Mais ce qui nous intéresse est la distribution du nombre de ces succès (et
non de leur proportion), qui, sous ces conditions, tend vers la distribution
binomiale B(N1, p).

L'on peut, en pratique, remplacer la loi hypergéométrique par la loi


binomiale lorsque la fraction sondée n/N est inférieure à 10 % et que les
nombres N1 et N2 = N – N1 sont supérieurs à n.

- Convergence de la distribution hypergéométrique vers une


distribution normale

Nous venons de mentionner que si N1/N tend vers une limite p quand N
tend vers l'infini (la taille de l'échantillon étant maintenue constante), la
distribution hypergéométrique H(N, N1, n) converge vers la distribution
binomiale B(n, p).

Par ailleurs, nous savons que la distribution binomiale B(n, p) tend vers
une distribution normale quand n tend vers l'infini. Il semble donc
presque évident que la distribution hypergéométrique doit tendre vers
Page 89 sur 124

une distribution normale quand N et n tendent simultanément vers


l'infini.

Malheureusement, les choses ne sont pas aussi simples. Considérons par


exemple le cas extrême suivant : en faisant tendre N tend vers l'infini,
nous maintenons en permanence n = N. Alors, quel que soit N,
l'échantillon contient toujours tous les succès, et la "distribution" de k est
toujours k = N1, une distribution qu'on ne peut soupçonner de tendre
vers une distribution normale.

Notre intuition nous dit donc :

- Qu'il est indispensable de laisser n augmenter avec N pour que la


distribution binomiale B(n, p) puisse tendre vers une distribution
normale.
- Mais que cette augmentation ne doit pas être trop rapide sous peine
d'appauvrir la distribution du nombre k de succès dans l'échantillon.

VIII.2 DISTRIBUTIONS DE PROBABILITÉ CONTINUES.

VIII.2.1
III.2.1 Distribution normale (ou Laplace – Gauss)

Définition
La loi normale est une distribution continue dont la densité de probabilité
f est donnée par
1 x−µ
1 − ( )²
f ( x) = e2 σ
2πσ
où µ la moyenne de la v.a.c X et σ l’écart-type de la v.a.c X
Notation : X = N (µ, σ)

On parle de loi normale lorsque l’on a affaire à une variable aléatoire


continue dépendant d’un grand nombre de causes indépendantes dont les
effets s’additionnent et dont aucune n’est prépondérante (conditions de
Borel). Cette loi acquiert sa forme définitive avec Gauss (en 1809) et
Laplace (en 1812).
Page 90 sur 124

C’est pourquoi elle porte également les noms de : loi de Laplace, loi de
Gauss et loi de Laplace-Gauss.

Remarques
1°) si µ = 0 et σ = 1, on obtient la loi normale centrée-réduite notée par
Z = N(0,1). C’est le cas le plus utilisé (en pratique). Sa loi de densité de P
est donnée par :
1
1 − z²
f (z) = e 2

2°) on peut toujours passer de la v.a.c normale x = N (µ, σ) à la v.a.c


Z = N(0,1).
Il suffit de poser
X −µ
Z=
σ

Exemple
Le poids moyen d’un échantillon de 50 étudiants vaut 78 kg avec un écart-
type de 10 kg. Déterminer le poids centré-réduit d’un étudiant pesant 93
kg.
Solution
µ = 78 kg
σ = 10 kg
x = 93 kg→

93 − 78
Z= = 1, 5
10

Tableau de la distribution Z = N(0,1)(cfr


N(0,1) annexes)

VIII.2.2
III.2.2 Loi de Student (ou de Gosset)

La loi de Student (ou loi de Student-Fisher) est utilisée lors des tests de
comparaison de paramètres comme la moyenne et dans l’estimation de
paramètres de la population à partir de données sur un échantillon (Test
de Student). Student est le pseudonyme du statisticien anglais William
Page 91 sur 124

Gosset qui travaillait comme conseiller à la brasserie Guinness et qui


publia en 1908 sous ce nom, une étude portant sur cette variable aléatoire

a) Notion de « degré de liberté » (ν


(ν)
C’est la différence entre la taille (n) de l’échantillon et le nombre de
paramètres (k) à estimer dans la population : ν = n – k

Exemple

si n = 45 et k = 2 alors ν = 45 – 2 = 43 d.d.l

b) Densité de probabilité de la v.a.t


yo
f (t ) =

(1 + )(ν +1)/ 2
ν
c) Tables de la distribution de Student (cfr annexes)

Elles donnent la valeur tp telle que le % d’individus compris entre -tp et


+tp soit de p (en fonction de d.d.l ν)

VIII.
III.2.3 Distribution de Chi-
Chi-carré (χ
(χ²)

Définition
On définit la statistique de Chi-carré (χ²) par :
N −

Ns ² ∑(X i − X )²
χ² = = i =1

σ² σ²
si nous considérons des échantillons de taille N tirés d’une population
d’écart-type σ, et si pour chaque échantillon nous calculons χ², appelée la
distribution de Chi-carré (χ²).

VIII.2.4
III.2.4 Distribution de Fisher (F)

Définition

Considérons deux échantillons de tailles respectives N1 et N2, tirés de


deux populations normales de variances σ12 et σ 22 .
Page 92 sur 124

Définissons la statistique :
^2
s1 N 1 s12
σ 12 ( N 1 − 1)σ 12
F = =
^2 N 2 s 22
s2
( N 2 − 1)σ 22
σ 22


N 1 s12 N 2 s 22
s12 = et s 2
=
( N 1 − 1)σ 12 ( N 2 − 1)σ 22
2

Alors la distribution F d’échantillonnage de F est appelée la distribution F


de Fisher, ou brièvement la distribution F, avec ν1=N1-1 et ν2=N2-1
degrés de liberté.
PROCEDURE DE RESOLUTION DES
DES PROBLÈMES

1. Suite à l’énoncé du problème, identifier correctement à l’aide de mots la


variable aléatoire que vous allez considérer.
2. Préciser les valeurs possibles que peut prendre cette variable.
3. Identifier correctement la loi de probabilité qu’elle suit en essayant de
reconnaître dans le problème une situation type.
4. Déterminer les paramètres de la loi.
5. Utiliser les formules théoriques ou les tables pour déterminer les
probabilités demandées. Face à de longs calculs et en l’absence de tables
correspondant à vos ou votre paramètre(s), penser à approcher votre loi
par une autre.
Page 93 sur 124

EXERCICES

1. Le temps requis pour présenter l’interrogation de statistique est une


variable aléatoire ayant une distribution normale de moyenne µ=72
minutes et d’écart-type σ=12 minutes. Quelle est la probabilité que :
a) L’interrogation prenne au moins 93 minutes
b) L’interrogation prenne au plus 80 minutes
c) L’interrogation prenne un temps compris entre 63 et 78 minutes

2. On considère les V.A suivantes: U=V.A χ210 et W= V.A. t15


Calculer:
P ( U < 12,5 ) ;
P (|W|<1,37).

3. Si une variable suit une loi normale ;


1) Quelle est la probabilité d’observer une valeur inférieure à la
moyenne µ ?
2) Quelle est la probabilité d’observer une valeur inférieure à (µ -
σ) ?
3) Quelle est la probabilité d’observer une valeur contenue entre
(µ - 2σ) et (µ+σ) ?
4. Soit X=V.A. N(100 ;3) ; Calculer P (94< X <106).

5. Soit X une V.A Normale N(20 ;5).Calculer :


i) P(X > 25)
ii) P(X ∉ [18 ; 25])

6. Trouver l’aire comprise sous la courbe normale dans chacun des cas
ci-après :
a) z=0 et z=1,2 d) z>-1,20
b) z=-2,40 et z=1,25 e) z>1,37
c) z=0,15 et z=1,65

7. Soit X = V.A Normale de moyenne µ = 18 et de variance σ2 = 9.


Calculer la probabilité de trouver une valeur ≥ 28.
Page 94 sur 124

6. On lance trois fois une pièce de monnaie parfaitement équilibrée.


Calculer la probabilité pour qu’l y ait (i) trois fois, (ii) deux fois face,
(iii) une fois face, (iv) aucune fois face.
7. Une équipe A a la probabilité 2/3 de gagner chaque fois qu’elle joue,
sachant que A joue 4 parties, calculer la probabilité pour que A gagne
(i) exactement 2 parties, (ii) au moins une partie, (iii) plus de la
moitié des parties.
8. Une famille a 6 enfants. Calculer la probabilité pour qu’il y ait (i) 3
garçons et 3 filles, (ii) moins de garçons que de fille. On suppose que
la probabilité pour qu’un enfant particulier soit un garçon est ½.
9. Combien de dés doit-on jeter pour que la probabilité d’obtenir un 6
soit plus grande que ½ ?
10. La probabilité pour qu’un tireur atteigne une cible est ¼. (i) En
supposant qu’il tire 7 fois, quelle est la probabilité P pour qu’il
atteigne la cible au moins deux fois ? (ii) Combien de fois doit-il tirer
pour que la probabilité qu’il atteigne la cible au moins une fois soit
plus grande que 2/3 ?
11. La moyenne et l’écart-type des résultats à un examen sont
respectivement 74 et 12. Calculer les résultats en unités centrées
réduites des étudiants ayant obtenu les notes (i) 65 ; (ii) 74 ; (iii)
86 ; (iv) 92.
12. Reprendre le problème précédent et calculer les notes
correspondant aux résultats centrés réduits suivants, (i) -1, (ii) 0,5
(iii) 1,25, (iv) 1,75.
13. Soit φ la distribution normale centrée réduite. Calculer φ(t) pour (i)
t = 1,63, (ii) t = -0,75, (iii) t= -2,08.
14. Soit X une variable aléatoire suivant la loi normale centrée réduite
φ. Calculer
(i) P(0 ≤ X ≤ 1,42)
(ii) P(−0,73 ≤ X ≤ 0)
(iii) P(−1,37 ≤ X ≤ 2,01)
(iv) P(0,65 ≤ X ≤ 1,26)
(v) P(−1,79 ≤ X ≤ −0,54)
(vi) P(X ≥ 1,13)
Page 95 sur 124

(vii) P(|X| ≤ 0,5)


15. On suppose que la température T pendant le mois de Juin suit une
loi normale de moyenne 20° et d’écart-type 3°. Calculer la probabilité
p pour que la température soit comprise entre 21° et 26°.
16. On suppose que le poids P de 800 étudiants suit une loi normale de
moyenne 66 kilogrammes et d’écart-type 5 kilogrammes. Calculer le
nombre N d’étudiants ayant des poids (i) compris entre 65 et 70
kilogrammes, (ii) supérieurs ou égaux à 72 kilogrammes.
17. On jette 12 fois une pièce bien équilibrée. Calculer la probabilité P
pour que le nombre de faces soit compris entre 4 et 7, en utilisant (i)
la distribution binomiale, (ii) l’approximation normale de la
distribution binomiale.
18. On jette 180 fois un dé bien équilibré. Calculer la probabilité P pour
que la face 6 sorte (i) entre 29 et 32 fois, bornes incluses (ii) entre
31 et 35 fois, bornes incluses.
19. On considère 10 000 chiffres au hasard. Calculer la probabilité P
pour que le chiffre 3 figure au plus 950 fois.
20. Calculer (i) eÕa,i , (ii) eÕb,c .
21. A partir de la distribution de Poisson p(k; λ) = , calculer (i)

¨!
p(2 ; 1), (ii) p(3 ; ½ ), (iii) p(2 ; 0,7).
22. On suppose que dans un livre de 500 pages, il y a 300 fautes
d’impression distribuées au hasard. Calculer la probabilité P pour
qu’une page donnée contienne (i) exactement 2 fautes d’impression,
(ii) 2 fautes d’impression ou plus.
23. On suppose que 2% des articles produits par une usine sont
défectueux. Calculer la probabilité P pour que dans un échantillon de
100 articles, il y ait 3 articles défectueux.
24. Montrer que la distribution de Poisson p(k ; λ) est une distribution
de probabilité, c.à.d. que ∑Ÿ̈r p(k; λ) = 1
25. Montrer que si p est petit et n est grand, la loi de Poisson donne une
approximation de la distribution binomiale, c’est-à-dire que b(k ; n,
p) ≈ p(k ; λ) où λ=np.


Page 96 sur 124

26. La Fig. 11-3 montre la distribution t de Student correspondant à 9


degrés de liberté. Trouver la valeur de t1 pour laquelle
(a) L’aire grisée de droite = 0,05,
(b) Toute l’aire grisée = 0,05,
(c) Toute l’aire non grisée = 0,99,
(d) L’aire grisée de gauche = 0,01,
(e) L’aire qui est à gauche de t1 est égale à 0,90.

27. Trouver les valeurs critiques de t pour lesquelles l’aire de


l’extrémité de droite de la distribution t est égale à 0,05, le nombre
de degrés de liberté v étant égal à (a) 16, (b) 27, (c) 200.
28. Les limites de confiance à 95% de la loi de Laplace-Gauss sont égales
à ±1,96. Quelles sont les valeurs des limites correspondantes pour la
distribution t, avec (a) v= 9, (b) v=20, (c) v = 30, (d) v = 60 ?
29. Trouver les valeurs critiques de χ2 vaut 0,05, avec un nombre de
degrés de liberté v égal à (a) 15, (b) 21, (c) 50.
30. Trouver la valeur médiane de χ2 correspondant à (a) 9, (b) 28, et (c)
40 degrés de liberté.
31. L’écart-type du poids de 16 étudiants masculins choisis au hasard
dans une université de 1000 étudiants est de 2,40 kg. Trouver les
limites de confiance (a) 95% et (b) 99% de l’écart-type pour tous les
étudiants masculins de l’université.
32. Trouver χb, c pour (a) v = 50 et (b) v =100 degrés de liberté.
33. L’écart-type des durées de vie d’un échantillon de 200 ampoules
électriques est égal à 100 heures. Trouver les limites de confiance à
(a) 95% et (b) 99% de l’écart-type de toutes les ampoules
électriques de ce type.
Page 97 sur 124

CHAPITRE IX. ESTIMATION

L’Etude d’une population dans son ensemble se heurte à certaines


contraintes : le cout, la main d’œuvre, le matériel, le délai d’exploitation, la
qualité des résultats. C’est ainsi que l’on ramène l’étude à une partie de la
population, l’échantillon. Il faudrait alors prendre en considération la
représentativité de l’échantillon et les fluctuations d’échantillonnage pour
éviter que les résultats manquent d’exactitude.

Estimer un paramètre d’une population, c’est en chercher une valeur


approchée en se basant sur les résultats obtenus dans un échantillon.

IX.1
IX.1 Estimation ponctuelle

On parle d’estimation ponctuelle lorsque dans une population donnée,


l’estimation d’un paramètre est donnée par une seule valeur. On note par
X la variable aléatoire dont on cherche à estimer un paramètre dont la
valeur est notée .
Si la population est de taille N, tout échantillon de taille n tiré de cette
population est une combinaison de N éléments pris n à n. A partir des
échantillons de tailles n, on construit une nouvelle variable aléatoire
notée l et appelée estimateur de .
Si ( l ) = , alors on dit que l est un estimateur sans biais, sinon on
dit que Tn est un estimateur biaisé et son biais est mesuré par
( l) − ) .

IX.2
IX.2 Estimation par intervalle

Soit une population infinie caractérisée par une variable aléatoire X dont
on connait la loi de probabilité. Soit la valeur du paramètre à estimer et
l un estimateur sans biais de θ .
Il s’agit de trouver d la limite telle que
ℙ[ m − ≤ ≤ m + ] = 1− ∝

où 1− ∝ est un degré de confiance imposé dès le départ de l’étude (∝ très


petit, le risque d’erreur).
Page 98 sur 124

ℙ[ m − ≤ ≤ m + ] = 1− ∝
ℙ\ m − ≤ ≤ m + x = 1− ∝
ℙ\ m ≤ + m ≥ − x = 1− ∝

La ℙ complémentaire
ℙ\ m > + m < − x = ∝

ℙ\ m > + x + ℙ\ m < − x = ∝
Si m suit une loi normale, alors

ℙ\ m > + x = ℙ\ m < − x =
2
Nota
Nota

Un intervalle de confiance pose la question suivante : « entre quelle limite


de part et d’autre d’une statistique d’échantillon, la valeur du parametre
à estimer dans la population se trouve – t – elle au risque ∝ ?

a) Cas
Cas de la moyenne d’une population.
de la moyenne d’une population.

Grands échantillons (n≥
Grands échantillons (n 30).
≥30).

Ûw la moyenne d’echantillon est un estimateur sans biais de la moyenne de


la population telle que Tn = Ûw .

ℙ\Ûw > + x =
2

ℙ\Ûw ≤ + x = 1 −
2

ℙ\Ûw − ≤ x = 1 −
2

Par changement de variable = ⁄
√l

ℙ ≤ = 1 − avec ⁄√m l’ecart – type de la population et s

⁄√l ⁄√l b
l’écart – type de l’échantillon.

ℙ ≤ ! = 1 −
⁄√m 2
On trouve la valeur critique aÕ∝ et on pose = ∝ .
aÕ " √l

"
Page 99 sur 124

ℙ #Ûw − . ≤ ≤ Ûw + . $ = 1−∝
√m √m
∝ ∝
aÕ " aÕ "

Donc
∈ #Ûw − . , Ûw + . $
√m √m
∝ ∝
aÕ " aÕ "


Petits échantillons (n<
Petits échantillons (n< 30).
0).
On trouve la valeur critique lÕa,% et on pose = lÕa,% . √l

ℙ #Ûw − lÕa,% . ≤ ≤ Ûw + lÕa,% . $ = 1−∝


√m √m

Donc

∈ #Ûw − lÕa,% . , Ûw + lÕa,% . $


√m √m
où lÕa,% est la valeur critique à n-1 ddl et à l’aire = 1 − ∝" .

b) Cas de la proportion d’un événement dans une population.
Cas de la proportion d’un événement dans une population.
de la proportion d’un événement dans une population.

Soit E un événement de pourcentage P inconnue dans la population-mère.
On en tire un échantillon de taille n et on évalue à p0 la proportion de
l’événement E dans l’échantillon.

On pose & = 1 − '
Alors

' & ' &


∈ ' − .k ,' + .k !
m m
∝ ∝
aÕ " aÕ "


c) Cas de l’écart
Cas de l’écart-
de l’écart-type d’une population.
type d’une population.

Soit une population normale d’écart-type σ, on en tire un échantillon de


taille n et d’écart-type s, alors la valeur du paramètre à estimer est dans
l’intervalle
Page 100 sur 124

( (
∈# − ∝ . , + . $
√2m

√2m
aÕ " aÕ "


d) Cas de
Cas de la somme et la différence des moyennes de deux populations.
la somme et la différence des moyennes de deux populations

Soient )a )b deux populations caractérisées par des variables


aléatoires normales. Soient a b les valeurs de leurs moyennes
respectives Ûwa et Ûwb d’échantillon tiré de )a et )b .
Ûwa et Ûwb sont des estimateurs sans biais des moyennes de )a )b
a l’écart – type d’échantillon tiré de )a
b l’écart – type d’échantillon tiré de )b
ma la taille de l’échantillon tiré de la population )a
mb la taille de l’échantillon tiré de la population )b

+ ∈ (Ûwa + Ûwb ) − .k + , (Ûwa + Ûwb ) + .k +


" " " "
a b ∝
aÕ "
* "

aÕ "
* "
! et
l* l" l* l"

b b b b
− ∈ +(Ûwa − Ûwb ) − ., + , (Ûwa − Ûwb ) + ., + -
a b a b
ma mb ma mb
a b ∝ ∝
aÕ " aÕ "

e) Cas de
Cas de la somme et de
la somme et de la différence des proportions de deux populations.
de la différence des proportions de deux populations.
la différence des proportions de deux populations.

Soit E un événement de pourcentage 'a dans la population )a et'b dans la


population )b . On tire de )a un échantillon de taille ma et on évalue à 'a la
proportion de l’événement E dans cet échantillon.
De même, on tire de )b un échantillon de taille mb et on évalue à 'b la
proportion de l’événement E dans cet échantillon.
Avec &a = 1 − 'a et &b = 1 − 'b ,on a :
+ ∈ #('a + 'b ) − .k + , ('a + 'b ) +
%* .* %" ."
a b ∝
aÕ " l* l"

.k + $et
%* .* %" ."

aÕ " l* l"
Page 101 sur 124

'a &a 'b &b


− ∈ +('a − 'b ) − ., + , ('a − 'b )
ma mb
a b ∝
aÕ "

'a &a 'b &b


+ ., + -
ma mb


"


Page 102 sur 124

EXERCICES

1. On a effectué cinq mesures du diamètre d’une sphère qui ont


respectivement donnée 6.33 ;6.37 ;6.36 ;6.32 et 6.37 cm.
Déterminer des estimateurs sans biais et efficaces de :
La moyenne
La variance
a)
b)

2. Supposons que les poids de 100 étudiants de l’INBTP représentent un


échantillon aléatoire des poids des 1546 étudiants de l’INBTP.
Déterminer des estimateurs non biaisés et efficaces de :
La moyenne
La variance
a)
b)

3. Déterminer un intervalle de confiance à 95% et à 99% pour estimer le


poids moyen des étudiants de l’INBTP de l’exercice 2

4. Les mesures des diamètres de 200 roues dentées issues d’un


échantillon aléatoire, fabriquées pendant une journée par une certaine
machine, ont montré que la moyenne du diamètre était 0.824cm et l’écart
– type 0.042cm.
Déterminer les limites de confiance à 90%,95% ,98%, 99% et à 99,73%
du diamètre moyen de toutes les roues dentées.

5. Un échantillon de 100 votants choisis au hasard parmi tous les votants


d’une circonscription donnée a montré que 55% d’entre eux étaient
favorables à un certain candidat.
Déterminer les limites de confiance à 95%,99% et à 99,73% de la
proportion de tous les votants favorables à ce candidat ?
a)

Quelle doit être la taille de l’échantillon de votants si l’on veut être


sûr à 95% et à 99,73% que le candidat sera élu ?
b)

6. En jetant 40 fois une pièce, on obtient 24 fois face. Déterminer les


limites de confiance à 95% et 99,73% de la fréquence des faces que l’on
aurait obtenue pour un nombre de jets illimité.

7. Un échantillon de 150 lampes de qualité A a donné une durée de vie


moyenne de 1400 heures et un écart – type de 120 heures. Un échantillon
de 200 lampes de qualité B a donné une durée de vie moyenne de 1200
heures et un écart – type de 80heures.Determiner les limites de confiance
Page 103 sur 124

à 95% et à 99% de la différence des durées de vie moyennes des variétés


A et B.

8. La force électromotrice moyenne des batteries fabriquées par une


usine est de 45.1 volts avec un écart – type de 0.04 volt. Si l’on connecte
en série quatre batteries de ce type, déterminer les limites de confiance à
50%,95%,99% et à 99,73% de la force électromotrice totale.

9. On a calculé que l’écart –type des durées de vie d’un échantillon de 200
ampoules électriques valait 100heures.
a) Déterminer les limites de confiance à 95% et 99% de l’écart –type de
l’ensemble des ampoules de ce type.
b) De quelle taille doit – on choisir un échantillon d’ampoules électriques
dans les limites de confiance à 99,73% pour que l’écart –type de la
population ne diffère pas plus de 5% et de 10% de l’écart –type
empirique ?
Page 104 sur 124

CHAPITRE X TESTS D’HYPOTHÈSES PARAMÉTRIQUES

Introduction

On parle d’un test paramétrique lorsque les données sont issues d’une
distribution paramétrée. Alors, la question de base du test d’hypothèse est
de déterminer combien grande ou significative doit être la différence
entre un paramètre et une valeur supposée du paramètre pour pouvoir
légitimement rejeter l’hypothèse que le paramètre vaut bien cette valeur
présumée. Cette hypothèse est appelée hypothèse nulle et notée H0. Sa
validité est vérifiée à partir des données de l’échantillonnage.
L’hypothèse alternative à H0 est notée H1.
L’expérimentateur se fixe a priori une limite afin de séparer ce qu’il
considère comme des valeurs conformes (la zone de confiance)et des
valeurs non conformes(la zone d’erreur de type I). Cette limite s’appelle
seuil ou niveau de signification et a pour valeur critique aÕ∝ pour un test
unilatéral et aÕ∝ pour un test bilatéral.
"

X.1 ETAPES D’UN TEST D’HYPOTHÈSE

1. Formuler les hypothèses H0 et H1


2. Choisir le seuil de signification∝. C’est la probabilité maximale
acceptable de commettre une erreur de type I(rejeter une hypothèse
qui aurait dû être acceptée).
Plus la taille de l’échantillon est grande, plus l’erreur de type
II(accepter une hypothèse qui aurait dû être rejetée) est petite.
3. Déterminer la distribution à utiliser pour effectuer le test. En
général, on utilise la distribution normale et la distribution de
Student. Mais pour comparer plusieurs pourcentages
échantillonnaux, on utilise la distribution de χ ² .
si on fait des rapports de variances, la distribution à utiliser est celle
de Fischer.
4. Définir la région critique, c’est – à – dire calculer la valeur critique
en fonction du seuil de signification et de la distribution choisie.
aÕ∝ : valeur critique pour un test unilatéral
Page 105 sur 124

aÕ "
∝ : valeur critique pour un test bilatéral
( :on doit partager la probabilité d’erreur en deux parties égales

b
de chaque coté de la distribution)
Le tableau suivant donne les valeurs critiques pour les tests
bilatéraux et unilatéraux.

Tableau 8.1.
Niveau de signification 0.10 0.05 0.01 0.005 0.002
α
Valeurs de z pour des -1.28 ou -1.645 ou -2.33 ou -2.58 ou -2.88 ou
tests unilatéraux 1.28 1.645 2.33 2.58 2.88
Valeurs de z pour des -1.645 et -1.96 et -2.58 et -2.81 et -3.08 et
tests unilatéraux 1.645 1.96 2 ;58 2.81 3.08

5. Etablir la règle de décision. De façon générale, la règle de décision


est la suivante : Maintenir H0 si la valeur observée se situe dans la
région d’acceptation ou rejeter H0 si la valeur observée se situe dans
la région de rejet.
6. Calculer la valeur observée
7. Prendre la décision

X.2 QUELQUES TESTS D’HYPOTHÈSES

X.2.1 Test de comparaison de 2 moyennes

Cas de 2 grands échantillons (n1 ≥ 30, n2 ≥ 30)

Soit deux populations )a )b dont on prélève deux échantillons de


tailles respectives n1 et n2, de moyennes respectiveso̅a et o̅b ; d’écart-
types respectifs s1 et s2 . On considère le test bilatéral :
H0 : /a =/b (Il n’existe pas de différence significative entre les moyennes de
2 populations).
H1 : /a ≠ /b (il existe une différence significative entre les moyennes de 2
populations)
Page 106 sur 124

Procédure du test

a) Calcul de la statistique
x1 − x2
ε=
s12 s22
+
n1 n2

b) Fixer un seuil de confiance α ( α =0,05 ou α =0,01).

c) Règle de décision (ou règle de comportement) :


- si ε < aÕ∝ on accepte H0 (d’où pas de différence significative entre les
"
moyennes de deux populations.
- si ε ≥ aÕ∝ , on rejette H0 on accepte H1 ( d’où il existe une différence
"
significative entre les moyennes de deux populations).

Cas où l’un au moins des échantillons est petit (n1 < 30 ou n2< 30)

Procédure du test
a) Calcul de la statistique t =
x1 − x2
1 1
s +
n1 n2

où s=
n1s12 + n2 s22
n1 + n2 − 2

b) Choix du seuil ( α = 0,05 ou α = 0,01)

c) Détermination de la valeur critique l* `l" Õb;% à n1+n2-2 degrés de


liberté et à l’aire ' = 1 − ∝".

d) Règle de décision :
-Si t < l* `l"Õb;% , accepter H0
-Si t ≥ l* `l" Õb;% , rejeter H0 accepter H1
Page 107 sur 124

Exemple 1 : On considère la charge maximale supportée par des câbles de


deux groupes de matériaux de construction :

Groupe 1 : n1= 36 Groupe 2 : n2 = 50


x1 =107 x 2 = 112
s1 =10 s2 = 8
Existe –t-il une différence significative entre les charges maximales
supportées par des câbles de deux groupes au seuil de confiance de 5 % ?
et de 1 % ?

Solution
* Hypothèses : H0 : /a =/b
H1 : /a ≠ /b
* Statistique

= -2,5
x1 − x2 107 − 112
ε= =
2 2
s s 100 64
+
1 2 +
n1 n2 36 50

Avec α = 0,05 Valeur critique ∝


aÕ "
= 1,96
Avec α = 0,01 Valeur critique ∝
aÕ "
= 2,58
* Règle de décision.
ε = 2,5
Pour α = 0,05 ε = 2,5 > 1 rejeter H0 H1(d’où, différence
significative)
Pour α = 0,01 ∝
aÕ "
= 2,58 ε = 2,5 < 2,58 accepter H0
Exemple 2 (cfr. Données/ ex.1)

Groupe 1 : n1= 16 Groupe 2 :n2 = 14


x1 =107 x 2 = 112
s1 =10 s2 = 8
Existe-t-il une différence significative entre les charges maximales
supportées par des câbles de deux groupes aux seuils de 5 % et de 1 %
Page 108 sur 124

Solution
a) Statistique

x1 − x2
t=
1 1
s +
n1 n2

Calculons d’abord s= ?
n1s12 + n2 s22 16.(100) + 14(64)
s= = = 9,4
n1 + n2 − 2 16 + 14 − 2

107 − 112
t= = −1,5
1 1
9,4 +
16 14

Au seuil de α = 0,05
d.d.l = n1+n2 -2 = 16+14-2 = 28
' = 1 − ∝"=0,975

c) valeur critique : t 28;0,975 = 2,05

d) Règle de décision : = 1,5 < 2,05 accepter H0 ; d’où pas de


différence significative entre les charges maximales supportées par les
t

deux groupes :
Au seuil de α = 0,01 , t 28;0,995 = 2,76 ; d.d.l = 28

Règle de décision : t = -1,5 < 2,76 ; d’où accepter H0

X.2.2 Test de comparaison d’une moyenne théorique à une moyenne


observée

On considère le test bilatéral suivant :

H0 : µ = µ 0
H1 : µ ≠ µ 0
Page 109 sur 124

Procédure du test

a) Calcul de la statistique
x − µ0
ε=
σ

Choix d’un seuil α=0,05 ou α=0,01.


n

Détermination de la valeur critique


d)

aÕ "
e)
Règle de décision :
Si ε < aÕ∝ on accepte H0 si non on accepte H1
f)

"

X.2.3 Test de comparaison de deux proportions.

On considère deux populations )a )b indépendantes sur lesquelles on


mesure la proportion d’un caractère A. On note P1 et P2 les proportions
respectives de A sur )a )b . On tire deux échantillons de tailles
respectives n1 et n2. On note par '̂a et'̂ b les proportions observées du
caractère A sur les deux échantillons (respectivement).

Soit le test bilatéral :

H0 : P1 =P2
H 1 : P 1 ≠ P2
* Procédure du test
a) Calcul de la statistique =
%1* Õ%1"
3 *4
2 3* 2
3 "4
3"
k 5 ` 5
* "
où &1a = 1- '̂a
&1b = 1-'̂ b
b) Fixer un seuil α ( α = 0,05 ou α = 0,01)
c) Recherche de la valeur critique : α = 0,05 aÕ "
∝ = 1,96
α = 0,01 ∝

= 2,58
"
d) Règle de décision :

- si z < ∝
aÕ " ,
on accepte Ho (d’où pas de différence significative)
Page 110 sur 124

Exemple
Selon les résultats d’une enquête 15 étudiantes de l’INBTP sur 100
fument la cigarette contre 18 étudiants sur total de 100. Existe –t-il une
différence signification entre les deux proportions aux seuils de : a) 0,05 ?
et b) 0,01 ?

Solution
Ech.1 (étudiantes) : n1= 100
'̂a = 15/100 = 0,15
&1a = 1- '̂a = 1-0,015= 0, 85
Ech.2. (étudiants) : n2 = 100
'̂ b = 18/100 = 0,18
&1b = 1- '̂ b = 1 – 0, 018= 0,82
* Hypothèses : H0 : P1 =P2
H 1 : P 1 ≠ P2

* Statistique : = = -0, 19
%1* Õ%1" 0,15 − 0,18
=
3 *4
2 3* 2
3 "4
3"
k 5 ` 5
* "
(0,15)(0,85) (0,18)(0,82)
+
100 100

* Avec α = 0,05 ∝
aÕ "
= 1,96
Avec α = 0,01 ∝
aÕ "
= 2,58

* Règle de décision : Si z < ∝


aÕ "
accepter H0
Si z ≥ ∝
aÕ "
rejeter H0, accepter H1

Pour α = 0,05 z = 0,57 < 1,96 : accepter H0

Pour α = 0,01 z = 0,19 < 2,58 : accepter H0

X.2.4 Test de comparaison d’une proportion théorique P à une proportion


observée P0

Test bilatéral : H0 : P =P0


H 1 : P ≠ P0
Page 111 sur 124

Règle de décision : Si < aÕ


∝ accepter H0
"
z

Si z ≥ aÕ "
∝ rejeter H0, accepter H1
Calcul de la valeur observée : =
%Õ%6
2 4
k 6 6
5

X.2.5 Comparaison de données appariées.


appariées.

Pour tester l’efficacité d’un traitement dans un processus expérimental,


on procède souvent à des observations sur des échantillons qui ne sont
pas indépendants. Dans ce cas, les hypothèses doivent être testées sur des
données appariées, c’est – à – dire il s’agit en fait du même échantillon sur
lequel des mesures sont prises à deux reprises.
On note µd et σd respectivement la moyenne et l’écart-type des différences
des valeurs observées sur les populations appariées ; d et Sd

respectivement la moyenne et l’écart-type des différences sur les


échantillons dépendants.

Procédure du test.
• On considère le test bilatéral suivant :

8 : / = 0ú
7
8a : / ≠ 0

• Règle de décision
a) Si la variance de la population est inconnue
on vérifie si | | < aÕ∝ alors on accepte H0
"
et si | | ≥ aÕ "
∝ alors on rejette H0

où Student à n-1 ddl .



d− µ d
t=

b) Si la variance de la population est connue


Sd n

on vérifie si | | < aÕ∝ alors on accepte H0


"
et si | | ≥ ∝
aÕ "
alors on rejette H0
Page 112 sur 124



d− µ d
z=
σd
n

X.2.6 Test d’existence d’une liaison statistique linéaire.

On note
ρ : le coefficient de corrélation linéaire entre deux caractères quantitatifs
X et Y au sein d’une population.
r : le coefficient de corrélation linéaire entre les deux caractères dans un
échantillon tiré de cette population.
• On considère le test bilatéral :
8 : ρ = 0ú
8a : ρ ≠ 0
7
Règle de décision
-Si t < lÕb,% , accepter H0
-Si t ≥ lÕb,% , rejeter H0 accepter H1
On calcule la statistique de Student :
=9 student à (n – 2 ) ddl et à l’aire ' = 1 − ∝"
√lÕb
ñaÕ: "
Page 113 sur 124

EXERCICES

1. On désire tester la charge de rupture de 6 câbles métalliques


fabriqués par une usine. Le test indique une charge de rupture
moyenne de 7750 kilogrammes avec un écart-type de 145
kilogrammes, alors que le fabricant affirme que la résistance de
rupture moyenne est de 8000 kilogrammes. Peut-on maintenir les
affirmations du fabricant aux seuils de signification de (a) 0,05, (b)
0,01 ?

2. Les quotients intellectuels de 16 étudiants d’un quartier d’une


grande ville ont pour moyenne 107 et pour écart-type 10. D’autre
part, les quotients intellectuels de 14 étudiants d’un autre quartier
de la même ville ont pour moyenne 112 et pour écart-type 8. U a-t-il
une différence significative entre les quotients intellectuels des deux
groupes aux seuils de signification (a) 0,01, et (b) 0,05 ?

3. Dans une coopérative agricole, on désire tester l’effet d’un engrais


déterminé sur la production de blé. Pour cela on choisit 24 lots de
terrain de même superficie. La moitié de ces parcelles est traitée
avec l’engrais et l’autre moitié ne l’est pas (c’est le groupe de
référence). Les autres conditions demeurent les mêmes pour les
deux groupes. La moyenne de blé obtenue sur les lots non traités est
de 4.8 tonnes avec un écart – type de 0.40 tonne, tandis que la
moyenne obtenue sur les lots traités est de 5.1 tonnes avec un écart –
type de 0.36 tonne. Peut – on conclure qu’il n’ y a pas d’amélioration
significative de la production de blé avec l’engrais aux seuils de
signification de 1 % et 5% ?

4. L’examen de 320 familles ayant 5 enfants s’est traduit par la


distribution du Tableau 1. Ce résultat est-il compatible avec
l’hypothèse que la naissance d’un garçon et la naissance d’une fille
sont des événements équiprobables ?
Page 114 sur 124

Tableau 1
Nombre de 5 garçons 4 garçons 3 garçons 2 garçons 1 0 Total
garçons et filles 0 fille 1 fille 2 filles 3 filles garçon garçon
4 filles 5 filles
Nombre de 18 56 110 88 40 8 320
famille

5. Lors d’une enquête sur la durée de sommeil des enfants de 2 à 3 ans


effectuée sur un échantillon de 540 enfants d’une commune de Kinshasa,
on a trouvé une moyenne du temps de sommeil par nuit de 1,3 heures
avec un écart-type de 0,05 h.
Donner l’intervalle de confiance de durée moyenne de sommeil de tous les
enfants de 2 à 3 ans de cette commune

6. Un groupe de 12 enfants de moins de 5 ans a donné les paramètres


suivants pour l’hémoglobine ; x = 8,05 s= 0,01.
_

Déterminer les limites de confiance du taux d’hémoglobine moyen à 5%


de toute la population.

7. Un échantillon de 100 votants choisis au hasard parmi tous les votants


d’une circonscription donnée a montré que 54,8% d’entre eux étaient
favorables à un certain candidat. Déterminer l’intervalle de confiance à
95% et 99% de la proportion de tous les votants favorables à ce
candidat.

8. Quelle doit être la taille de l’échantillon de votants du problème


précédent si l’on veut être sûr à 95% que le candidat sera élu ?

9. En mesurant le temps de réaction, un psychologue estime que l’écart -


type est de0.05 secondes. Quelle doit être la taille de son échantillon de
mesure pour que l’erreur de son estimation n’excède pas 0.01 secondes a)
à 95% b) à 99%

10. Deux groupes de 40 et 60 étudiants respectivement ont subit le même


examen. la note moyenne du premier groupe a été de 74 avec un écart-
type de 8 et pour le second la note moyenne a été de 78 avec un écart-
type de 7. Existe-il une différence significative entre les résultats de 2
groupes au niveau α=0,05 ?
Page 115 sur 124

11. On choisit par hasard dans un vaste champ 200 parcelles et on recense
dans chacune d’elles, le nombre des touffes d’une certaine espèce d’herbe.
On observe la distribution suivante :

Nombre de
0 1 2 3 4 5 6 7 8
touffes
Nombre de
109 58 20 6 4 2 0 1 0
parcelles

a) Donner un intervalle de confiance à 95% pour la moyenne du nombre


des touffes par parcelle.
b) Tester que cette moyenne n’est pas inférieure à 0,8 sur base de cet
échantillon avec un seuil de signification de 0,05.

12. Le poids moyen de 50 étudiants qui ont montré un intérêt particulier


pour l’athlétisme était de 68,2kgs avec un écart-type de 2,5kgs tandis que
50 autres étudiants qui n’éprouvaient aucun intérêt pour l’athlétisme
avaient un poids moyen de 67,5 kgs avec un écart-type de 2,8 kg Tester
l’hypothèse que les étudiants participant aux épreuves d’athlétisme sont
plus gros que les autres

13. De combien devrait augmenter la taille des échantillons de chacun de


2 groupes des Pb 76) et 77) précèdent pour que la différence observée de
0,7 kgs sur les poids moyens soit significative au seuil de 0,05.

14. On désire comparer la précision et l’exactitude de deux balances en


étudiant les résultats des pesages d’un poids calibré à 15 kg. On a obtenu
les résultats suivants (en kgs).

1ère 15 14 13 17 16
balance
2ème 11 12 14 12 15
balance

a) Les deux balances ont-elles la même précision ?


b) La première balance est-elle exacte ?
c) La deuxième balance est-elle exacte ?
Page 116 sur 124

15. On a p = 30%, n = 200, p0 = 35% ; la différence est-elle significative ?

16. Dans une enquête sur le cancer de la vessie, on trouve : sur 210
cancers, 90% de fumeurs ; sur 210 témoins, 80% de fumeurs. Le
pourcentage de fumeurs est-il diffèrent chez les malades atteints de
cancer et les témoins ?

17. On estime qu’une machine à former les pilules fonctionne de façon


satisfaisante si le pourcentage de pilules non réussies est de 1 pour
1000.sur un échantillon de n=10 000 pilules, on a trouvé 15 pilules
défectueuses.
La machine est - elle mal réglée ?

18. Le fabricant d’un médicament annonce qu’un de ses produits est


efficace à 90%, en supprimant une allergie dans un délai de 8hoo. Dans un
échantillon de 200 personnes, le résultat a été effectif pour 160 d’entre-
elles.
Dire si l’affirmation du fabricant est légitime.
Page 117 sur 124

CHAPITRE XI. TESTS D’HYPOTHESES NON


PARAMETRIQUES.

XI.1 Introduction

Les tests d’hypothèses non paramétriques sont des tests qui concernent
des variables qualitatives. Elles ne sont pas mesurables numériquement
mais sont répertoriées selon les modalités.
Supposons une population dont on voudrait étudier un caractère
qualitatif à k modalités. On note ;<= la proportion d’individus présentant
la modalité i
On prélève de cette population un échantillon de taille n. On note par >n
l’effectif observé, le nombre d’individus présentant la modalité ? dans
l’échantillon et ;n = la proportion d’individus présentant la modalité ?
@=
l
dans l’échantillon.
Sous l’hypothèse que H0(;n = ;<= ), on s’attend à observer m;<= le nombre
d’individus présentant la modalité ?. Ce nombre s’appelle effectif attendu
ou effectif théorique de la modalité ? et on le note par n .
La question de base du test d’hypothèse non paramétrique est de savoir si
les effectifs observés >n différent sensiblement des effectifs théoriques n .
La statistique utilisée à cet effet est la variable aléatoire continue
B B B
(>n − n )b
Ab = – ãC D m = – >n = – n
n
nra nra nra

Tableau 10.1.
Evénement E1 E2 E3 …. Ek
Effectif O1 O2 O3 …. Ok
observé
Effectif e1 e2 e3 …. ek
théorique
Page 118 sur 124

XI.2 QUELQUES TESTS D’HYPOTHÈSES NON PARAMÉTRIQUES

XI.2.1 Test d’indépendance.

On considère une population ) dont on voudrait étudier l’indépendance


de deux variables qualitatives.

Formulation d’hypothèses :

H0≡Les deux variables sont indépendantes


H1≡Les deux variables sont liées

Tableau de contingence
Effectifs Observés
1ère Variable
mod1 mod2 … mod i … mod k Total
mod1 l1
mod2 l2
2nd variable


modj … Oji … lj


mod m lm
Total C1 C2 Ci Ck n

FG ×H=
On trouve les effectifs théoriques correspondants : En =
l

Effectifs théoriques
1ère Variable
mod1 mod2 … mod i … mod k Total
mod1 l1
mod2 l2
2nd variable

modj … eji … lj

mod m lm
Total C1 C2 Ci Ck n
Page 119 sur 124

On calcule
I B
(>En − En )
b
A = ––
b
En
Era nra
De manière compacte, en considérant toutes les cellules du tableau de
contingence numérotées de 1 à m :
I
(> − )b
A =–b

ra

Règle de décision

A b < A(HÕa)×(FÕa),aÕ∝
b
on accepte H0
A b ≥ A(HÕa)×(FÕa),aÕ∝
b
on rejette H0
où c : le nombre de colonnes du tableau
l : le nombre de ligne du tableau

XI.2.2 Test d’homogénéité.

On suppose deux populations )a )b dont les distributions de la


variable qualitative sont inconnues.
On souhaite donc comparer deux distributions observées pour savoir si
elles sont identiques.
On prélève deux échantillons, l’un de taille n1issu de )a et l’autre de taille
n2 issu de )b .

Formulation d’hypothèses

H0≡Les distributions de la variable qualitative sont identiques dans les


deux populations.
H1≡Ces distributions diffèrent

Tableau de contingence

On note
O1i : nombre d’individus issu de l’échantillon 1,présentant la modalité i.
O2i : nombre d’individus issu de l’échantillon 2,présentant la modalité i.
Page 120 sur 124

Effectifs observés
mod1 mod2 … mod i … mod k total
échantillon 1 O11 O12 … O1i … O1k n1
échantillon 2 O21 O22 … O2i … O2k n2
Total C1 C2 … Ci … Ck n

On trouve les effectifs théoriques correspondants :


où J ∈ {1,2} , ? ∈ {1,2, … , K }
lG ×H=
=
En l

Effectifs théoriques
mod1 mod2 … mod i … mod k total
échantillon 1 e11 e12 … e1i … e1k n1
échantillon 2 e21 e22 … e2i … e2k n2
Total C1 C2 … Ci … Ck n

On calcule
b B
(>En − En )
b
A = ––
b
En
Era nra
De manière compacte, en considérant toutes les cellules du tableau de
contingence numérotées de 1 à m :
M
(OL − eL )b
χ =–
b
eL
Lra
Règle de décision

χb < χb(NÕa)×(OÕa),aÕ∝ on accepte H0


χb ≥ χb(NÕa)×(OÕa),aÕ∝ on rejette H0
où c : le nombre de colonnes du tableau
l : le nombre de ligne du tableau

XI.2.3 Test d’ajustement.


d’ajustement.

Il s’agit de comparer une distribution observée à une distribution


théorique donnée (par exemple, normale ou binomiale).
Page 121 sur 124

Formulation d’hypothèses

H0≡Les données observées suivent la distribution théorique donnée.


H1≡ Les données observées ne suivent pas la distribution théorique
donnée.

Statistique de décision
¨
(Ov − ev )b
χ =–
b
ev
vra
Où les Ov sont données et ev = n × φPÓ avec φPÓ la proportion de la
modalité i selon la distribution théorique

Règle de décision

χb < χb¨Õa,aÕ∝ on accepte H0


χb ≥ χb¨Õa,aÕ∝ on rejette H0
Où k est le nombre de modalités
Page 122 sur 124

EXERCICES

1. Le tableau 2 donne les fréquences observées lors de 120 parties de


dés et les fréquence théoriques correspondantes. Tester l’hypothèse
que le dé est parfait au seuil de 0,05.
Face 1 2 3 4 5 6
Fréquence 25 17 15 23 24 16
observée
Fréquence 20 20 20 20 20 20
théorique
Tableau2
2. Une table de nombres aléatoires constituée de 250 chiffres a donné
la distribution suivante pour les chiffres 0, 1, 2, 3, 4, 5, 6, 7, 8, 9. Est-
ce que la distribution observée diffère significativement de la
distribution théorique ?
Chiffre 0 1 2 3 4 5 6 7 8 9
Fréquence 17 31 29 18 14 20 35 30 20 36
observée
Fréquence 25 25 25 25 25 25 25 25 25 25
théorique
5. Dans ses expériences avec des pois, Mendel a observé 315 pois ronds
et jaunes, 108 pois ronds et verts, 101 pois ridés et jaunes, et 32 pois
ridés et verts. Selon sa loi de l’hérédité, ces nombres devraient être
proportionnels respectivement à 9, 3, 3 et 1. Peut-on douter de cette
loi aux seuils respectifs de 0,01 et 0,05 ?
6. Une urne contient un très grand nombre de billes de 4 couleurs
différentes : rouge, orange, jaune et vert. Un échantillon de 12 billes
tirées au hasard dans l’urne a donné 2 billes rouges, 5 billes orange, 4
billes jaunes et 1 bille verte. Tester l’hypothèse suivant laquelle
l’urne contient de »s propositions égales de billes dans chaque
couleur.
7. 360 jets d’une paire de dés ont donné 74 ‘’sept’’ et 24 ‘’onze’’. Tester
l’hypothèse suivant laquelle les dés sont bien équilibrés au seuil de
signification de 0,05.

8. Dans ses expériences avec les pois, Mendel a observé 315 pois ronds
et jaunes ; 108 pois ronds et verts, 101 pois ridés et jaunes et 32 pois
Page 123 sur 124

ridés et verts. Selon la loi de l’hérédité, ces nombres devraient être


proportionnels à 9, 3, 3 et 1.
Peut – on douter de cette loi au seuil de signification de 0,01 et 0,05 ?

9. Chez Homo sapiens, le gène qui détermine le groupe sanguin possède


trois allèles A, B et C. dans une petite population, on a trouvé 15
homozygotes AA, 18 homozygotes BB, 19 homozygotes OO, 26
hétérozygotes AB, 19 hétérozygotes AO et 17 hétérozygotes BO. A l’aide
d’un test de Khi-carré, comparez les effectifs observés pour les six
génotypes aux attendus sous la loi de Hardy-Weinberg et dites si cette
population suit la loi de Hardy-Weinberg au seuil de 1% et 5% ?

10. Le tableau suivant indique le résultat de l’examen de 124 sujets, d’un


pays européen, classés d’après la couleur de leurs yeux et la couleur de
leurs cheveux. On demande s’il existe une liaison statistique entre ces
deux caractères qualitatifs.
Couleur des cheveux Blonds Bruns Noirs Roux TOTAL

Bleus
Couleur des yeux
25(16,0) 9(13,8) 3(7,5) 7(6,7) 44

Gris ou Verts 13(17,1) 17(14,8) 10(7,9) 7(7,2) 47

Marrons 7(11,9) 13(10,4) 8(5,6) 5(5,1) 33

TOTAL 45 39 21 19 124
Nota : Les nombres entre parenthèses représentent les effectifs
théoriques.
Page 124 sur 124

Comment faire un bon travail statistique ?

Un travail statistique comporte essentiellement 4 phases

1. On définit les caractères statistiques sur lesquels va porter


l’étude(les quantités ou les qualités)
2. On procède au recueil des données :(échantillonnage, sondages,
inventaire, recensements, enquêtes par questionnaires)
3. On passe ensuite à la statistique descriptive univariée pour résumer
l’information qui ressort de l’ensemble des données, pour décrire le
comportement de l’ensemble des données :
On organise les données recueillies à l’aide d’un tableau
statistique, selon le type de distribution. Si le nombre des
données est supérieur ou égal à 30, alors la distribution est
continue ; si non elle est discrète.
On présente les données à l’aide des graphiques selon le type
de distribution (histogramme, diagramme en bâtonnets,
polygone statistique, diagramme à colonnes)
On résume le comportement de l’ensemble des données grâce
aux valeurs typiques de tendance centrale (moyenne, mode,
médianes), de dispersion (variance, écart – type, étendue,
quartiles, coefficient de variation) et de forme (moments,
coefficients de Fisher, coefficient de Pearson)
4. On essaie enfin de généraliser ce comportement à l’ensemble de la
population en rattachant les valeurs typiques à un modèle ou à une
loi statistique (binomiale, normale, etc.). C’est déjà là la statistique
Inférentielle. En généralisant, on est tenu d’émettre des réserves
d’où la notion d’intervalles de confiance.