Vous êtes sur la page 1sur 239

Module: PROBABILITÉ ET

STATISTIQUE
2016-17/SVI

Par Dr Abdelkrim MERBOUHA


Université Moulay Slimane
Faculté POLYDSCIPLINAIRE , BéniMellal
Plan du cours
 Ch 1: Statistiques descriptives et
représentation graphique
 Ch 2: Probabilités
 Ch 3: Quelques distributions usuelles
 Ch 4: Échantillonnage et estimation des
paramètres
 Ch 5: Tests d’hypothèses
 Ch 6: Introduction aux cartes de contrôle

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
Avant propos

La statistique est à la fois une science formelle,


une méthode et une technique. Elle comprend la
collecte, l'analyse, l'interprétation de données
ainsi que la présentation de ces ressources afin
de les rendre compréhensibles de tous, et en
tirer des conclusions judicieuses.

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
Un peu d’histoire
Bien que le nom de statistique soit
relativement récent – on attribue en
général l'origine du nom au XVIIIe siècle
de l'allemand Staatskunde
– cette activité semble exister dès la
naissance des premières structures
sociales. D'ailleurs, les premiers textes
écrits retrouvés étaient des recensements
du bétail, des informations sur son cours
et des contrats divers.
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
On a ainsi trace de recensements en
Chine au XXIIIe siècle av. J.-C. ou en
Égypte au XVIIIe siècle av. J.-C.. Ce
système de recueil de données se
poursuit jusqu'au XVIIe siècle. En Europe,
le rôle de collecteur est souvent tenu par
des guildes marchandes, puis par les
intendants de l'État.

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
Ce n'est qu'au XVIIIe siècle que l'on voit
apparaître le rôle prévisionnel des
statistiques avec la construction des
premières tables de mortalité.
Antoine Deparcieux écrit en 1746 l'Essai
sur les probabilités de la durée de vie
humaine. Elle va d'abord servir aux
compagnies d'assurances sur la vie qui se
créent alors.

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
La première application industrielle des
statistiques eut lieu lors du recensement
américain de 1890, qui mit en œuvre la
carte perforée inventée par le statisticien
Herman Hollerith. Celui-ci avait déposé un
brevet au bureau américain des brevets.

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
Une Définition préalable : Les statistiques sont le
produit des analyses reposant sur l'usage de la
statistique. Cette activité regroupe trois
principales branches :

 la collecte des données ;


 le traitement des données collectées, aussi
appelé la statistique descriptive ;
 l'interprétation des données, aussi appelée l'
inférence statistique, qui s'appuie sur la théorie
des sondages et la statistique mathématique.

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
Ch 1: Statistiques descriptives et
représentation graphique

1. Notions fondamentales

1.1 Individu, population et échantillon

Individu: c’est l’unité sur laquelle on observe une ou


plusieurs caractéristiques. Par exemple : personne,
ville, plante, machine, etc.

Population: c’est l’ensemble des individus que l’on


veut étudier, qui ont des propriétés communes et
pour lesquelles on veut obtenir de l’information.
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
Échantillon: c’est un sous-ensemble de la population,
soit la partie qu’on va examiner.

Taille: on appelle taille d’un échantillon le nombre


d’individus dans cet échantillon. On le note par n.

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
Choix d’échantillons

La règle est que l’échantillon doit être


représentatif de la population dont il est
extrait, pour se faire, on procède par
- Echantillonnage aléatoire: les individus d’une
population ont la même chance d’être
sélectionné.
- Echantillonnage aléatoire simple: de n sujet est
choisi de telle façon que chaque échantillon de
taille n ait la même chance d’être choisi.
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
Echantillonnage systématique: On choisi un point de
départ et on sélectionne chaque k ième élément de la
population.
Echantillonnage opportun: On collecte simplement les
résultats qui sont faciles à obtenir.
Echantillonnage stratifié: On subdivise la population
en au moins deux sous-groupes différents (strates)
dont les individus partagent les mêmes
caractéristiques (comme le genre, la classe d’âge) et
on tire un échantillon dans chaque sous groupes.
Echantillonnage en grappes: La population est
subdivisé en sections (grappes), puis on prend tous
les membres des grappes sélectionnées
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
1.2 Variable statistique

 Une variable statistique est une


caractéristique susceptible de variations
observables.
 Les modalités d’une variable statistique
sont les valeurs possibles à priori de la
variable.
 Les données sont les valeurs observées a
posteriori de la variable. C’est les valeurs de
la variable sur les individus de l’échantillon
x1 , x2 ,..., xn .
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
1.3 Type de variables
- Variable quantitative : elle fait référence à un
système de mesure numérique. On en distingue
deux types :

- Variable quantitative discrète: l’ensemble des


modalités est dénombrable. Par exemple, la
variable nombre d’enfants par ménage.

- Variable quantitative continue : l’ensemble des


modalités est un intervalle. Par exemple, la durée
de vie d’un instrument électronique.
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
 Variable qualitative : elle ne fait pas
référence à un système de mesure numérique.
On distingue deux cas :

- Ordinale : l’ensemble des modalités


correspond à une échelle avec un ordre. Par
exemple: niveau de satisfaction, niveau de
scolarité.
- Nominale : l’ensemble des modalités ne
correspond à aucune échelle. Par exemple:
sexe, nationalité.

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
pour les biologistes

La terminologie est un peu différente chez les


biologistes, où l’on définit alors 4 niveaux de
mesure

- Le niveau nominal de mesure. (oui/non;


couleurs…)
- Niveau ordinal de mesure

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
- Le niveau intervalle de mesure: qui est
semblable au niveau ordinal avec la propriété
supplémentaire que la différence entre deux
valeurs a un sens, (exemple: la température,
les années de naissance)
- Le niveau rapport de mesure: est semblable au
niveau intervalle de mesure avec la propriété
de mesure qu’il y a un zéro naturel pour lequel
aucune quantité n’est présente.
(exemple: poids)

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
2. Représentation des données
2.1 Variables quantitatives continues

 Données brutes : sont les données ‘’en vrac ‘’.

Exemple 1: les données ci-après représentent les


durées de vie (10 3 en heures) d’un certain type
d’appareils électroniques.

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
78.9 83.4 90.0 88.2 89.3 60.8

75.0 88.0 92.3 73.1 73.1 76.3

60.3 67.4 84.2 84.2 70.2 97.8

92.1 80.0 77.0 77.0 77.2 84.5

93.7 78.5 65.0 56.5 56.5 84.2

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
 Données groupées : sont des données obtenues
en regroupant les données brutes ordonnées dans
des classes sous la forme d’un tableau de
fréquences.

 Tableau de fréquences: les données brutes


ci-dessus sont résumées dans le tableau de
fréquence ci après :

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
Exemple 2 :

Classe Fréquence n Valeur Fréquence


centrale m relative f
[55,65[ 4 60 4/30
[65,75[ 5 70 5/30
[75,85[ 13 80 13/30
[85,95[ 7 90 7/30
[95,105[ 1 100 1/30
n = 30 F=1
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
Définitions

- L’amplitude d’une classe ei , ei 1  est ei 1  ei


ei  ei 1
- Son centre est
2

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
Nombre de classes à retenir

Sturges suggère

10
1 logn 
3

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
Lorsque la répartition des données semble
symétrique , il convient de construire des
classes de même amplitude. Si elle n’est
pas symétrique ou si une classe a un
effectif nul ou très faible, alors il convient
de la regrouper avec la suivante (resp.
précédente) si cette classe se trouve à
droite (resp. gauche) de la classe la plus
fréquente. Cette technique permet
d’obtenir une répartition régulière.

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
2.2 Variables quantitatives discrètes
 Données brutes.
Exemple 3: nombre de pièces défectueuses.

0 1 0 2 0
0 1 2 0 0

1 0 1 3 0

1 2 1 0 0

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
 Tableau de fréquences.

On peut présenter les données brutes


précédentes selon les modalités dans le
tableau de fréquence suivant:

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
Modalité x Fréquences n Fréquences
relatives f
0 10 10/20

1 6 6/20

2 3 3/20

3 1 1/20

n = 20 F=1
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
3. Caractères de position et de dispersion  

3.1 Caractères de position: moyenne d’un


échantillon
3.1.1 Moyenne arithmétique
 Cas de données brutes :
La moyenne d’un échantillon est donnée par la
formule :

x1  ⋯  x n
x
n
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
Exemple: Mesure du taux de plomb dans l’air

On liste ci-dessous des valeurs mesurées de plomb


dans l’air (en microgrammes par mètre cube).
L’Agence de protection de l’environnement a
établi un standard de qualité de l’air pour le
plomb: un maximum de 1.5. Les mesures
indiquées ci-dessous
Ont été enregistrées dans l’immeuble numéro 5 du
World Trade Center dans les jours qui ont suivi
immédiatement sa destruction par l’attaque du 11
septembre 2001.Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
Trouver la moyenne pour cet échantillon de
mesure de plomb dans l’air

5.4 1.10 0.42 0.73 0.48 1.10

x  1.538

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
 Cas de données groupées :
La moyenne des données groupées
s’exprime par :

n1 m1  ⋯  n p m p
x
n

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
Propriétés de la moyenne arithmétique

Soit x1 , x2 ,..., xn un échantillon.

Soient y1 , y2 ,..., yn tels que:yi  axi  b

où a et b sont deux nombres réels, alors

y  ax  b
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
3.1. 2 Moyenne harmonique

La moyenne harmonique est donnée par

n
H  n
1
i 1 xi
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
3.1.3 Moyenne géométrique

Elle est donnée par

G   x1.x2 ....xn 
1
n

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
3.1.4 Le mode
Le mode est la valeur de la variable étudiée
correspondant à l’effectif le plus élevé.
Il renseigne sur la valeur la plus probable. On
peut le déterminer par simple lecture du
tableau des effectifs ou des fréquences pour
les caractères quantitatifs discrets et
qualitatifs.
Dans le cas d’un caractère continu, on
détermine la classe modale, puis on cherche le
mode à l’intérieur de la classe modale
graphiquement.
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
ni ai ni' 
 ni
Classe
ai
[10,12 20 2 20
] 40 2 40
[12,14 52 4 26
] 10 2 10
[14,18 8 4 4
]
[18,20
]
[20,24
]
ai amplitude de la classe i

 est la plus petite amplitude, ici c’est 2.


Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
Les deux triangles (MAB) et (MCD) sont
semblables, alors
AB CD
 ce qui entraine que
MP MQ 1 2 2
 
M0  I S  M0 I  a  M0
Et qui donne
a 1
M0  I 
1   2

1 et  2 sont respt les excédents d’effectifs de la


classe CM sur la classe qui la précède et la
succède. Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
Application à l’exemple:

2  20
M 0  12 
20  14

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
3.1.4 Le midrange

Minimum  Maximum
Midrange 
2

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
Exemple: Mesure du taux de plomb dans
l’air

1.10  5.40
Midrange   3.25
2

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
3.2 Caractères de dispersion

3.2.1 Variance d’un échantillon


 Cas de données brutes :
La variance d’un échantillon x1 ,  , x n est
donnée par:
1 n
1  n
2 2
S   ( xi  x)    xi   n x 
2 2

n i 1 n  i 1  
S est appelé écart-type empirique

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
 Cas de données groupées :

La variance des données s’exprime par :

1  p
2 2
S    ni mi   n x 
2

n  i 1  

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
Recette de l’étendu

Pour estimer une valeur de l’écart-type s: pour


une approximation rapide de l’écart-type,
utiliser:
étendu
s
4

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
Règle empirique (dite des 68-95-99.7) pour
une distribution en « cloche ».

Une autre règle utile pour interpréter les valeurs


d’un écart-type est la règle empirique. Cette
règle dit que pour des données avec une
distribution approximativement en cloche, les
propriété suivantes s’appliquent:

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
- À peu près 68 % des valeurs sont situées à moins
d’un écart-type la moyenne

- À peu près 95 % des valeurs sont situées à moins de


deux écart-type la moyenne.

- À peu près 99.7 % des valeurs sont situées à moins


de trois écart-type la moyenne

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
Théorème de Chebychev
La proportion d’un ensemble de données situés à
moins de K écart-type de la moyenne est au
1
moins de 1 2 où K est une nombre positif
K

Plus grand que 1.

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
Pour k = 2 et k = 3 nous obtenons les proposition
suivantes:

- Au moins 75 % de toutes les données sont à


moins de 2 écarts-type de la moyenne.

- Au moins 89 % de toutes les données sont à


moins de 3 écarts-type de la moyenne.

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
Propriétés de la variance empirique

Soit x1 , x2 ,..., xn un échantillon.

Soient y1 , y2 ,..., yn tels que:yi  axi  b

où a et b sont deux nombres réels, alors

S  aS  b
2
y
2
x
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
Le coefficient de variation :

Le coefficient de variation est le rapport de l'écart ‑type


par rapport à la moyenne.
S
CV 
x
En particulier, le coefficient de variation permet de
comparer la variabilité relative de plusieurs
distributions qui diffèrent fortement par leur ordre
de grandeur et éventuellement même par leur unité
de mesure.
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
3.2.2 Etendu

On appelle étendu d’un échantillon l’écart en


valeur absolue entre la plus grande valeur et
la plus petite valeur de l’échantillon.
c

xmax  xmin
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
3.2.3 Intervalle interquartile

 Médiane d’un échantillon : c’est la valeur


qui partage l’échantillon en deux parties
égales.

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
Calcul de la médiane :

Soit x1 ,⋯ , x n un échantillon ordonné.

Pour calculer la médiane M, on distingue deux cas :


Cas 1 : n est impaire:

M  x n 1
2
Cas 2 : n est paire:

x n / 2  x1 n / 2
M 
2
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
 Quartiles

Quartile d’ordre 1, noté Q1

Q1 est la médiane des observations qui sont


strictement plus petites que la médiane.

Quartile d’ordre 3, noté Q3


Q3 est la médiane des observations qui sont
strictement plus grandes que la médiane.

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
Cas d’approximation de calcul de
quartiles, cas continu

Quand on ne dispose que de tableau des


fréquences cumulées croissantes, on
approche les quartiles graphiquement grâce
au polygone des fréquences cumulées
croissantes, et par interpolation linéaire grâce
au tableau correspondant.

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
Exemple de calcul
Utilisation du tableau des fréquences cumulées
croissantes
Le tableau des fréquences cumulées croissantes
est :

mi 8 12 16 20 30 40 60
fréquences
cumulées 7 12.3 21.1 48.1 81.7 94.7 100
Croissantes
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
25  21.1
Q1  16  4  16.57
48.1  21.1

50  48.1
Q2  20  10  20.56
81.7  48.1

75  48.1
Q3  20  10  28
81.7  48.1

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
Intervalle interquartile

L’intervalle interquartile est

Q1 , Q3 

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
4. Représentations graphiques des données
4.1 Représentation graphique d’une variable
continue: Histogramme
6
4
2
0

60 70 80 90 100

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
L’histogramme donne une idée sur le comportement
de la distribution théorique des données.

Par exemple, cet histogramme laisse croire que la


distribution théorique des observations suit une loi
normale.

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
4.2 Représentation graphique d’une variable 
qualitative ou quantitative discrète:

Diagramme à secteurs circulaires.

Le diagramme à secteurs circulaires visualise les


fréquences des modalités dans le cas d’une
variable qualitative ou quantitative discrète. Les
données discrètes de l’exemple 3 sont reprises
dans le diagramme circulaire ci-après.

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
pas de déf
1 déf
2 déf
3 déf

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
5. Diagramme en boîte (Box PLot).

Le diagramme en boîte est une représentation


graphique qui nous informe sur la symétrie
et la dispersion des données. Il permet
aussi d’identifier les valeurs aberrantes (les
outliers) et de comparer plusieurs
populations.

Afin de construire le diagramme en boîte,


nous utiliserons la médiane et les quartiles
d’un échantillon.
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
 .

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
Construction du diagramme en boîte
1) On calcule  Q1 , M et Q3 .
2) On calcule l’écart interquartile E  Q3  Q1
3) On calcule les bornes normales :

bi  Q1  1.5 E
bS  Q3  1.5E
4) On identifie les données aberrantes qui sont les
données qui sont en dehors de l’intervalle (b ,b ).
i s

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
X XX
bi Q1 M Q3 bs

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
Remarque

Les boites à moustaches permettent d’aider à


comparer les distributions dans différentes
populations au vue d’une caractéristique
donnée.

Le schéma ci-dessous le montre:

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
Ch2 : Statistique descriptive
bivariée

29/11/17 Cours de Statistique et


Probabilité MERBOUHA
Introduction: La statistique descriptive à
deux dimensions a essentiellement pour
but d’examiner s’il existe une certaine
forme d’association entre deux variables.
Par exemple, étudier l’association

• entre le revenu annuel et le nombre d’années


de scolarité.
• entre l’âge et la maladie.

Ces observations peuvent être de


différentes natures.
29/11/17 Cours de Statistique et
Probabilité MERBOUHA
1 Variables quantitatives

Dans ce paragraphe, nous traitons une


forme particulière d’association appelée
corrélation linéaire.

29/11/17 Cours de Statistique et


Probabilité MERBOUHA
• Diagramme de dispersion
Pour visualiser graphiquement une
corrélation, on prélève un échantillon de
taille n et nous observons ensuite, sur
chaque unité de l’échantillon, les valeurs de
deux variables statistiques X et Y. On
dispose alors de n couples d’observations
( xi , yi ) que l’on reporte sur un graphique en
prenant pour abscisse la variable X et Y
pour ordonnée. Le diagramme qui résulte
est appelé diagramme de dispersion
29/11/17 Cours de Statistique et
Probabilité MERBOUHA
Diagramme de dispersion
70

60

50

40

30

20

10

0
Y

0 2 4 6 8 10 12 14 16 18

29/11/17 Cours de Statistique et


Probabilité MERBOUHA
• Mesure de dépendance : Coefficient de
corrélation

Le coefficient de corrélation ou Coefficient


de Bavais Pearson est un indice qui permet
de mesurer l’intensité de l’association
linéaire entre deux variables. Il se calcule à
( xi , y i )
partir des observations de la manière
suivante :

29/11/17 Cours de Statistique et


Probabilité MERBOUHA
S xy
rxy 
S xx S yy

1 n
S xy   ( xi  x )( y i  y ) Covariance de (x,y)
n i 1

1 n 1 n
S xx   ( xi  x) 2
S yy   ( yi  y) 2
n i 1 n i 1

sont les variances de x et y

29/11/17 Cours de Statistique et


Probabilité MERBOUHA
Remarques :

• r est réservé uniquement à des nuages à


répartition plus ou mois linéaire.
• Une corrélation r positive indique une
dépendance linéaire positive, tandis qu’une
corrélation négative r correspond à une
dépendance linéaire négative.
• Un coefficient de corrélation est un nombre
sans unité compris entre -1 et 1.
29/11/17 Cours de Statistique et
Probabilité MERBOUHA
Définition:

- Les deux variables sont dites « fortement


corrélées» lorsque la coefficient de
corrélation est proche de 1 en valeur
absolue

- Et «faiblement corrélées lorsque le


coefficient de corrélation est proche de 0.

29/11/17 Cours de Statistique et


Probabilité MERBOUHA
La Régression linéaire simple :
Lorsque le nuage de points du diagramme
de dispersion est disposé avec une
tendance linéaire et que les deux
variables quantitatives sont fortement
corrélées, on cherche à établir, dans un
but explicatif et prévisionnel, une relation
(qu’on suppose) linéaire reliant les deux
variables de la forme y  ax  b , ou a et b
sont deux réels à estimer. Le critère utilisé
pour déterminer a et b est le critère des
«moindres carré».
29/11/17 Cours de Statistique et
Probabilité MERBOUHA
Critère des moindres carrés

L’idée de la méthode des moindres carrés


est de choisir a et b de façon à minimiser
la somme quadratique des erreurs
ei  yi  (axi  b), c’est à dire minimiser

e i
2
 L ( a, b)
par rapport à a et b.

29/11/17 Cours de Statistique et


Probabilité MERBOUHA
Les estimateurs des moindres carrés de a et b
sont

S xy ˆb  y  â x
â et
S xx
L’équation y  âx  bˆ
sert alors à prédire les valeurs de la variable Y
sachant les valeurs de la variable X.

29/11/17 Cours de Statistique et


Probabilité MERBOUHA
Exemple: Poids de naissance en fonction du terme
semaines
de la grossesse
Poids
27 1146
28 1292 Poids de Naissance / Ag
29 1694
30 1892 4500
31 1986
32 2000 4000
33 2118
34 2290
35 2310 3500

es
36 2800

m
37 3019 3000

ram
38 3210
39 3450

G
2500
40 3475
41 3553
42 3582 2000
43 3604
1500

1000
27 28 29 30 31 32 33 34 35 36

29/11/17 Cours de Statistique et


Probabilité MERBOUHA
2 Variables qualitatives ordinales

Lorsque les deux variables sont qualitatives


ordinales, on utilise la corrélation non-
paramétrique par le biais du coefficient de
Spearman défini par n
6 Di
2

rs  1  i 12
n(n  1)
• D représente, pour chaque observation, les différences
de rang obtenues sur les deux variables.

29/11/17 Cours de Statistique et


Probabilité MERBOUHA
• Lorsque rs est proche de 1 en valeur
absolue, on dira qu’il y a une forte liaison
entre les deux caractères. Sinon, i.e si rs
est proche de 0, il n’y a pas de liaison ou
de corrélation entre les deux variables.
• Mais attention, on ne saura déterminer la
nature de cette liaison quand elle existe.

29/11/17 Cours de Statistique et


Probabilité MERBOUHA
Exemple:
Ech. Be Zr Rang Be Rang Zr D*D
1 1,71 62,04 5 5 0
2 1,91 71,50 10 13 9
3 1,98 68,40 12 11 1
4 1,74 61,25 7 4 9 n
5
6
1,87
1,38
64,16
58,49
9
3
7
3
4
0
6 D 2
7
8
0,99
1,13
30,33
39,55
1
2
1
2
0
0 rs  1  i 1
9 1,65 64,71 4 8 16 n(n  1)
2
10 2,26 71,47 16 12 16
11 1,72 63,14 6 6 0
6  70
12 1,77 67,09 8 9 1
rs  1 
17  (17 2  1)
13 2,31 85,68 17 15 4
14 2,09 88,52 15 17 4
15 2,03 88,30 14 16 4
16
17
2,02
1,91
77,45
68,20
13
11
14
10
1
1
rs  0.914
Somme D*D 70

29/11/17 Cours de Statistique et


Probabilité MERBOUHA
3 Variables qualitatives nominales (ou ordinales):
Exemple 1: Cas Rola-Cola

Question :
Existe-t-il une liaison entre la boisson préférée (X)
et le goût pour le sucre (Y)?
Les données :

boisson préférée * goût pour le sucre Crosstabulation

Count
goût pour le sucre
d'accord indifferent pas d'accord Total
boisson rola-cola 8 9 7 24
préférée koka-cola 6 4 6 16
Total 14 13 13 40
29/11/17 Cours de Statistique et
Probabilité MERBOUHA
Représentations graphiques
du tableau de contingence

En effectif En pourcentage
10 100
43 31 46
90
9
8 80
8
70
7 69
6 60
6 6
57
50 54

4 40
4
30
boisson préférée boisson préférée
2 20
rola-cola koka-cola
Count

Count
10
0 koka-cola 0 rola-cola
d'accord indifferent pas d'accord d'accord indifferent pas d'accord

goût pour le sucre goût pour le sucre

Il n’y a pas de relation entre la boisson préférée et le goût pour le sucre

29/11/17 Cours de Statistique et


Probabilité MERBOUHA
On peut Construire le tableau Boisson préférée*Goût pour le sucre
ayant les mêmes marges que le tableau d’origine et
correspondant à l’indépendance

Goût pour le sucre


Boisson Total Total
préférée D’accord indifférent Pas (effectif) (pourcentage)
d’accord
Rola-Cola 24 60 %
Koka-Cola 16 40 %
Total 14 13 13 40 100 %

29/11/17 Cours de Statistique et


Probabilité MERBOUHA
Distance entre le tableau observé et le tableau
correspondant à l’indépendance

boisson préférée * goût pour le sucre Crosstabulation

goût pour le sucre


d'accord indifferent pas d'accord Total
boisson rola-cola Count 8 9 7 24
préférée Expected Count 8.4 7.8 7.8 24.0
koka-cola Count 6 4 6 16
Expected Count 5.6 5.2 5.2 16.0
Total Count 14 13 13 40
Expected Count 14.0 13.0 13.0 40.0

(8  8.4) (9  7.8) 2
(6  5.2) 2 2
  2
  ... 
8.4 7.8 5.2
29/11/17 Cours de Statistique et
Probabilité MERBOUHA
Exemple 2: On désire vérifier si les intentions de
vote aux prochaines élections provinciales
varient d’une région à l’autre. Le tableau suivant
donne les résultats d’un sondage effectué
auprès de 1000 personnes choisies au hasard
dans trois régions différentes.

29/11/17 Cours de Statistique et


Probabilité MERBOUHA
Région 1 Région 2 Région 3 Total

PLQ 205 155 100 460

PQ 125 200 80 405

Autre 70 45 20 135

Total 400 400 200 1000

29/11/17 Cours de Statistique et


Probabilité MERBOUHA
On considère le tableau suivant :

Classes …… Total des


A1 A2 Ak lignes

nB
C
⋮Af 102
L
B1
oor
ork
21rk21112
11
22
21
1k2

n11 n12 …… n1k n1.


B2 n21 n22 …… n2 k n2.

Br nr1 nr 2 ……. nrk nr .


Total des
colonnes
n.1 n.2 ……. n.k n

où nij représente la fréquence observée relative à la


classe Ai  B j
29/11/17 Cours de Statistique et
. Probabilité MERBOUHA
Pour quantifier l’indépendance entre les deux caractères,
on utilise le coefficient Khi-deux définie par:

  
2
k r n ij  neij 
2

i 1 j 1 neij

ni.n.j
neij 
n
29/11/17 Cours de Statistique et
Probabilité MERBOUHA
On constate
- que  2
est toujours positif.
- Plus  est faible et plus on est proche de
2

l’indépendance et plus il est grand est plus2 on est proche


de 2l’association (voir table de la loi de  ).
-  n’est pas majoré.
-  est sensible à la taille de l’échantillon.
2

Pour y remédier, on introduit d’autres coefficients, le


coefficient phi et de V Cramer par exemple…

29/11/17 Cours de Statistique et


Probabilité MERBOUHA
Le coefficient V de Cramer

• Contrairement à  Le coefficient V Crammer est stable


2

quand n est grand et est défini par

2
 2
V  
 max
2
n(min(l , c )  1)

29/11/17 Cours de Statistique et


Probabilité MERBOUHA
Plus V est proche de zéro, plus il y a indépendance
entre les deux variables étudiées. Il vaut 1 en cas de
complète dépendance.

29/11/17 Cours de Statistique et


Probabilité MERBOUHA
4. Une variable quantitative et une variable
qualitative :
Etudier la relation entre la variable quantitative «âge» et
variable qualitative «situation familiale» dans une
population de 30 personnes (masculins).

29/11/17 Cours de Statistique et


Probabilité MERBOUHA
Données brutes

Age Situation familiale

22 Célibataire
37 Célibataire
19 Célibataire
50 Célibataire
38 Célibataire
24 Célibataire
17 Célibataire
28 Célibataire
29 Célibataire
31 Célibataire
23 Célibataire
24 Célibataire
26 Célibataire
18 Célibataire
29/11/17 Cours de Statistique et
Probabilité MERBOUHA
La suite du tableaux
30 Célibataire
15 Célibataire
75 Marié
37 Marié
45 Marié
81 Marié
33 Marié
21 Marié
42 Marié
29 Marié
65 Marié
53 Marié
36 Marié
49 Marié
40 Marié
68 Marié
29/11/17 Cours de Statistique et
Probabilité MERBOUHA
Le diagramme ayant la forme suivante :

29/11/17 Cours de Statistique et


Probabilité MERBOUHA
Commentaire:

La forme du box-plot varie en fonction de la


situation familiale. Cela veut dire qu’on
pourrait dire que la situation familiale
dépend de l’âge.

29/11/17 Cours de Statistique et


Probabilité MERBOUHA
Ch2: Probabilités

Un peu d’histoire

A l'origine, dans les traductions d'Aristote


, le mot "probabilité" ne désigne pas une
quantification du caractère aléatoire d'un
fait mais l'idée qu'une idée est
communément admise par tous
Ce n'est qu’ au cours du Moyen Âge puis
de la Renaissance autour des
commentaires successifs et des
imprécisions de traduction de l'œuvre d'
Aristote que ce terme connaîtra un
glissement sémantique pour finir par
désigner la vraisemblance d'une idée.

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
Il faudra attendre le milieu du XVIIe siècle
pour que ce mot prenne son sens actuel
avec le début du traitement mathématique
du sujet par Blaise Pascal et
Pierre de Fermat. Ce n'est alors qu'au
XIXe siècle qu'apparaît ce qui peut être
considéré comme la théorie moderne des
probabilités en mathématiques.

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
1. Vocabulaire

Épreuve aléatoire : C’est une


expérience dont le résultat n’est pas
connu à l’avance avec certitude.

Exemple : l’expérience qui consiste à


lancer un dé à six faces est une épreuve
aléatoire.
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
Espace échantillonnal S : C’est l’ensemble de
tous les résultats possibles d’une épreuve
aléatoire.

Exemple : L’espace S relatif à l’épreuve de l’exemple


Du dé est :
S  1,2,3,4,5,6
Événement : C’est un sous-ensemble de l’espace
échantillonnal S.
Exemple : Pour l’expérience du premier exemple,
trouvez les événements, Obtenir un nombre impair.
Obtenir un nombre multiple de 3.
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
2. Définition d’une probabilité
2.1 Cas d’un espace échantillonnal fini
et équiprobable.

Définition 1 : On dit qu’un espace échantillonnal


S est fini et équiprobable si

1. S contient un nombre fini d’éléments 


2. Chaque élément de S a la même chance de
réalisation:
1
P(a1 )  P (a 2 )  ⋯  P (a n )  .
Cours de Proba/Stat Svi/Sem 3
n
Par Dr A. MERBOUHA
La probabilité de réalisation d’un événement A sera :

Card ( A)
P( A) 
n
Où Card ( A) désigne le nombre d’éléments de A.

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
2.2 Cas d’un espace échantillonnal fini

quelconque
Soient A et B deux événements d’un espace
2.échantillonnal
2.1 RappelS. ensembliste 

Réunion : La réunion de A et B est


l’événement, noté A  B , défini par :

A  B  x  S : x  A ou x  B

Notons que la réunion  se réalise si A ou B


se réalise.
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
Intersection : L’intersection de A et B est
l’événement définie et noté par :

A  B  x  S : x  A et x  B
De même, l’événement A B se réalise si A et B
se réalisent simultanément.

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
Complémentaire : Le complémentaire
d’un événement A est l’événement A

défini par  A  x  S : x  A 

Événements incompatibles : A et B
sont incompatibles si leur intersection est
vide.
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
Différence

A  B  x / x  A et x  B.

on peut voir que


A B  A B
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
Distribution de l’intersection par rapport à la réunion

A  B  C    A  B    A  C 

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
Complémentaire de l’intersection et réunion

c
 n
 n
 ∩ Ai    Ai
c

 i 1  i 1

c
 n
 n
  Ai   ∩ Ai .
c

 i 1  i 1

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
2.2.2. Approche axiomatique

Soit S un espace échantillonnal fini.

Définition 2 : On appelle probabilité toute fonction


réelle d’événements de S, notée P, satisfaisant
les axiomes suivants :
Quel que soit les événements A et B , on a:

1. 0  P( A)  1
2. P( S )  1

3. P ( A  B )  P ( A)  P ( B )  P( A  B )
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
3. Probabilité conditionnelle

Définition : Soient A et B deux événements


d’un espace échantillonnal S. On appelle
probabilité conditionnelle de A sachant B,
notée P( A | B ) , la probabilité que l’événement
A se réalise étant donné que l’événement B
s’est déjà produit :

P( A  B)
P( A | B) 
P( B)
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
Remarque : La formule précédente de la probabilité
conditionnelle fournit la règle de multiplication qui
permet de calculer la probabilité de l’intersection de
deux événements :

P ( A  B)  P ( A) P ( B | A)

P( A  B)  P( B) P( A | B)
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
Définition d’événements indépendant: Deux
événements A et B sont indépendants si et
seulement si

P( B | A)  P( B)
ce qui est équivalent à

P ( A  B)  P ( A) P( B ).
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
Exemple
Dans une famille qui comporte deux enfants, l’un
est une fille. On cherche la probabilité que l’autre
soit un garcon.
On choisit  = {FF, FG,GF,GG} ou FG signifie
que l’ainé est une fille et le second un garcon. Cet

espace est muni de la probabilité uniforme.
On note
A = {un des enfants est un garcon} =
{FG,GF,GG},
B = {un des enfants est une fille} = {FF, FG,GF}.
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
4. Variable aléatoire

Définition : On appelle variable aléatoire v. a, toute


fonction qui fait correspondre à chaque résultat
d’une expérience aléatoire un nombre réel.

Exemple :

• Nombre d’articles vendus par un magasin durant


un mois.
• Nombre d’enfants par ménage.
• Température maximale durant une journée.
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
On distingue deux types de variables aléatoires :

Variable aléatoire discrète : les valeurs prises par


la variable sont isolées. Par exemple, la variable
nombre d’enfants par ménage.

Variable aléatoire continue : les valeurs prises par


la variable constituent un intervalle de IR. Par
exemple, la variable température maximale d’une
journée.

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
4.1 Variable aléatoire discrète.
4.1.1 Fonction de masse d’une variable
discrète

Soit une variable aléatoire discrète prenant des


valeurs x1 , x 2 ,  . On appelle fonction de
masse associée à X, la fonction définie par :
p( xi )  P( X  xi ) , i  1,2,
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
Exemple 1: On lance une pièce de monnaie trois fois
et on note X le nombre de faces obtenues. Dans ce
cas, les valeurs possibles des X sont 0, 1, 2 et 3 et
la fonction de masse de X sera :

xi 0 1 2 3
1/8 3/8 3/8 1/8
P ( X  xi )

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
4.1.2 Espérance mathématique d’une
variable discrète

Soit X une variable aléatoire discrète prenant des


valeurs x1 , x 2 ,
alors l’espérance
mathématique de X est définie et notée par :


  E ( X )   xi p ( xi )  x1 p ( x1 )  x 2 p ( x 2 )  ⋯
i 1

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
Exemple: Calculons l’espérance mathématique de la
variable nombre de faces obtenues dont la fonction
de masse est 

xi 0 1 2 3

1/8 3/8 3/8 1/8


P ( X  xi )

1 3 3 1
  0   1   2   3   1 .5
8 8 8 8
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
4.1.3 Variance d’une variable aléatoire
discrète

Définition: Soit X une variable aléatoire discrète


qui prend des valeurs  x1 , x 2 ,  alors la variance
de X est définie et notée par :

  Var ( X )   ( xi   ) p( xi )
2 2

i 1

 ( x1   ) p( x1 )  ( x2   ) p( x2 )  ⋯
2 2

Ainsi l’écart-type sera :   Var (X )


Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
Exemple : La variance de l’exemple précédent est :

1 2 3 2 3 2 1
  (0  1.5)   (1  1.5)   (2  1.5)   (3  1.5)   0.75
2 2

8 8 8 8
et

  0.75  0.87

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
4.2 Variable aléatoire continue.
4.2.1 Fonction de densité continue

Définition: Une fonction f(.) réelle est dite


une fonction de densité si :

1.   f ( x)  0 : la courbe est toujours au


dessus de l’axe des abscisses.
2. L’aire entre la courbe est l’axe des abscisses
est 1. 



f ( x ) dx  1
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
Définition: Soit f(.) une fonction de densité. Soit
X une variable aléatoire réelle continue. On dit
que X admet f(.) comme fonction de densité ou X
est de densité f(.) ssi
pour tout a et b dans IR, on a:

b
P (a  X  b)   f ( x)dx
a

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
4.2.2 Espérance mathématique d’une
variable aléatoire continue.

Définition
Soit X une variable aléatoire continue de densité
f(.), l’espérance de X est définie et notée par

E ( X )   X   xf ( x)dx

Remarque: L’espérance mathématique de X
représente la moyenne des valeurs prise
par X.
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
4.2.3 Variance d’une variable aléatoire
continue
Définition
Soit X une variable aléatoire continue de densité f(.),
l’espérance de X est définie et notée par

  
 X  Var ( X )  E ( X   X )   ( x   X ) 2 f ( x)dx
2 2


Remarque: La variance de la v.a X est la moyenne


des carrés des écart des valeurs de X à
leur moyenne.
L’écart type de X estParCours  X Svi/Sem
de Proba/Stat
Dr A. MERBOUHA
 3 Var ( X )
5. Propriétés de l’espérance mathémati-
que et de la variance.
5.1 Propriétés de l’espérance mathémati-
que:
Soient X et Y deux v.a et a et b deux
réels quelconques alors:

• E(a X + b) = a E(X)+b.
• E(X  Y) = E(X)  E(Y).

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
5.2 Propriétés de la variance
Soient X et Y deux v.a et a et b deux réels
quelconques alors:

2
• Var (a X + b) = a Var(X).
• Var(X Y) = Var(X)+Var(Y) si X et Y sont
indépendantes.

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
6. Fonction de répartition

Définition

Soit X une variable aléatoire réelle, la fonction


définie par

FX ( x )  P ( X  x )
est appelée fonction de répartition de la v.a X.

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
Propriétés de la fonction de répartition:
Soit X une v.a continue (respt discrète) de fonction
de densité f(.) (respt fonction de masse m(.)) et x un
réel quelconque, alors on
a les propriétés suivantes:

. FX ( x)  1  FX ( x)
si f(.) (respt m(.)) est symétrique

. P[ X  x ]  1  FX ( x )
. P[a  X  b]  FX (b)  FX (a )
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
En résumé

Une fonction de répartition d’une variable aléatoire X est une fonction


F(x) qui, pour tout x, indique la probabilité pour que X soit inférieur ou
égal à x.

Variable continue Variable discrète (escalier)

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
Ch3: Probabilités

Un peu d’histoire

A l'origine, dans les traductions d'Aristote


, le mot "probabilité" ne désigne pas une
quantification du caractère aléatoire d'un
fait mais l'idée qu'une idée est
communément admise par tous
Ce n'est qu’ au cours du Moyen Âge puis
de la Renaissance autour des
commentaires successifs et des
imprécisions de traduction de l'œuvre d'
Aristote que ce terme connaîtra un
glissement sémantique pour finir par
désigner la vraisemblance d'une idée.

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
Il faudra attendre le milieu du XVIIe siècle
pour que ce mot prenne son sens actuel
avec le début du traitement mathématique
du sujet par Blaise Pascal et
Pierre de Fermat. Ce n'est alors qu'au
XIXe siècle qu'apparaît ce qui peut être
considéré comme la théorie moderne des
probabilités en mathématiques.

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
1. Vocabulaire

Épreuve aléatoire : C’est une


expérience dont le résultat n’est pas
connu à l’avance avec certitude.

Exemple : l’expérience qui consiste à


lancer un dé à six faces est une épreuve
aléatoire.
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
Espace échantillonnal S : C’est l’ensemble de
tous les résultats possibles d’une épreuve
aléatoire.

Exemple : L’espace S relatif à l’épreuve de l’exemple


Du dé est :
S  1,2,3,4,5,6
Événement : C’est un sous-ensemble de l’espace
échantillonnal S.
Exemple : Pour l’expérience du premier exemple,
trouvez les événements, Obtenir un nombre impair.
Obtenir un nombre multiple de 3.
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
2. Définition d’une probabilité
2.1 Cas d’un espace échantillonnal fini
et équiprobable.

Définition 1 : On dit qu’un espace échantillonnal


S est fini et équiprobable si

1. S contient un nombre fini d’éléments 


2. Chaque élément de S a la même chance de
réalisation:
1
P(a1 )  P (a 2 )  ⋯  P (a n )  .
Cours de Proba/Stat Svi/Sem 3
n
Par Dr A. MERBOUHA
La probabilité de réalisation d’un événement A sera :

Card ( A)
P( A) 
n
Où Card ( A) désigne le nombre d’éléments de A.

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
2.2 Cas d’un espace échantillonnal fini

quelconque
Soient A et B deux événements d’un espace
2.échantillonnal
2.1 RappelS. ensembliste 

Réunion : La réunion de A et B est


l’événement, noté A  B , défini par :

A  B  x  S : x  A ou x  B

Notons que la réunion  se réalise si A ou B


se réalise.
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
Intersection : L’intersection de A et B est
l’événement définie et noté par :

A  B  x  S : x  A et x  B
De même, l’événement A B se réalise si A et B
se réalisent simultanément.

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
Complémentaire : Le complémentaire
d’un événement A est l’événement A

défini par  A  x  S : x  A 

Événements incompatibles : A et B
sont incompatibles si leur intersection est
vide.
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
Différence

A  B  x / x  A et x  B.

on peut voir que


A B  A B
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
Distribution de l’intersection par rapport à la réunion

A  B  C    A  B    A  C 

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
Complémentaire de l’intersection et réunion

c
 n
 n
 ∩ Ai    Ai
c

 i 1  i 1

c
 n
 n
  Ai   ∩ Ai .
c

 i 1  i 1

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
2.2.2. Approche axiomatique

Soit S un espace échantillonnal fini.

Définition 2 : On appelle probabilité toute fonction


réelle d’événements de S, notée P, satisfaisant
les axiomes suivants :
Quel que soit les événements A et B , on a:

1. 0  P( A)  1
2. P( S )  1

3. P ( A  B )  P ( A)  P ( B )  P( A  B )
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
3. Probabilité conditionnelle

Définition : Soient A et B deux événements


d’un espace échantillonnal S. On appelle
probabilité conditionnelle de A sachant B,
notée P( A | B ) , la probabilité que l’événement
A se réalise étant donné que l’événement B
s’est déjà produit :

P( A  B)
P( A | B) 
P( B)
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
Remarque : La formule précédente de la probabilité
conditionnelle fournit la règle de multiplication qui
permet de calculer la probabilité de l’intersection de
deux événements :

P ( A  B)  P ( A) P ( B | A)

P( A  B)  P( B) P( A | B)
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
Définition d’événements indépendant: Deux
événements A et B sont indépendants si et
seulement si

P( B | A)  P( B)
ce qui est équivalent à

P ( A  B)  P ( A) P( B ).
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
Exemple
Dans une famille qui comporte deux enfants dont
l’un est une fille. On cherche la probabilité que
l’autre soit un garcon.
On choisit  = {FF, FG,GF,GG} ou FG signifie
que l’ainé est une fille et le second un garcon. Cet

espace est muni de la probabilité uniforme.
On note
A = {un des enfants est un garcon} =
{FG,GF,GG},
B = {un des enfants est une fille} = {FF, FG,GF}.
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
4. Variable aléatoire

Définition : On appelle variable aléatoire v. a, toute


fonction qui fait correspondre à chaque résultat
d’une expérience aléatoire un nombre réel.

Exemple :

• Nombre d’articles vendus par un magasin durant


un mois.
• Nombre d’enfants par ménage.
• Température maximale durant une journée.
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
On distingue deux types de variables aléatoires :

Variable aléatoire discrète : les valeurs prises par


la variable sont isolées. Par exemple, la variable
nombre d’enfants par ménage.

Variable aléatoire continue : les valeurs prises par


la variable constituent un intervalle de IR. Par
exemple, la variable température maximale d’une
journée.

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
4.1 Variable aléatoire discrète.
4.1.1 Fonction de masse d’une variable
discrète

Soit une variable aléatoire discrète prenant des


valeurs x1 , x 2 ,  . On appelle fonction de
masse associée à X, la fonction définie par :
p( xi )  P( X  xi ) , i  1,2,
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
Exemple 1: On lance une pièce de monnaie trois fois
et on note X le nombre de faces obtenues. Dans ce
cas, les valeurs possibles des X sont 0, 1, 2 et 3 et
la fonction de masse de X sera :

xi 0 1 2 3
1/8 3/8 3/8 1/8
P ( X  xi )

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
4.1.2 Espérance mathématique d’une
variable discrète

Soit X une variable aléatoire discrète prenant des


valeurs x1 , x 2 ,
alors l’espérance
mathématique de X est définie et notée par :


  E ( X )   xi p ( xi )  x1 p ( x1 )  x 2 p ( x 2 )  ⋯
i 1

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
Exemple: Calculons l’espérance mathématique de la
variable nombre de faces obtenues dont la fonction
de masse est 

xi 0 1 2 3

1/8 3/8 3/8 1/8


P ( X  xi )

1 3 3 1
  0   1   2   3   1 .5
8 8 8 8
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
4.1.3 Variance d’une variable aléatoire
discrète

Définition: Soit X une variable aléatoire discrète


qui prend des valeurs  x1 , x 2 ,  alors la variance
de X est définie et notée par :

  Var ( X )   ( xi   ) p( xi )
2 2

i 1

 ( x1   ) p( x1 )  ( x2   ) p( x2 )  ⋯
2 2

Ainsi l’écart-type sera :   Var (X )


Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
Exemple : La variance de l’exemple précédent est :

1 2 3 2 3 2 1
  (0  1.5)   (1  1.5)   (2  1.5)   (3  1.5)   0.75
2 2

8 8 8 8
et

  0.75  0.87

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
4.2 Variable aléatoire continue.
4.2.1 Fonction de densité continue

Définition: Une fonction f(.) réelle est dite


une fonction de densité si :

1.   f ( x)  0 : la courbe est toujours au


dessus de l’axe des abscisses.
2. L’aire entre la courbe est l’axe des abscisses
est 1. 



f ( x ) dx  1
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
Définition: Soit f(.) une fonction de densité. Soit
X une variable aléatoire réelle continue. On dit
que X admet f(.) comme fonction de densité ou X
est de densité f(.) ssi
pour tout a et b dans IR, on a:

b
P (a  X  b)   f ( x)dx
a

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
4.2.2 Espérance mathématique d’une
variable aléatoire continue.

Définition
Soit X une variable aléatoire continue de densité
f(.), l’espérance de X est définie et notée par

E ( X )   X   xf ( x)dx

Remarque: L’espérance mathématique de X
représente la moyenne des valeurs prise
par X.
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
4.2.3 Variance d’une variable aléatoire
continue
Définition
Soit X une variable aléatoire continue de densité f(.),
l’espérance de X est définie et notée par

  
 X  Var ( X )  E ( X   X )   ( x   X ) 2 f ( x)dx
2 2


Remarque: La variance de la v.a X est la moyenne


des carrés des écart des valeurs de X à
leur moyenne.
L’écart type de X estParCours  X Svi/Sem
de Proba/Stat
Dr A. MERBOUHA
 3 Var ( X )
5. Propriétés de l’espérance mathémati-
que et de la variance.
5.1 Propriétés de l’espérance mathémati-
que:
Soient X et Y deux v.a et a et b deux
réels quelconques alors:

• E(a X + b) = a E(X)+b.
• E(X  Y) = E(X)  E(Y).

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
5.2 Propriétés de la variance
Soient X et Y deux v.a et a et b deux réels
quelconques alors:

2
• Var (a X + b) = a Var(X).
• Var(X Y) = Var(X)+Var(Y) si X et Y sont
indépendantes.

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
6. Fonction de répartition

Définition

Soit X une variable aléatoire réelle, la fonction


définie par

FX ( x )  P ( X  x )
est appelée fonction de répartition de la v.a X.

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
Propriétés de la fonction de répartition:
Soit X une v.a continue (respt discrète) de fonction
de densité f(.) (respt fonction de masse m(.)) et x un
réel quelconque, alors on
a les propriétés suivantes:

. FX ( x)  1  FX ( x)
si f(.) (respt m(.)) est symétrique

. P[ X  x ]  1  FX ( x )
. P[a  X  b]  FX (b)  FX (a )
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
En résumé

Une fonction de répartition d’une variable aléatoire X est une fonction


F(x) qui, pour tout x, indique la probabilité pour que X soit inférieur ou
égal à x.

Variable continue Variable discrète (escalier)

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
Ch 4 : Quelques
distributions usuelles
I. Quelques Lois continues
I. 1 La loi normale (Laplace Gauss)

La loi normale est le modèle le plus utilisé en


statistique. Elle possède l’avantage d’approcher
des distributions de sommes de variables
indépendantes. Elle fut découverte par Karl
Friedrich Gauss (1777-1855).
Définition : On dit qu’une variable aléatoire X suit une
 
loi normale de paramètres et2
, si sa densité est de
la forme :

( x )2
1 
f ( x)  e 2 2
pour tout x dans IR
 2

La loi normale de paramètres  et  2 est notée:

N ( , ) 2

Cours de Proba/Stat Svi/Sem 3


13/12/17 Par Dr A. MERBOUHA 2
Résultats:

Soit X une variable aléatoire distribuée selon une


loi   X  N ( , )
2 2

normale de paramètres et :
.
Alors on montre que:
E( X )   Var ( X )   2

et

Cours de Proba/Stat Svi/Sem 3


13/12/17 Par Dr A. MERBOUHA 3
I. 1.1 Graphe d’une loi normale : La courbe a une forme
de cloche. Elle est symétrique par rapport à la droite
verticale passant par la moyenne. L’écart type représente
la distance entre l’axe de symétrie et le point d’inflexion
de la courbe (changement de courbure).

Cours de Proba/Stat Svi/Sem 3


13/12/17 Par Dr A. MERBOUHA 4
Effet de la moyenne   : lois normales de variances
égales mais de moyennes différentes.

Cours de Proba/Stat Svi/Sem 3


13/12/17 Par Dr A. MERBOUHA 5
Effet de la variance 2
: lois normales de même moyenne
mais de variances différentes.

2

1

Cours de Proba/Stat Svi/Sem 3


13/12/17 Par Dr A. MERBOUHA 6
I.1.2 Loi normale centrée réduite

La loi normale de moyenne   0 et de variance


  1 est appelée loi normale centrée réduite.
2

La variable aléatoire qui suit une normale centrée


réduite.

Sa densité est alors:


x2
1 
f ( x)  e 2

2
Cours de Proba/Stat Svi/Sem 3
13/12/17 Par Dr A. MERBOUHA 7
I.1.3 Fonction de répartition de la loi normale
centrée réduite

La fonction de répartition de la loi normale N(0,1)


nous permet le calcul des probabilités par la table
de la loi normale. Elle est définie par :

 ( x)  P( Z  x)
où Z  N (0,1) ,
et représente la surface, située à gauche de x, entre
la courbe de densité et l’axe des abscisses :
Cours de Proba/Stat Svi/Sem 3
13/12/17 Par Dr A. MERBOUHA 8
Cours de Proba/Stat Svi/Sem 3
13/12/17 Par Dr A. MERBOUHA 9
x2
1 
f ( x)  e 2

2

Cours de Proba/Stat Svi/Sem 3


13/12/17 Par Dr A. MERBOUHA 10
Résultat : Si X ˜N (  ,  )
2

X 
alors ˜ N (0,1)

Cours de Proba/Stat Svi/Sem 3


13/12/17 Par Dr A. MERBOUHA 11
X v.a suivant N(m, σ2 ) et Z v.a suivant N(0;1)

Les intervalles suivants ou plages de normalité


se calculent grâce aux égalités ci-dessous,
obtenues grâce à la table de la loi N(0;1) :

P(m-σ <X<m+ σ)= P(-1<Z<+1)= 0,68.

P(m-1,6 σ <X<m+1,6 σ)= P(-1,6<Z<+1,6)= 0,90.

P(m-1,96 σ <X<m+1,96 σ)= P(-1,96<Z<+1,96)= 0,95.

P(m-3,09 σ <X<m+3,09 σ)= P(-3,09<Z<+3,09)= 0,99.

Cours de Proba/Stat Svi/Sem 3


13/12/17 Par Dr A. MERBOUHA 12
I.2. Loi exponentielle
Une loi exponentielle modélise la durée de vie
d'un phénomène sans mémoire, ou sans
vieillissement, ou sans usure : la probabilité
que le phénomène dure au moins s + t heures
sachant qu'il a déjà duré t heures sera la même
que la probabilité de durer s heures à partir de
sa mise en fonction initiale. En d'autres termes,
le fait que le phénomène ait duré pendant t
heures ne change rien à son espérance de vie à
partir du temps t.
Cours de Proba/Stat Svi/Sem 3
13/12/17 Par Dr A. MERBOUHA 13
Plus formellement, soit X est une variable
aléatoire définissant la durée de vie d'un
phénomène, d'espérance mathématique . On
suppose que :
P( X  t  s X  t )  P( X  s)

Cours de Proba/Stat Svi/Sem 3


13/12/17 Par Dr A. MERBOUHA 14
 L’absence de mémoire se traduit par le fait
qu’un phénomène a autant de chances de se
produire sur un laps de temps donné après
l’instant t qu’après l’instant h. La
probabilité qu’il survienne aujourd’hui
sachant qu’on l’attend depuis un siècle est
la même que si on l’attendait depuis un
jour.

Cours de Proba/Stat Svi/Sem 3


13/12/17 Par Dr A. MERBOUHA 15
 Définition
Soit  une constante strictement positive.
On dit qu’une variable aléatoire suit une loi
exponentielle de paramètre sur , lorsque sa
densité de probabilité associée est la fonction
f(.) définie sur IR+  par:
 x
f ( x )  e

Cours de Proba/Stat Svi/Sem 3


13/12/17 Par Dr A. MERBOUHA 16
Illustration
Cours de Proba/Stat Svi/Sem 3
13/12/17 Par Dr A. MERBOUHA 18
Remarques
• f(0) = λ.

• f est continue et positive sur IR.

1
• E( X ) 

1
• Var ( X )  2

Cours de Proba/Stat Svi/Sem 3


13/12/17 Par Dr A. MERBOUHA 19
I.3. La loi de khi-carré

Soit X une v.a continue. On dit que X suit la loi de


Khi-carré àk d.d.l notée k si sa fonction densité
2

définie sur IR+ est :

1
k / 21  x
f ( x)  x0 x e 2
I 0,   ( x)

où x0 est une constante positive.

Cours de Proba/Stat Svi/Sem 3


13/12/17 Par Dr A. MERBOUHA 20
Cours de Proba/Stat Svi/Sem 3
13/12/17 Par Dr A. MERBOUHA 21
Résultat

U1 ,U 2 ...,U pétant p variables indépendantes et distribuées


selon la loi normales centrée et réduite.

Alors 2
p

Ui
i
2

p

Cours de Proba/Stat Svi/Sem 3


13/12/17 Par Dr A. MERBOUHA 22
Si X est distribuée selon la loi de
2
K ,

E ( X )  K et Var ( X )  2 K

Cours de Proba/Stat Svi/Sem 3


13/12/17 Par Dr A. MERBOUHA 23
I.4. La loi de Student

Soit X une v.a continue. On dit que X suit la loi de Student à 


 IN( ) degrés de liberté (d.d.l) si sa fonction densité est :

t0
f (t )  2  1
t
(1  ) 2

où t 0 est une constante positive.

On montre que:

E(X)=0 et Var(X)= si   3,
 2
Cours de Proba/Stat Svi/Sem 3
13/12/17 Par Dr A. MERBOUHA 24
Résultat

Soient U et X deux v.a indépendantes telles que

U  N 0,1 et X  2
p

U
alors  tp
X
p
Cours de Proba/Stat Svi/Sem 3
13/12/17 Par Dr A. MERBOUHA 25
Remarque: La loi de Student tend vers la loi
normale.

Cours de Proba/Stat Svi/Sem 3


13/12/17 Par Dr A. MERBOUHA 26
I.5. La loi de Fisher

Soit X une v.a continue. On dit que X suit la loi de


Fisher à n1 et n2 d.d.l notée Fn1 ,n2 si sa fonction
densité définie sur IR+ est :
n1
1
Cx 2
f ( x)  n1  n2
(n1 x  n2 ) 2

où C est une constante positive.

Cours de Proba/Stat Svi/Sem 3


13/12/17 Par Dr A. MERBOUHA 27
Cours de Proba/Stat Svi/Sem 3
13/12/17 Par Dr A. MERBOUHA 28
Résultat

Soient X et Y deux v.a indépendantes telles que

X  2
p et Y  2
q

Alors
X
p
 Fp , q
Y
q
Cours de Proba/Stat Svi/Sem 3
13/12/17 Par Dr A. MERBOUHA 29
II. Quelques loi discrètes

II.1 Loi de Bernoulli

On appelle variable de Bernoulli ou variable


indicatrice, la variable aléatoire X telle que : 
X :   R/    échec, succès  et X( )   0,1

Loi de probabilité: P(X=0)=1-p et P(X=1)=p


où p est compris entre 0 et 1,
et E(X) = p et Var(X) = p(1-p)
Cours de Proba/Stat Svi/Sem 3
13/12/17 Par Dr A. MERBOUHA 30
II.2 Loi Binomiale
 On appelle variable Binomiale une variable
aléatoire X correspondant à la somme de n
variables de Bernoulli : 

k k nk n!
Loi de probabilité: p(X  k)  C n p q avec C n 
k

k!(n  k)!
Elle est appelée loi Binomiale,
Binomiale notée B(n,p) et on a,

E(X)  np V(X)  npq


Cours de Proba/Stat Svi/Sem 3
13/12/17 Par Dr A. MERBOUHA 31
Diagrammes en bâtons de trois fonctions de masse de lois binomiales. Les
paramètres sont n = 20 et p = 0,1 (en bleu), p = 0,5 (en vert) et p = 0,8 (en
rouge).

Cours de Proba/Stat Svi/Sem 3


13/12/17 Par Dr A. MERBOUHA 32
II.3 Loi de Poisson
Le nombre moyen d’occurrence d’un événement X dans un
temps T est k
 X={0,1,…} :
k
P ( X  k )  e 
k!

On note X  P ( )
E ( X )   et V ( X )  
 = nombre moyen d’événement par unité de
temps.

 Relation avec la loi binomiale :


Cours de Proba/Stat Svi/Sem 3
13/12/17  Si p<0.1 et n>50 : B(n,p)P(np)
Par Dr A. MERBOUHA 33
II.4 Loi géométrique (loi de Pascal)
 Une variable géométrique correspond au
nombre d’épreuves de Bernoulli nécessaires
pour obtenir 1 succès:
X : Ω  IN* telle que
X(Ω)  1,2..., n...

Loi de probabilité: p(X  i)  q i1 p

1 q
E(X)  V(X) 
p p2

Cours de Proba/Stat Svi/Sem 3


13/12/17 Par Dr A. MERBOUHA 34
II.5 Loi Hypergéométrique

Une variable hypergéométrique correspond à l’observation de k succè


lors de n épreuves sans remise, dans une population de dimension N:

X :  n  IN telle que
X( n )   0,1, ....n

C kNp C nN(1
-k
- p)
Loi de probabilité: p(X  k)  n
C N

p étant la probabilité qu’un tirage se réalise avec succès.

Cours de Proba/Stat Svi/Sem 3


13/12/17 Par Dr A. MERBOUHA 35
N-n
E(X)  np V(X)  n p(1 - p)
N -1

Cours de Proba/Stat Svi/Sem 3


13/12/17 Par Dr A. MERBOUHA 36
Ch 5: Échantillonnage et
estimation des paramètres
1. Échantillon, paramètre et statistique

1.1 Échantillon aléatoire

Un échantillon aléatoire est une suite de variables

aléatoires X 1 ,  , X n indépendantes et de même

loi qu’une caractéristique X d’une population.

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
1.2 Paramètre

Un paramètre est un nombre qui décrit une


caractéristique de la population étudiée.
Citons, à titre d’exemples, la moyenne  , la
variance  , la médiane M et la proportion
2

p d’une population. Notons que les


paramètres sont souvent inconnus.

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
1.3 Statistique

Une statistique est une fonction de l’échantillon qui


permet d’estimer un paramètre de la population.

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
Par exemple :

a) La moyenne  d’une population est


estimée par la moyenne X d’un
échantillon de cette population :

X1  ⋯  X n
X 
n
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
b) La variance  d’une population est
2

2
estimée par la variance S d’un échantillon
de cette population :

1 n
1  2
n
S 
2

n  1 i 1
(Xi  X ) 
2
 
n  1  i 1
Xi  nX 
2

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
c) Soit une population ayant une caractéristique
qualitative (une maladie particulière). La
proportion p des individus ayant cette
caractéristique dans la population est estimée
par :
Sn
ˆ 
p
n
où S n désigne le nombre d’individus de
l’échantillon qui possèdent cette caractéristique .

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
Remarque 

Notons que les statistiques X , S et p̂ sont


2

appelées aussi estimateurs. Par contre, la


valeur calculée par un estimateur pour un
échantillon donnée est appelée estimation
ponctuelle.

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
2. Qualité d’un estimateur
2.1 Estimateur sans biais
Définition : Un estimateur T d’un paramètre 
est dit sans biais si son espérance mathématique est
égale à la vraie valeur du paramètre à estimer :

E (T )  
Notons qu’un estimateur sans biais ne surestime ni
sous-estime systématiquement le paramètre. On dit
d’un estimateur sans biais qu’il est bien centré.
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
2
Remarque : Notons que X, S et p̂ sont
respectivement des estimateurs sans biais
des   p 2

paramètres , et c'est-à-dire :

E( X )  , E (S )  
2 2
et E ( pˆ )  p.

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
2.2 Estimateur efficace

Définition : Soient T1et T2 deux estimateurs sans


biais d’un paramètre inconnu  . On dit que T1 est
plus efficace que T2 si

Var (T1 )  Var (T2 )

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
Un estimateur sans biais doit avoir une variance
aussi petite que possible, afin d’être aussi précis
que possible. Ainsi les variances des estimateurs

 2
p (1  p )
Var ( X )  et Var ( pˆ ) 
n n
Ces formules montrent que les variances de X et
celle de p̂ diminuent lorsque la taille n de
l’échantillon augmente. Donc, plus l’échantillon est

grand, plus X et p̂ sont précis.


Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
3. Distribution d’échantillonnage
Une statistique est par définition basée sur un
échantillon qui n’est qu’une partie de la population
étudiée; il est donc fort improbable que la valeur
prise par cette statistique coïncide avec le
paramètre étudié.
Définition : La distribution d’échantillonnage d’une
statistique est la distribution de toutes les valeurs
possibles de cette statistique. Ces valeurs sont
calculées à partir de tout les échantillons de même
taille et issus de la même population.

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
3.1 Étude de la distribution échantillonnale de X

a. Population normale de variance connue :

Si X 1 ,  , X nun échantillon issu d’une population


de loi normale de variance  2 connue, alors, X suit
une lois normale:

X 
Z   N (0,1)
/ n
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
b. Population normale de variance inconnue :

Si X 1 ,  , X n un échantillon issu d’une population


de loi normale de variance  2 inconnue, alors:

X 
T   t n 1
S/ n
où t n1 désigne la loi de Student de d.d.l n  1.
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
c. Population de loi inconnue :

Si X 1 ,  , X n un échantillon issu d’une population


de loi inconnue, alors le théorème central limite
nous permet d’écrire :

X 
Z   N (0,1)
S/ n

pourvue que la taille de l’échantillon n soit assez


grande ( n  30).

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
3.2 Étude de la distribution échantillonnale de la
variance.
a. Population normale de moyenne connue :

Si X 1 ,  , X n un échantillon aléatoire issu d’une


population de loi normale de moyenne  connue,
alors,
n
1
 2 (X
i 1
i  )   , 2 2
n

la lois de Khi-carré à n d.l.l:


Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
b. Population normale de moyenne inconnue :

Si X 1 ,  , X n un échantillon aléatoire issu d’une


population de loi normale de moyenne 
inconnue, alors,

n 1
S  2 2
n 1 ,
 2

la lois de Khi-carré à n-1 d.l.l.


Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
4. Estimation par intervalle de confiance.
4.1 Estimation par intervalle de confiance
de la moyenne  .
La moyenne X calculée à partir d’un échantillon
donné est presque toujours un peu plus grande
ou un peu plus petite que la vraie moyenne de la
population  . On cherche plutôt une
approximation qui tient compte de la marge
d’erreur d’estimation. Cette estimation se
présente alors sous la forme :

X  E
La marge d’erreur E est appelée précision de l’estimateur X .
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
Ainsi l’estimation par intervalle de confiance de 
consiste à déterminer l’erreur E
de façon que


  X  E, X  E 
avec une probabilité égale à 1   appelée niveau de
confiance.

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
Par exemple, on peut déterminer un intervalle de
confiance qui contient la valeur de  avec un
niveau de confiance égal à 95%. Cela veut dire que
si on répète la même procédure d’estimation 100
fois, la moyenne sera dans 95 intervalles parmi les
100 intervalles établis. Cela signifie que si on
construit un intervalle de confiance par un seul
échantillon, il y aura un risque de 5% que la valeur
de  ne sera pas dans cet intervalle.

Pour construire de tels intervalles de confiance,


nous aurons besoin des quantiles de la loi normale
et de la loi de Student définis ci-après.
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
4.1.1 Quantile d’ordre  des lois normale et
Student

Fixons un nombre  dans l’intervalle 0,1 et


notons z et t ,v les quantiles de la loi normale
et de la loi de Student définis par :

z est la valeur telle que P ( Z  z )  

t ,v est la valeur telle que P(T  t ,v )  

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
Exemple : Calculez à l’aide des tables: z 0.05 , z 0.025 ,

t 0.05,10 et t 0.025,12 .
Tableau de certaines valeurs critiques de la loi
normale:
 (z  )  1  

 0.005 0.01 0.025 0.05 0.01

1.96 1.645 1.285


z 2.575 2.325

z / 2 2.807 2.575
2.241 1.96 1.645

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
4.1.2 Construction de l’intervalle de confiance
de .

 
Soit X  E , X  E un intervalle de confiance de .
Afin de déterminer la précision E , on distingue

quatre cas :

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
Cas 1: Si X 1 ,  , X n est un échantillon issu d’une
population de loi normale de variance  connue,
2

alors l’intervalle de confiance de niveau 1   de 


est :
   
 X  z / 2 , X  z / 2 
 n n

Ainsi la précision de l’estimation sera :


E z / 2
n

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
Cas 2: Si X 1 ,  , X n est un échantillon issu d’une
population de loi normale de variance  inconnue,
2

alors l’intervalle de confiance de niveau 1   de 


est :

 S S 
 X  t / 2;n 1 n , X  t / 2;n 1 n 
 
La précision de l’estimation sera :

S
E  t / 2;n1
n
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
Cas 3: Si X 1 ,  , X n est un échantillon issu d’une
population de loi inconnue, alors pourvue que
la taille n soit assez grande ( n  30), l’intervalle de
confiance de niveau 1   de  est :

 S S 
 X  z / 2 , X  z / 2 
 n n
De même la précision de l’estimation sera :

S
E z / 2
n

Cours de Proba/Stat Svi/Sem 3


Par Dr A. MERBOUHA
Cas 4: Si X 1 ,  , X n est un échantillon choisi sans
remise à partir d’une population de taille finie N
et de loi inconnue, alors pourvue que la taille n soit
assez grande ( n  30 ), l’intervalle de confiance de
niveau 1   est :

 S N n S N n
 X  z / 2 , X  z / 2 
 n N 1 n N 1 
Dans cette situation la précision sera :

S N n
E  z / 2
n N 1
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
4.2. Intervalle de confiance d’une proportion
Soit p la proportion d’individus dans la population
ayant une caractéristique qualitative donnée.
4.2. 1 Intervalle de confiance d’une proportion
pour une population infinie
L’intervalle de confiance de niveau 1   de p est de
la forme :
 pˆ (1  pˆ ) pˆ (1  pˆ ) 
 pˆ  z / 2 , pˆ  z / 2 
 n n 
pourvue que la taille n soit assez grande et
que np  5 et n(1  p )  5.
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
4.2.2 Intervalle de confiance d’une proportion
pour une population finie, avec tirage sans
remise

L’intervalle de confiance de niveau 1   de p est:

 pˆ (1  pˆ ) N  n pˆ (1  pˆ ) N  n 
 pˆ  z / 2 , pˆ  z / 2 
 n N 1 n N 1 
pourvue que np  5 et n(1  p )  5.
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
5. Choix de la taille d’échantillon
La qualité d’un intervalle de confiance se mesure par son
degré de confiance 1   et sa marge d’erreur E. Un choix
adéquat de la taille de l’échantillon permet de contrôler
simultanément ces deux facteurs.
5.1 Cas d’une moyenne .
Dans le cas d’une population normale de variance connue
(cas 1), nous pouvons déterminer la taille minimale requise de
l’échantillon pour avoir un intervalle de confiance de niveau
1   au moins et de précision fixés e à l’avance: 2
 z / 2 
n 
 e 
Lorsque  est inconnu, on le remplacera par une pré-
estimation S .
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
 
5.2 Cas d’une proportion p.
Dans le cas d’une proportion, si l’on dispose d’une pré-
p
estimation p̂ de , la taille minimale sera : 

2
 z / 2 
n  ˆ
p (1  ˆ
p )
 e 
Par contre, si la pré-estimation n’est pas disponible, la taille
requise sera alors :
2
 z / 2 
n 
 2e 
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA
Remarque : Si la population est de taille finie N et le
tirage est sans remise, alors :
1) La taille requise pour la moyenne sera :
Nz  2 2
n  /2
( N  1)e  z / 2
2 22

Ainsi si la variance est inconnue, on la remplace


par une pré-estimation.
2) La taille requise pour la proportion sera :
Nz2 / 2 pˆ (1  pˆ )
n
( N  1)e 2  z2 / 2 pˆ (1  pˆ )
Lorsqu’on ne possède pas de pré-estimation p̂, on prendra:
pˆ  0.5.
Cours de Proba/Stat Svi/Sem 3
Par Dr A. MERBOUHA

Vous aimerez peut-être aussi