Cours Proba Stats 2015

Probabilités & Statistiques
Probabilités & Statistiques

Probabilité
Branche des mathématiques
qui permet d’expliquer le
risque (inversement la chance)
le hasard
Statistique
Discipline ayant pour objet l’analyse
de données ainsi que la prévision
Statistiques
I. Séries à une variable
I.1. Généralités
But
Terminologie
I.2. Grandeurs caractéristiques d’une série statistique
Caractéristiques de position
Caractéristiques de dispersion
I.3. Mise en forme des données
II. Séries à deux variables

Ajustement linéaire, droite de régression, corrélation
Série à une variable
I.1. Généralités
La statistique est l'activité qui consiste à recueillir, traiter et interpréter
un ensemble de données d'informations.
On distingue 3 principales branches :
Enquête statistique : consiste à recueillir les données

Statistique descriptive : consiste à traiter
L’Inférence statistique : consiste à interpréter les données collectées
Statistiques
Ces domaines ne sont pas étanches : le traitement et l'interprétation

des données ne peuvent se faire que lorsque celles-ci ont été
récoltées.
I.1.1 But de la statistique
Présentation de données sous

forme de tableaux, diagrammes, …
Analyse de ces données,

pour aboutir à les
caractériser sous forme
d’un petit nombre de
données caractéristiques.
I.1.2 Terminologie
Une étude statistique est toujours précédée d'une phase où sont
déterminés les différents caractères à étudier.
À la base de toute étude statistique, il y a une population, formée

d'individus sur lesquels on observe des caractères.
Population P : tout ensemble étudié en statistique.
La définition de la population est très importante car elle conditionne

l’homogénéité des unités observées et la fiabilité des résultats
Échantillon : sous ensemble appartenant à l’ensemble P.
Individu (unité statistique): tout élément de la population
Caractère : la particularité de l’individu auquel on s’intéresse.
Un caractère est dit

qualitatif, quand les valeurs ne peuvent être ni ordonnées ni ajoutées
(couleur, lieu de naissance …)
ordinal, quand les valeurs peuvent être ordonnées mais pas ajoutées
quantitatif, quand les valeurs sont numériques (grandeurs mesurables).
Discret : si les valeurs observées sont isolées
Continu : s’il peut prendre toute valeur d’un intervalle réel
Les valeurs que peut prendre un caractère s'appellent les modalités

Exemple
Pour mieux comprendre, il est plus facile de penser en termes de
population humaine.
Les individus sont des personnes,
Les caractères observés peuvent être:
morphologiques (taille, poids, couleur des yeux),
physiologiques (groupe sanguin, numération globulaire, taux de

cholestérol)
psychologiques (réactions à des tests ou réponses à une enquête

d'opinion).
En statistiques, on est en général en présence d'un grand
nombre de valeurs.
Or, si l'intégralité de ces valeurs forme l'information, il n'est

pas aisé de manipuler plusieurs centaines de chiffres, ni d'en
tirer des conclusions.
Il faut donc calculer quelques valeurs caractéristiques

qui vont permettre d'analyser les données
Statistiques
I.1. Généralités
But
Terminologie


Critères de position
Effectifs / fréquences
Mode
Médiane
Moyennes
Quartiles
Critères de dispersion
Étendue
Écarts
Effectif - fréquence
L'effectif total d'une population est le nombre d'individus observés, noté n.
Cas d’une variable discrète (la variable ne prend qu'un nombre fini de valeurs)
Soit {x1, x2, …, xm} les valeurs distinctes prises pas la variable X.
Les xi sont les modalités du caractère X.
L’effectif de xi est le nombre ni d’individus de P ayant xi pour caractère

(n =  ni, i =1,…, m)
L'effectif cumulé croissant d'une valeur est le nombre de fois où une

valeur inférieure ou égale à cette valeur apparaît.
L'effectif cumulé décroissant d'une valeur est le nombre de fois où
une valeur supérieure ou égale à cette valeur apparaît.
Exemple
Lors d’une petite interrogation sur 5 points, les résultats de 23 élèves

ont été :
1 ; 2 ; 4 ; 5 ; 2 ; 3 ; 5 ; 5 ; 2 ; 1 ; 5 ; 2 ; 2 ; 1 ; 4 ; 2 ; 5 ; 2 ; 2 ; 3 ; 5 ; 2 et 4
Notes 1 2 3 4 5
Effectifs 3 9 2 3 6
Effectifs cumulés croissants 3 12 14 17 23
Effectifs cumulés décroissants 23 20 11 9 6
Cela nous dit que

14 élèves ont une note inférieure ou égale à 3
20 élèves ont une note supérieure ou égale à 2
…
La fréquence de modalité xi :
fi = ni/n  fi =1
(généralement donnée en pourcentage)
Les fréquences cumulées croissantes cumulent les fréquences
associées aux valeurs du caractère ≤ xi.
Les fréquences cumulées décroissantes cumulent les fréquences
associées aux valeurs du caractères ≥ xi.
Exemple:
Lors d’une interrogation sur 5 points, les résultats de 23 élèves ont été :
1 ; 2 ; 4 ; 5 ; 2 ; 3 ; 5 ; 5 ; 2 ; 1 ; 5 ; 2 ; 2 ; 1 ; 4 ; 2 ; 5 ; 2 ; 2 ; 3 ; 5 ; 2 et 4
Notes 1 2 3 4 5
Fréquences 13% 39% 9% 13% 26%
Fréquences cumulées croissantes 13 % 52 % 61 % 74 % 100 %
Fréquences cumulées 100 % 87 % 48 % 39 % 26%
décroissantes
Cas d’une variable continue (la variable prends ses valeurs dans un intervalle)
On partage l’intervalle I sur lequel X prend ses valeurs en intervalle

disjoint appelés classes (en générale de même amplitude)
I = [x0, x1[ U [x1, x2[ U … U [xm-1, xm] avec x0<x1<…<xm
L’effectif ni associé à l’intervalle [xi, xi+1[ est l’effectif de cette base.
La classe [xi, xi+1[ est souvent désignée par (ci, ni) où ci est le centre de
classe.
On définit également:
• l’amplitude ai de la classe définie par ai=xi+1-xi
• La densité di définie par ni/ai
La fonction de répartition (fonction cumulative)
Relativement à la modalité xi :
La fonction de répartition est définie par
{ F(x) =  fj avec j<x } = somme des modalités inférieures à x.
F est une fonction en escalier nulle sur ] -, x1] et égale à 1 sur [x1, +[
Pour une variable continue, la fonction cumulative relativement à la classe

(ci, ni); est la fonction dont le graphique est une ligne brisée joignant les
points de coordonnées :
(c0, 0), (c1, f1), (c2, f1+f2), .., (ci, fj : i=0 à i), …, (cn, 1).
Mode : C'est la valeur du caractère correspondant à l'effectif
le plus grand. Lorsqu'il s'agit de classe on parle de classe
modale
c’est la valeur du caractère statistique qui apparaît le plus

fréquemment
(Il peut ne pas y avoir de mode, Il peut y avoir plusieurs modes)

Exemples
L’ensemble des nombres 2, 2, 5, 7, 9, 9, 9, 10, 10, 11, 12, 18 a pour

mode : 9
L’ensemble des nombres 3, 5, 8, 10, 12, 15, 16 n'a pas de mode
L’ensemble des nombres 2, 3, 4, 4, 4, 5, 5, 7, 7, 7, 9 a deux modes:
4 et 7
Médiane : C'est la valeur du caractère correspondant à un
effectif cumulé égal à la moitié de l'effectif total.
Le quantile d’ordre 50 % : Il partage la série en deux série de

même taille, noté (Me)
Exemple
Lors de l’interrogation sur 5 points, les résultats de 23 élèves ont été :
1 ; 2 ; 4 ; 5 ; 2 ; 3 ; 5 ; 5 ; 2 ; 1 ; 5 ; 2 ; 2 ; 1 ; 4 ; 2 ; 5 ; 2 ; 2 ; 3 ; 5 ; 2 et 4
9+3=12
La médiane est donc la note du 12ème élève, c’est-à-dire 2

Moyenne : C'est le nombre noté x ou parfois E(x) défini par :
𝑚
1 𝑛1 𝑥 1 +𝑛2 𝑥 2 +…+𝑛 𝑚 𝑥 𝑚
´𝑥 = ∑ 𝑛𝑖 𝑥 𝑖=
𝑛 𝑖=1 𝑛
Lorsqu'il s'agit de classe on remplace les valeurs xi par les valeurs ci

correspondant aux centres des classes.
Propriétés
E(X + b) = E(X ) + b Changement par translation (chgt. d’origine)

E(aX) = a E(X ) Changement par homothétie (chgt. d’échelle)
E(aX + b) = a E(X ) + b Changement d’origine et d’échelle
Les changements d’origine et d’échelle sont utilisés pour simplifier les

calculs
Exemples
On considère les tailles en cm de 11 personnes. On obtient:
La manière dont les données

sont regroupées influe sur la
moyenne…
On peut présenter les données

de plusieurs manières
différentes…
Quartiles :
Les 3 quartiles partagent la série en quatre séries de même
taille :
• 25% des observations sont inférieures au 1er quartile Q25
• 50% des observations sont inférieures au 2ème quartile Q50
• 75% des observations sont inférieures au 3ème quartile Q75
Exemple Donner les quartiles correspondant à cette série:

6, 47, 49, 15, 43, 41, 7, 39, 43, 41, 36.
Si on ordonne les données dans l’ordre croissant, on a :

6, 7, 15, 36, 39, 41, 41, 43, 43, 47, 49.
Donc Quartile supérieur Q75 =43 et Quartile inférieur Q25 =15.

Etendue : différence entre la valeur maximum et la valeur
minimum du caractère.
Etendue interquartile: différence entre le troisième quartile

Q75 et le premier quartile Q25
Variance : moyenne des carrés des écarts à la moyenne

𝑚 𝑚
1 1
𝑉 ( 𝑋 ) = ∑ 𝑛𝑖 ( 𝑥𝑖 − ´𝑥 )2 ou 𝑉 ( 𝑋 ) = ∑ 𝑛𝑖 𝑥2𝑖 − ´𝑥 2
𝑛 𝑖=0 𝑛 𝑖=0
Ecart type : L'écart type d'une série statistique est la racine
carrée de la variance : 𝜎 ( 𝑋 ) =√ 𝑉 ( 𝑋 )
Plus l’écart type est grand, plus la dispersion autour de la moyenne est importante
Propriétés V (X + b) = V (X ) Changement par translation.

V (aX ) = a2V (X ) Changement par homothétie
L'écart type est toujours positif ou nul :
 Il est nul si la série statistique est constante.
 comme la moyenne, l'écart type est sensible aux valeurs

extrêmes ou aberrantes et il est parfois nécessaire
d'éliminer ces valeurs avant de faire le calcul de l'écart type.
Si m est la moyenne, σ l'écart-type, alors :
  68 % des données se situent ] m-σ ; m+σ [

  95 % des données se situent ] m-2σ ; m+2σ [
  99 % des données se situent ] m-3σ ; m+3σ [
Exemple
Calculer l’écart type de la série 8,8,12,12
𝑚 𝑚
1 2 1 2 2
𝑉 ( 𝑋 ) = ∑ 𝑛𝑖 ( 𝑥𝑖 − ´𝑥 ) 𝑉 ( 𝑋 ) = ∑ 𝑛𝑖 𝑥𝑖 − ´𝑥
𝑛 𝑖=0 𝑛 𝑖=0
xi 8 12
Moyenne de la série x = (8+8+12+12)/4 = 10
ni 2 2
2 2
𝑉 ( 𝑋 ) = 2 ( 8 − 10 ) +2 ( 12− 10 ) =4 =2
4
Exercices
• Répartition des effectifs par année d’ancienneté
Nombre d’années
1 2 3 4 5 6 7 8 9 10
d’ancienneté
Effectifs 3 4 4 1 3 3 1 1 3 2
• Durées en min des achats de 2500 consommateurs

Classes
(intervalle [15,5 ; 20,5[ [20,5 ; 25,5[ [25,5 ; 30,5[ [30,5 ; 35,5[ [25,5 ; 30,5]
des durées)
Effectifs 200 500 1000 600 200
Mode(s), moyenne, médiane, variance, écart-type ?

Statistiques
I.1. Généralités
But
Terminologie


En statistique, les données sont présentées sous forme de

tableaux de valeurs et de graphiques
 Diagramme en bâton ( discret ) ou histogramme ( continu )
 Polygone des effectifs : lignes brisées joignant les points

de coordonnées (xi, ni).
 Polygone des fréquences cumulées
 Courbe cumulative des effectifs : C'est la représentation

de la fonction de répartition.
Mise en forme des données
Variable discrète ni
Diagramme en bâtons
on trace un segment proportionnel à
ni, à partir du point d’abscisse xi
Polygones
Variable continue
Histogramme
bande rectangulaire ayant la largeur de
chaque classe et la hauteur proportionnelle
à l’effectif de la classe.
Rq: Dans le cas d’intervalle de largeurs
différentes, la hauteur sera proportionnelle
à la densité (di=ni/ai=ni/(xi+1-xi) )
Courbe cumulative croissante
C'est le tracé de la fonction N qui à tout x

associe N ( x ) = nbre d'observations  x.
Il s'obtient au moyen des effectifs cumulés Variable discrète
croissants.
Cas discret : fct. en escalier,

Cas continu : fct. continue, affine par morceaux.
Si on raisonne en fréquences (au lieu

d'effectifs), on a le tracé de la fonction de
répartition F ( x ) = proportion d'observations  x
Variable continue
Courbe cumulative décroissante
C'est le tracé de la fonction N' qui à tout x associe N' ( x ) = nombre
d'observations  x. Il s'obtient au moyen des effectifs cumulés décroissants.
Variable continue
Variable discrète
Statistiques
I.1. Généralités
But
Terminologie
Mises en forme des données

Ajustement linéaire, droite de régression, corrélation

Série à deux variables
Soit une population d'effectif n,
si on étudie deux caractères X et Y de cette population,
on dit que l'on étudie une série statistique double
Exemple
1. Quelle est le pourcentage de

femmes blondes parmi la
population? X x1 x2
y1 y2
2. Quel est le pourcentage de Y
femmes qui sont blondes ?
Effectif n
Les résultats peuvent être présentés sous forme de données groupées

ou sous forme de données non groupées.
Données non groupées
Données groupées
Regrouper les données en classes de largeur Nuage de points
2 et affecter à chaque classe la valeur
centrale de l'intervalle.
Toute série statistique à 2 variables peut être donnée sous 2 formes de
tableaux d’effectifs.
 Tableau de données ponctuelle
 Tableau à double entrée : lorsqu’un certain nombre d’observations

sont identiques, on peut utiliser les tableaux à double entrée.
Exemple
Une usine produit des bobines Teneur en carbone (%) xi 0,6 0,61 0,62 0,64 0,65
de fil d’acier, une étude sur la
Charge de rupture (kg) yi 65 70 70 75 75
charge du rupture de l’acier en
fonction de sa teneur en
carbone a donné les résultats
yi / xi 0,60 0,61 0,62 0,64 0,65
suivants :
65 X
70 X X
75 X X
II.1 Ajustement linéaire
Dans certains cas le nuage de point semble donner un ensemble de points

presque alignés
faire un ajustement linéaire c'est trouver une droite d'équation

y = a.X + b qui permet de représenter cette série
a.X+b
X
Méthode de la règle
On trace au jugé une droite D passant au plus prés possible
des points en s’efforçant d’équilibrer le nombre de points au
dessus et au dessous de la droite.
Y
a.x+b
X
Méthode de Mayer :
On partage le nuage en deux nuages de même effectif (à une
unité près).
On cherche pour chacun leur point moyen notés
respectivement G1 et G2 .
La droite (G1G2) est la droite d'ajustement selon la méthode
de Mayer.
Y
G2
a.x+b
G1
X
II.2 Droite de régression : Méthode des moindres carrées
On cherche une droite telle que,

si on projette les points Mi sur
cette droite parallèlement à oy,
On obtient des points P, tels

que : soit
minimale
Cette droite est appelée droite de régression de Y en X notée DY/X
Elle a pour équation : avec

II.2 Droite de régression : Méthode des moindres carrées
De même, la droite de
régression de X en Y notée DX/Y
A pour équation
𝜎 2𝑦
𝑦= ( 𝑥 − 𝑥´ ) + ´𝑦
𝑐𝑜𝑣 ( 𝑥 , 𝑦 )
avec Ou encore
II.3 Corrélation linéaire
On appelle covariance des variables X et Y le réel
Moyenne des produits moins le

produit des moyennes
Ce nombre est : positif si X et Y ont tendance à varier dans le même sens,

négatif si elles ont tendance à varier en sens contraire.
Les coefficients directeurs des droites de régression s’écrivent :
Pour comparer les directions des deux droites de régression on est

amené à comparer leurs coefficients directeurs m et m' .
2
m   xy 
r 
2
 
m'  x . y 
La quantité s'appelle le coefficient de corrélation linéaire

des variables X et Y de la série statistique double.
Les droites seront alors d'autant plus proches l'une de l'autre que le
rapport r sera proche de 1.
On a : –1  r  1
Le nuage de pts est une droite si et seulement si :

r = 1 (droite ascendante)
ou r = -1 (droite descendante)
Y r0 Y r>0 Y r<0
X X X
Corrélation nulle Corrélation positive Corrélation négative
Si x alors y  Si x alors y
0  r²  3/4 3/4  r²  1 I r I =1
Y Y Y
X X X
Faible corrélation Forte corrélation Corrélation parfaite
Probabilités
I. Introduction
I.1. Opérations et événements

I.2. Probabilités sur un ensemble fini (Notions)
Définition
Conséquences
Equiprobabilité
Dénombrement : Arrangements, combinaisons
I.3. Probabilité conditionnelle
Probabilités
II. Variables aléatoires – Lois de probabilités
II.1. Variables aléatoire
Notions (discrète finie, discrète infinie, continue)
II.2. Espérance mathématique, variance, écart type
II.3. Loi de probabilité discrètes

Lois discrètes finies
Lois discrètes non finies
II.4. Loi de probabilité de variables aléatoires continues
III. Echantillonnage – Estimation d’une population

Introduction
Terminologie de probabilité Exemples
Expérience aléatoire : résultat dépend du hasard
Eventualités (possibilités) : résultats possible 1, 2, 3, 4, 5 ou 6
Univers  : ensemble des éventualités  = {1, 2, 3, 4, 5, 6}
Un événement est une partie de  {1, 3, 5}
Un événement élémentaire : partie contenant 1 seule éventualité {6}
Un événement certain : partie égale à  A=
Un événement impossible : ensemble Ф A=Ф

Opérations et évènements
Exemple
Soit l’univers  = {1, 2, 3, 4, 5, 6}
Evénement contraire de A (A) : contient toutes les Si A = {1, 3, 5}

éventualités qui ne sont pas dans A A = {2, 4, 6}
Réunion de 2 évènements (AB ou A+B) : A ={1, 3, 5}, B={1, 2, 3, 4}

éventualités contenant toutes celles de A et de B AB = {1,2, 3, 4, 5}
L’intersection de 2 évènements (AB ou AB) : A ={1, 3, 5}, B={1, 2, 3, 4}

éventualités communes à A et à B A  B = {1, 3}
A ={2, 3, 4}, B={6}

Si AB = Ф on a alors des évènements incompatibles AB=Ф
Probabilités
I. Introduction
I.1. Opérations et événements
I.2. Probabilités sur un ensemble fini (notions)

Définition
Conséquences
Equiprobabilité
Dénombrement : Arrangements, combinaisons
I.3. Probabilité conditionnelle

Probabilités sur un ensemble fini
Définition
Soit :  un univers fini et P() ensemble des parties de 

Dans une épreuve, on appelle probabilité définie sur , toute
application P de P() dans 0, 1 vérifiant :
 P () = 1
 Si A et B sont 2 événements incompatibles AB=Ф
P (AB) = P(A) + P(B)
P (A) : possibilité pour que A se réalise

Exemple
On reprend l’expérience du lancé de dé
{1}, {2}, ..., {6} sont les évenements élémentaires
Si le dé est équilibré, chaque événement à une probabilité égale à 1/6
P ({1}) = P ({2}) = ... = P ({6}) = 1/6
On a P ({1, 2}) = 1/6 + 1/6 = 1/3
On a P ({3, 4, 5}) = 1/6 + 1/6 + 1/6 = 1/2
On a P ({1, 2, 3, 4, 5, 6}) = 1/6 + 1/6 + 1/6 + 1/6 + 1/6 + 1/6 = 1
On construit ainsi une application de l’ensemble des parties de 

Conséquences
A et B deux événements quelconques

0  P( A)  1
P ( A)  1  P ( A)
P ( )  0
P ( )  1
A, B P( A  B)  P ( A)  P ( B )  P ( A  B )
Si A et B deux événements incompatibles
 A  B    P( A  B)  0
 P ( A  B )  P ( A)  P( B)
Equiprobabilité
C’est le cas où tous les événements ont la même probabilité
 Pour tout événement A :
nbre d ' élts de A nbre de cas favorables à A

P( A)  
nbre d ' élts de  nbre de cas possibles
Exemple On reprend l’expérience du lancé de dé
{1}, {2}, ..., {6} sont les évenements élémentaires
Si le dé est équilibré, chaque événement à une probabilité égale à 1/6
P ({1}) = P ({2}) = ... = P ({6}) = 1/6 On dit qu’il y a equiprobabilité

Dénombrements : Arrangements, combinaisons
Factorielle
Le factorielle n, noté n!, est le nombre obtenu par le produit
de tous les nombres entiers de 1, ..., n
n
n! 1 2  3  ...  (n  1)  n   m
m 1
Arrangements
 Arrangements avec répétition

 Arrangements sans répétition
Arrangements sans répétition Soit E un ensemble de n éléments
Soit p  n ; un arrangement sans répétition de p éléments pris parmi n

est un sous ensemble ordonné de E ayant p éléments
Le nombre total de ces arrangements est :

n!
A  n.(n  1).( n  2)...( n  p  1) 
n
p
(n  p )!
Arrangements avec répétitions

Un arrangement avec répétitions de p éléments choisis parmi n est une
liste ordonnée avec répétition éventuelles des éléments.
p
Le nombre d’arrangements avec répétition est : n
Exemple
Un logiciel propose de créer un mot de passe de 4 lettres distinctes (alphabet latin

majuscule)
Combien de tels mots de passe pouvez-vous créer ?
Il s’agit de choisir 4 lettres distinctes, dans un ordre précis, parmi 26 lettres (tirage
sans remise, ordonné : pour un mot de passe, l’ordre est nécessaire)
26!
Il y a donc A 
4
26  358 800 possibilités
(26  4)!
Si l’on s’autorise la répétition des lettres (tirage avec remise, ordonné), on obtient:
26 4  456 976 possibilités

Permutations
On réalise une permutation si on écrit tous les éléments de l’ensemble
dans un ordre déterminé.
Le nombre de permutations de n éléments est n!
Exemple
Soit un ensemble E = {a, b, c}. On peut écrire tous les triplets obtenus à
l’aide des éléments de E
(a, b, c), (a, c, b), (b, a, c), (b, c, a), (c, a, b) et (c, b, a)
(a, c, b) est une permutation des éléments de E
Le nombre de permutation de E = 3! = 3x2x1=6

Combinaisons
On réalise une combinaison de p éléments parmi n si on les choisit dans
un ordre indifférent.
Le nombre de combinaisons à p élément parmi n est
n!
C 
n
p
p!(n  p )!
Exemple
Une grille de loto comporte 49 numéros différents de 1 à 49.

Combien y a-t-il de grilles possibles avec 6 numéros ?
Une combinaison de 6 éléments choisis 49!

parmi 49 est un sous-ensemble de E
6
C49   13 983 816
(ensemble de 49 élts) ayant 6 éléments
6!(49  6)!
Propriétés des combinaisons
Formule du binôme de Newton
Le développement de (a+b)n est donnée par la formule du binôme de

Newton.
n
(a  b)   Cnp .a p .b n  p  a n  Cn1 .a n 1.b  Cn2 .a n  2 .b 2  ...  Cnn .b n
n
nN
p 0
Les Cnp s’appellent coefficients binomiaux

Probabilité conditionnelle
On appelle probabilité conditionnelle de l’événement B conditionnée

par l’événement A, la probabilité notée PA(B)
Si P(A)  0 P( A  B)
PA ( B) 
P ( A) PA(B) : probabilité de B sachant A
Si P(A)  0 et P(B)  0
 P( A  B)  PA ( B).P( A)  PB ( A).P( B )
P( B)  P( A).PA ( B )  P( A).PA ( B) Formule de probabilité totale
2 événements sont indépendants ssi : P( A  B)  P( A).P( B)

Généralisation : Formule de BAYES
Soit Ai (i=1 à n) = système complet d’événements tel que :

i P (Ai)  0
P ( Ai ).PAi ( B)
alors PB ( Ai )  n
 P ( A ).P( A )
j 1
B j j
Probabilités
II.3. Loi de probabilité discrètes

II.4. Loi de probabilité de variables aléatoires continues

Variable aléatoire – loi de probabilité
Définition
On appelle variable aléatoire (v.a.) toute fonction X de l’univers dans R

qui, à tout élément de l’univers fait correspondre un nombre réel x.
On notera X(univers) l'ensemble des valeurs prises par la v.a. X.
Une variable aléatoire est caractérisée par l'ensemble des valeurs

qu'elle peut prendre et par l'expression mathématique de la probabilité
de ces valeurs.
Cette expression s'appelle la loi de probabilité

(ou distribution de probabilité) de la variable aléatoire.
Il existe plusieurs types de valeurs que peut prendre une
variable aléatoire :
Variable aléatoire discrète : elle ne prend que des valeurs

discontinues dans un intervalle donné (borné ou non borné).
Si l’intervalle est bornée, la variable aléatoire est finie sinon

elle est infinie
Exemple : L'ensemble des nombres entiers est discret.
En règle générale, toutes les variables qui résultent d'un

dénombrement ou d'une numération sont discrètes.
Variable aléatoire discrète Manipulation de lancé de dé
V.A. discrète finie V.A. discrète infinie
 2 lancés successifs  X : nbres de coups qu’il faut jouer

pour obtenir un 6
 n1 et n2 : nombres obtenus pour

chaque lancé
 X : V.A. discrète qui peut prendre
comme valeur l’ensemble des entiers
 X = n1 + n2 : nombres obtenus naturels N : c’est une V.A. discrète
pour chaque lancé infinie
 X peut prendre un nombre fini de  Le nombre de coups est infini

valeurs  {2, 3, ..., 12}
Définition
La loi de probabilité d'une variable aléatoire discrète est entièrement
déterminée par les probabilités Pi des évènements {X = xi}, xi parcourant
l'univers.
La loi de probabilité est donnée par les (xi, Pi)
Exemple : lancé successif d’un dé
xi 1 2 3 4 5 6 7 8 9 10 11 12
P(X=xi) 0 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36
On appelle fonction de répartition F de la V. A. X

i
F ( x)  P( X  x) avec xi  x  xi 1 F ( x)   P( X  x j )
j 1
x  xn F ( x)   Pi  1
i 1
Étant donnée une v.a. discrète X prenant les valeurs x1, x2,…,xn avec les
probabilités respectives P1, P2,…,Pn.
L'espérance mathématique de X est le nombre réel noté E(X) défini

par : n
E ( X )   xi .Pi  x1 P1  x2 P2  ...  xn Pn
i 1
La variance de la v.a. X est le nombre réel noté V(X) et défini par
V ( X )  E ( X ²)  ( E ( X ))²
L'écart type d'une v.a. X est le réel positif noté défini par :
 (X )  V (X )
Variable aléatoire continue
Une variable aléatoire est continue si elle peut prendre toutes les valeurs
dans un intervalle donné (borné ou non borné).
En règle générale, toutes les variables qui résultent d'une mesure sont de type
continu
Pour une V. A. continue, la probabilité associée à l'évènement {X = a} est nulle,

car il est impossible d'observer exactement cette valeur.
On considère alors la probabilité que la V. A. X prenne des valeurs

comprises dans un intervalle [x1, x2] tel que P(x1 ≤ X ≤ x2)
On a alors par exemple P(a  X  b)  F (b)  F (a )

Définition
On appelle densité de probabilité de la V. A. X toute fonction f définie sur R
vérifiant :
 x f ( x)  0
b
  P ( a  X  b)   f ( x) dx  F (b)  F (a )
 
f ( x ) dx  1 a
On appelle fonction de répartition la fonction F, définie sur R, par :

x
F ( x)   f (t )dt

f(x) F(x) Fonction de répartition

Fonction de P (a< X  b)
densité de 1
probabilité
x x
a b
Définition
Étant donnée une v.a. continue X, de densité de probabilité f(x) prenant
des valeurs comprises dans l'intervalle [a,b]
L'espérance mathématique de X est le nombre réel noté E(X) défini

par : b
E ( X )   x. f ( x)dx
a
La variance de la v.a. X est le nombre réel noté V(X) et défini par

b
V ( X )   x ². f ( x)dx  ( E ( X ))²
a
L'écart type d'une v.a. X est le réel positif noté défini par :
 (X )  V (X )
Lois de probabilité
Lois de probabilité discrètes finies
Loi uniforme
X ()   x1 , x2 ,..., xn 
Une variable aléatoire X suit une loi uniforme sur  si :
1
i  1,2,..., n  P ( X  xi )  Pi 
n
Exemple
On lance un dé non pipé et l’on considère la variable aléatoire X égale au

résultat obtenu
Loi de Bernoulli
Une variable aléatoire X suit une loi de Bernoulli sur  si :
X ()   0,1 avec P ( X  1)  p et P ( X  0)  q  1  p
E( X )  p et V ( X )  pq
Exemple
On lance une pièce de monnaie :

(X = 0) correspond à pile
et (X = 1) correspond à face
Loi binomiale
C’est la loi de probabilité d’une série d’épreuves répétées possédant les

propriétés suivantes :
 Chaque épreuve a deux résultats possibles de probabilités p et q=1-p
 Les épreuves répétées sont indépendantes
La variable aléatoire X a pour valeur le nombre de succès à une suite de n

épreuves
X ()   0,1,..., n P( X  i )  Cni p i q n i  Cni p i (1  p ) n i
X suit une loi binômiale B (n,p) de paramètres n et p.

C’est la loi de probabilité d’une série de n épreuves de Bernoulli indépendantes
Dans ce cas, on a :
E ( X )  np et V ( X )  npq  np(1  p )
Exemple
On lance une pièce de monnaie : X est égale au nombre de « piles »

obtenus au cours de n lancers indépendants d’une pièce
Lois de probabilité discrètes infinies
Loi géométrique
Soit p  ]0, 1[, avec p réel. q = 1-p
X suit une loi de probabilité géométrique si
X ()   i    P( X  i )  p q i  p (1  p ) i
q 1 p q (1  p )
E( X )   et V (X )  
p p p² p²
Exemple
On lance une pièce de monnaie : X est égale au nbre de piles obtenus avant
l’apparition du premier face
Loi de Poisson
La loi de Poisson relative à la variable aléatoire X est telle que :
X ()   i
  *
i    P ( X  i )  e  .
i!
 : paramètre de la loi de poisson P()

E( X )   et V (X )  
Exemple
La loi de Poisson est généralement utilisée lorsque l’étude porte sur un

phénomène rare : panne de machine, sinistre ….
Lien entre loi Binomiale et loi de Poisson
n est grand On peut approximer la loi binomiale B (n,p)

Si
p voisin de 0 par la loi de Poisson P() avec  = n.p
n.p pas trop grand
On admet que n i  i
P( X  i)  C p q
i
n
i
e .
i!
En général, cette approximation est utilisée lorsque :
p  0,1 ; n  30 et n.p  15 ou p  0,1 ; n  50 et n.p  10

Lois de probabilité continues
Loi uniforme a, b 
On appelle variable uniforme sur [a, b], une variable aléatoire continue dont la
fonction de densité de probabilité est :
1
f ( x)  x   a, b ab (b  a ) 2
ba E( X )  et V (X ) 
f ( x)  0 x   a, b 2 12
f(x)
Fonction de densité F(x) Fonction de répartition
a b a b
Loi normale ou loi de Laplace - Gauss
Loi utilisée généralement à une variable aléatoire continue dépendante de

nombreux facteurs indépendants dont les effets s’additionnent et dont aucune n'est
prépondérante.
Une variable aléatoire continue X est distribuée selon une loi normale N (m,s²)
si sa densité de probabilité est :
où m est la moyenne de X
σ est l'écart-type de X
E( X )  m et V (X )   2
Points d’inflexions
m- m+
La cloche de Gauss
Pour les calculs, on effectue généralement le changement de variable :
(X - m) t a pour moyenne 0,
t et pour écart-type 1

La loi de distribution de t est alors
Cette loi est notée N(m=0, =1) et dite loi normale centrés réduite
t x
1 2
Sa fonction de répartition est :  (t )  
 2
.e .dx
La lecture de cette fonction se fait grâce à une table

t
1  2x f(t)
 (t )  
 2
.e .dx
b
P(a  T  b)   f (t ).dt  (b)   (a )
a
a b t
f(t)
On utilise également la fonction (t)
F (t ) = P (t ) - 0,5
t
P(T  t )   f (t ).dt  (t )  0,5  (t )

t
Approximation d’une loi Binomiale par une loi normale
n est grand n 0
Si
p ni proche de 0 et ni proche de 1 tel que np(1-p) >10
On peut approximer la loi binomiale B (n,p) par la loi normale N(m, )
Où m  n. p et  ( X )  n. p.(1  p)
1  k m  2
1  
2  

On admet que P( X  k )  .e
 2
Probabilités
II.3. Lois de probabilités discrètes

II.4. Lois de probabilités de variables aléatoires continues

Echantillonnage - Estimation
Population mère
La théorie de l’échantillonnage consiste à
déterminer des propriétés sur des échantillons {I1, I2, ..., IN}
prélevés dans une population dont on connaît déjà
X caractères
des propriétés.
Xi variables aléatoires
m, 
Estimation est le problème inverse de
Echantillon
l’échantillonnage, c’est à dire connaissant des
renseignements sur un on plusieurs échantillons, on Xe
cherche à en déduire des informations sur la
population totale. Pour un échantillon i :
xi ,  i
Loi d’échantillonnage
L’effectif de la population étudiée est N, sa moyenne m et son écart type .
On prélève un échantillon aléatoire de taille n (tirage avec remise)
Soit X la V.A. qui à tout échantillon, associe la moyenne de cet échantillon

Pour n assez grand, X suit approximativement N (m, )
n
 n
Si les tirages sont sans remise (exhaustifs) X  N (m, 1 )
n N
Estimation
Échantillon prélevé au hasard dans la
Estimation ponctuelle population
n : son effectif
e² : sa variance
Moyenne
On choisit Xe d’1 échantillon prélevé au hasard comme estimation de la

moyenne de la population
Variance – écart type
n
On choisit . e2 comme estimation de la variance ² de la
n 1 population
e n
Ecart type  . 1
n N
Estimation par intervalle de confiance
On commence par :
 Fixer un coefficient de confiance (95, 99 %, …)
 Chercher un intervalle de confiance de la moyenne pour ce coefficient :
Trouver un intervalle [a, b] tel que l’on soit sûr à 95%

(ou 99%, …) que la moyenne est dans cet intervalle

Pour n  30 la distribution d’échantillonnage N (m, )
n
n
Donc la variable aléatoire T  .( X e  m) N (0, 1)

Alors si t  0, p(t  T  t )  2 (t )  1
donc, lorsqu’on prélève un échantillon de taille n, il y a 95% de chance que sa
moyenne soit dans l’intervalle :
   
 m  1,96 ; m  1,96 
 n n
 
On peut aussi écrire : X e  1,96  m  X e  1,96
n n
Donc après avoir prélevé un échantillon de taille n, on peut estimer qu’il y’a 95%
de chances que la moyenne de la population soit dans l’intervalle
   
X e  1,96 ; X e  1,96
 
 n n
   
Cas général : p X e  t  m  X e  t   1 avec   2 (t )
 n n 

Cours Proba Stats 2015

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Cours Proba Stats 2015

Transféré par

Droits d'auteur :

Formats disponibles

Probabilités & Statistiques

Probabilités & Statistiques

II. Séries à deux variables

On distingue 3 principales branches :

Enquête statistique : consiste à recueillir les données

Ces domaines ne sont pas étanches : le traitement et l'interprétation

Présentation de données sous

Analyse de ces données,

À la base de toute étude statistique, il y a une population, formée

Population P : tout ensemble étudié en statistique.

La définition de la population est très importante car elle conditionne

Échantillon : sous ensemble appartenant à l’ensemble P.

Individu (unité statistique): tout élément de la population

Caractère : la particularité de l’individu auquel on s’intéresse.

Un caractère est dit

Les valeurs que peut prendre un caractère s'appellent les modalités

Les individus sont des personnes,

Les caractères observés peuvent être:

morphologiques (taille, poids, couleur des yeux),

physiologiques (groupe sanguin, numération globulaire, taux de

psychologiques (réactions à des tests ou réponses à une enquête

Or, si l'intégralité de ces valeurs forme l'information, il n'est

Il faut donc calculer quelques valeurs caractéristiques

I.2. Grandeurs caractéristiques d’une série statistique

I.3. Mise en forme des données

II. Séries à deux variables

Les xi sont les modalités du caractère X.

L’effectif de xi est le nombre ni d’individus de P ayant xi pour caractère

L'effectif cumulé croissant d'une valeur est le nombre de fois où une

Lors d’une petite interrogation sur 5 points, les résultats de 23 élèves

Cela nous dit que

On partage l’intervalle I sur lequel X prend ses valeurs en intervalle

I = [x0, x1[ U [x1, x2[ U … U [xm-1, xm] avec x0<x1<…<xm

L’effectif ni associé à l’intervalle [xi, xi+1[ est l’effectif de cette base.

La fonction de répartition est définie par

{ F(x) =  fj avec j<x } = somme des modalités inférieures à x.

Pour une variable continue, la fonction cumulative relativement à la classe

c’est la valeur du caractère statistique qui apparaît le plus

(Il peut ne pas y avoir de mode, Il peut y avoir plusieurs modes)

L’ensemble des nombres 2, 2, 5, 7, 9, 9, 9, 10, 10, 11, 12, 18 a pour

Le quantile d’ordre 50 % : Il partage la série en deux série de

La médiane est donc la note du 12ème élève, c’est-à-dire 2

Lorsqu'il s'agit de classe on remplace les valeurs xi par les valeurs ci

E(X + b) = E(X ) + b Changement par translation (chgt. d’origine)

Les changements d’origine et d’échelle sont utilisés pour simplifier les

La manière dont les données

On peut présenter les données

Exemple Donner les quartiles correspondant à cette série:

Si on ordonne les données dans l’ordre croissant, on a :

Donc Quartile supérieur Q75 =43 et Quartile inférieur Q25 =15.

Etendue interquartile: différence entre le troisième quartile

Variance : moyenne des carrés des écarts à la moyenne

Propriétés V (X + b) = V (X ) Changement par translation.

 Il est nul si la série statistique est constante.

 comme la moyenne, l'écart type est sensible aux valeurs

Si m est la moyenne, σ l'écart-type, alors :

  68 % des données se situent ] m-σ ; m+σ [

Calculer l’écart type de la série 8,8,12,12

• Durées en min des achats de 2500 consommateurs

Mode(s), moyenne, médiane, variance, écart-type ?

I.2. Grandeurs caractéristiques d’une série statistique

I.3. Mise en forme des données

II. Séries à deux variables