Vous êtes sur la page 1sur 88

Probabilités & Statistiques

Probabilités & Statistiques


Probabilité
Branche des mathématiques
qui permet d’expliquer le
risque (inversement la chance)
le hasard

Statistique
Discipline ayant pour objet l’analyse
de données ainsi que la prévision
Statistiques
I. Séries à une variable
I.1. Généralités
But
Terminologie
I.2. Grandeurs caractéristiques d’une série statistique
Caractéristiques de position
Caractéristiques de dispersion
I.3. Mise en forme des données

II. Séries à deux variables


Ajustement linéaire, droite de régression, corrélation
Série à une variable
I.1. Généralités
La statistique est l'activité qui consiste à recueillir, traiter et interpréter
un ensemble de données d'informations.

On distingue 3 principales branches :

Enquête statistique : consiste à recueillir les données


Statistique descriptive : consiste à traiter
L’Inférence statistique : consiste à interpréter les données collectées
Statistiques

Ces domaines ne sont pas étanches : le traitement et l'interprétation


des données ne peuvent se faire que lorsque celles-ci ont été
récoltées.
Série à une variable
I.1.1 But de la statistique

Présentation de données sous


forme de tableaux, diagrammes, …

Analyse de ces données,


pour aboutir à les
caractériser sous forme
d’un petit nombre de
données caractéristiques.
Série à une variable
I.1.2 Terminologie
Une étude statistique est toujours précédée d'une phase où sont
déterminés les différents caractères à étudier.

À la base de toute étude statistique, il y a une population, formée


d'individus sur lesquels on observe des caractères.

Population P : tout ensemble étudié en statistique.

La définition de la population est très importante car elle conditionne


l’homogénéité des unités observées et la fiabilité des résultats
Série à une variable

Échantillon : sous ensemble appartenant à l’ensemble P.

Individu (unité statistique): tout élément de la population

Caractère : la particularité de l’individu auquel on s’intéresse.

Un caractère est dit


qualitatif, quand les valeurs ne peuvent être ni ordonnées ni ajoutées
(couleur, lieu de naissance …)
ordinal, quand les valeurs peuvent être ordonnées mais pas ajoutées
quantitatif, quand les valeurs sont numériques (grandeurs mesurables).
Discret : si les valeurs observées sont isolées
Continu : s’il peut prendre toute valeur d’un intervalle réel

Les valeurs que peut prendre un caractère s'appellent les modalités


Série à une variable
Exemple
Pour mieux comprendre, il est plus facile de penser en termes de
population humaine.

Les individus sont des personnes,

Les caractères observés peuvent être:

morphologiques (taille, poids, couleur des yeux),

physiologiques (groupe sanguin, numération globulaire, taux de


cholestérol)

psychologiques (réactions à des tests ou réponses à une enquête


d'opinion).
Série à une variable
En statistiques, on est en général en présence d'un grand
nombre de valeurs.

Or, si l'intégralité de ces valeurs forme l'information, il n'est


pas aisé de manipuler plusieurs centaines de chiffres, ni d'en
tirer des conclusions.

Il faut donc calculer quelques valeurs caractéristiques


qui vont permettre d'analyser les données
Statistiques
I. Séries à une variable

I.1. Généralités
But
Terminologie

I.2. Grandeurs caractéristiques d’une série statistique


Caractéristiques de position
Caractéristiques de dispersion

I.3. Mise en forme des données

II. Séries à deux variables


Série à une variable
I.2. Grandeurs caractéristiques d’une série statistique

Critères de position
Effectifs / fréquences
Mode
Médiane
Moyennes
Quartiles

Critères de dispersion
Étendue
Écarts
Critères de position
Effectif - fréquence
L'effectif total d'une population est le nombre d'individus observés, noté n.

Cas d’une variable discrète (la variable ne prend qu'un nombre fini de valeurs)

Soit {x1, x2, …, xm} les valeurs distinctes prises pas la variable X.

Les xi sont les modalités du caractère X.

L’effectif de xi est le nombre ni d’individus de P ayant xi pour caractère


(n =  ni, i =1,…, m)

L'effectif cumulé croissant d'une valeur est le nombre de fois où une


valeur inférieure ou égale à cette valeur apparaît.
L'effectif cumulé décroissant d'une valeur est le nombre de fois où
une valeur supérieure ou égale à cette valeur apparaît.
Critères de position
Exemple

Lors d’une petite interrogation sur 5 points, les résultats de 23 élèves


ont été :
1 ; 2 ; 4 ; 5 ; 2 ; 3 ; 5 ; 5 ; 2 ; 1 ; 5 ; 2 ; 2 ; 1 ; 4 ; 2 ; 5 ; 2 ; 2 ; 3 ; 5 ; 2 et 4

Notes 1 2 3 4 5
Effectifs 3 9 2 3 6
Effectifs cumulés croissants 3 12 14 17 23
Effectifs cumulés décroissants 23 20 11 9 6

Cela nous dit que


14 élèves ont une note inférieure ou égale à 3
20 élèves ont une note supérieure ou égale à 2

Critères de position
La fréquence de modalité xi :

fi = ni/n  fi =1
(généralement donnée en pourcentage)
Les fréquences cumulées croissantes cumulent les fréquences
associées aux valeurs du caractère ≤ xi.
Les fréquences cumulées décroissantes cumulent les fréquences
associées aux valeurs du caractères ≥ xi.
Exemple:
Lors d’une interrogation sur 5 points, les résultats de 23 élèves ont été :
1 ; 2 ; 4 ; 5 ; 2 ; 3 ; 5 ; 5 ; 2 ; 1 ; 5 ; 2 ; 2 ; 1 ; 4 ; 2 ; 5 ; 2 ; 2 ; 3 ; 5 ; 2 et 4
Notes 1 2 3 4 5
Fréquences 13% 39% 9% 13% 26%
Fréquences cumulées croissantes 13 % 52 % 61 % 74 % 100 %
Fréquences cumulées 100 % 87 % 48 % 39 % 26%
décroissantes
Critères de position
Cas d’une variable continue (la variable prends ses valeurs dans un intervalle)

On partage l’intervalle I sur lequel X prend ses valeurs en intervalle


disjoint appelés classes (en générale de même amplitude)

I = [x0, x1[ U [x1, x2[ U … U [xm-1, xm] avec x0<x1<…<xm

L’effectif ni associé à l’intervalle [xi, xi+1[ est l’effectif de cette base.

La classe [xi, xi+1[ est souvent désignée par (ci, ni) où ci est le centre de
classe.
On définit également:
• l’amplitude ai de la classe définie par ai=xi+1-xi
• La densité di définie par ni/ai
Critères de position
La fonction de répartition (fonction cumulative)

Relativement à la modalité xi :

La fonction de répartition est définie par

{ F(x) =  fj avec j<x } = somme des modalités inférieures à x.

F est une fonction en escalier nulle sur ] -, x1] et égale à 1 sur [x1, +[

Pour une variable continue, la fonction cumulative relativement à la classe


(ci, ni); est la fonction dont le graphique est une ligne brisée joignant les
points de coordonnées :
(c0, 0), (c1, f1), (c2, f1+f2), .., (ci, fj : i=0 à i), …, (cn, 1).
Critères de position
Mode : C'est la valeur du caractère correspondant à l'effectif
le plus grand. Lorsqu'il s'agit de classe on parle de classe
modale

c’est la valeur du caractère statistique qui apparaît le plus


fréquemment

(Il peut ne pas y avoir de mode, Il peut y avoir plusieurs modes)


Exemples

L’ensemble des nombres 2, 2, 5, 7, 9, 9, 9, 10, 10, 11, 12, 18 a pour


mode : 9
L’ensemble des nombres 3, 5, 8, 10, 12, 15, 16 n'a pas de mode
L’ensemble des nombres 2, 3, 4, 4, 4, 5, 5, 7, 7, 7, 9 a deux modes:
4 et 7
Critères de position
Médiane : C'est la valeur du caractère correspondant à un
effectif cumulé égal à la moitié de l'effectif total.

Le quantile d’ordre 50 % : Il partage la série en deux série de


même taille, noté (Me)

Exemple
Lors de l’interrogation sur 5 points, les résultats de 23 élèves ont été :
1 ; 2 ; 4 ; 5 ; 2 ; 3 ; 5 ; 5 ; 2 ; 1 ; 5 ; 2 ; 2 ; 1 ; 4 ; 2 ; 5 ; 2 ; 2 ; 3 ; 5 ; 2 et 4

9+3=12

La médiane est donc la note du 12ème élève, c’est-à-dire 2


Critères de position
Moyenne : C'est le nombre noté x ou parfois E(x) défini par :
𝑚
  1 𝑛1 𝑥 1 +𝑛2 𝑥 2 +…+𝑛 𝑚 𝑥 𝑚
´𝑥 = ∑ 𝑛𝑖 𝑥 𝑖=
𝑛 𝑖=1 𝑛

Lorsqu'il s'agit de classe on remplace les valeurs xi par les valeurs ci


correspondant aux centres des classes.

Propriétés

E(X + b) = E(X ) + b Changement par translation (chgt. d’origine)


E(aX) = a E(X ) Changement par homothétie (chgt. d’échelle)
E(aX + b) = a E(X ) + b Changement d’origine et d’échelle

Les changements d’origine et d’échelle sont utilisés pour simplifier les


calculs
Critères de position
Exemples
On considère les tailles en cm de 11 personnes. On obtient:

La manière dont les données


sont regroupées influe sur la
moyenne…

On peut présenter les données


de plusieurs manières
différentes…
Critères de position
Quartiles :
Les 3 quartiles partagent la série en quatre séries de même
taille :
• 25% des observations sont inférieures au 1er quartile Q25
• 50% des observations sont inférieures au 2ème quartile Q50
• 75% des observations sont inférieures au 3ème quartile Q75

Exemple Donner les quartiles correspondant à cette série:


6, 47, 49, 15, 43, 41, 7, 39, 43, 41, 36.

Si on ordonne les données dans l’ordre croissant, on a :


6, 7, 15, 36, 39, 41, 41, 43, 43, 47, 49.

Donc Quartile supérieur Q75 =43 et Quartile inférieur Q25 =15.


Critères de dispersion
Etendue : différence entre la valeur maximum et la valeur
minimum du caractère.

Etendue interquartile: différence entre le troisième quartile


Q75 et le premier quartile Q25

Variance : moyenne des carrés des écarts à la moyenne


𝑚 𝑚
  1   1
𝑉 ( 𝑋 ) = ∑ 𝑛𝑖 ( 𝑥𝑖 − ´𝑥 )2 ou 𝑉 ( 𝑋 ) = ∑ 𝑛𝑖 𝑥2𝑖 − ´𝑥 2
𝑛 𝑖=0 𝑛 𝑖=0
Ecart type : L'écart type d'une série statistique est la racine
carrée de la variance : 𝜎  ( 𝑋 ) =√ 𝑉 ( 𝑋 )
Plus l’écart type est grand, plus la dispersion autour de la moyenne est importante

Propriétés V (X + b) = V (X ) Changement par translation.


V (aX ) = a2V (X ) Changement par homothétie
Critères de dispersion
L'écart type est toujours positif ou nul :

 Il est nul si la série statistique est constante.

 comme la moyenne, l'écart type est sensible aux valeurs


extrêmes ou aberrantes et il est parfois nécessaire
d'éliminer ces valeurs avant de faire le calcul de l'écart type.

Si m est la moyenne, σ l'écart-type, alors :

  68 % des données se situent ] m-σ ; m+σ [


  95 % des données se situent ] m-2σ ; m+2σ [
  99 % des données se situent ] m-3σ ; m+3σ [
Critères de dispersion
Exemple

Calculer l’écart type de la série 8,8,12,12

𝑚 𝑚
  1 2   1 2 2
𝑉 ( 𝑋 ) = ∑ 𝑛𝑖 ( 𝑥𝑖 − ´𝑥 ) 𝑉 ( 𝑋 ) = ∑ 𝑛𝑖 𝑥𝑖 − ´𝑥
𝑛 𝑖=0 𝑛 𝑖=0

xi 8 12
Moyenne de la série x = (8+8+12+12)/4 = 10
ni 2 2

2 2
 𝑉 ( 𝑋 ) = 2 ( 8 − 10 ) +2 ( 12− 10 ) =4   =2
4
Exercices
• Répartition des effectifs par année d’ancienneté

Nombre d’années
1 2 3 4 5 6 7 8 9 10
d’ancienneté
Effectifs 3 4 4 1 3 3 1 1 3 2

• Durées en min des achats de 2500 consommateurs


Classes
(intervalle [15,5 ; 20,5[ [20,5 ; 25,5[ [25,5 ; 30,5[ [30,5 ; 35,5[ [25,5 ; 30,5]
des durées)
Effectifs 200 500 1000 600 200

Mode(s), moyenne, médiane, variance, écart-type ?


Statistiques
I. Séries à une variable

I.1. Généralités
But
Terminologie

I.2. Grandeurs caractéristiques d’une série statistique


Caractéristiques de position
Caractéristiques de dispersion

I.3. Mise en forme des données

II. Séries à deux variables


Série à une variable
I.3. Mise en forme des données

En statistique, les données sont présentées sous forme de


tableaux de valeurs et de graphiques

 Diagramme en bâton ( discret ) ou histogramme ( continu )

 Polygone des effectifs : lignes brisées joignant les points


de coordonnées (xi, ni).
 Polygone des fréquences cumulées

 Courbe cumulative des effectifs : C'est la représentation


de la fonction de répartition.
Mise en forme des données
Variable discrète ni

Diagramme en bâtons
on trace un segment proportionnel à
ni, à partir du point d’abscisse xi

Polygones

Variable continue

Histogramme
bande rectangulaire ayant la largeur de
chaque classe et la hauteur proportionnelle
à l’effectif de la classe.
Rq: Dans le cas d’intervalle de largeurs
différentes, la hauteur sera proportionnelle
à la densité (di=ni/ai=ni/(xi+1-xi) )
Mise en forme des données
Courbe cumulative croissante

C'est le tracé de la fonction N qui à tout x


associe N ( x ) = nbre d'observations  x.
Il s'obtient au moyen des effectifs cumulés Variable discrète
croissants.

Cas discret : fct. en escalier,


Cas continu : fct. continue, affine par morceaux.

Si on raisonne en fréquences (au lieu


d'effectifs), on a le tracé de la fonction de
répartition F ( x ) = proportion d'observations  x

Variable continue
Mise en forme des données
Courbe cumulative décroissante
C'est le tracé de la fonction N' qui à tout x associe N' ( x ) = nombre
d'observations  x. Il s'obtient au moyen des effectifs cumulés décroissants.

Variable continue

Variable discrète
Statistiques
I. Séries à une variable

I.1. Généralités
But
Terminologie
Mises en forme des données

I.2. Grandeurs caractéristiques d’une série statistique


Caractéristiques de position
Caractéristiques de dispersion

II. Séries à deux variables

Ajustement linéaire, droite de régression, corrélation


Série à deux variables
Soit une population d'effectif n,
si on étudie deux caractères X et Y de cette population,
on dit que l'on étudie une série statistique double

Exemple

1. Quelle est le pourcentage de


femmes blondes parmi la
population? X x1 x2
y1 y2
2. Quel est le pourcentage de Y
femmes qui sont blondes ?
Effectif n

Les résultats peuvent être présentés sous forme de données groupées


ou sous forme de données non groupées.
Série à deux variables
Données non groupées

Données groupées
Regrouper les données en classes de largeur Nuage de points
2 et affecter à chaque classe la valeur
centrale de l'intervalle.
Série à deux variables
Toute série statistique à 2 variables peut être donnée sous 2 formes de
tableaux d’effectifs.

 Tableau de données ponctuelle

 Tableau à double entrée : lorsqu’un certain nombre d’observations


sont identiques, on peut utiliser les tableaux à double entrée.

Exemple
Une usine produit des bobines Teneur en carbone (%) xi 0,6 0,61 0,62 0,64 0,65
de fil d’acier, une étude sur la
Charge de rupture (kg) yi 65 70 70 75 75
charge du rupture de l’acier en
fonction de sa teneur en
carbone a donné les résultats
yi / xi 0,60 0,61 0,62 0,64 0,65
suivants :
65 X
70 X X
75 X X
Série à deux variables
II.1 Ajustement linéaire

Dans certains cas le nuage de point semble donner un ensemble de points


presque alignés

faire un ajustement linéaire c'est trouver une droite d'équation


y = a.X + b qui permet de représenter cette série

a.X+b

X
Série à deux variables
Méthode de la règle
On trace au jugé une droite D passant au plus prés possible
des points en s’efforçant d’équilibrer le nombre de points au
dessus et au dessous de la droite.

Y
a.x+b

X
Série à deux variables
Méthode de Mayer :
On partage le nuage en deux nuages de même effectif (à une
unité près).
On cherche pour chacun leur point moyen notés
respectivement G1 et G2 .
La droite (G1G2) est la droite d'ajustement selon la méthode
de Mayer.
Y
G2
a.x+b

G1

X
Série à deux variables
II.2 Droite de régression : Méthode des moindres carrées

On cherche une droite telle que,


si on projette les points Mi sur
cette droite parallèlement à oy,

On obtient des points P, tels


que : soit
minimale

Cette droite est appelée droite de régression de Y en X notée DY/X

Elle a pour équation : avec


Série à deux variables
II.2 Droite de régression : Méthode des moindres carrées

De même, la droite de
régression de X en Y notée DX/Y
A pour équation

  𝜎 2𝑦
𝑦= ( 𝑥 − 𝑥´ ) + ´𝑦
𝑐𝑜𝑣 ( 𝑥 , 𝑦 )

avec Ou encore
Série à deux variables
II.3 Corrélation linéaire
On appelle covariance des variables X et Y le réel

Moyenne des produits moins le


produit des moyennes

Ce nombre est : positif si X et Y ont tendance à varier dans le même sens,


négatif si elles ont tendance à varier en sens contraire.

Les coefficients directeurs des droites de régression s’écrivent :

Pour comparer les directions des deux droites de régression on est


amené à comparer leurs coefficients directeurs m et m' .
Série à deux variables
2
m   xy 
r 
2
 
m'  x . y 

La quantité s'appelle le coefficient de corrélation linéaire


des variables X et Y de la série statistique double.

Les droites seront alors d'autant plus proches l'une de l'autre que le
rapport r sera proche de 1.

On a : –1  r  1

Le nuage de pts est une droite si et seulement si :


r = 1 (droite ascendante)
ou r = -1 (droite descendante)
Série à deux variables

Y r0 Y r>0 Y r<0

X X X
Corrélation nulle Corrélation positive Corrélation négative
Si x alors y  Si x alors y

0  r²  3/4 3/4  r²  1 I r I =1
Y Y Y

X X X
Faible corrélation Forte corrélation Corrélation parfaite
Probabilités
I. Introduction

I.1. Opérations et événements


I.2. Probabilités sur un ensemble fini (Notions)
Définition
Conséquences
Equiprobabilité
Dénombrement : Arrangements, combinaisons
I.3. Probabilité conditionnelle
Probabilités
II. Variables aléatoires – Lois de probabilités
II.1. Variables aléatoire
Notions (discrète finie, discrète infinie, continue)

II.2. Espérance mathématique, variance, écart type

II.3. Loi de probabilité discrètes


Lois discrètes finies
Lois discrètes non finies

II.4. Loi de probabilité de variables aléatoires continues

III. Echantillonnage – Estimation d’une population


Introduction
Terminologie de probabilité Exemples

Expérience aléatoire : résultat dépend du hasard

Eventualités (possibilités) : résultats possible 1, 2, 3, 4, 5 ou 6

Univers  : ensemble des éventualités  = {1, 2, 3, 4, 5, 6}

Un événement est une partie de  {1, 3, 5}

Un événement élémentaire : partie contenant 1 seule éventualité {6}

Un événement certain : partie égale à  A=

Un événement impossible : ensemble Ф A=Ф


Opérations et évènements
Exemple
Soit l’univers  = {1, 2, 3, 4, 5, 6}

Evénement contraire de A (A) : contient toutes les Si A = {1, 3, 5}


éventualités qui ne sont pas dans A A = {2, 4, 6}

Réunion de 2 évènements (AB ou A+B) : A ={1, 3, 5}, B={1, 2, 3, 4}


éventualités contenant toutes celles de A et de B AB = {1,2, 3, 4, 5}

L’intersection de 2 évènements (AB ou AB) : A ={1, 3, 5}, B={1, 2, 3, 4}


éventualités communes à A et à B A  B = {1, 3}

A ={2, 3, 4}, B={6}


Si AB = Ф on a alors des évènements incompatibles AB=Ф
Probabilités
I. Introduction

I.1. Opérations et événements

I.2. Probabilités sur un ensemble fini (notions)


Définition
Conséquences
Equiprobabilité
Dénombrement : Arrangements, combinaisons

I.3. Probabilité conditionnelle


Probabilités sur un ensemble fini
Définition

Soit :  un univers fini et P() ensemble des parties de 


Dans une épreuve, on appelle probabilité définie sur , toute
application P de P() dans 0, 1 vérifiant :
 P () = 1

 Si A et B sont 2 événements incompatibles AB=Ф

P (AB) = P(A) + P(B)

P (A) : possibilité pour que A se réalise


Probabilités sur un ensemble fini
Exemple

On reprend l’expérience du lancé de dé

{1}, {2}, ..., {6} sont les évenements élémentaires

Si le dé est équilibré, chaque événement à une probabilité égale à 1/6

P ({1}) = P ({2}) = ... = P ({6}) = 1/6

On a P ({1, 2}) = 1/6 + 1/6 = 1/3

On a P ({3, 4, 5}) = 1/6 + 1/6 + 1/6 = 1/2

On a P ({1, 2, 3, 4, 5, 6}) = 1/6 + 1/6 + 1/6 + 1/6 + 1/6 + 1/6 = 1

On construit ainsi une application de l’ensemble des parties de 


Probabilités sur un ensemble fini
Conséquences

A et B deux événements quelconques


0  P( A)  1
P ( A)  1  P ( A)
P ( )  0
P ( )  1
A, B P( A  B)  P ( A)  P ( B )  P ( A  B )

Si A et B deux événements incompatibles

 A  B    P( A  B)  0
 P ( A  B )  P ( A)  P( B)
Probabilités sur un ensemble fini
Equiprobabilité
C’est le cas où tous les événements ont la même probabilité
 Pour tout événement A :

nbre d ' élts de A nbre de cas favorables à A


P( A)  
nbre d ' élts de  nbre de cas possibles

Exemple On reprend l’expérience du lancé de dé

{1}, {2}, ..., {6} sont les évenements élémentaires

Si le dé est équilibré, chaque événement à une probabilité égale à 1/6

P ({1}) = P ({2}) = ... = P ({6}) = 1/6 On dit qu’il y a equiprobabilité


Probabilités sur un ensemble fini
Dénombrements : Arrangements, combinaisons

Factorielle
Le factorielle n, noté n!, est le nombre obtenu par le produit
de tous les nombres entiers de 1, ..., n

n
n! 1 2  3  ...  (n  1)  n   m
m 1

Arrangements

 Arrangements avec répétition


 Arrangements sans répétition
Probabilités sur un ensemble fini
Arrangements sans répétition Soit E un ensemble de n éléments

Soit p  n ; un arrangement sans répétition de p éléments pris parmi n


est un sous ensemble ordonné de E ayant p éléments

Le nombre total de ces arrangements est :


n!
A  n.(n  1).( n  2)...( n  p  1) 
n
p

(n  p )!

Arrangements avec répétitions


Un arrangement avec répétitions de p éléments choisis parmi n est une
liste ordonnée avec répétition éventuelles des éléments.

p
Le nombre d’arrangements avec répétition est : n
Probabilités sur un ensemble fini
Exemple

Un logiciel propose de créer un mot de passe de 4 lettres distinctes (alphabet latin


majuscule)

Combien de tels mots de passe pouvez-vous créer ?

Il s’agit de choisir 4 lettres distinctes, dans un ordre précis, parmi 26 lettres (tirage
sans remise, ordonné : pour un mot de passe, l’ordre est nécessaire)

26!
Il y a donc A 
4
26  358 800 possibilités
(26  4)!

Si l’on s’autorise la répétition des lettres (tirage avec remise, ordonné), on obtient:

26 4  456 976 possibilités


Probabilités sur un ensemble fini
Permutations
On réalise une permutation si on écrit tous les éléments de l’ensemble
dans un ordre déterminé.

Le nombre de permutations de n éléments est n!

Exemple

Soit un ensemble E = {a, b, c}. On peut écrire tous les triplets obtenus à
l’aide des éléments de E

(a, b, c), (a, c, b), (b, a, c), (b, c, a), (c, a, b) et (c, b, a)

(a, c, b) est une permutation des éléments de E

Le nombre de permutation de E = 3! = 3x2x1=6


Probabilités sur un ensemble fini
Combinaisons
On réalise une combinaison de p éléments parmi n si on les choisit dans
un ordre indifférent.
Le nombre de combinaisons à p élément parmi n est

n!
C 
n
p

p!(n  p )!

Exemple

Une grille de loto comporte 49 numéros différents de 1 à 49.


Combien y a-t-il de grilles possibles avec 6 numéros ?

Une combinaison de 6 éléments choisis 49!


parmi 49 est un sous-ensemble de E
6
C49   13 983 816
(ensemble de 49 élts) ayant 6 éléments
6!(49  6)!
Probabilités sur un ensemble fini
Propriétés des combinaisons

Formule du binôme de Newton

Le développement de (a+b)n est donnée par la formule du binôme de


Newton.
n
(a  b)   Cnp .a p .b n  p  a n  Cn1 .a n 1.b  Cn2 .a n  2 .b 2  ...  Cnn .b n
n
nN
p 0

Les Cnp s’appellent coefficients binomiaux


Probabilités sur un ensemble fini
Probabilité conditionnelle

On appelle probabilité conditionnelle de l’événement B conditionnée


par l’événement A, la probabilité notée PA(B)

Si P(A)  0 P( A  B)
PA ( B) 
P ( A) PA(B) : probabilité de B sachant A

Si P(A)  0 et P(B)  0

 P( A  B)  PA ( B).P( A)  PB ( A).P( B )

P( B)  P( A).PA ( B )  P( A).PA ( B) Formule de probabilité totale

2 événements sont indépendants ssi : P( A  B)  P( A).P( B)


Probabilités sur un ensemble fini
Généralisation : Formule de BAYES

Soit Ai (i=1 à n) = système complet d’événements tel que :


i P (Ai)  0
P ( Ai ).PAi ( B)
alors PB ( Ai )  n

 P ( A ).P( A )
j 1
B j j
Probabilités
II. Variables aléatoires – Lois de probabilités
II.1. Variables aléatoire
Notions (discrète finie, discrète infinie, continue)

II.2. Espérance mathématique, variance, écart type

II.3. Loi de probabilité discrètes


Lois discrètes finies
Lois discrètes non finies

II.4. Loi de probabilité de variables aléatoires continues

III. Echantillonnage – Estimation d’une population


Variable aléatoire – loi de probabilité
Définition

On appelle variable aléatoire (v.a.) toute fonction X de l’univers dans R


qui, à tout élément de l’univers fait correspondre un nombre réel x.

On notera X(univers) l'ensemble des valeurs prises par la v.a. X.

Une variable aléatoire est caractérisée par l'ensemble des valeurs


qu'elle peut prendre et par l'expression mathématique de la probabilité
de ces valeurs.

Cette expression s'appelle la loi de probabilité


(ou distribution de probabilité) de la variable aléatoire.
Variable aléatoire – loi de probabilité
Il existe plusieurs types de valeurs que peut prendre une
variable aléatoire :

Variable aléatoire discrète : elle ne prend que des valeurs


discontinues dans un intervalle donné (borné ou non borné).

Si l’intervalle est bornée, la variable aléatoire est finie sinon


elle est infinie

Exemple : L'ensemble des nombres entiers est discret.

En règle générale, toutes les variables qui résultent d'un


dénombrement ou d'une numération sont discrètes.
Variable aléatoire – loi de probabilité

Variable aléatoire discrète Manipulation de lancé de dé

V.A. discrète finie V.A. discrète infinie

 2 lancés successifs  X : nbres de coups qu’il faut jouer


pour obtenir un 6

 n1 et n2 : nombres obtenus pour


chaque lancé
 X : V.A. discrète qui peut prendre
comme valeur l’ensemble des entiers
 X = n1 + n2 : nombres obtenus naturels N : c’est une V.A. discrète
pour chaque lancé infinie

 X peut prendre un nombre fini de  Le nombre de coups est infini


valeurs  {2, 3, ..., 12}
Variable aléatoire – loi de probabilité
Définition
La loi de probabilité d'une variable aléatoire discrète est entièrement
déterminée par les probabilités Pi des évènements {X = xi}, xi parcourant
l'univers.
La loi de probabilité est donnée par les (xi, Pi)
Exemple : lancé successif d’un dé

xi 1 2 3 4 5 6 7 8 9 10 11 12
P(X=xi) 0 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36

On appelle fonction de répartition F de la V. A. X


i

F ( x)  P( X  x) avec xi  x  xi 1 F ( x)   P( X  x j )
j 1

x  xn F ( x)   Pi  1
i 1
Variable aléatoire – loi de probabilité

Étant donnée une v.a. discrète X prenant les valeurs x1, x2,…,xn avec les
probabilités respectives P1, P2,…,Pn.

L'espérance mathématique de X est le nombre réel noté E(X) défini


par : n
E ( X )   xi .Pi  x1 P1  x2 P2  ...  xn Pn
i 1

La variance de la v.a. X est le nombre réel noté V(X) et défini par

V ( X )  E ( X ²)  ( E ( X ))²

L'écart type d'une v.a. X est le réel positif noté défini par :

 (X )  V (X )
Variable aléatoire – loi de probabilité
Variable aléatoire continue

Une variable aléatoire est continue si elle peut prendre toutes les valeurs
dans un intervalle donné (borné ou non borné).

En règle générale, toutes les variables qui résultent d'une mesure sont de type
continu

Pour une V. A. continue, la probabilité associée à l'évènement {X = a} est nulle,


car il est impossible d'observer exactement cette valeur.

On considère alors la probabilité que la V. A. X prenne des valeurs


comprises dans un intervalle [x1, x2] tel que P(x1 ≤ X ≤ x2)

On a alors par exemple P(a  X  b)  F (b)  F (a )


Variable aléatoire – loi de probabilité
Définition
On appelle densité de probabilité de la V. A. X toute fonction f définie sur R
vérifiant :
 x f ( x)  0
b
  P ( a  X  b)   f ( x) dx  F (b)  F (a )
 
f ( x ) dx  1 a

On appelle fonction de répartition la fonction F, définie sur R, par :


x
F ( x)   f (t )dt


f(x) F(x) Fonction de répartition


Fonction de P (a< X  b)
densité de 1
probabilité

x x
a b
Variable aléatoire – loi de probabilité
Définition
Étant donnée une v.a. continue X, de densité de probabilité f(x) prenant
des valeurs comprises dans l'intervalle [a,b]

L'espérance mathématique de X est le nombre réel noté E(X) défini


par : b
E ( X )   x. f ( x)dx
a

La variance de la v.a. X est le nombre réel noté V(X) et défini par


b
V ( X )   x ². f ( x)dx  ( E ( X ))²
a

L'écart type d'une v.a. X est le réel positif noté défini par :

 (X )  V (X )
Lois de probabilité
Lois de probabilité discrètes finies

Loi uniforme

X ()   x1 , x2 ,..., xn 

Une variable aléatoire X suit une loi uniforme sur  si :

1
i  1,2,..., n  P ( X  xi )  Pi 
n

Exemple

On lance un dé non pipé et l’on considère la variable aléatoire X égale au


résultat obtenu
Lois de probabilité
Lois de probabilité discrètes finies

Loi de Bernoulli

Une variable aléatoire X suit une loi de Bernoulli sur  si :

X ()   0,1 avec P ( X  1)  p et P ( X  0)  q  1  p

E( X )  p et V ( X )  pq

Exemple

On lance une pièce de monnaie :


(X = 0) correspond à pile
et (X = 1) correspond à face
Lois de probabilité
Lois de probabilité discrètes finies
Loi binomiale

C’est la loi de probabilité d’une série d’épreuves répétées possédant les


propriétés suivantes :

 Chaque épreuve a deux résultats possibles de probabilités p et q=1-p

 Les épreuves répétées sont indépendantes

La variable aléatoire X a pour valeur le nombre de succès à une suite de n


épreuves

X ()   0,1,..., n P( X  i )  Cni p i q n i  Cni p i (1  p ) n i

X suit une loi binômiale B (n,p) de paramètres n et p.


Lois de probabilité
Lois de probabilité discrètes finies
C’est la loi de probabilité d’une série de n épreuves de Bernoulli indépendantes

Dans ce cas, on a :

E ( X )  np et V ( X )  npq  np(1  p )

Exemple

On lance une pièce de monnaie : X est égale au nombre de « piles »


obtenus au cours de n lancers indépendants d’une pièce
Lois de probabilité
Lois de probabilité discrètes infinies

Loi géométrique

Soit p  ]0, 1[, avec p réel. q = 1-p

X suit une loi de probabilité géométrique si

X ()   i    P( X  i )  p q i  p (1  p ) i

q 1 p q (1  p )
E( X )   et V (X )  
p p p² p²

Exemple

On lance une pièce de monnaie : X est égale au nbre de piles obtenus avant
l’apparition du premier face
Lois de probabilité
Lois de probabilité discrètes infinies
Loi de Poisson

La loi de Poisson relative à la variable aléatoire X est telle que :

X ()   i
  *
i    P ( X  i )  e  .
i!

 : paramètre de la loi de poisson P()


E( X )   et V (X )  

Exemple

La loi de Poisson est généralement utilisée lorsque l’étude porte sur un


phénomène rare : panne de machine, sinistre ….
Lois de probabilité
Lois de probabilité discrètes infinies

Lien entre loi Binomiale et loi de Poisson

n est grand On peut approximer la loi binomiale B (n,p)


Si
p voisin de 0 par la loi de Poisson P() avec  = n.p
n.p pas trop grand

On admet que n i  i
P( X  i)  C p q
i
n
i
e .
i!

En général, cette approximation est utilisée lorsque :

p  0,1 ; n  30 et n.p  15 ou p  0,1 ; n  50 et n.p  10


Lois de probabilité
Lois de probabilité continues
Loi uniforme a, b 

On appelle variable uniforme sur [a, b], une variable aléatoire continue dont la
fonction de densité de probabilité est :

1
f ( x)  x   a, b ab (b  a ) 2
ba E( X )  et V (X ) 
f ( x)  0 x   a, b 2 12

f(x)
Fonction de densité F(x) Fonction de répartition

a b a b
Lois de probabilité
Lois de probabilité continues
Loi normale ou loi de Laplace - Gauss

Loi utilisée généralement à une variable aléatoire continue dépendante de


nombreux facteurs indépendants dont les effets s’additionnent et dont aucune n'est
prépondérante.

Une variable aléatoire continue X est distribuée selon une loi normale N (m,s²)
si sa densité de probabilité est :

où m est la moyenne de X
σ est l'écart-type de X

E( X )  m et V (X )   2
Lois de probabilité
Lois de probabilité continues

Points d’inflexions

m- m+

La cloche de Gauss
Lois de probabilité
Lois de probabilité continues

Pour les calculs, on effectue généralement le changement de variable :

(X - m) t a pour moyenne 0,
t et pour écart-type 1

La loi de distribution de t est alors

Cette loi est notée N(m=0, =1) et dite loi normale centrés réduite

t x
1 2
Sa fonction de répartition est :  (t )  
 2
.e .dx

La lecture de cette fonction se fait grâce à une table


Lois de probabilité
Lois de probabilité continues
t
1  2x f(t)
 (t )  
 2
.e .dx
b
P(a  T  b)   f (t ).dt  (b)   (a )
a

a b t
f(t)
On utilise également la fonction (t)
F (t ) = P (t ) - 0,5

t
P(T  t )   f (t ).dt  (t )  0,5  (t )


t
Lois de probabilité
Lois de probabilité continues
Lois de probabilité
Lois de probabilité continues

Approximation d’une loi Binomiale par une loi normale

n est grand n 0
Si
p ni proche de 0 et ni proche de 1 tel que np(1-p) >10

On peut approximer la loi binomiale B (n,p) par la loi normale N(m, )

Où m  n. p et  ( X )  n. p.(1  p)

1  k m  2
1  
2  

On admet que P( X  k )  .e
 2
Probabilités
II. Variables aléatoires – Lois de probabilités
II.1. Variables aléatoire
Notions (discrète finie, discrète infinie, continue)
II.2. Espérance mathématique, variance, écart type

II.3. Lois de probabilités discrètes


Lois discrètes finies
Lois discrètes non finies

II.4. Lois de probabilités de variables aléatoires continues

III. Echantillonnage – Estimation d’une population


Echantillonnage - Estimation

Population mère
La théorie de l’échantillonnage consiste à
déterminer des propriétés sur des échantillons {I1, I2, ..., IN}
prélevés dans une population dont on connaît déjà
X caractères
des propriétés.
Xi variables aléatoires

m, 
Estimation est le problème inverse de
Echantillon
l’échantillonnage, c’est à dire connaissant des
renseignements sur un on plusieurs échantillons, on Xe
cherche à en déduire des informations sur la
population totale. Pour un échantillon i :

xi ,  i
Echantillonnage - Estimation
Loi d’échantillonnage

L’effectif de la population étudiée est N, sa moyenne m et son écart type .

On prélève un échantillon aléatoire de taille n (tirage avec remise)

Soit X la V.A. qui à tout échantillon, associe la moyenne de cet échantillon


Pour n assez grand, X suit approximativement N (m, )
n

 n
Si les tirages sont sans remise (exhaustifs) X  N (m, 1 )
n N
Echantillonnage - Estimation
Estimation
Échantillon prélevé au hasard dans la
Estimation ponctuelle population
n : son effectif
e² : sa variance
Moyenne

On choisit Xe d’1 échantillon prélevé au hasard comme estimation de la


moyenne de la population

Variance – écart type

n
On choisit . e2 comme estimation de la variance ² de la
n 1 population

e n
Ecart type  . 1
n N
Echantillonnage - Estimation
Estimation par intervalle de confiance

On commence par :

 Fixer un coefficient de confiance (95, 99 %, …)

 Chercher un intervalle de confiance de la moyenne pour ce coefficient :

Trouver un intervalle [a, b] tel que l’on soit sûr à 95%


(ou 99%, …) que la moyenne est dans cet intervalle


Pour n  30 la distribution d’échantillonnage N (m, )
n
n
Donc la variable aléatoire T  .( X e  m) N (0, 1)

Alors si t  0, p(t  T  t )  2 (t )  1
Echantillonnage - Estimation
donc, lorsqu’on prélève un échantillon de taille n, il y a 95% de chance que sa
moyenne soit dans l’intervalle :

   
 m  1,96 ; m  1,96 
 n n

 
On peut aussi écrire : X e  1,96  m  X e  1,96
n n

Donc après avoir prélevé un échantillon de taille n, on peut estimer qu’il y’a 95%
de chances que la moyenne de la population soit dans l’intervalle

   
X e  1,96 ; X e  1,96
 
 n n

   
Cas général : p X e  t  m  X e  t   1 avec   2 (t )
 n n 

Vous aimerez peut-être aussi