Vous êtes sur la page 1sur 33

Probabilité et Statistiques

Statistique descriptive

Mohamed Zeriab Essadek


ENSAM - Rabat.
Plan de la présentation

1 Probabilités

2 Statistique descriptive

Essadek Proba-Stat ENSAMR 2 / 33


Grandes lignes

1 Probabilités

2 Statistique descriptive

Essadek Proba-Stat ENSAMR 3 / 33


Définitions

Expérience aléatoire
Une expérience aléatoire est répétée plusieurs fois. L’ensemble des
résultats obtenus est appelé l’espace échantillon noté Ω. L’espace
échantillon peut être discret ou continu.

Evénement
Un événement est un ensemble de résultats, il est un sous-ensemble
de Ω.

Essadek Proba-Stat ENSAMR 4 / 33


Définitions

Définition
Soient A et B deux événements. On dit que A et B sont incompatibles
si et seulement si A ∩ B = ∅

Définition
On dit que P est une probabilité sur Ω si :
∀A ⊂ Ω 0 ≤ P(A) ≤ 1.
P(Ω) = 1.
n
S
Si P = Ai et les Ai sont incompatibles alors :
i=1

n
X
P(A) = P(Ai ).
i=1

Essadek Proba-Stat ENSAMR 5 / 33


Propriétés

Soit A un événement et A0 son complémentaire, alors :

P(A) = 1 − P(A0 )

P(∅) = 0
Si A ⊂ B, alors P(A) ≤ P(B).
Si A et B sont deux événements pas incompatibles, alors :

P(A ∪ B) = P(A) + P(B) − P(A ∩ B)

Essadek Proba-Stat ENSAMR 6 / 33


Propriétés

Fréquence relative
On appelle fréquence d’un résultat k le nombre de fois que ce résultat
est obtenu, on le note Nk .
Supposons que l’expérience aléatoire est répétée n fois, alors la
fréquence relative est définie par :

Nk
fk (n) =
n

Essadek Proba-Stat ENSAMR 7 / 33


Propriétés

Probabilité conditionnelle
La probabilité conditionnelle de l’événement A sachant B est définie
par :
P(A ∩ B)
P(A|B) = , P(B) 6= 0
P(B)

Définition
Soient A et B deux événements tels que P(A)P(B) > O. On dit que A
et B sont indépendants si et seulement si :

P(A|B) = P(A) ou P(B|A) = P(B)

Essadek Proba-Stat ENSAMR 8 / 33


Propriétés

Il en résulte que A et B sont indépendants si et seulement si


P(A ∩ B) = P(A)P(B).
D’une manière plus général, les événements A1 , . . . , An sont
indépendants si et seulement si :
n
\ n
Y
P( Ai ) = P(Ai )
i=1 i=1

Formule de Bayes
On a :
P(A|B)P(B)
P(B|A) = , P(A)P(B) > 0
P(A)

Essadek Proba-Stat ENSAMR 9 / 33


Propriétés

Le nombre d’applications d’un ensemble à p éléments dans un


ensemble à n éléments est np .
Le nombre de permutations de n objets est n!.
Le nombre de sous-ensembles de k objets choisis dans un
ensemble à n éléments et l’ordre n’est pas important est :

n!
Cnk =
k !(n − k )!

Si l’ordre est important, alors le nombre de sous-ensembles de k


objets choisis dans un ensemble à n éléments est :

n!
Akn =
(n − k )!

Essadek Proba-Stat ENSAMR 10 / 33


Grandes lignes

1 Probabilités

2 Statistique descriptive

Essadek Proba-Stat ENSAMR 11 / 33


Introduction

On appelle :
Population : un ensemble homogène auquel on s’intéresse, par
exemple les étudiants d’une classe, les habitants d’une ville...
Individus : les éléments d’une population.
variable statistique : série d’observations concernant un thème
précis sur les individus d’une population, par exemple notes
d’examens de mathématiques des étudiants, les intentions de
vote des habitants d’une ville...

Essadek Proba-Stat ENSAMR 12 / 33


Introduction

Les types de variables statistiques sont :


quantitatives : la variable est mesurée par un nombre (par
exemple les notes de examens de mathématiques des étudiants,
le chiffre d’affaire d’une société), elle est ou bien bien discrète ou
bien continue.
qualitatives : la variable statistique est désignée par des noms,
par exemple le sexe, la couleur des cheveux... On peut distinguer
deux types de variables qualitatives :
ordinales : les valeurs de la variable peuvent être classé dans un
ordre, par exemple les mentions de l’année scolaire.
nominales : Les valeurs de la variable ne peuvent pas être classé
dans un ordre, par exemple la couleur des cheveux.

Essadek Proba-Stat ENSAMR 13 / 33


Représentation graphique

Pour un groupe de 8 étudiants, on a relevé les valeurs suivantes :

Etudiant Sexe Couleur des yeux Note


Hicham H V 13
Chahine H B 15
Saloua F N 13
Hamza H M 12
Sana F M 8
Nada F N 8
Chadi H N 10
Youssef H B 2

Essadek Proba-Stat ENSAMR 14 / 33


Représentation graphique
On représente les variables qualitatives par des diagrammes en baton,
prenons comme exemple la couleur des yeux :
Couleur Vert Noir Marron Bleu
Effectif 1 3 2 2

Essadek Proba-Stat ENSAMR 15 / 33


Représentation graphique
On peut aussi représenter les variables qualitatives par un diagramme
en secteurs

Essadek Proba-Stat ENSAMR 16 / 33


Fréquence

La fréquence d’une modalité M d’une variable qualitative est :


Effectif ayant M
fM =
Effectif total
Le pourcentage des individus ayant la modalité M est :

pM = fm × 100

Notons que la somme des fréquences de toutes les modalités est


égale à 1.

Essadek Proba-Stat ENSAMR 17 / 33


Variable quantitative discrète

A chaque valeur k d’une variable quantitative discrète correspond un


effectif nk , la fréquence est donc :
nk
fk =
N
Où N est l’effectif total.
Pour représenter graphiquement une variable quantitative discrète, il
faut créer des classes qui sont des intervalles égales.

Essadek Proba-Stat ENSAMR 18 / 33


Variable quantitative discrète

Note Effectif Fréquence Note Effectif Fréquence


k=0 0 0 11 0 0
1 0 0 12 1 1/8
2 1 1/8 13 2 1/4
3 0 0 14 0 0
4 0 0 15 1 1/8
5 0 0 16 0 0
6 0 0 17 0 0
7 0 0 18 0 0
8 2 1/4 19 0 0
9 0 0 k=20 0 0
10 1 1/8

Essadek Proba-Stat ENSAMR 19 / 33


Variable quantitative discrète

Pour représenter graphiquement une variable quantitative discrète, il


faut créer des classes qui sont des intervalles égales.
Les classes sont aussi utilisées dans le cas des variables quantitatives
continues.

Classe Effectif Fréquence


[0, 4] 1 1/8
]4, 8] 2 1/4
]8, 12] 2 1/4
]12, 16] 3 3/4
]16, 20] 0 0

Essadek Proba-Stat ENSAMR 20 / 33


Variable quantitative discrète

Essadek Proba-Stat ENSAMR 21 / 33


Valeurs centrales

Le mode
Le mode est la valeur de la variable pour laquelle l’effectif est le plus
grand. Il est utilisé dans le cas d’une variable quantitative discrète.

La classe modale
Dans le cas d’une variable quantitative continue ou discrète classée,
on parle classe modale qui est la classe pour laquelle la fréquence est
la plus élevée.

Essadek Proba-Stat ENSAMR 22 / 33


Valeurs centrales
La médiane
La Médiane d’une variable quantitative notée Me est la valeur pour
laquelle le nombre d’effectif plus grand est le même que celui plus
petit.

Soit X une variable quantitative continue ou discrète classée, dont


l’intervalle de variation a été divisé en p classes disjointes
[x0 , x1 ], . . . , ]xn−1 , xp ], pour lesquelles les effectifs sont respectivement
n1 , . . . , np
Effectif cumulé
L’effectif cumulé de la i ème classe est
i
X
Ni = ni
k =1

Essadek Proba-Stat ENSAMR 23 / 33


Valeurs centrales

Fréquence cumulée
La fréquence cumulée de la i ème classe est
i
Ni X
Fi = = fk
N
k =1

Où N est l’effectif total et fk la fréquence de la classe k .

Fonction de répartition
La fonction de répartition, appelée aussi fonction cumulative, notée
F (t) est égale le pourcentage des individus pour lesquelles on a
observé une valeur de la variable X plus petite ou égale à t.

Essadek Proba-Stat ENSAMR 24 / 33


Valeurs centrales

Propriétés
La fonction de répartition est croissante.
∀x ≤ xO F (x) = 0.
∀x ≥ xp F (x) = 1.
F (Me) = 50%.

Quantile
Le quantile d’ordre α, 0 ≤ α ≤ 1 d’une variable quantitative X , est la
valeur xα qui divise la population en deux sous-populations dont les
effectifs respectifs sont égaux à α et 1 − α de la population initiale :

F (xα ) = α

Essadek Proba-Stat ENSAMR 25 / 33


Valeurs centrales

Quartile
Les quartiles sont les trois quantiles Q1 = x0,25 , Q2 = x0,5 et
Q3 = x0,75 .
On remarque que la médiane est le quartile Q2 .

Soit une variable quantitative discrète X , et x1 , . . . , xN les observations


sur X .
Moyenne
La moyenne de X est :
N
1X
x̄ = xi
N
i=1

Essadek Proba-Stat ENSAMR 26 / 33


Valeurs centrales

Soient ni le nombre de fois où la valeur xi est observée, alors on a :


K K
1X X
x̄ = ni xi = fi x i
N
i=1 i=1

Où K est le nombre des valeurs distinctes de X , et fi la fréquence de


de xi .

Essadek Proba-Stat ENSAMR 27 / 33


Indicateurs de dispersion

L’étendue
L’étendue eX de la variable quantitative discrète X est :

eX = max xi − min xi
1≤i≤N 1≤i≤N

Variance
La variance de la variable quantitative X , notée Var (X ) est définie
par :
N
1X
Var (X ) = (xi − x̄)2
N
i=1

Essadek Proba-Stat ENSAMR 28 / 33


Indicateurs de dispersion
Remarque
La variance peut s’écrire sous la forme :
K
X
Var (X ) = fi (xi − x̄)2
i=1

Où K est le nombre des valeurs distinctes de X , et fi la fréquence de


de xi .

Formule de Huygens
On peut montrer que :
N K
! !
1X 2 X
Var (X ) = xi − (x̄)2 = fi xi2 − (x̄)2
N
i=1 i=1

Essadek Proba-Stat ENSAMR 29 / 33


Indicateurs de dispersion

L’écart-type
On définit l’écart-type de la variable X , noté σX , par :
p
σX = Var (X )

L’écart absolu moyen


L’écart absolu moyen de la variable quantitative discrète X est défini
par :
N K
1X X
ex̄ = |xi − x̄| = fi |xi − x̄|
N
i=1 i=1

Où K est le nombre des valeurs distinctes de X , et fi la fréquence de


de xi .

Essadek Proba-Stat ENSAMR 30 / 33


Covariance et corrélation

Considérons une population de N individus, et X et Y deux variables


quantitatives discrètes qui prennent respectivement les valeurs
x1 , . . . , xn et y1 , . . . , yn .

Covariance
La covariance de X et Y est définie par :
N
!
1X
cov (X , Y ) = xi yi − x̄ ȳ
N
i=1

Remarque
cov (X , X ) = Var (X )

Essadek Proba-Stat ENSAMR 31 / 33


Covariance et corrélation

Inégalité de Cauchy-Schwarz
On a :
|cov (X , Y )| ≤ σx σy

Coefficient de corrélation
Le coefficient de corrélation linéaire de deux variables X et Y , noté
R(X , Y ), est défini par :

cov (X , Y )
R(X , Y ) =
σx σy

Essadek Proba-Stat ENSAMR 32 / 33


Covariance et corrélation

Interprétation des coefficients de corrélation


Si R(X , Y ) w 0, il y’a absence de corrélation entre les variables X
et Y .
Si R(X , Y ) w 1, il y’a une corrélation directe entre les variables X
et Y , ce qui veut dire Y augmente lorsque X augmente, et que X
augmente lorsque Y augmente.
Si R(X , Y ) w −1, il y’a une corrélation inverse entre les variables
X et Y , ce qui veut dire Y augmente lorsque X diminue, et que X
augmente lorsque Y diminue.

Essadek Proba-Stat ENSAMR 33 / 33

Vous aimerez peut-être aussi