Académique Documents
Professionnel Documents
Culture Documents
Statistique descriptive
1 Probabilités
2 Statistique descriptive
1 Probabilités
2 Statistique descriptive
Expérience aléatoire
Une expérience aléatoire est répétée plusieurs fois. L’ensemble des
résultats obtenus est appelé l’espace échantillon noté Ω. L’espace
échantillon peut être discret ou continu.
Evénement
Un événement est un ensemble de résultats, il est un sous-ensemble
de Ω.
Définition
Soient A et B deux événements. On dit que A et B sont incompatibles
si et seulement si A ∩ B = ∅
Définition
On dit que P est une probabilité sur Ω si :
∀A ⊂ Ω 0 ≤ P(A) ≤ 1.
P(Ω) = 1.
n
S
Si P = Ai et les Ai sont incompatibles alors :
i=1
n
X
P(A) = P(Ai ).
i=1
P(A) = 1 − P(A0 )
P(∅) = 0
Si A ⊂ B, alors P(A) ≤ P(B).
Si A et B sont deux événements pas incompatibles, alors :
Fréquence relative
On appelle fréquence d’un résultat k le nombre de fois que ce résultat
est obtenu, on le note Nk .
Supposons que l’expérience aléatoire est répétée n fois, alors la
fréquence relative est définie par :
Nk
fk (n) =
n
Probabilité conditionnelle
La probabilité conditionnelle de l’événement A sachant B est définie
par :
P(A ∩ B)
P(A|B) = , P(B) 6= 0
P(B)
Définition
Soient A et B deux événements tels que P(A)P(B) > O. On dit que A
et B sont indépendants si et seulement si :
Formule de Bayes
On a :
P(A|B)P(B)
P(B|A) = , P(A)P(B) > 0
P(A)
n!
Cnk =
k !(n − k )!
n!
Akn =
(n − k )!
1 Probabilités
2 Statistique descriptive
On appelle :
Population : un ensemble homogène auquel on s’intéresse, par
exemple les étudiants d’une classe, les habitants d’une ville...
Individus : les éléments d’une population.
variable statistique : série d’observations concernant un thème
précis sur les individus d’une population, par exemple notes
d’examens de mathématiques des étudiants, les intentions de
vote des habitants d’une ville...
pM = fm × 100
Le mode
Le mode est la valeur de la variable pour laquelle l’effectif est le plus
grand. Il est utilisé dans le cas d’une variable quantitative discrète.
La classe modale
Dans le cas d’une variable quantitative continue ou discrète classée,
on parle classe modale qui est la classe pour laquelle la fréquence est
la plus élevée.
Fréquence cumulée
La fréquence cumulée de la i ème classe est
i
Ni X
Fi = = fk
N
k =1
Fonction de répartition
La fonction de répartition, appelée aussi fonction cumulative, notée
F (t) est égale le pourcentage des individus pour lesquelles on a
observé une valeur de la variable X plus petite ou égale à t.
Propriétés
La fonction de répartition est croissante.
∀x ≤ xO F (x) = 0.
∀x ≥ xp F (x) = 1.
F (Me) = 50%.
Quantile
Le quantile d’ordre α, 0 ≤ α ≤ 1 d’une variable quantitative X , est la
valeur xα qui divise la population en deux sous-populations dont les
effectifs respectifs sont égaux à α et 1 − α de la population initiale :
F (xα ) = α
Quartile
Les quartiles sont les trois quantiles Q1 = x0,25 , Q2 = x0,5 et
Q3 = x0,75 .
On remarque que la médiane est le quartile Q2 .
L’étendue
L’étendue eX de la variable quantitative discrète X est :
eX = max xi − min xi
1≤i≤N 1≤i≤N
Variance
La variance de la variable quantitative X , notée Var (X ) est définie
par :
N
1X
Var (X ) = (xi − x̄)2
N
i=1
Formule de Huygens
On peut montrer que :
N K
! !
1X 2 X
Var (X ) = xi − (x̄)2 = fi xi2 − (x̄)2
N
i=1 i=1
L’écart-type
On définit l’écart-type de la variable X , noté σX , par :
p
σX = Var (X )
Covariance
La covariance de X et Y est définie par :
N
!
1X
cov (X , Y ) = xi yi − x̄ ȳ
N
i=1
Remarque
cov (X , X ) = Var (X )
Inégalité de Cauchy-Schwarz
On a :
|cov (X , Y )| ≤ σx σy
Coefficient de corrélation
Le coefficient de corrélation linéaire de deux variables X et Y , noté
R(X , Y ), est défini par :
cov (X , Y )
R(X , Y ) =
σx σy