Académique Documents
Professionnel Documents
Culture Documents
Exemples de populations :
Les véhicules immatriculés en Algérie
La population des entreprises d'un pays
Les salariés d'une usine
Les habitants d'un quartier
Echantillon : C'est un ensemble d'individus prélevés dans une population déterminée (un sous
ensemble de la population)
Caractère : C'est un trait présent chez tous les individus d'une population sur laquelle on effectue
une étude statistique (il est quantitatif ou qualitatif).
Un caractère est dit quantitatif s'il est mesurable.
Un caractère est dit qualitatif s'il est observable sans être mesurable.
Exemples de caractères qualitatifs :
La couleur de la carrosserie d'un véhicule
Le lieu de travail des habitants d'un quartier
La situation des salariés d'une usine
Paramètres de position :
Les paramètres de position (mode, médiane, moyenne … etc) permettent de savoir autour de quelles
valeurs se situent les valeurs d'une variable statistique.
= =
Mo = xi + (xi + 1 – xi).
Lorsque les classes adjacentes à la classe modale ont des fréquences égales, le mode coïncide avec
le centre de la classe modale.
Le mode dépend beaucoup de la répartition en classes.
Une variable statistique peut présenter plusieurs modes : on dit alors qu'elle est plurimodale.
(Existence de plusieurs sous-populations, donc l'hétérogénéité de la population étudiée).
La médiane (Me) :
La médiane Me est telle que l'effectif des observations dont les variables sont inférieures à Me est
égal à l'effectif des observations dont les variables sont supérieures à Me.
Cette définition n'a de sens que si la série est ordonnée. Me est donc le centre de la série.
𝐧𝐢𝐗𝐢
La moyenne : d’une façon générale =∑𝐧𝐢=𝟏 𝐍
: est la moyenne arithmétique des variables pondérées par les effectifs
N : est le nombre total d’effectifs
ni : sont les effectifs partiels (dans le cas d’une série donnée sous cette forme : variable continue)
ni=1 dans le cas d’une série de variables discrètes ou sans répétitions
Dans tous les cas : N=∑𝐧𝐢=𝟏 𝒏𝒊
La moyenne ne se définit que pour une variable statistique quantitative.
Paramètres de dispersion :
Les paramètres de dispersion (étendue, intervalle interquartile … etc) sont calculés pour les variables
statistiques quantitatives.
Etendue :
L'étendue ω de X est la différence entre la plus grande valeur de X et la plus petite valeur de X.
E = Xmax – Xmin
Quartiles :
Pour une variable statistique quantitative réelle continue X, on appelle quartiles les nombres réels
Q1, Q2, Q3, pour lesquels les fréquences cumulées de X sont respectivement 0,25, 0,50, 0,75. Ce sont
les valeurs pour lesquelles l'ordonnée de la courbe cumulative des fréquences est respectivement
égale à 0,25, 0,50, 0,75. Les quartiles partagent l'étendue en quatre intervalles qui ont le même
effectif.
Le deuxième quartile, Q2, est égal à la médiane.
L'intervalle interquartile : est la différence entre les valeurs du 3ème et du 1er quartile : Q3 – Q1.
L'intervalle [Q1, Q3] contient 50 % des valeurs de X.
Déciles et centiles :
Les 9 déciles sont les nombres réels qui partagent l'étendue en 10 intervalles de même effectif.
Les 99 centiles sont les nombres réels qui partagent l'étendue en 100 intervalles de même effectif.
𝐧𝐢(𝐗𝐢− )²
V(X)= Ϭ2(X)=∑𝐧𝐢=𝟏 𝐍
Le coefficient de variation : est un nombre sans dimension qui permet de comparer deux variables
statistiques de natures différentes, il est égal à Ϭ(X)/ , il est donné en % et peut être supérieur à 100 %.
Moments :
Soit X une variable statistique quantitative réelle. On appelle moment d'ordre r de X, la quantité :
mr = ni xi r
Pour r = 0 : m0 = 1.
Pour r = 1 : m1 = . Le moment d'ordre 1 est la moyenne.
Pour r = 2 : m2 = La moyenne de
On appelle moment centré d'ordre r de X, le moment d’ordre r en utilisant la variable centrée X –
il est noté par µr
Pour r = 0 : µ0 = 1.
Pour r = 1 : µ1 = 0.
Pour r = 2 : µ2 = Ϭ2(X) = m2 – m1 2. Le moment centré d'ordre 2 est la variance.
Centrer et réduire une variable statistique quantitative X consiste la remplacer par Ϭ(X) :
X – pour la centrer (moyenne 0)
Diviser par Ϭ(X) pour la réduire (écart-type 1).
Par exemple, si nous considérons la variable statistique continue théorique de Gauss :
h (x) = e
Sa moyenne est 0 et son écart-type est 1 : c'est une variable centrée réduite et de fréquence associée
est appelée la courbe en cloche, ou courbe de Gauss, ou courbe de la loi normale (allure
symétrique).
Paramètres de forme :
On définit les paramètres de forme pour une variable statistique quantitative, discrète ou continue,
à valeurs réelles.
Coefficient d'asymétrie :
Il existe plusieurs coefficients d'asymétrie. Les principaux sont les suivants.
Le coefficient P d'asymétrie de Pearson fait intervenir le mode M o quand il existe, il est définie par :
Le coefficient Y d'asymétrie de Yule fait intervenir la médiane et les quartiles, il est défini par :
Le coefficient F d'asymétrie de Fisher fait intervenir les moments centrés, il est défini par :
=
avec s3(X) = Ϭ3(X)
On utilise souvent un coefficient d'asymétrie β1 de Pearson basé sur les moments centrés : µ32/µ23
Ce coefficient d'asymétrie est toujours positif.
Il est nul pour une distribution à densité de fréquence symétrique, telle la loi de Gauss.
Coefficient d'aplatissement :
Le coefficient d'aplatissement de Pearson est β 2 =
Corrélation linéaire :
En présence d'une distribution statistique de deux variables (X,Y) et dans certains cas, on peut poser
la question suivante : La connaissance d'une variable X apporte-t-elle une information
supplémentaire sur la variable Y ?
La liaison entre X et Y s'apprécie par la mesure de la corrélation (relation de dépendance).
Soient X et Y des variables réelles quantitatives, la corrélation linéaire est donnée par le coefficient :
r(X,Y)=Cov(X,Y)/(Ϭ(X)Ϭ(Y)) avec r(X,Y) compris entre -1 et 1, il est donné en %.
Si X et Y sont indépendantes, leur covariance est nulle, donc r(X,Y) nul.
ZEUDMI