Vous êtes sur la page 1sur 19

Chapitre 2 : Analyse univariée

() 1 / 15
Préambule

l’analyse univariée porte sur l’étude d’une seule variable prise d’une façon
isolée.

() 2 / 15
1. Paramètres de position
Les paramètres de position ont pour objectif de caractériser l’ordre de
grandeur des observations.
La moyenne arithmétique
Définition
Soit n valeurs observées x1 , x2 , . . . , xi , . . . , xn d’une variable quantitative
X . On définit sa moyenne observée x̄ comme la moyenne arithmétique des
n valeurs :
1 n
x̄ = ∑ xi
n i =1

Remarque : Si les données observées xi sont regroupées en k classes


d’effectif ni (variable continue regroupée en classe ou variable discrète), il
faut les pondérer par les effectifs correspondants :
1 k
n i∑ ∑ ni
x̄ = n i xi , n =
=1

() 3 / 15
1. Paramètres de position

La médiane
Définition
La médiane est la valeur de la variable pour laquelle 50% des valeurs
observées sont supérieures et 50% sont inférieures. Elle correspond donc
au centre de la série statistique classée par ordre croissant.

Si n est impair, alors n = 2m + 1 et la médiane est la valeur du


milieu, soit xm+1 .
Si n est pair, alors n = 2m et une médiane est une valeur quelconque
entre xm et xm+1 . Dans ce cas, il est commode de prendre le milieu.

() 4 / 15
1. Paramètres de position

Le mode
Définition
Le mode d’une série statistique est la valeur de la variable la plus fréquente
ou la plus dominante dans la série. Le mode correspond à la valeur de la
variable ayant une fréquence maximale dans la distribution des fréquences.

() 5 / 15
1. Paramètres de position

Exercice d’application
Les données suivantes représentent les tailles de 50 personnes : 153
165 160 150 159 151 163 160 158 149 154 153 163 140 158 150 158
155 163 159 157 162 160 152 164 158 153 162 166 162 165 157 174
158 171 162 155 156 159 162 152 158 164 164 162 158 156 171 164
158

() 6 / 15
1. Paramètres de position

Exercice d’application
Les données suivantes représentent les tailles de 50 personnes : 153
165 160 150 159 151 163 160 158 149 154 153 163 140 158 150 158
155 163 159 157 162 160 152 164 158 153 162 166 162 165 157 174
158 171 162 155 156 159 162 152 158 164 164 162 158 156 171 164
158
La moyenne est
153 + . . . 158
x̄ = = 158.9
50

() 6 / 15
1. Paramètres de position

Exercice d’application
Les données suivantes représentent les tailles de 50 personnes : 153
165 160 150 159 151 163 160 158 149 154 153 163 140 158 150 158
155 163 159 157 162 160 152 164 158 153 162 166 162 165 157 174
158 171 162 155 156 159 162 152 158 164 164 162 158 156 171 164
158
La moyenne est
153 + . . . 158
x̄ = = 158.9
50
Calcul de la médiane
On a n = 50 (pair) donc la médiane appartient à [x25 , x26 ] i.e. à
[158, 159]. La médiane est 158,5.

() 6 / 15
1. Paramètres de position

Exercice d’application
Les données suivantes représentent les tailles de 50 personnes : 153
165 160 150 159 151 163 160 158 149 154 153 163 140 158 150 158
155 163 159 157 162 160 152 164 158 153 162 166 162 165 157 174
158 171 162 155 156 159 162 152 158 164 164 162 158 156 171 164
158
La moyenne est
153 + . . . 158
x̄ = = 158.9
50
Calcul de la médiane
On a n = 50 (pair) donc la médiane appartient à [x25 , x26 ] i.e. à
[158, 159]. La médiane est 158,5.
Le mode est 158.

() 6 / 15
2. Paramètres de dispersion

Les paramètres de dispersion ont pour objectif de caractériser la variabilité


des données dans l’échantillon.
La variance
Définition
Soit n valeurs observées x1 , x2 , . . . , xi , . . . , xn d’une variable quantitative X
et soit x̄ sa moyenne observée. On définit la variance observée notée σ2
comme la moyenne arithmétique des carrés des écarts à la moyenne.

1 n
(xi − x̄ )2
n i∑
x̄ =
=1

La variance mesure de combien les observations sont dispersées autour de


la moyenne.

() 7 / 15
2. Paramètres de dispersion

Pour des commodités de calcul, on se sert de la formule de Koenig :

1 n 2
xi − x̄ 2
n i∑
x̄ =
=1
Remarque : Dans le cas de données regroupées en k classes d’effectif ni
(variable continue regroupée en classes ou variable discrète), la formule de
la variance est la suivante :

1 k
ni (xi − x̄ )2
n i∑
x̄ =
=1

Pour des commodités de calcul, on utilisera la formule développée


suivante :
1 k
x̄ = ∑ ni xi2 − x̄ 2
n i =1

() 8 / 15
2. Paramètres de dispersion

L’écart-type
L’écart-type observé correspond à la racine carrée de la variance observée :

σ = σ2

Application :
La variance est σ2 = 37.184, l’écart type est σ = 6.1.

() 9 / 15
2. Paramètres de dispersion

Variable centrée-réduite
Définition
Soit une variable X de moyenne x̄ et d’écart-type σ. On construit une
nouvelle variable Y = X σ−x̄ qui s’appelle “la variable centrée réduite de
X ”. Il est facile de voir que, la moyenne de Y est nulle et que son écart
type est 1.

() 10 / 15
2. Paramètres de dispersion

Application
La moyenne est x̄ = 158.9. L’écart type est σ = 6.1. La variable
158.9
centrée réduite de X est Y = X −6.1 .
2. Paramètres de dispersion

Application
La moyenne est x̄ = 158.9. L’écart type est σ = 6.1. La variable
158.9
centrée réduite de X est Y = X −6.1 .
Les observations de Y sont :
-,97 1,00 ,18 -1,46 ,02 -1,30 ,67 ,18 -,15 -1,62 -,80 -,97 ,67 -3,10 -,15
-1,46 -,15 -,64 ,67 ,02 -,31 ,51 ,18 -1,13 ,84 -,15 -,97 ,51 1,16 ,51
1,00 -,31 2,48 -,15 1,98 ,51 -,64 -,48 ,02 ,51 -1,13 -,15 ,84 ,84 ,51
-,15 -,48 1,98 ,84 -,15
3. Paramètres de forme

On appelle moment centré d’ordre r de X , la quantité

1 n
(xi − X̄ )r
n i∑
µr =
=1

Si les données de X sont regroupées en k classes d’effectif ni , le moment


centré d’ordre r est
1 k
µr = ∑ ni (xi − X̄ )r ,
n i =1
avec n = ∑ ni .
Coefficient d’asymétrie.
Définition
µ3
Le coefficient d’asymétrie de Fisher est défini par F = .
µ23/2

() 12 / 15
3. Paramètres de forme
Lorsque le coefficient d’asymétrie est positif, la distribution est plus étalée
à droite.
Lorsque le coefficient d’asymétrie est négatif, la distribution est plus étalée
à gauche.
Coefficient d’aplatissement.
Définition
µ4
Le coefficient d’aplatissement de Yule est F = µ22
.

Si F2 = 0, le polygone de la variable a le même aplatissement qu’une


courbe en cloche.
Si F > 2, le polygone de la variable est moins aplati qu’une courbe en
cloche.
Si F2 < 0, le polygone de la variable est plus aplati qu’une courbe en
cloche.
() 13 / 15
4. Représentation graphique I

Variable qualitative :
Diagramme en bâtons :
En abscisse, les modalités.
En ordonnée, des segments dont la longueur est proportionnelle aux
effectifs (ou aux fréquences) de chaque modalité.
Tuyaux d’orgue
En abscisses, les modalités.
En ordonnées, des rectangles dont la longueur est proportionnelle aux
effectifs (ou aux fréquences) de chaque modalité.
Secteurs
Les diagrammes circulaires, ou semi-circulaires, consistent à partager un
disque ou un demi-disque, en tranches, ou secteurs, correspondant aux
modalités observées et dont la surface est proportionnelle à l’effectif (ou à
la fréquence) de la modalité.

() 14 / 15
4. Représentation graphique

Variable quantitative :
Variable discrète
Diagramme en bâtons des effectifs (ou des fréquences). Ici, les
abscisses sont les valeurs de la variable.
Courbe en escaliers des effectifs cumulés ou des fréquences cumulées.
Variable continue (Les observations sont regroupées en classes)
Histogramme : en abscisse les classes et en ordonnées des rectangles
dont la longueur est proportionnelle à la densité d’effectif.
La densité d’effectif est le rapport entre l’effectif d’une classe et son
amplitude.

() 15 / 15

Vous aimerez peut-être aussi