Vous êtes sur la page 1sur 94

Rappels

Étude à partir des données individuelles


Étude à partir des données regroupées en classes
Bilan général

R.1-04 : Statistique descriptive 1


Chapitre 4 : Variables quantitatives continues

Vincent Brault
Vincent.Brault@univ-grenoble-alpes.fr

UGA/IUT2/SD

BUT SD 1A, 2023-2024

VB Statistique descriptive 1
Rappels
Étude à partir des données individuelles
Étude à partir des données regroupées en classes
Bilan général

Variables quantitatives

2 sous-types de variables
discrètes : valeurs numériques (en général entières) concentrées sur
un petit nombre de valeurs différentes. Ex : nombre de tasses de thé
ou de café par jour, nombre de frères et sœurs, etc
continues : valeurs numériques (en général réelles) mesurées en
continu (sur un intervalle de R). Ex : hauteur d’eau, température,
âge, taille, poids, pression exercée par un doigt,

VB Statistique descriptive 1
Rappels
Étude à partir des données individuelles
Étude à partir des données regroupées en classes
Bilan général

Variables quantitatives
Où finit le discret, où commence le continu ?
Discret/continu
La distinction discret/continu porte plus sur le nombre de répétitions de
chaque modalité que sur la nature mathématique de la donnée.

Exemples :
nombre d’enfants par famille : beaucoup de familles auront 0, 1, 2
ou 3 enfants ⇒ variable discrète
nombre de logements mis en vente ou vendus : peu de chance de
trouver 2 trimestres avec exactement le même nombre de logements
⇒ variable continue
nombre d’habitants par commune : peu de chance de trouver 2
communes avec exactement le même nombre de logements ⇒
variable continue
nombre d’exemplaires du DL vendus dans un dépôt ⇒ variable
discrète dans les petits dépôts, continue dans les grandes surfaces.
VB Statistique descriptive 1
Rappels
Étude à partir des données individuelles Résumés statistiques
Étude à partir des données regroupées en classes Représentations graphiques
Bilan général

Tableau statistique : le tri à plat


Pour une variable quantitative continue, il y a trop de modalités
différentes pour faire un tri à plat : 37 pour la variable Taille, 51 pour la
variable Poids, 28 pour la variable âge.
Tailles (cm) Effectifs Freq Poids (kg) Effectifs Freq Ages Effectifs Freq
140 1 0,44% 38 1 0,44% 65 6 2,65%
148 2 0,88% 40 1 0,44% 66 10 4,42%
150 5 2,21% 42 2 0,88% 67 11 4,87%
151 4 1,77% 44 1 0,44% 68 8 3,54%
152 5 2,21% 45 4 1,77% 69 17 7,52%
153 7 3,10% 48 4 1,77% 70 13 5,75%
154 12 5,31% 49 1 0,44% 71 13 5,75%
155 9 3,98% 50 6 2,65% 72 14 6,19%
156 11 4,87% 51 3 1,33% 73 16 7,08%
157 4 1,77% 52 2 0,88% 74 17 7,52%
158 8 3,54% 53 9 3,98% 75 12 5,31%
159 5 2,21% 54 6 2,65% 76 15 6,64%
160 22 9,73% 55 7 3,10% 77 12 5,31%
161 2 0,88% 56 5 2,21% 78 18 7,96%
162 10 4,42% 57 5 2,21% 79 7 3,10%
163 12 5,31% 58 8 3,54% 80 3 1,33%
164 8 3,54% 59 1 0,44% 81 4 1,77%
165 14 6,19% 60 13 5,75% 82 4 1,77%
166 4 1,77% 61 3 1,33% 83 2 0,88%
167 3 1,33% 62 7 3,10% 84 5 2,21%
168 11 4,87% 63 8 3,54% 85 5 2,21%
169 3 1,33% 64 8 3,54% 86 2 0,88%
170 10 4,42% 65 6 2,65% 87 3 1,33%
171 5 2,21% 66 5 2,21% 88 2 0,88%
172 10 4,42% 67 7 3,10% 89 4 1,77%
173 3 1,33% 68 6 2,65% 90 1 0,44%
174 3 1,33% 69 5 2,21% 91 2 0,88%
175 6 2,65% 70 8 3,54% Total général 226 100,00%
176 7 3,10% 71 3 1,33%
177 3 1,33% 72 2 0,88%
178 4 1,77% 73 5 2,21%
179 1 0,44% 74 9 3,98%
180 2 0,88% 75 18 7,96%
181 2 0,88% 76 4 1,77%
182 2 0,88% 77 3 1,33%
186 3 1,33% 78 3 1,33%
188 3 1,33% 79 2 0,88%
Total général 226 100,00% 80 9 3,98%
81 2 0,88%
82 4 1,77%
83 2 0,88%
85 4 1,77%
86 1 0,44%
87 1 0,44%
90 7 3,10%
91 1 0,44%
92 1 0,44%
94 1 0,44%
95 1 0,44%
96 1 0,44%
Total général 226 100,00%

Figure – Tri à plat des variables continues.

VB Statistique descriptive 1
Rappels
Étude à partir des données individuelles Résumés statistiques
Étude à partir des données regroupées en classes Représentations graphiques
Bilan général

Tableau statistique : le tri à plat

Pour une variable quantitative continue, il y a trop de modalités


différentes pour faire un tri à plat : 37 pour la variable Taille, 51 pour la
variable Poids, 28 pour la variable âge.

Figure – Tri à plat des variables continues (présenté horizontalement).

" Ce n’est pas un bon résumé statistique donc il est inutile de le


mettre dans un rapport.
En revanche, il peut être utile pour calculer les autres résumés
statistiques.

VB Statistique descriptive 1
Rappels
Étude à partir des données individuelles Résumés statistiques
Étude à partir des données regroupées en classes Représentations graphiques
Bilan général

Résumés statistiques des variables quantitatives

Pour résumer l’information contenue dans les variables quantitatives, on


peut également faire appel aux résumés statistiques.
Résumés statistiques
On distingue
les résumés statistiques de position qui donnent son ordre de
grandeur ;
les résumés statistiques de dispersion qui expriment la variabilité des
valeurs prises ;
les résumés statistiques de forme qui traduisent l’allure générale.

VB Statistique descriptive 1
Rappels
Étude à partir des données individuelles Résumés statistiques
Étude à partir des données regroupées en classes Représentations graphiques
Bilan général

Résumé statistique de position : la médiane

Médiane
La médiane est une valeur centrale qui divise la population en deux
sous-populations d’effectifs égaux : la sous-population des individus de
modalité inférieure à la médiane et la sous-population des individus de
modalité supérieure à la médiane.
Nous la notons me.

VB Statistique descriptive 1
Rappels
Étude à partir des données individuelles Résumés statistiques
Étude à partir des données regroupées en classes Représentations graphiques
Bilan général

Résumé statistique de position : la médiane

Médiane
La médiane est une valeur centrale qui divise la population en deux
sous-populations d’effectifs égaux : la sous-population des individus de
modalité inférieure à la médiane et la sous-population des individus de
modalité supérieure à la médiane.
Nous la notons me.
En d’autres termes,
Définition
me est une médiane si les 2 conditions suivantes sont réalisées :
1 La proportion d’individus dont la valeur est inférieure ou égale à me
est supérieure ou égale à 0.5.
2 La proportion d’individus dont la valeur est supérieure ou égale à me
est supérieure ou égale à 0.5.

VB Statistique descriptive 1
Rappels
Étude à partir des données individuelles Résumés statistiques
Étude à partir des données regroupées en classes Représentations graphiques
Bilan général

Résumé statistique de position : la médiane

Nous supposons que les modalités a1 < . . . < ak < . . . < aK sont
ordonnées
Pk et nous notons fk la fréquence associée à la modalité ak et
Fk = ℓ=1 fℓ la fréquence cumulée jusqu’à la modalité ak .

Calcul de la médiane
La médiane est la première valeur pour laquelle les fréquences cumulées
dépassent 50% c’est-à-dire que me est égale à la modalité ak vérifiant :
1 Fk ≥ 0.5.
2 Fk−1 < 0.5.

VB Statistique descriptive 1
Rappels
Étude à partir des données individuelles Résumés statistiques
Étude à partir des données regroupées en classes Représentations graphiques
Bilan général

Résumé statistique de position : la médiane


Dans le cas d’une variable quantitative continue, il arrive que toutes les
valeurs prises par la variable soient distinctes (si on n’a pas trop d’effet
d’arrondi). Dans ce cas, pour tout k :

1 k
fk = , Fk = .
n n

Cas de données individuelles distinctes


Si nous organisons toutes les valeurs par ordre croissante
x(1) < x(2) < · · · < x(n) (où x(i) symbolise la i ème valeur dans cet ordre
croissant) alors nous avons :
Si n = 2m + 1 est impair, me = x(m+1) .
Si n = 2m est pair, toute valeur entre x(m) et x(m+1) peut être
considérée comme médiane (au sens de la définition). Certains
x +x
logiciels proposent de prendre me = (m) 2 (m+1) .

VB Statistique descriptive 1
Rappels
Étude à partir des données individuelles Résumés statistiques
Étude à partir des données regroupées en classes Représentations graphiques
Bilan général

Résumé statistique de position : les fractiles

Fractiles
Étant donné un réel α compris entre 0 et 1, le fractile d’ordre α est la
première valeur pour laquelle les fréquences cumulées dépassent α.

Exemples :
La médiane est le fractile d’ordre 0.5.
Le minimum est le fractile d’ordre 0.
Le maximum est le fractile d’ordre 1.

VB Statistique descriptive 1
Rappels
Étude à partir des données individuelles Résumés statistiques
Étude à partir des données regroupées en classes Représentations graphiques
Bilan général

Résumé statistique de position : Fractiles couramment utilisés

Quartiles
Les quartiles sont les fractiles d’ordre 0.25 et 0.75 notés souvent Q1 et
Q3 .

Déciles
Les déciles sont les fractiles d’ordre 0.1, 0.2,. . ., 0.8 et 0.9 notés souvent
D1 , D2 ,. . .,D8 et D9 .

Centiles
Les centiles sont les fractiles avec un ordre k/100, 1 ≤ k ≤ 99 notés
souvent Ck . Parmi eux, C95 et C99 sont souvent utilisés.

" Il est tout à fait possible d’avoir des fractiles valant la même valeur
comme, par exemple, Q1 = Q3 . Ceci est d’autant plus plausible quand il
y a peu de modalités.
VB Statistique descriptive 1
Rappels
Étude à partir des données individuelles Résumés statistiques
Étude à partir des données regroupées en classes Représentations graphiques
Bilan général

Résumé statistique de position : la moyenne

Moyenne
Étant donné un échantillon de n observations x1 , . . . , xn , la moyenne,
notée x, est définie par :
n
1X x1 + x2 + . . . + xn
x= xi = .
n n
i=1

VB Statistique descriptive 1
Rappels
Étude à partir des données individuelles Résumés statistiques
Étude à partir des données regroupées en classes Représentations graphiques
Bilan général

Résumé statistique de position : calcul de la moyenne


Calcul par les effectifs
Avec les notations précédentes, nous avons :
K
1X
x= nk ak .
n
k=1

Calcul par les fréquences


Avec les notations précédentes, nous avons :
K
X
x= fk ak .
k=1

Solutions des exercices

VB Statistique descriptive 1
Rappels
Étude à partir des données individuelles Résumés statistiques
Étude à partir des données regroupées en classes Représentations graphiques
Bilan général

Résumé statistique de position : calcul de la moyenne


///////
Calcul/////
par////
les//////////
effectifs
//////
Avec////
les////////////
notations///////////////
précédentes,///////
nous///////
avons///:
/
K
/X
1
x////
= n/////
k ak .
n/
////
k=1

///////
Calcul/////
par////
les/////////////
fréquences
//////
Avec////
les////////////
notations///////////////
précédentes,///////
nous///////
avons///:
/
K
X
x////
= f////k ak .
////
k=1

Inutiles dans le cas de données continues.


Solutions des exercices
VB Statistique descriptive 1
Rappels
Étude à partir des données individuelles Résumés statistiques
Étude à partir des données regroupées en classes Représentations graphiques
Bilan général

Résumé statistique de position : les propriétés de la moyenne

Moyenne d’une constante


Si toutes les valeurs xi valent la même constante c ∈ R alors :

x = c.

Linéarité
Étant donnés deux variables x1 , . . . , xn et y1 , . . . , yn prenant leurs valeurs
dans R et une constante λ ∈ R alors :

x +y = x + y,
λx = λx.

VB Statistique descriptive 1
Rappels
Étude à partir des données individuelles Résumés statistiques
Étude à partir des données regroupées en classes Représentations graphiques
Bilan général

Résumé statistique de position : les propriétés de la moyenne

Formule utile
Nous avons :
n
X
(xi − x) = 0.
i=1

VB Statistique descriptive 1
Rappels
Étude à partir des données individuelles Résumés statistiques
Étude à partir des données regroupées en classes Représentations graphiques
Bilan général

Résumé statistique de position : sensibilité de la moyenne par rapport à la médiane

Sensibilité
Contrairement à la médiane, la moyenne est sensible aux valeurs
extrêmes.

Lien internet pour le film

VB Statistique descriptive 1
Rappels
Étude à partir des données individuelles Résumés statistiques
Étude à partir des données regroupées en classes Représentations graphiques
Bilan général

Moyenne quadratique
Étant donné un échantillon de n observations x1 , . . . , xn , la moyenne quadratique est
définie par : v s
n
x12 + . . . + xn2
u
u1 X p
mQ = t 2
xi = = x 2.
n i=1 n

Moyenne géométrique
Étant donné un échantillon de n observations positives x1 , . . . , xn , la moyenne
géométrique est définie par :
n
!1/n
Y √
mG = xi = n x1 × · · · xn = e log x .
i=1

Moyenne harmonique
Étant donné un échantillon de n observations non nulles x1 , . . . , xn , la moyenne
harmonique est définie par :
n n 1
mH = Pn 1
= 1 1
= .
i=1 xi x1
+ ··· + xn
1
x

VB Statistique descriptive 1
Rappels
Étude à partir des données individuelles Résumés statistiques
Étude à partir des données regroupées en classes Représentations graphiques
Bilan général

Résumés statistiques de dispersion : l’étendue et l’intervalle interquartile

Étendue
L’étendue (range en anglais) de la distribution x1 , . . . , xn , notée W, est
définie comme l’écart (positif) entre la plus grande et la plus petite
valeur :
W = max xi − min xi .
1≤i≤n 1≤i≤n

Intervalle interquartile
L’intervalle interquartile de la distribution x1 , . . . , xn est l’intervalle de
bornes Q1 et Q3 . La longueur de cet intervalle est un indicatif de
dispersion noté IQ et valant :

IQ = Q3 − Q1 .

VB Statistique descriptive 1
Rappels
Étude à partir des données individuelles Résumés statistiques
Étude à partir des données regroupées en classes Représentations graphiques
Bilan général

Résumés statistiques de dispersion : rapport interdécile

Rapport interdécile
Étant donnée une distribution strictement positive x1 , . . . , xn , le
rapport interdécile entre le k ème et le ℓ ème décile de la distribution
correspond au rapport entre ces deux déciles, noté Rk/ℓ , est définie si Dℓ
est différent de 0 et vaut :
Dk
Rk/ℓ = .
Dℓ

Typiquement, le rapport R9/1 = D9 /D1 est utilisé pour l’évolution des


salaires en France.

VB Statistique descriptive 1
Rappels
Étude à partir des données individuelles Résumés statistiques
Étude à partir des données regroupées en classes Représentations graphiques
Bilan général

Résumés statistiques de dispersion : la variance et l’écart-type

Variance et écart-type
Étant donné un échantillon de n observations x1 , . . . , xn , la variance,
notée var (x), est définie par :
n
1X 2
var (x) = (xi − x) .
n
i=1

De plus, l’écart-type, noté σ̂x , est défini par :


v
u n
p u1 X 2
σ̂x = var (x) = t (xi − x) .
n
i=1

" Dans certains logiciels, les fonctions calculant la variance ou


l’écart-type divisent la somme par (n − 1) plutôt que par n. Il faut
toujours vérifier quelle normalisation est faite avant d’utiliser ces
commandes.
VB Statistique descriptive 1
Rappels
Étude à partir des données individuelles Résumés statistiques
Étude à partir des données regroupées en classes Représentations graphiques
Bilan général

Résumé statistique de dispersion : calcul de la variance

Calcul par les effectifs


Avec les notations précédentes, nous avons :
K
1X 2
var (x) = nk (ak − x) .
n
k=1

Calcul par les fréquences


Avec les notations précédentes, nous avons :
K
X 2
var (x) = fk (ak − x) .
k=1

VB Statistique descriptive 1
Rappels
Étude à partir des données individuelles Résumés statistiques
Étude à partir des données regroupées en classes Représentations graphiques
Bilan général

Résumé statistique de dispersion : calcul de la variance


///////
Calcul/////
par////
les//////////
effectifs
//////
Avec////
les////////////
notations///////////////
précédentes,///////
nous///////
avons///:
/
K
1/ X
2
var (x) =
/////////// n k (ak − x) .
//////////////
n/ ///
k=1

///////
Calcul/////
par////
les/////////////
fréquences
//////
Avec////
les////////////
notations///////////////
précédentes,///////
nous///////
avons///:
/
K
X 2
var (x) =
/////////// k (ak − x) .
f/////////////
///
k=1

Inutiles dans le cas des données quantitatives continues


VB Statistique descriptive 1
Rappels
Étude à partir des données individuelles Résumés statistiques
Étude à partir des données regroupées en classes Représentations graphiques
Bilan général

Résumé statistique de dispersion : calcul de la variance

Autres calculs
Avec les notations précédentes, nous avons :
n
!
2 1X 2
var (x) = x2 −x = xi − x2
n
i=1

Solutions des exercices

VB Statistique descriptive 1
Rappels
Étude à partir des données individuelles Résumés statistiques
Étude à partir des données regroupées en classes Représentations graphiques
Bilan général

Résumé statistique de dispersion : les propriétés de la variance

Variance d’une constante


Si toutes les valeurs xi valent la même constante c ∈ R alors :

var (x) = 0.

Positivité de la variance
Une variance est toujours positive.

" Après un calcul (à la main ou par programmation), il faut


TOUJOURS vérifier que le résultat est positif.

VB Statistique descriptive 1
Rappels
Étude à partir des données individuelles Résumés statistiques
Étude à partir des données regroupées en classes Représentations graphiques
Bilan général

Comment évaluer la valeur d’un écart-type ?

Coefficient de variation
Étant donné un échantillon de n observations x1 , . . . , xn , le coefficient de
variation, noté cv , est définie par :
q P
1 n 2
σ̂x n i=1 (xi − x)
cv = = 1
Pn .
x n i=1 xi

VB Statistique descriptive 1
Rappels
Étude à partir des données individuelles Résumés statistiques
Étude à partir des données regroupées en classes Représentations graphiques
Bilan général

Résumés statistiques de forme : skewness

Le coefficient d’asymétrie (ou skewness en anglais) mesure la dissymétrie


de la distribution. Sa formule vaut :
1
Pn 3
(xi − x)
G1 (x) = n i=1 3 .
σ̂x

Plus la distribution sera symétrique, plus le coefficient sera proche de 0.

VB Statistique descriptive 1
Rappels
Étude à partir des données individuelles Résumés statistiques
Étude à partir des données regroupées en classes Représentations graphiques
Bilan général

Résumés statistiques de forme : kurtosis

Le coefficient d’aplatissement (ou kurtosis) s’utilise dans le cadre d’une


distribution symétrique (donc si le précédent coefficient est proche de 0)
et mesure la répartition des poids. Sa formule vaut :
1
Pn 4
n i=1(xi − x)
G2 (x) = − 3.
σ̂x4

Il sera proche de 0 si la distribution ressemble à une loi gaussienne et


négatif si les points sont répartis uniformément.

VB Statistique descriptive 1
Rappels
Étude à partir des données individuelles Résumés statistiques
Étude à partir des données regroupées en classes Représentations graphiques
Bilan général

Représenter les variables quantitatives


2 graphiques qui conviennent aux variables quantitatives discrètes et
continues :
la fonction de répartition empirique, basée sur les fréquences
cumulées : proportion de valeurs inférieures à x

Figure – Fonctions de répartition empiriques des variables Thé et Poids.

A faire avec un autre logiciel que Excel !


Pour une variable discrète, il y a peu de sauts et ceux-ci sont de
taille importante. VB Statistique descriptive 1
Rappels
Étude à partir des données individuelles Résumés statistiques
Étude à partir des données regroupées en classes Représentations graphiques
Bilan général

Représenter les variables quantitatives


La fonction de répartition empirique est définie sur tout l’espace R et sa
formule mathématique est pour tout t ∈ R :
K
X K
X
Fb(t) = fk = fk 1ak ≤t .
k=1 k=1
tel que ak ≤t

Propriétés de la fonction de répartition empirique


Elle est croissante et constante par morceaux.
Chaque saut se fait au moment d’une modalité.
La hauteur de chaque saut correspond à la fréquence de la modalité
associée ( n1 si les données sont toutes distinctes).
Elle vaut 0 avant la première modalité et 1 après la dernière
modalité.
Elle est continue à droite.
Solutions des exercices

VB Statistique descriptive 1
Rappels
Étude à partir des données individuelles Résumés statistiques
Étude à partir des données regroupées en classes Représentations graphiques
Bilan général

Représenter les variables quantitatives


2 graphiques qui conviennent aux variables quantitatives discrètes et continues :
la boite à moustaches (boxplot) basée sur les quartiles

Figure – Boites à moustaches des variables Thé et Taille.

Pour la variable Thé, on retrouve le fait que le minimum, le premier quartile et la


médiane sont égaux.
Pour la variable Taille, on distingue bien tous les résumés statistiques.

Solutions des exercices

VB Statistique descriptive 1
Rappels
Création de classes
Étude à partir des données individuelles
Représentation graphique
Étude à partir des données regroupées en classes
Résumés statistiques approchés
Bilan général

Résumé statistique d’une variable quantitative continue : le


regroupement en classes
Pour une variable quantitative continue, il y a trop de modalités
différentes pour faire un tri à plat : 37 pour la variable Taille, 51 pour la
variable Poids, 28 pour la variable âge.
⇒ On réalise un regroupement en classes des données.

Figure – Regroupement en classes des variables quantitatives continues Taille,


Poids et Age.

Solutions des exercices

VB Statistique descriptive 1
Rappels
Création de classes
Étude à partir des données individuelles
Représentation graphique
Étude à partir des données regroupées en classes
Résumés statistiques approchés
Bilan général

Résumé statistique d’une variable quantitative continue : le


regroupement en classes
Attention : lors d’un regroupement en classes
on a perdu de l’information : (on ne peut plus reconstruire le tableau
des données individuelles à partir d’un regroupement en classes)
l’information présentée est sensible au choix des classes : combien de
classes choisir ? quelles bornes choisir ?
s’il existe des regroupements en classes ”naturels” ou ”habituels”, on
s’y conforme.
sinon, un bon choix peut être de faire des classes isofréquences (de
même fréquence approximativement).

Figure – Deux regroupements en classes de la variable Taille.

Solutions des exercices


VB Statistique descriptive 1
Rappels
Création de classes
Étude à partir des données individuelles
Représentation graphique
Étude à partir des données regroupées en classes
Résumés statistiques approchés
Bilan général

Combien de classes ?

Critère de Sturges :

ln(n)
1 + log2 (n) = 1 + .
ln(2)

Règle de Yule : √
2, 5 4 n.
Règle de Freedman-Diaconis :

2 × IQ(x)
√ .
3
n

VB Statistique descriptive 1
Rappels
Création de classes
Étude à partir des données individuelles
Représentation graphique
Étude à partir des données regroupées en classes
Résumés statistiques approchés
Bilan général

" À partir du moment où les classes sont formées, nous ne pouvons
plus savoir comment sont répartis les points au sein de chaque classe.

VB Statistique descriptive 1
Rappels
Création de classes
Étude à partir des données individuelles
Représentation graphique
Étude à partir des données regroupées en classes
Résumés statistiques approchés
Bilan général

" À partir du moment où les classes sont formées, nous ne pouvons
plus savoir comment sont répartis les points au sein de chaque classe.
⇒ Nous allons donc supposer par la suite qu’ils sont répartis
uniformément.

VB Statistique descriptive 1
Rappels
Création de classes
Étude à partir des données individuelles
Représentation graphique
Étude à partir des données regroupées en classes
Résumés statistiques approchés
Bilan général

Représenter une variable quantitative continue


Histogramme

Figure – Trois histogrammes de la variable Taille. Version internet

Basé sur un regroupement en classe, donc l’histogramme hérite de


tous les problèmes liés : choix des classes, du nombre de classes, etc
La hauteur de chaque rectangle représente la densité : dk = flkk où fk
est la fréquence de la classe et lk la longueur de l’intervalle.
L’aire de chaque rectangle représente la fréquence fk de la classe.
Solutions des exercices

VB Statistique descriptive 1
Rappels
Création de classes
Étude à partir des données individuelles
Représentation graphique
Étude à partir des données regroupées en classes
Résumés statistiques approchés
Bilan général

Polygone des fréquences cumulées

Le polygone des fréquences cumulées est le pendant de la fonction de


répartition.
L’hypothèse de base de la construction du polygone des fréquences
cumulées est la même que pour les histogrammes : supposer que, une fois
les classes formées, les observations au sein d’une même classe sont
réparties uniformément à l’intérieur de cette classe.

VB Statistique descriptive 1
Rappels
Création de classes
Étude à partir des données individuelles
Représentation graphique
Étude à partir des données regroupées en classes
Résumés statistiques approchés
Bilan général

Polygone des fréquences cumulées : construction

Solutions des exercices

VB Statistique descriptive 1
Rappels
Création de classes
Étude à partir des données individuelles
Représentation graphique
Étude à partir des données regroupées en classes
Résumés statistiques approchés
Bilan général

Polygone des fréquences cumulées : construction

Solutions des exercices

VB Statistique descriptive 1
Rappels
Création de classes
Étude à partir des données individuelles
Représentation graphique
Étude à partir des données regroupées en classes
Résumés statistiques approchés
Bilan général

Polygone des fréquences cumulées : construction

Polygone des fréquences cumulées


1
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1 Solutions des exercices
0
135 140 145 150 155 160 165 170 175 180 185 190 195

VB Statistique descriptive 1
Rappels
Création de classes
Étude à partir des données individuelles
Représentation graphique
Étude à partir des données regroupées en classes
Résumés statistiques approchés
Bilan général

Polygone des fréquences cumulées : construction

Polygone des fréquences cumulées


1
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1 Solutions des exercices
0
135 140 145 150 155 160 165 170 175 180 185 190 195

VB Statistique descriptive 1
Rappels
Création de classes
Étude à partir des données individuelles
Représentation graphique
Étude à partir des données regroupées en classes
Résumés statistiques approchés
Bilan général

Polygone des fréquences cumulées : construction

Polygone des fréquences cumulées


1
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1 Solutions des exercices
0
135 140 145 150 155 160 165 170 175 180 185 190 195

VB Statistique descriptive 1
Rappels
Création de classes
Étude à partir des données individuelles
Représentation graphique
Étude à partir des données regroupées en classes
Résumés statistiques approchés
Bilan général

Résumé statistique de position : le mode


Définitions (Variables quantitatives discrètes)
Un mode absolu de la distribution est une modalité qui apparaı̂t
avec la plus grande fréquence.
Un mode (relatif) de la distribution est une modalité qui apparaı̂t
avec une fréquence supérieure à celle des valeurs voisines
immédiates. Les modes absolus sont les modes dont la fréquence est
plus élevée que celle des autres modes.

Solutions des exercices

VB Statistique descriptive 1
Rappels
Création de classes
Étude à partir des données individuelles
Représentation graphique
Étude à partir des données regroupées en classes
Résumés statistiques approchés
Bilan général

Résumé statistique de position : le mode


Définitions (Variables quantitatives discrètes)
Un mode absolu de la distribution est une modalité qui apparaı̂t
avec la plus grande fréquence.
Un mode (relatif) de la distribution est une modalité qui apparaı̂t
avec une fréquence supérieure à celle des valeurs voisines
immédiates. Les modes absolus sont les modes dont la fréquence est
plus élevée que celle des autres modes.

Définitions (Variables quantitatives continues)


Une classe modale (absolue) de la distribution est une classe avec la
plus grande densité.
Une classe modale (relative) de la distribution est une classe avec
une densité supérieure à celle des classes voisines immédiates. Les
classes modales absolues sont les classes modales dont la densité est
plus élevée que celle des autres classes modales.
Solutions des exercices

VB Statistique descriptive 1
Rappels
Création de classes
Étude à partir des données individuelles
Représentation graphique
Étude à partir des données regroupées en classes
Résumés statistiques approchés
Bilan général

Résumé statistique de position : les fractiles

Si nous notons PFC la fonction polygone des fréquences cumulées alors


nous avons :
Fractiles
Étant donné un réel α compris entre 0 et 1, le fractile approché d’ordre α
est la valeur xeα telle que PFC (e
xα ) = α.

VB Statistique descriptive 1
Rappels
Création de classes
Étude à partir des données individuelles
Représentation graphique
Étude à partir des données regroupées en classes
Résumés statistiques approchés
Bilan général

Résumé statistique de position : Fractiles couramment utilisés

Médiane
La médiane approchée est le fractile approché d’ordre 0.5 notée souvent
me.
f

Quartiles
Les quartiles approchés sont les fractiles approchés d’ordre 0.25 et 0.75
notés souvent Qe1 et Q
e3 .

Déciles
Les déciles approchés sont les fractiles approchés d’ordre 0.1, 0.2,. . ., 0.8
et 0.9 notés souvent De1 , D
e2 ,. . .,D
e8 et D
e9 .

Centiles
Les centiles approchés sont les fractiles approchés avec un ordre
k/100, 1 ≤ k ≤ 99 notés souvent Cek . Parmi eux, Ce95 et Ce99 sont souvent
utilisés.
VB Statistique descriptive 1
Rappels
Création de classes
Étude à partir des données individuelles
Représentation graphique
Étude à partir des données regroupées en classes
Résumés statistiques approchés
Bilan général

Résumé statistique de position : les fractiles


Construction à partir du graphique :

Solutions des exercices

VB Statistique descriptive 1
Rappels
Création de classes
Étude à partir des données individuelles
Représentation graphique
Étude à partir des données regroupées en classes
Résumés statistiques approchés
Bilan général

Résumé statistique de position : les fractiles


Construction à partir du graphique :
1 Tracer le trait horizontal y = α sur le graphe du polygone des
fréquences cumulées.

Solutions des exercices

VB Statistique descriptive 1
Rappels
Création de classes
Étude à partir des données individuelles
Représentation graphique
Étude à partir des données regroupées en classes
Résumés statistiques approchés
Bilan général

Résumé statistique de position : les fractiles


Construction à partir du graphique :
1 Tracer le trait horizontal y = α sur le graphe du polygone des
fréquences cumulées.
2 Tracer le trait vertical passant par l’intersection du trait horizontal
et de la courbe représentant le polygone.

Solutions des exercices

VB Statistique descriptive 1
Rappels
Création de classes
Étude à partir des données individuelles
Représentation graphique
Étude à partir des données regroupées en classes
Résumés statistiques approchés
Bilan général

Résumé statistique de position : les fractiles


Construction à partir du graphique :
1 Tracer le trait horizontal y = α sur le graphe du polygone des
fréquences cumulées.
2 Tracer le trait vertical passant par l’intersection du trait horizontal
et de la courbe représentant le polygone.
3 xeα est l’abscisse du trait vertical.

xeα

Solutions des exercices

VB Statistique descriptive 1
Rappels
Création de classes
Étude à partir des données individuelles
Représentation graphique
Étude à partir des données regroupées en classes
Résumés statistiques approchés
Bilan général

α
Solutions des exercices

VB Statistique descriptive 1
Rappels
Création de classes
Étude à partir des données individuelles
Représentation graphique
Étude à partir des données regroupées en classes
Résumés statistiques approchés
Bilan général

1 Trouver l’intervalle [Fa ; Fb ] des fréquences cumulées dans lequel se trouve


α et les bornes a et b de la classe correspondante.

Fb
α
Solutions des exercices

Fa

a b
VB Statistique descriptive 1
Rappels
Création de classes
Étude à partir des données individuelles
Représentation graphique
Étude à partir des données regroupées en classes
Résumés statistiques approchés
Bilan général

1 Trouver l’intervalle [Fa ; Fb ] des fréquences cumulées dans lequel se trouve


α et les bornes a et b de la classe correspondante.
2 Calculer l’équation de la droite, c’est-à-dire :
Fb − Fa
y = Fa + (x − a).
b−a

Fb
α
Solutions des exercices

Fa

a b
VB Statistique descriptive 1
Rappels
Création de classes
Étude à partir des données individuelles
Représentation graphique
Étude à partir des données regroupées en classes
Résumés statistiques approchés
Bilan général

1 Trouver l’intervalle [Fa ; Fb ] des fréquences cumulées dans lequel se trouve


α et les bornes a et b de la classe correspondante.
2 Calculer l’équation de la droite, c’est-à-dire :
Fb − Fa
y = Fa + (x − a).
b−a
3 Trouver xeα vérifiant y = α :
Fb − Fa b−a
α = Fa + xα − a) ⇔ xeα = a +
(e (α − Fa ).
b−a Fb − Fa

Fb
α
Solutions des exercices

Fa

a xeαb
VB Statistique descriptive 1
Rappels
Création de classes
Étude à partir des données individuelles
Représentation graphique
Étude à partir des données regroupées en classes
Résumés statistiques approchés
Bilan général

Résumé statistique de position : la moyenne


Centre d’une classe
Étant donnée une classe [ak ; bk ] (ou [ak ; bk [ ou ]ak ; bk ] ou ]ak ; bk [), nous appelons
centre de la classe, noté ck , le milieu de l’intervalle :
ak + b k
ck = .
2

Solutions des exercices

VB Statistique descriptive 1
Rappels
Création de classes
Étude à partir des données individuelles
Représentation graphique
Étude à partir des données regroupées en classes
Résumés statistiques approchés
Bilan général

Résumé statistique de position : la moyenne


Centre d’une classe
Étant donnée une classe [ak ; bk ] (ou [ak ; bk [ ou ]ak ; bk ] ou ]ak ; bk [), nous appelons
centre de la classe, noté ck , le milieu de l’intervalle :
ak + b k
ck = .
2

Moyenne approchée par les effectifs


Si nous notons nk les effectifs des classes, la moyenne approchée vaut
K
1X
x=
e nk ck .
n k=1

Calcul approché par les fréquences


Si nous notons fk les fréquences des classes, la moyenne approchée vaut
K
X
x=
e fk c k .
k=1

Solutions des exercices

VB Statistique descriptive 1
Rappels
Création de classes
Étude à partir des données individuelles
Représentation graphique
Étude à partir des données regroupées en classes
Résumés statistiques approchés
Bilan général

Résumés statistiques de dispersion : l’intervalle interquartile approché

Intervalle interquartile approché


L’intervalle interquartile approché de la distribution x1 , . . . , xn est
l’intervalle de bornes Qe1 et Qe3 . La longueur de cet intervalle est un
indicatif de dispersion noté IQ et valant :
f

IQ
f=Qe3 − Q
e1 .

VB Statistique descriptive 1
Rappels
Création de classes
Étude à partir des données individuelles
Représentation graphique
Étude à partir des données regroupées en classes
Résumés statistiques approchés
Bilan général

Résumés statistiques de dispersion : la variance et l’écart-type

Calcul approché par les effectifs


Avec les notations précédentes, nous avons :
K 2
1X 
var
f (x) = nk c k − e
x .
n
k=1

Calcul approché par les fréquences


Avec les notations précédentes, nous avons :
K
X  2
var
f (x) = fk ck − e
x .
k=1

Solutions des exercices

VB Statistique descriptive 1
Rappels
Création de classes
Étude à partir des données individuelles
Représentation graphique
Étude à partir des données regroupées en classes
Résumés statistiques approchés
Bilan général

Résumé statistique de dispersion : calcul de la variance

Autres calculs
Avec les notations précédentes, nous avons :
K
!
2 1X 2
f (x) = x 2 − e
var x = nk ck2 −e
x
e
n
k=1

Solutions des exercices

VB Statistique descriptive 1
Rappels
Étude à partir des données individuelles
Étude à partir des données regroupées en classes
Bilan général

Pour quelles familles ?

Quanti Continue

Quali Nominale

Quanti discrète

Quali Ordinale
VB Statistique descriptive 1
Rappels
Étude à partir des données individuelles
Étude à partir des données regroupées en classes
Bilan général

Pour quelles familles ?

Quanti Continue

Classes isoamplitudes ou
isofréquences, classe modale,
Quali Nominale
statistiques approchées,
histogramme, polygone des fréquences cumulée
Diagramme de Pareto

moyenne, fractile, min, max,


Diagramme en barres variance, étendue, IQ, rapport
Tri à plat
Diagramme circulaire Diagramme en bâtons interdécile, skewness, kurtosis,
Mode
Diagramme empilé fonction de répartition
empirique, boxplot

Quanti discrète

Quali Ordinale
VB Statistique descriptive 1
Moyenne

Taille Poids
x
Retour au cours

VB Statistique descriptive 1
Moyenne

Taille Poids
x ≈ 178, 1 ≈ 68, 4
Retour au cours

VB Statistique descriptive 1
Variance

Taille Poids
var
σ̂x
Retour au cours

VB Statistique descriptive 1
Variance

Taille Poids
var ≈ 43, 2 ≈ 62, 7
σ̂x ≈ 6, 6 ≈ 7, 9
Retour au cours

VB Statistique descriptive 1
Fonctions de répartitions

Fonction de répartition de la variable "Taille"


1,1

0,9

0,8

0,7

0,6

0,5

0,4

0,3

0,2

0,1

0
150 152 154 156 158 160 162 164 166 168 170 172 174 176 178 180 182 184 186 188 190 192 194

Fonction de répartition de la variable "Poids"


1,1

0,9

0,8

0,7

0,6

0,5

0,4

0,3

0,2

0,1
Retour au cours
0
45 50 55 60 65 70 75 80 85 90 95

VB Statistique descriptive 1
Paramètres de position

Taille Poids
x
min
Q1
me
Q3
max
Retour au cours

VB Statistique descriptive 1
Paramètres de position

Taille Poids
x ≈ 178, 1 ≈ 68, 4
min 155 50
Q1 175 63
me 179 68
Q3 182 72
max 190 92
Retour au cours

VB Statistique descriptive 1
Paramètres de dispertion

Taille Poids
var
σ̂x
W
IQ
Retour au cours

VB Statistique descriptive 1
Paramètres de dispertion

Taille Poids
var ≈ 43, 2 ≈ 62, 7
σ̂x ≈ 6, 6 ≈ 7, 9
W 35 42
IQ 7 9
Retour au cours

VB Statistique descriptive 1
Boite à moustaches

Retour au cours

VB Statistique descriptive 1
Boite à moustaches

Retour au cours

VB Statistique descriptive 1
Données
Taille Poids Taille Poids Taille Poids
177 65 168 72 175 62
182 62 175 60 170 64
180 63 168 63 180 72
179 65 173 69 175 75
170 70 182 78 179 68
180 67 190 76 155 55
171 60 185 65 175 61
185 85 176 73 179 63
175 72 183 73 186 70
190 80 180 65 180 81
180 71 175 65 177 72
178 92 168 65 186 70
182 68 188 75 181 62
190 85 180 64 175 54
183 73 175 60 173 62
171 50 180 66 175 63
180 72 188 72 175 72
VB Statistique descriptive 1
Regroupement

Retour au cours

VB Statistique descriptive 1
Regroupement

Retour au cours

VB Statistique descriptive 1
Classes isofréquences

Retour au cours

VB Statistique descriptive 1
Classes isofréquences

Retour au cours

VB Statistique descriptive 1
Histogrammes
Avec chacun des regroupements précédents, faire les histogrammes.

Retour au cours

VB Statistique descriptive 1
Histogrammes
Avec chacun des regroupements précédents, faire les histogrammes.

Taille Poids

0,05 0,06

0,045

0,05
0,04

0,035
0,04
Densité de fréquence

Densité de fréquence
0,03

0,025 0,03

0,02

0,02
0,015

0,01
0,01

0,005

0 0
150 160 170 180 190 200 50 60 70 80 90 100
Valeur de la variable Valeur de la variable

Isoamplitudes
Retour au cours

VB Statistique descriptive 1
Histogrammes
Avec chacun des regroupements précédents, faire les histogrammes.

Taille Poids

0,25 0,12

0,1
0,2

0,08
Densité de fréquence

Densité de fréquence
0,15

0,06

0,1

0,04

0,05
0,02

0 0
154 159 164 169 174 179 184 189 49 54 59 64 69 74 79 84 89 94
Valeur de la variable Valeur de la variable

Isofréquences
Retour au cours

VB Statistique descriptive 1
Polygone des fréquences cumulées
Avec chacun des regroupements précédents, faire les polygone des
fréquences cumulées.

Retour au cours

VB Statistique descriptive 1
Polygone des fréquences cumulées
Avec chacun des regroupements précédents, faire les polygone des
fréquences cumulées.

Taille Poids

Polygone des fréquences cumulées : Isoamplitude Tailles Polygone des fréquences cumulées : Isoamplitude Poids
100,00% 1

90,00% 0,9

80,00% 0,8

70,00% 0,7

60,00% 0,6

50,00% 0,5

40,00% 0,4

30,00% 0,3

20,00% 0,2

10,00% 0,1

0,00% 0
145 150 155 160 165 170 175 180 185 190 195 200 205 45 50 55 60 65 70 75 80 85 90 95 100 105

Isoamplitudes
Retour au cours

VB Statistique descriptive 1
Polygone des fréquences cumulées
Avec chacun des regroupements précédents, faire les polygone des
fréquences cumulées.

Taille Poids

Polygone des fréquences cumulées : Isofréquences Tailles


Polygone des fréquences cumulées : Isofréquences Poids
1
100,00%
0,9
90,00%

0,8 80,00%

0,7 70,00%

0,6 60,00%

0,5 50,00%

0,4 40,00%

0,3 30,00%

20,00%
0,2
10,00%
0,1
0,00%
0 45 50 55 60 65 70 75 80 85 90 95
150 155 160 165 170 175 180 185 190 195

Isofréquences
Retour au cours

VB Statistique descriptive 1
Classes modales

Taille Poids
Isoamplitudes [170; 180[ [60; 70[
Isofréquences [175; 176[ et [180; 181[ [63; 66[ et [72; 74[
En rouge, les classes modales absolues.
Retour au cours

VB Statistique descriptive 1
Calcul des fractiles
Sur les graphiques précédents, trouver les valeurs des quartiles et des
médianes.

Retour au cours

VB Statistique descriptive 1
Calcul des fractiles
Sur les graphiques précédents, trouver les valeurs des quartiles et des
médianes.

Taille Poids

Isoamplitudes
Retour au cours

VB Statistique descriptive 1
Calcul des fractiles
Sur les graphiques précédents, trouver les valeurs des quartiles et des
médianes.

Taille Poids

Isofréquences
Retour au cours

VB Statistique descriptive 1
Calcul des fractiles
Par le calcul, trouver les valeurs des quartiles approchés et des médianes
approchées.
Isoamplitudes Isofréquences
Taille Poids Taille Poids
Q
f1
me
f
Q
f3

Pour rappel :
Taille Poids
Q1
me
Q3
Retour au cours

VB Statistique descriptive 1
Calcul des fractiles
Par le calcul, trouver les valeurs des quartiles approchés et des médianes
approchées.
Isoamplitudes Isofréquences
Taille Poids Taille Poids
Q
f1 ≈ 173, 8 63, 9 175,275 63, 4
me
f ≈ 179, 3 69 ≈ 179, 1 ≈ 67, 7
Q
f3 ≈ 185, 4 ≈ 75, 7 181, 25 73, 25
Pour rappel :
Taille Poids
Q1 175 63
me 179 68
Q3 182 72
Retour au cours

VB Statistique descriptive 1
Polygone des fréquences cumulées
Par le calcul, trouver les valeurs des quartiles et des médianes.
Isoamplitudes Isofréquences
Taille Poids Taille Poids
x
e
var
f
σ̂
fx

Pour rappel :
Taille Poids
x
var
σ̂x
Retour au cours

VB Statistique descriptive 1
Polygone des fréquences cumulées
Par le calcul, trouver les valeurs des quartiles et des médianes.
Isoamplitudes Isofréquences
Taille Poids Taille Poids
x
e ≈ 179, 3 ≈ 70, 1 ≈ 177, 6 ≈ 68, 6
var
f
σ̂
fx

Pour rappel :
Taille Poids
x ≈ 178, 1 ≈ 68, 4
var
σ̂x
Retour au cours

VB Statistique descriptive 1
Polygone des fréquences cumulées
Par le calcul, trouver les valeurs des quartiles et des médianes.
Isoamplitudes Isofréquences
Taille Poids Taille Poids
x
e ≈ 179, 3 ≈ 70, 1 ≈ 177, 6 ≈ 68, 6
var
f ≈ 59, 8 ≈ 64, 2 ≈ 57, 8 ≈ 78, 5
σ̂
fx ≈ 7, 7 ≈ 8, 0 ≈ 7, 6 ≈ 8, 9
Pour rappel :
Taille Poids
x ≈ 178, 1 ≈ 68, 4
var ≈ 43, 2 ≈ 62, 7
σ̂x ≈ 6, 6 ≈ 7, 9
Retour au cours

VB Statistique descriptive 1

Vous aimerez peut-être aussi