Vous êtes sur la page 1sur 5

Chapitre 3 : Etude d’une série à caractère continue

Etude d’une série à caractère continue

Une variable est dite continue lorsqu’elle peut prendre une infinité de valeurs. En pratique,
il ne s’agit pas d’une infinité puisque les statistiques sont établies sur une variable mesurée. On
considère donc une variable comme continue dès lors qu’on lui attribue un grand nombre de
valeurs possibles.

Exemple

Salaire [15000 - 25000[ [25000-35000[ [35000-45000[ [45000-55000[ [55000-65000[ [65000-75000[

effectif 30 40 60 40 20 10

I. Groupement en classes
Le regroupement en classes soulève deux questions :
- Combien de classes créer ?
- Où placer les bornes des classes ?

I.1 Nombre de classes « K»


La réponse n’est pas unique. Soit N l’effectif total. Nous pouvons considérer dans ce cours
trois réponses à titre d’exemple.
- La formule la plus simple est : K = √N (partie entière) ;
- Formule de de Sturge K = 1 + 3.3 log10 (N) ;
4
- Formule de Yule K = 2.5 √N.
Avec : k = nombre de classes

Exemple
Considérons 40 valeurs entre 56.5 cm et 97.8 cm. Dans ce cas :
- √N  √40 = 6.32  6 ;
- Sturge K = 1 + 3.3 log10 (N)  K = 1 + 3.3 log10 (40) = 6.29  6;
Yule K = 2.5 √N  K = 2.5 √40 = 6.29  6.
4 4
-
Remarque : les deux formules (Sturge, Yule) sont presque pareils si N  200.

I.1.1. Regroupement en classes par progression arithmétique


L’amplitude des classes augmente selon une progression arithmétique à raison de R. R étant
l’étendue de la série divisée par le nombre de classes.

Page 1
Chapitre 3 : Etude d’une série à caractère continue

Xmax – X min
𝒂𝑲 =
K

I.2 L'amplitude des classes « ak »


L'amplitude des classes ak :
- classe n°1 : min à min + ak ;
- classe n° 2 : min + ak à min+2 ak, etc.

ak

Remarque : La méthode est conçue pour les distributions asymétriques avec beaucoup de
valeurs faibles et peu de valeurs fortes.

I.3 Classe de valeur


Pour pouvoir analyser la série statistique, on définir des classes de valeurs. Ce sont des
intervalles [a, b[ qui se suivent et qui englobent toutes les valeurs de la série X (𝜔). Ces
intervalles sont semi-ouverts. La borne basse est comprise et la borne haute est exclue, pour :
- classe n°1 : a = min, b = min + 𝒂𝒌 ;
- classe n° 2 : a = min + 𝒂𝒌 , b = min + 2 𝒂𝒌 , etc.
De ce fait, On appelle classe de valeurs de X un intervalle de type [a, b[ tel que X ∈ [a, b[
si et seulement si a ≤ X (𝜔) < b, c’est à dire, que les valeurs du caractère sont dans la classe
[a, b[.
- a : borne inférieure ;
- b : borne supérieure.

II. Étude d’une variable statistique continue


II.1 Effectif partiel (fréquence absolue) « nk »
Effectif partiel est le nombre d’individus dont les valeurs des caractères sont dans la classe K,

II.2 Effectif cumulé « Nk »


L’effectif cumulé « Nk » d’une valeur est la somme de l’effectif de cette valeur et de tous les
effectifs des valeurs qui précèdent. Pour chaque classe, on pose par définition.
Nk = n1 + n2 + ... + ni.

Page 2
Chapitre 3 : Etude d’une série à caractère continue

II.3 Fréquence (fréquence relative) « fi »


« fi » s’appelle la fréquence partielle de « K » :
𝑛𝑘 𝑛𝑘
𝑓𝑘 = =
∑ 𝑛𝑘 𝑁

II.4 Fréquence cumulée « Fi »


La fréquence cumulée « Fi » d’une valeur est la somme de la fréquence relative de cette
valeur et de toutes fréquences des valeurs qui précèdent. Pour chaque classe « Ck », on pose

par définition : Fk = f1 + f2 + ... + fk.


𝑘=𝑖

Fi = ∑ 𝑓𝑘
𝑘=1

III. Paramètres de tendance central


Les indicateurs statistiques de tendance centrale (dits aussi de position) considérés
fréquemment sont la moyenne, la médiane et le mode.

III.1 Centre de classe « Ck »


On note par Cc le centre de la classe Ci, on pose par définition :
a+b
Ck =
2
Avec : a  borne inférieure et b  borne supérieure de l’intervalle

̅»
III.2 La moyenne « 𝒙
Défini comme suit pour une série à variable continue :
∑ ck . nk
̅=
𝒙
∑ nk

III.3 Le mode « M0 »
Le mode se trouve dans une des classes dite « Classe modale ». La définition suivante
permet de comprendre la démarche à suivre pour calculer d’une manière exacte.
Nous définissions la classe modale comme étant la classe des valeurs de X(𝜔) qui a le plus
grand effectif partiel (ou la plus grande fréquence partielle).
∆1
M0 = a + 𝑎
∆1 + ∆2 𝑘
Ou :
Page 3
Chapitre 3 : Etude d’une série à caractère continue

- a : la borne inférieure de la classe modale ;


- ak : le pas de la classe modale ;
- ∆1 = n1 − n0, ∆2 = n1 − n2 ou bien ∆1 = f1 − f0, ∆2 = f1 – f2 ;
- n1 et f1 sont l’effectif et la fréquence associés à la classe modale ;
- n0 et f0 sont l’effectif et la fréquence de la classe qui précède la classe modale ;
- n2 et f2 sont l’effectif et la fréquence de la classe qui suit la classe modale.

III.4 La médiane « Me »
Pour le calcul de la médiane, il n'y a aucune différence selon que les classes de la variable
sont d'amplitudes constantes ou variables.
Le calcul de la médiane se fait alors en deux temps :

1- Détermination de la classe médiane


La classe médiane est la classe de valeurs de la variable contenant la médiane. Elle est
déterminée à partir de fréquence cumulée. On commence par chercher la classe comprenant la
fréquence cumulée =50 %,

1- Détermination de la médiane Me
Cette seconde étape cherche à déterminé la valeur précise de la médiane à l'intérieur de la
classe médiane. La méthode généralement utilisée pour ce faire est celle de l'interpolation
linéaire ; c'est mathématiquement une application simple du théorème de Thalès.

0.5 − 𝐹𝑘−1
𝑀𝑒 = a + 𝑎𝑘
𝑓𝑘
- a : la borne inférieure de la classe modale ;
- ak : le pas de la classe modale.
Exemple :
Soit la distribution statistique d'une population de 30 étudiants d'un group TD classés selon
leur taille :
Taille Effectifs nk Effectifs cumulés Nk fréquence fk Fréquence cumulée Fk
<1,60 8 8 0.27 0.27
[1,60-1,70[ 9 17 0.3 0.57
[1,70-1,80[ 10 25 0.33 0.9
[1,80-1,90[ 2 27 0.07 0.97
≥ 1,90 1 30 0.03 1
∑ 30 30 1 -

Page 4
Chapitre 3 : Etude d’une série à caractère continue

On détermine la classe comprenant la fréquence cumulée 50 % = [1,60-1,70[.


Calcul de la médiane :
0.5 − 0.27
𝑀𝑒 = 1.60 + 0.10 = 1.68
0.3

IV. Caractéristiques de dispersion

IV.1 Etendue
L’étendue est la quantité :
𝑒 = 𝑥𝑚𝑎𝑥 − 𝑥𝑚𝑖𝑛

IV.2 Écart interquartile


La détermination ou le calcul de Qi se fait exactement comme le calcul de la médiane
(interpolation linéaire) pour :
- Q1 → 25%,
- Q2 → 50%, 𝐸𝑐𝑎𝑟𝑡 𝑖𝑛𝑡𝑒𝑟𝑞𝑢𝑎𝑟𝑡𝑖𝑙𝑒 = Q 3 − Q1
- Q3 → 75%.

IV.3 La variance
La variance est la quantité :
1- Si la série est une population

2(
∑𝑖=𝑘
𝑖=1 (𝑥̅ − 𝐶𝑘 )
2
𝜎 𝑥) =
𝑛
2- Si la série est un échantillon
∑𝑖=𝑘
𝑖=1 (𝐶𝑘 − 𝑥̅ )
2
𝜎 2 (𝑥) =
𝑛−1

IV.3.1. Écart-type
L’écart-type est la quantité :
𝜎(𝑥) = √𝜎(𝑥)²

IV.4 Coefficient de variation


σ (x)
Cv =

Page 5

Vous aimerez peut-être aussi