Vous êtes sur la page 1sur 9

Niveau 

: 1ère AP Cours de statistique descriptive 2020/2021

Chapitre 1 : Distribution statistique univariée


Introduction :
Statistique et statistiques :

Au singulier, le mot « statistique » désigne un ensemble de techniques d’interprétation mathématique


qui permettent d’élaborer des modèles probabilistes à partir de données réelles. Ces techniques visent à
rassembler, à décrire et à analyser des données.

Au pluriel

Au pluriel et au singulier, les « statistiques » pluriel de la « statistique » représentent les données se


rapportant à des faits qu’on souhaiterait observer (statistiques sociales, économiques,…).

La statistique Descriptive est une branche de la statistique qui développe des méthodes scientifiques pour
recueillir, observer et traiter les données observées.

1- Démarche à suivre :
Toute étude statistique passe impérativement par trois étapes :

1/ Collecte des données ;

2/ Etablissement de tableaux et de représentations visuelles (graphiques) ;

3/ Sommaire du paquet de données par quelques ou valeurs typiques qui synthétisent au mieux l’ensemble
(caractéristiques de tendance centrale, de dispersion, …).

La collecte des données :

Dans le cadre d’une étude particulière, le recueil des informations statistiques peut se faire de différentes
façons :

- Il peut être issu d’un relevé exhaustif concernant la population à étudier. On parle alors de
« recensement » (Tous les individus de la population sont examinés).
- Il peut être issu d’un « sondage » ; seul un échantillon de la population est questionné (en pratique
c’est la situation la plus courante).

1
2- Vocabulaire élémentaire de la statistique :
 Population et individu (Univers ou unité statistique) : On appelle « individu » ou « unité
statistique » tout élément examiné dans le cadre d’une étude statistique.
On appelle « population statistique » toute collection d’unités statistiques élémentaires à étudier.
On appelle « échantillon statistique » tout sous ensemble d’individus prélevé dans une population.
 Variable (caractère) statistique :
On appelle variable statistiques X une application (relation) définie sur une population statistique
étudiée, dans un ensemble de modalités (chaque individu a une unique modalité et chaque modalité
correspond à au moins un individu).
On peut également définir la variable statistique comme étant le caractère statistique observé dans
une population, chaque variable étant formé de modalités ou d’observations xi.

Types de variables statistiques :


Les variables statistiques peuvent être classées selon leur type ou nature :

a- Variable Qualitative : une variable statistique est dite qualitative lorsque l’ensemble de ses
modalités n’est pas mesurable (les observations ne sont pas numériques).

Il existe deux types de variables qualitatives :

Les variables qualitatives ordinales dont les modalités peuvent être ordonnées (ex : pour la
variable « catégorie socioprofessionnelle » on a : cadre supérieur, cadre moyen,…).

Les variables qualitatives nominales dont les modalités ne peuvent pas être ordonnées (ex :
pour la variable « situation matrimoniale » on a : (Célibataire, marié, divorcé, veuf)

b- Variable Quantitative : Une variable statistique est dite quantitative lorsque ses modalités sont
mesurables (numériques).

Il existe deux types de variables quantitatives :

Variables quantitative discrète ou discontinue lorsque ses modalités numériques forment un


ensemble fini et dénombrable (ex : pour le «Nombre d’enfants » on a : 0, 1, 2, 3, 5).

Variables quantitative continue lorsque ses modalités sont des valeurs d’un intervalle réel où
toutes les valeurs peuvent être prises (ex : pour le «poids des élèves » on a : les intervalles : 20 à
30kg, 30 à 40kg , 40 à 45kg).
Passage d’un type de variable à l’autre :

Il est possible de quantifier les modalités d’une variable qualitative par un système de codage
(niveaux de formation : I, II, …).

A l’inverse, on peut également passer d’une variable quantitative à une variable qualitative par un système
de regroupement.

5- Distribution d’une variable statistique :

Soit X une variable statistique qualitative ou quantitative, soient : x 1 , x 2 , … , x k les différentes


modalités de cette variable.

a – Effectifs (Fréquences absolues) :

 On appelle effectif d’une modalité donnée xi de la variable X et on note  ni  le nombre de fois ou cette
modalité est observée.
 on appelle effectif total de la population (taille de la population), et on note «  N  » la somme des « k  
» effectifs particuliers « ni  » correspondant à chacune des modalités.
k
N=n1+ n2 +…+n k =∑ n i.
i=1

On appelle distribution statistique à une variable ou série statistique univariée l’ensemble des « k  »
couples {(x i , ni )i=1 ,2 ,… ,k } .

b – Fréquences :

On appelle fréquence de la modalité x i de la variable «  X  », et on note f i le rapport de l’effectif particulier


« ni  » correspondant à la modalité x i et de l’effectif total « N » de la population étudiée, soit :

f i (%)= ¿ ∙ 100
N

 Ce rapport permet de connaitre la proportion d’individus présentant cette modalité particulière de la


k
variable par rapport à l’ensemble des individus. On a toujours : 0 ≤ f i≤ 1 et ∑ f i=1.
i=1

3
6- Organisation des données dans des tableaux statistiques :

En pratique, les données ainsi que les résultats numériques relatifs à leur traitement statistique, sont
présentés sous forme de tableaux. La forme de ces tableaux est variable, mais un certain nombre de
principes fondamentaux déterminent leur construction.

1/ On appelle tableau élémentaire (tableau des données brutes), le tableau qui précise, pour chaque
individu de la population la modalité correspondante de la variable étudiée.

On appelle tri à plat, l’opération de comptage des individus par modalité.

2/ On appelle tableau de dénombrement, le tableau à deux colonnes x i et ni .

3/ On appelle tableau de traitement, le tableau obtenu en complétant le tableau de dénombrement par les
résultats relatifs aux différents calculs statistiques.

La forme d’un tableau de traitement peut différer sensiblement selon la nature des modalités.

1- Variable qualitative :

Situation familiale (xi) Effectifs (ni) Fréquences (fi)


x1 : Célibataire n1= 35 f1= 0.35
x2 : Divorcé n2= 20 f2= 0.2
x3 : Marié n3= 30 f3= 0.3
x4 : veuf n4= 15 f4= 0.15

Σ N= 100 1

2-Variable quantitative discrète :

Nombre d’enfants ( x i) Effectifs (ni ) Fréquences ( f i)


0 10 0.2
1 20 0.4
2 05 0.1
3 15 0.3
Σ 50 1
3-Variable quantitative continue :

[ei-1-ei[ Ci centre de classe ni fi

[0-10[ 5 15 0.15 e i−1est l’extrémité inferieur de la classe.

[10-40[ 25 30 0.3
( ei−1 +e i)
c i est le centre de la classe, c i=
[40-60[ 50 25 0.25 2

[60-100[ 80 30 0.3 Amplitude de la classe (longueur), a i =e i – e i−1.

/ 100 1

7- Effectifs (fréquences) cumulés :


On suppose que la variable étudiée est quantitative et que les différentes modalités sont ordonnées par
ordre croissant.

a-Effectif cumulé croissant :


1- Cas de variable statistique discrète : On appelle effectif cumulé croissant jusqu’à la valeur x i de la
variable X, et on note N i la somme des effectifs associés aux valeurs inférieurs ou égales à x i.

2- Cas de variable statistique continue : On appelle effectif cumulé croissant jusqu’à l’extrémité de classe
e i, et on note N i la somme des effectifs associés à la classe [e i−1,e i [ et aux classes précédentes .

i
On a : N i=n1+ n2 +… .+ni=∑ n j
j=1

b-Effectif cumulé décroissant N’i :


C’est la somme des effectifs associés aux valeurs supérieures (strictement) à la valeur observée x i
(l'extrémité e i pour le cas continu).

k
N ’i = ∑ n j et N ’ i=N−N i
j=i+1

5
Remarque :

Les effectifs cumulés croissants N i permettent de connaitre le nombre d’individus présentant une valeur de
la variable inférieure ou égale à une valeur observée (ou à une extrémité de classe donnée).

c- Fréquences cumulées croissantes et décroissantes :


Les fréquences cumulées croissantes Fi permettent de connaitre la proportion d’individus présentant une
valeur de la variable inférieure ou égale à une valeur observée (ou à une extrémité de classe donnée).
i
F i=f 1+ f 2 +… .+ f i=∑ f j
j=1

Pour les fréquences cumulées décroissantes F’i :


k
F ’ i= ∑ f j=1 – F i et F ’ i= ¿
j=i +1 N

Exemple :

Nombre d’enfants (xi) ni Ni N’i fi Fi F ’i


0 40 0 1
0 10 0.25
10 30 0.25 0.75
1 16 0.4
26 14 0.65 0.35
2 7 0.175
33 7 0.825 0.175
3 3 0.075
36 4 0.9 0.1
4 3 0.075
39 1 0.975 0.025
5 0 0
39 1 0.975 0.025
6 1 0.025
40 0 1 0

Σ / / 1 / /

On peut lire dans le tableau :


- Le nombre de familles qui ont un nombre d’enfants inférieur ou égal à 4 est : 39.
- Le nombre de familles qui ont la modalité x 3 est : 7
- L’effectif cumulé croissant N3 est : 33.
- La proportion des familles qui ont plus de 3 enfants est de 10%.

6- Les types de représentations graphiques :

L’objet de la représentation graphique est de représenter l’ensemble des observations en fonction de la


nature de la variable. Il existe plusieurs représentations.

a- Cas d’une Variable


Couleur des yeux (xi) vert bleu Noir Marron
Qualitative :
Effectif (ni) 10 8 20 30
1- Diagramme en
tuyaux d’orgue (à bandes) : c’est un graphique qui à chaque modalité xi associé un rectangle de
base constante et de hauteur propositionnelle à l’effectif ni ou fi.
Exemple :

35
30
25
20
15
10
5
0
Vert Bleu Noir Marron

Diagramme en tuyaux d’orgue 

2- Diagramme à secteurs circulaires ou semi – circulaire :


C’est un graphique qui divise un cercle (demi-cercle) en des proportion angulaires dont les mesures
sont proportionnelles aux effectifs ni ou f i . Pour une modalité x i d’effectif ni ou f i, l’angle α i c
orrespondante est donnée par :
α i= ¿ .360 °=f i .360 °=f i .2 π pour le cercle .
N
α i= ¿ .180 °=f i .180 °=f i . π pour le demi-cercle.
N

Exemple : Utilisant l’exemple précédent : Σ ni=N=68

10 8
f i= ¿ ∙100 → f 1 = .100=14.70 % , f 2= . 100=11.67 % … etc
N 68 68

7
Donc :α i=f i . 360 °→ α 1 =f 1 .360 °=52.94 ° , α 2=f 2 . 360 °=42.35 ° …etc

Couleur des yeux ( xi ) vert bleu Noir Marron


Effectif (ni ) 10 8 20 30
fi 14.70 11.76 29.41 44.11

vert
15%
bleu
Marron 12%
44%

Noir
29%

Diagramme à secteur circulaire

Remarque :

En général les représentations graphiques utilisées par des variables qualitatives restent valable pour
des variables quantitatives mais pas le contraire.

b-Variable quantitatives discrète :

1- Diagramme en bâtons : Il associe à chaque modalité un segment dont la hauteur est proportionnelle
à l’effectif ni ou fi .

Nombre d’enfants xi 0 1 2 3 4
ni 5 15 25 35 20
b- Variable quantitative continue :
1- Histogramme : On appelle histogramme un diagramme de rectangles contigus d’aires
proportionnelles aux ni ou fi , et de bases déterminées par les deux extrémités de classe .
l’histogramme est la surface de l’ensemble des rectangles.

Exemple :

[ei-1 , ei[ ni fi Fi
[0-5[ 4 0.4 0.4
[5-10[ 2 0.2 0.6
[10-15[ 3 0.3 0.9
[15-20[ 1 0.1 1
/ 10 1

Vous aimerez peut-être aussi