Académique Documents
Professionnel Documents
Culture Documents
La statistique descriptive à une variable est l’ensemble des méthodes qui permet d’obtenir et de faire un
1er traitement des informations relatives à un caractère particulier d’individus d’une population donnée.
La statistique descriptive a plusieurs objectifs:
- recueillir l’ensemble des données relatives à un caractère particulier d’individus d’une population
donnée;
- classer l’ensemble de ces données selon des séries statistiques afin de permettre d’en faire :
* des représentations graphiques pour en visualiser l’allure ;
* des traitements mathématiques pour en déterminer certaines caractéristiques.
Dans cette partie, nous axerons notre propos, d’abord sur la définition des différents concepts que nous
venons d’introduire, ensuite sur les premiers traitements mathématiques en vue de la détermination de
certaines caractéristiques.
Objectifs :
➢ Connaitre les différents termes qui constituent le vocabulaire de la statistique descriptive
ainsi que leurs définitions.
➢ Savoir identifier clairement, dans un exercice ou dans une étude statistique :
Le groupe sur lequel porte une étude.
La caractéristique étudiée et sa nature.
Statistique générale :
La statistique descriptive appartient à un ensemble plus vaste, la statistique générale, qui se divise en
deux branches : statistique descriptive et la statistique mathématique (ou statistique
« inférentielle »).
Les diverses méthodes de la statistique descriptive sont séparées en trois groupes (catégories) selon le
nombre de variables étudiées sur une population :
Statistique à 1 variable (analyse univariée) : ensemble de méthodes visant à décrire et analyser les
données d’une seule variable mesurée sur une population.
Statistique à 2 variables (analyse bivariée) : ensemble de méthodes visant à étudier conjointement deux
(2) variables mesurées sur une même population pour mettre en évidence d’éventuelles relations entre
ces deux variables.
Statistique à plus de 2 variables (analyse multivariée) : ensemble de méthodes visant à étudier plusieurs
(3 et plus) variables mesurées sur une même population pour avoir une bonne description des relations
générales entre ces variables, de déceler des proximités entre individus de la population mais aussi à
déterminer les critères qui contribuent le mieux à « expliquer » les différences ou ressemblances.
A. Terminologie
Population : l’ensemble des éléments sur lesquels porte une étude. La population constitue l’univers de
l’étude.
Unité ou individu statistique : un élément parmi la population sur laquelle porte une étude.
Echantillon : c’est un sous-ensemble de la population. La notion d’échantillon est fondamentale, car, en
règle générale, la population entière n’est pas disponible ou observable. Dans ce cas, seul un échantillon
est étudié et les résultats obtenus sont extrapolés à la population.
Les relations qui existent entre la population, les échantillons et l’unité statistique sont résumées dans le
schéma ci-dessous.
Variable ou caractère statistique : c’est le critère d’étude d’une population. C’est ce qui est observé ou
mesuré sur une population.
Modalité : ce sont les différents résultats (ou valeurs) que peut prendre la variable statistique.
Les éléments suivants sont autant d’exemples de critères (variables) d’étude d’une population.
Le prix
Application 1
On réalise une étude sur la répartition selon le sexe de 400 étudiants de la filière économie-droit à
l’université.
Question
Traduisez ces informations dans le vocabulaire de la statistique descriptive.
Réponse
Exemples:
n = 30 s’il ya 30 étudiants dans l’échantillon ;
n = 2000 s’il y a 2000 habitants dans l’échantillon ;
n = 125 s’il y a 125 livres dans l’échantillon ;
n = 15 000 s’il y a 15000 unités produites constituant l’échantillon ;
etc
Application 3:
On considère le poids des habitants d’une ville comme caractère, on a, pour un échantillon, la
distribution suivante :
Unité statistique : habitant de la ville ; Population : l’ensemble des habitants de la ville ; Caractère
étudié : le poids ; Type de caractère : variable statistique discrète. (dans le cas de l’exemple).
Les effectifs cumulés ou relatives cumulées croissantes sont calculées en cumulant les effectifs cumulés
ou relatives du haut du tableau vers le bas. Elles permettent de répondre aux questions du genre : quel
est le nombre ou la proportion au plus ?
Par contre, les effectifs cumulés ou relatives cumulées décroissantes sont calculées en cumulant les
effectifs cumulés ou relatives du bas du tableau vers le haut. Elles permettent de répondre aux questions
du genre : quel est le nombre ou la proportion au moins (au minimum ou plus de) ?
Si le caractère est continu : *Ci ; Ci+1*est l’intervalle ou classe des modalités avec :
Parmi les 169 personnes, 35 mesurent entre 1,50 m et moins de 1,60 m, ce qui représente 20,71 % de
l’ensemble de l’échantillon.
Le fait de remplacer la classe par ci permet de faire des calculs car on ne sait pas faire des
calculs sur des intervalles.
Série statistique : Une série statistique est l’ensemble constitué des xi et ni.
On parle aussi de distribution statistique à une seule variable, comme par exemple :
Tailles et effectifs ;
Situations matrimoniales et effectifs ;
Ages et effectifs.
Etc.
Question 1: Comment passer d’une série statistique relative à un caractère discret ou continu donnée
sous forme d’une suite de classes *Ci ; Ci+1*et d’effectifs ni de ces classes à une série statistique sous
forme d’une suite de valeurs xi et d’effectifs ni relatifs à ces valeurs ?
Il suffit, dans ce cas, de remplacer chaque classe [Ci ; Ci+1[par son élément central ci = (Ci + Ci+1)/ 2
auquel il faut affecter l’effectif ni.
On remplace chaque classe par le centre de cette classe, on obtient alors la série équivalente suivante :
Application 2: On considère la série statistique relative aux notes obtenues dans une matière, par les
étudiants d’une classe d’école :
On remplace chaque classe par le centre de cette classe, on obtient alors la série équivalente suivante :
Remarquons que cette méthode repose sur l’hypothèse simple suivante qui consiste à admettre que les
effectifs se répartissent de façon régulière dans une classe.
Application 2: Reprenons l’exemple 13 et considérons la série statistique relative aux notes obtenues
dans une autre matière, par les étudiants d’une classe d’école :
Dans cette série, les amplitudes des différentes classes sont : 6 ; 2 ; 6 ; 4. Leur PGCD est 2. On remplace
chaque classe par plusieurs autres classes et on obtient alors la série équivalente suivante :
Remarque: Ainsi on peut considérer que toute série statistique est donnée, selon les besoins du
traitement numérique:
- Soit sous forme d’une suite de classes *Ci ; Ci+1*et d’effectifs ni.
- Soit sous forme d’une suite de valeurs xi et d’effectifs ni.
Question 2: Comment passer d’une série statistique relative à un caractère discret ou continu donnée
sous forme d’une suite de valeurs xi à une série donnée sous forme d’une suite de classes *Ci , Ci+1* et
d’effectifs ni par classe ?
Pour ce faire, on utilise la règle de STURGES donnant le nombre k de classes en fonction du nombre n
des données :
k = 1 + 3,322 log n
Ce calcul donne un nombre réel, on prend alors pour k le nombre entier très proche du résultat de calcul
de la formule précédente.
xmax et xmin étant la valeur maximale et la valeur minimale prises par le caractère, les différentes classes
seront alors :
La borne inférieure de la première classe C1 est égale à xmin ou à une valeur légèrement inférieure à xmin.
Application 1: En prenant la taille comme caractère des habitants d’une ville on a les résultats relatifs à
un échantillon de 169 habitants:
Remarque: on aboutit à 9 classes au lieu de 8 du fait de la configuration des intervalles définissant les
classes.
Légende du tableau:
Le nombre de personnes pesant entre 64 et moins de 70 kilogrammes est 10, ils représentent 12,5 % des
personnes pesées.
Le nombre de personnes pesant au moins 70 kilogrammes est 56, ils représentent 70 % des personnes
pesées.
Le nombre de personnes pesant moins de 82 kilogrammes est 59, ils représentent 73,75 % des personnes
pesées.
Pour récapituler toute cette première partie, donnons, dans un tableau synthétique, grâce à des
exemples, l’ensemble des concepts que nous avons introduits jusque-là: