Vous êtes sur la page 1sur 4

Chapitre 1 : Statistique Analyse descriptive

2020/2021

Analyse descriptive
La statistique descriptive a pour but de résumer l’information contenue dans les données de façon à
en dégager les caractéristiques essentielles sous une forme simple et compréhensible. Les deux
principaux outils de la statistique descriptive sont les représentations graphiques et les indicateurs
statistiques.
La statistique est un ensemble de méthodes permettant :
‐ de recueillir des données “brutes” ;
‐ de présenter et résumer ces données ;
‐ de tirer des conclusions sur la population étudiée (sa structure, sa composition), d’aider à la
prise de décision ; en présence de données dépendants du temps, de faire de la prévision.

I. Vocabulaire
Input : Entrée des données en vue d'un traitement ; ensemble des informations destinées à être
traitées ; action d'introduire des données.
Output : Sortie des données après traitement ; ensemble des informations traitées ; action d'extraire
des données.

I.1 Population statistique – Unité statistique – Variables


On appelle population l’ensemble étudié c’est-à-dire celui sur lequel portent les observations ; la
population doit être définie de façon précise et sans ambiguïté. Cet ensemble est noté « Ω ».
Remarque : Soit Ω un ensemble. On appelle et on note Card(Ω), le nombre d’éléments de Ω.
Card(Ω)∶= nombre d’éléments de Ω = N.
Avec :
‐ Card(Ω) : Le cardinal (nombre d’éléments de l’ensemble Ω) ;
‐ ∶= : défini comme étant (symbole d’affectation) ;
‐ N : Ensemble des nombres entiers naturels.
On appelle unité statique (ou individu), un élément particulier d’une population, il est noté « ω »
(ω dans Ω). On s’intéresse à une ou plusieurs particularités des individus appelées variables ou
caractère, elle est noté « X »

I.2 Observation
Des observations concernant un thème particulier sont effectuées sur des individus. La série de ces
observations forme ce que l’on appelle une variable statistique. Par exemple, les notes des étudiants à
l’examen de statistique, les mentions qu’ils ont obtenues à leur bac, les couleurs de leurs yeux, le nombre
d’enfants par maison, etc…

Page 1
Chapitre 1 : Statistique Analyse descriptive
2020/2021

I.3 Echantillon
On appelle échantillon, une partie de la population. Si la population est trop nombreuse pour être
observée dans sa totalité, on fait l’étude sur un échantillon, ceci n’a de sens que si l’échantillon étudié
est représentatif de la population entière.
Exemple 1 : si l’échantillon est un groupe de TD au département génie civile, alors on aura :
- Un individu est un étudiant ;
- la population peut être l’ensemble des étudiants du département génie civil ;
- la variable étudiée peut être la taille, la filière choisie en master, la moyenne d’année, la couleur
des yeux,….
Exemple 2 : si les populations étudiées sont les employés d’une usine, alors on aura :
- Population : Employés d’une usine ;
- Individu : Un employé de cette usine ;
- Caractère : Salaire ;
- Modalités : 15000DA, 20000DA, 25000DA ;
Exemple 3 : si les populations étudiées sont des ressorts, alors on aura :
- Population : Ressorts ;
- Individu : Un ressort parmi ces ressort ;
- Caractère : Rigidité K ;
- Modalités : K ∈ [10 20,] N / m.

I.4 Recensement – Sondage


Si l’échantillon est constitué de tous les individus de la population, on dit que l’on fait un
recensement. Il est extrêmement rare que l’on se trouve dans cette situation, essentiellement pour des
raisons de coût. Quand l’échantillon n’est qu’une partie de la population, on parle de sondage. Le
principe des sondages est d’étendre à l’ensemble de la population les enseignements tirés de l’étude de
l’échantillon. Pour que cela ait un sens, il faut que l’échantillon soit représentatif de la population. Il
existe des méthodes pour y parvenir, dont nous parlerons ultérieurement.
Remarque : le mot « variable » désigne à la fois la grandeur que l’on veut étudier (variable
statistique) et l’objet mathématique qui la représente (variable aléatoire (en probabilité).
Une variable statistique peut être discrète ou continue, qualitative ou quantitative. Les méthodes
de représentation des données diffèrent suivant la nature des variables étudiées.

Page 2
Chapitre 1 : Statistique Analyse descriptive
2020/2021

I.5 Variable qualitative et quantitative


Une variable statistique est dite :
Quantitative : lorsqu’elle est mesurée par un nombre (les notes des étudiants à l’examen de
statistique, le chiffre d’affaire par pme, le nombre d’enfants par maison, . . .). On distingue 2 types de
variables quantitatives : les variables quantitatives discrètes et les variables quantitatives continues.
Les variables discrètes (ou discontinues) ne prennent que des valeurs isolées. Par exemple le
nombre d’enfants par maison ne peut être que 0, ou 1, ou 2, ou 3, . . . ; il ne peut jamais prendre une
valeur comprise entre 0 et 1, ou 1 et 2, ou 2 et 3, . . .
Les variables quantitatives continues peuvent prendre toute valeur dans un intervalle. Par
exemple, la rigidité d’un ressort K qui peut être comprise dans un intervalle [10 20,] N / m.

Qualitative : lorsque les modalités (ou les valeurs) qu’elle prend sont désignées par des noms. Par
exemples, les modalités de la variable : couleur des yeux sont : bleu, marron, noir et vert ; les modalités
de la variable mention au Bac sont : TB, B, AB et P. On distingue deux types de variables qualitatives :
les variables qualitatives ordinales et les variables qualitatives nominales. Plus précisément une
variable qualitative est dite ordinale, lorsque ses modalités peuvent être classées dans un certain ordre
naturel (c’est par exemple le cas de la variable mention au Bac) ; une variable qualitative est dite
nominale, lorsque ses modalités ne peuvent être classées de façon naturelle (c’est par exemple le cas de
la variable couleur des yeux).

I.6 Modalités
Les modalités d’une variable statistique sont les différentes valeurs que peut prendre celle-ci. Ils sont
les différentes situations dans lesquelles les individus peuvent se trouver à l’égard du caractère
considéré.
Exemple :

- Variable est " situation familiale "


- Modalités sont " célibataire, marié, divorcé ".

II. Application
On souhaite connaitre l’état de 100 maisons choix en utilisant différents caractères :

1- Caractère qualitatif
‐ Population : Maisons (100) ;
‐ Individu : Une maison parmi ces 100 maisons ;
‐ Caractère : L’état de la maison ;
‐ Modalités : Petite, moyenne, grande.
2- Caractère quantitatif discret

Page 3
Chapitre 1 : Statistique Analyse descriptive
2020/2021

‐ Population : Maisons (100) ;


‐ Individu : Une maison parmi ces 100 maisons ;
‐ Caractère : Nombre de pièces ;
‐ Modalités : 1, 2, 3, 4, 5.
3- Caractère quantitatif continu
‐ Population : Maisons (100) ;
‐ Individu : Une maison parmi ces 100 maisons ;
‐ Caractère : Surface (notée S) ;
‐ Modalités : S∈ [60, 200] m².

Page 4

Vous aimerez peut-être aussi