Vous êtes sur la page 1sur 7

Introduction 

Comme nous l’avons vu précédemment, la statistique est la branche des

mathématiques qui étudie la variabilité, ainsi que le processus qui la génère selon des

lois et des modèles de probabilité. Nous savons qu’il est nécessaire de faire de la

recherche et de comprendre comment la recherche se fait actuellement , au-delà des

conclusions de toute étude. Mais quels sont les concepts de base de la statistique ?

Ainsi, pour se concentrer sur les concepts de base en statistique, il faut avoir recours à

des statistiques descriptives. Il s’agit de la description de données expérimentales. Plus

précisément de la collecte, de l’organisation et de l’analyse de données sur certaines

caractéristiques de certains individus appartenant à une population donnée.

Selon le professeur Ignacio Cascos, de l’Université Carlos III de Madrid, voici quelques-

uns des concepts de base en statistique que nous devons connaître.


1. La population

La population correspond à un ensemble bien défini sur lequel on peut observer une

certaine caractéristique.

Cette caractéristique peut être finie ou infinie. Ainsi, la taille de la population est le

nombre d’individus qu’elle compte, indiqué par N.

Si la population est très importante, cela devient très coûteux de la mesurer et, dans

certains cas, impossible de tenir compte de chaque individu et une sélection

appelée échantillon est faite.

2. L’individu

Chacun des éléments de la population est appelé un individu. Ces éléments ne doivent

pas nécessairement être des personnes, bien qu’en psychologie c’est le cas le plus

courant.

4. Les variables et les données


Une variable (X) est un symbole qui représente une caractéristique à
étudier dans la population. Nous appelons données (r) la valeur
(numérique ou non) que la variable prend sur un individu spécifique de
l’échantillon.
Le sexe est un exemple de ce type de variable. On dit qu’elles sont
qualitatives parce que les différences entre les catégories sont précisément
qualitatives.

Les variables ordinales


Il s’agit de variables qui sont susceptibles d’être divisées en catégories.
Contrairement à une variable purement qualitative, dans ce type de variable,
on pourrait ordonner les catégories.

Pensons aux notes scolaires, par exemple. Un “A” est supérieur à un “B” et
un “B” à un “C”.
Les variables quantitatives
La variable quantitative concerne des valeurs dans un ensemble standard
de valeurs numériques. Cela signifie que l’on peut la mesurer. La variable
quantitative comprend deux types de variables :
 Discrète. L’ensemble est fini ou dénombrable. Par exemple, le
nombre d’enfants dans une famille.
 Continue. L’ensemble est infini et ne peut être numéroté. Cela
signifie qu’il contient un certain intervalle. Un exemple pourrait
être le temps.

Les mesures de position


En statistique, nous pouvons déterminer la position de nos données à partir
des mesures de position. En voici quelques-unes :

Les mesures de la tendance centrale


Les moyennes ou mesures des tendances centrales sont des valeurs
typiques ou représentatives d’un ensemble de données. Ainsi, elles se
destinent à comprimer toutes les données en une seule valeur.
Il s’agit de concepts très élémentaires en statistique et voici les trois les
plus fréquemment utilisées : la mode (variables qualitatives), la médiane
(variables catégorielles) et la moyenne (variables quantitatives).
 La mode. C’est la valeur de la plus grande fréquence, celle qui
se répète le plus. S’il y a plus d’une de ces valeurs, on qualifie la
variable de “multimodale” et on peut la calculer pour tout type de
variable.
 La médiane. On la calcule pour les variables catégorielles. C’est
un nombre tel qu’au moins 50 % des données sont inférieures
ou égales à la médiane et au moins 50 % sont supérieures ou
égales à celle-ci. Ainsi, s’il y a plus d’une médiane, nous prenons
le point médian entre la médiane la plus grande et la plus petite. Il
s’agit donc des données qui apparaissent dans l’échantillon et qui
servent de médianes.
 La moyenne. Il s’agit de la statistique la plus couramment
utilisée. On la calcule pour les variables quantitatives. C’est, pour
ainsi dire, le centre de gravité géométrique des données. Ce qui
est étrange, c’est qu’avec la moyenne se produit un phénomène
assez intéressant. Il se peut qu’elle ne représente pas
l’échantillon, voire qu’elle ne représente personne dans cet
échantillon. Par conséquent, il est possible que personne n’ait
cette valeur dans la variable.
Il y a beaucoup d’autres concepts que l’on utilise dans les statistiques,
mais ceux que nous venons de vous présenter sont peut-être les plus
fondamentaux. Ainsi, à l’aide de ces concepts, les statistiques descriptives
sont chargées d’épurer, d’organiser et de calculer les statistiques et les
représentations des données afin d’offrir au chercheur, et par extension à
la communauté scientifique, une carte complète de ce qui s’est passé
dans son étude.

https://nospensees.fr/les-concepts-de-base-de-la-statistique-descriptive/
Caractéristiques de tendance centrale
Il s’agit de résumer à travers quelques indicateurs numériques ou paramètres
caractéristiques la distribution d’une variable statistique. On les appelle des
indicateurs de synthèse d’une distribution statistique. On distingue :les
indicateurs de tendance centrale,les indicateurs de position, Les indicateurs de
dispersion, les indicateurs de forme.

Les caractéristiques ou indicateurs de tendance centrale sont le mode, la


médiane et la moyenne.Le modeLe mode est la valeur la plus fréquente dans
une séried’observations

La médiane : C’est la valeur qui sépare une série d’observations ordonnées en


ordre croissant ou décroissant, en deux parties comportant le même nombre
d’observations.Méthode de calcul-cas généralPrésenter les données sous forme
de sérieOrdonner la série par ordre croissant ou décroissantDéterminer si la
série comprend un nombre pair ou impair d’unités statistiques

Soit N le nombre d’observations:Si N est impair, alors la médiane est la valeur


qui occupe le 𝑁 rang de la série ordonnée.Si N est pair, alors la médiane est la
moyenne des valeurs de rang 𝑁 2 et 𝑁Exemple: Série statistique du nombre
d’enfants à charge de 6 employés d’une entreprise : 1; 2; 5; 4; 3 ; 1 La médiane
est 2,5

Méthode de calcul- cas des données groupéesSi les données sont groupées par
classes (cas des variables continues), il faut :localiser la classe médiane, c’est-à-
dire celle qui contient la médiane.calculer par extrapolation linéaire la valeur de la
médiane ;ou déterminer la médiane par projection à partir du diagramme des
fréquences cumulées.

Exemple: Salaires mensuels des employés de l’entreprise YClasses de


salaireEffectifs ( 𝒏 𝒊 )Fréquences ( 𝒇 𝒊 = 𝒏 𝒊 𝑵 )Fréquences cumulées[800,
900[210,20[900 ; 1 000[130,120,32[1 000 ; 1 100[570,540,86[1 100 ; 1
200[100,090,95[1 200 ; 1 300[50,051,00Total106 -Médiane Me = ( )X 𝟎,𝟓𝟎−𝟎,𝟑𝟐
𝟎,𝟖𝟔−𝟎,𝟑𝟐Médiane Me = 1 033,3

50 %. 50 % et dont la classe précédente a une fréquence cumulée NB : La


classe médiane est celle dont la fréquence cumulée est Avantages et
inconvénients de la médianeSon calcul est facile.Elle donne une idée
satisfaisante de la tendance centrale de la distribution.Elle n’est pas influencée
par les valeurs extrêmes de la distribution (valeurs aberrantes).

Avantages et inconvénientsLa médiane Me possède la propriété suivante:𝑖 𝑥 𝑖 −


𝑀 𝑒 ≤ 𝑖 𝑥 𝑖 − 𝑥 0 , pour toute valeur 𝑥 0 de la série différente de la médiane.Elle
ne tient pas compte des valeurs prises par la variable mais seulement de leurs
ordres de grandeur.Elle concerne uniquement les variables quantitatives.

La moyenne arithmétique
Calcul de la superficie moyenne pondérée sur la série observée𝑋 = 1 𝑁 𝑖=1 𝐾 𝑁 𝑖
𝑥 𝑖Application numérique𝑋 = * (20* * * * *5 +38*3)= 20,80 ha

https://slideplayer.fr/slide/14258130/

MODE

C'est la valeur observée d'effectif maximum.

Variable discrète: classer les données par ordre croissant. Celle d'effectif maximum donne le
mode.

Il est fortement conseillé d'utiliser le diagramme en bâtons pour déterminer le mode. En


effet, deux valeurs consécutives xi , xi+1 peuvent avoir le même effectif maximum; on
parlera d'intervalle modal [xi , xi+1]. Il peut aussi y avoir un mélange de deux populations qui
conduit à un diagramme en bâtons où apparaissent deux bosses; on considérera deux
modes. Il est déconseillé, sauf raison explicite, d'envisager plus de deux modes.

Variable classée: la classe modale correspond à la classe ayant l'effectif maximum. Il est
fortement conseillé d'utiliser l'histogramme pour déterminer le mode. Comme pour le cas
discret, on peut avoir deux classes modales. Toutes les valeurs de la classe pouvant à priori
se réaliser, on ne se contentera pas de déterminer la classe modale. Une des valeurs de
cette classe sera le mode. Certains auteurs préconisent par simplicité de prendre le centre
de la classe modale.

QUANTILES

Ce sont des caractéristiques de position.

Il y a 1 médiane Mé qui sépare les observations en 2 groupes d'effectifs égaux

3 quartiles Q1, Q2, Q3 qui séparent les observations en 4 groupes d'effectifs égaux

9 déciles D1, D2, ..., D9 qui séparent les observations en 10 groupes d'effectifs égaux

99 centiles C1, C2, ..., C99 qui séparent les observations en 100 groupes d'effectifs égaux
La détermination de ces caractéristiques est identique à celle de la médiane.

Les quartiles sont obtenus lorsqu'on a cumulé 25, 50, 75% de la population

Les déciles sont obtenus lorsqu'on a cumulé 10, 20,...., 90% de la population

Les centiles sont obtenus lorsqu'on a cumulé 1, 2,...., 99% de la population

https://www.iutbayonne.univ-pau.fr/~grau/1A/cadre4.html