Académique Documents
Professionnel Documents
Culture Documents
DEPARTEMENT DE psychologie
COURS DE STATISTIQUES
NIVEAU I
Par
Dr. NDINGA Henri
Doctorat PhD en Marketing , Stratégie et organisations
PLAN DU COURS DE STATISTIQUES NIVEAU I
Objectifs du cours : Amener l’étudiant à se familiariser avec les notions élémentaires de la statistique
descriptive liée à l’observation des faits.
Ce cours est divisé en deux parties : la première est consacrée à l’initiation aux statistiques
descriptives appliquée sur un environnement où l’information à traiter est supposée connue et la
deuxième partie consacrée aux probabilités c’est-à-dire l’apprentissage du traitement des données
dans un environnement incertain
CHAPITRE I : TERMINOLOGIE
SECTION I : Notion de : population, d’individu, de caractère
1- Notion de population
Les ensembles étudiés en statistiques descriptives portent le nom général de population
ou univers .Une population en statistique est un ensemble d’individus faisant l’objet
d’étude ou d’observation.
Exemple : l’ensemble des étudiants de sociologie 1.
Cette terminologie que la statistique a héritée de son premier camp d’action : La
démographie, s’applique aussi bien à des ensembles de personnes humaines qu’à des
ensembles d’objets concrets ou abstraits.
2- Notion d’individu
En statistique descriptive, un individu est un élément de la .population d’étude. C’est
l’objet d’observation ou d’étude. cet objet peut être un animal, un être humain, ou un
objet immatériel.
Exemple :les réunion académiques tenues au département de sociologie., l’étudiant de
sociologie1
3- Notion de caractère
Un caractère est la propriété ou l’aspect singulier que l’on se propose d’observer
dans la population.
Exemple : Le sexe, l’âge, le salaire
Il existe plusieurs types de caractère : Le caractère qualitatif et le caractère quantitatif.
Un caractère est dit qualitatif lorsque ses différentes modalités ne sont pas mesurables
Exemple : le sexe, le rang occupé par un étudiant de par ses performances académiques
Alors qu’un caractère est qualitatif si ses différentes modalités sont mesurables et
repérables.
Exemple : l’âge, le nombre de malade fréquentant un hôpital.
4- Notion modalité et de variable
4-1- Notion de modalité
Une modalité est la position à laquelle se trouve un caractère. Ce terme d’abord utilisé :
Exemple : pour le caractère « sexe » on peut avoir comme modalité : masculin ou
féminin.
Remarque : La définition des modalités d’un caractère, comme d’ailleurs celle de la
population étudiée, doit faire l’objet de soins très attentifs au stade de l’élaboration de
l’information. Les règles doivent être énoncées sans ambiguïté pour tout individu d’une
part s’il appartient ou non à la population et d’autre part à quelle modalité du caractère,
il correspond.
Exemple : si on veut mener une enquête auprès des étudiants de sociologie 1, il faudra
préciser s’il s’agit des étudiants : présents, inscrits, ou réguliers
4-2 –Notion de variable
La variable quant à elle est la valeur numérique que peut prendre un caractère
quantitatif.
Exemple : pour le caractère « âge » des étudiants de sociologie 1, on peut avoir : 14
ans, 15 ans……..
Il existe deux types de variables : la variable discrète et la variable continue
Une variable est dite discrète si ses valeurs possibles sont des nombres isolés
Une variable est dite continue si ses valeurs possibles sont à priori en nombres infini
et quelconque dans un intervalle de valeurs.
R1 : Le nombre de classes ne doit être ni trop, ni trop petit. Un nombre se situant entre
5 et 15 est généralement suffisant.
R2 : Les classes doivent être définies sans ambiguïté de sorte qu’il soit toujours aisé de
déterminer la classe à laquelle appartient une observation.
Pour ce faire, on exige des classes adjacentes les unes aux autres. Par convention, on
donne à chaque classe la forme d’un intervalle fermé à gauche et ouvert à droite.[a ;b)
ou [a ;b[ avec a ϵ[a ;b) et b n’appartient pas à [a ;b)
R3 : Les longueurs d’intervalle associées à chacune des classes doivent être égales.
R4 : Les classes contiennent toutes au moins une observation
𝑏𝑖−1+𝑏𝑖
ci= Ai= bi -bi-1
2
Exemple : à supposer que les âges avancés par les étudiants soient les suivants :
15 ;12 ;20 ; 22 ;24 ;23 ;25 :27 :30 ;31 ;32 ;34 ;35 ;39 ;40 ;45 ;40 ;23 ;22 ;21 ;et que
l’amplitude Ai soit de 5. Nous aurons les classes suivantes :
[12 ;17) ; [17 ;22) ; [22 ;27 ) ; [27 ;32) ;[32 ;37) ; [37 ;42)
500
400
300
200
100
0
TCHAD RCA CAMEROUN GABON CONGO AUTRES TOTA
effectifs
600
500
400
300
200
100
0
0 1 2 3 total
600
500
400
300
200
100
0
effectifs
𝑛𝑖𝑋100
fi= 𝑁
Le cumul des effectifs ou effectifs cumulés notée N est la somme des effectifs dont l’indice
est inférieur ou égal à i. c’est-à-dire Ni=n1 +n2+……..+ni
NB : il est conseillé de placer les effectifs cumulés sur les lignes pour la détermination de la
médiane.
Exemple : soit la distribution suivante des salaires mensuels des employés dans une
entreprise.
Salaires Effectifs N
mensuels(en (ni)
milliers de
francs) 0
125 3 3
3 N/2
130 5 8
135 3 11
200 2 11 13
215 1
14
Total 14
Pour calculer la médiane lorsque la variable est discrète, on suit les étapes suivantes :
On divise l’effectif total par 2
On repère les deux valeurs de l’effectif cumulé qui encadre la moitié de l’effectif
total
On sélectionne la valeur xi située dans la colonne correspondante
Pour le tableau ci- contre on a :
𝑁 14
= =7
2 2
7𝜖[3 ;8) dans la distribution des Ni
b) Signification de la médiane
La médiane se situe à la lisière de 50% d’effectifs cumulés. Soit 50% avant la valeur de
la variable et 50% après cette valeur.
Dans l’exemple précédent on dira que 50% des employés de cette entreprise ont un
salaire inférieur à 130 000frs
c) Cas de la variable continue
Dans le cas de la variable continue, il faut d’abord déterminer la classe médiane par le
procédé décrit dans le cas de la variable discrète puis nous appliquons la formule
suivante :
𝑁
−𝑁𝑒𝑖−1
2
Me=ei-1 +Ai𝑁𝑒𝑖−𝑁𝑒𝑖−1
Exemple : Soit le tableau de distribution suivant des employés d’une entreprise selon
leur niveau d’ancienneté.
Calcul de Me
𝑁
−𝑁𝑒𝑖−1
2
Me= ei-1 +Ai𝑁𝑒𝑖−𝑁𝑒𝑖−1
24.5−10
Me= 2+2
25−10
14.5
Me=2+2
15
Me= 3.93
Traduction : 50% des employés ont une durée d’ancienneté inférieure ou égale à
3.93 ans
2) Le mode :
C’est la valeur de la variable ou la modalité ayant l’effectif le plus élevé ou la fréquence
la plus élevée.
Dans le cas de la variable continue on parle de classe modale.
3) La moyenne arithmétique
La notion de moyenne d’une variable statistique a été introduite à l’origine dans le cas
des grandeurs financières (salaires, revenu, bénéfices…). Ainsi, le salaire moyen d’un
ensemble d’individus est le salaire que chacun percevrait si la masse salariale totale était
répartie de façon égalitaire entre les individus considérés. Elle est symbolisée par 𝑋̅
Elle se calcule par les formules suivantes :
∑𝑁
𝑖=0 𝑛𝑖𝑋𝑖
𝑋̅= Si la variable est discrète
𝑁
∑𝑛
𝑖=0 𝑋𝑖
𝑋̅= Si le caractère est qualitatif avec N= nombre de modalités
𝑁
∑𝑁
𝑖=0 𝑛𝑖𝑐𝑖
𝑋̅= Si variable est continue. Avec ci le centre de la classe i
𝑁
Exemple : Soit la distribution suivante des étudiants selon les jours de retard à l’examen
de fin d’année
Jour de L M Me J V Total
retard
Effectifs 20 10 22 12 11 75
∑𝑛
𝑖=0 𝑋𝑖 75
𝑋̅= AN 𝑋̅= 5 =15
𝑁
SECTION II : Les caractéristiques de dispersion
1) L’ETENDUE
Une première façon de mesurer la dispersion d’une variable statistique consiste à
déterminer l’intervalle dans lequel la variable prend ses valeurs. La différence entre
ces deux nombres est l’étendue de la variable statistique.
2) L’écart-type
L’écart type est la mesure de dispersion la plus usuelle. Cette caractéristique mesure
la concentration de la distribution d’une variable autour de la moyenne arithmétique.
L’idée sous-jacente au concept d’écart type est d’analyser globalement les
déviations observées entre les valeurs prises par une variable et la moyenne de celle-
ci . Il est noté par σ(xi).
Pour calculer l’écart type on calcule d’abord la variance V(x) ou 𝜎 2
Ainsi :
∑𝑁 2
𝑖=0 𝑛𝑖𝑋𝑖
V(x) = - 𝑋̅ 2 Si la variable est discrète avec N= effectif
𝑁
total
∑𝑁 2
𝑖=0 𝑥𝑖
V(x)= - 𝑋̅ 2 si le caractère est qualitatif Avec N= nombre de
𝑁
modalités
∑𝑁
𝑖=0 𝑛𝑖𝑐𝑖
2
V(x) = - 𝑋̅ 2 Si la variable est continue avec N= effectif
𝑁
total
𝜎(x)=√𝑉(𝑥)
𝑁
4
−𝑁𝑒𝑖−1
Q1= 𝑒𝑖−1 + Ai
𝑁𝑒𝑖 −𝑁𝑒𝑖−1
𝑁
3 4 −𝑁𝑒𝑖−1
Q3= 𝑒𝑖−1 + Ai
𝑁𝑒𝑖 −𝑁𝑒𝑖−1
Pour Q1 :
292
N/4= = 73 𝜖[45 ; 145[dans la distribution des Ni
4
Donc Q1 𝜖[20 ; 25[
Pour Q3
3N /4= 219𝜖[145 ; 255[dans la distribution des Ni
Donc Q3𝜖[25 ;30[
Détermination de Q1 ET Q3
𝑁
4
−𝑁𝑒𝑖−1
Q1= 𝑒𝑖−1 + Ai
𝑁𝑒𝑖 −𝑁𝑒𝑖−1
73−45
=20+ 5145−45
140
=20+100
= 20+1.4
=21.4
𝑁
3 4 −𝑁𝑒𝑖−1
Q3= 𝑒𝑖−1 + Ai
𝑁𝑒𝑖 −𝑁𝑒𝑖−1
𝟐𝟏𝟗−𝟏𝟒𝟓
=25+5𝟐𝟓𝟓−𝟏𝟒𝟓
𝟑𝟕𝟎
=25+𝟏𝟏𝟎= 28.36