Vous êtes sur la page 1sur 51

JOUR 2

5- VARIABLES (1/8)

Les variables qualitatives sont constituées de deux sous-classes :


a) Les variables qualitatives nominales : ce sont celles dont les modalités ne
peuvent qu’être constatées, nommées.
Le sexe (masculin, féminin), la nationalité (Canadienne, Française, Marocaine,..), les
cours suivis durant une session (mathématiques, anglais, philosophie,..) …
b) Les variables qualitatives ordinales. ce sont les variables qualitatives dont
les modalités appellent naturellement un ordre dans leur rangement. 
Exemple : Le niveau scolaire (primaire, secondaire, collégial, universitaire),
le comportement lors d’une réception (incongru, correct, parfait,..), …
5- VARIABLES (2/8)

Il existe divers types de données / variables :


Il y a les variables qualitatives :
binaires : homme / femme ; malade / non malade …
nominales : couleur des yeux, des cheveux …
ordinales : degré de satisfaction des étudiants par rapport au cours de statistiques :
peu satisfait / satisfait / très satisfait / il n'y a pas de mots tellement c'était bon !
Autrement, dans le niveau qualitatif on mesure les changements observables: attitudes-
comportements - capacités - perceptions- qualité de vie - niveau de compréhension.
5- VARIABLES (3/8)

Indicateur qualitatif : jugements ou perception des gens.


Méthode de collecte: entrevues, témoignages, groupes de discussions, interrogation
appréciative.
Exemple: satisfaction des patients à la sortie de l’hôpital.
Les variables qualitatives peuvent être représentées de plusieurs manières :
a) diagramme en bâton ou histogramme. Les barres sont proportionnelles aux valeurs
représentées
b) tableau
c) secteur ( = camember) : les surfaces sont proportionnelles aux valeurs représentées
5- VARIABLES (4/8)

Exemple : On relève la couleur des yeux de 90 bébés à la sortie de


la maternité. On constate que:
a) 10 ont les yeux bleus
b) 30 ont les yeux verts
c) 40 ont les yeux marrons
d) 10 ont les yeux verrons (un œil vert et l'autre marron)
5- VARIABLES (5/8)

Les variables quantitatives sont elles aussi subdivisées en deux sous-classes :


a) Les variables quantitatives discrètes : ce sont celles dont les modalités sont des valeurs isolées.
 Le nombre de pannes, le nombre d’accidents, le nombre d’enfants,…
Exemple 1 : Nombre de filles dans une famille de 3 enfants
Modalités : X=0, 1, 2, 3, …
La taille, le poids, glycémie, le revenu,…
Exemple 2: X= Poids (en Kg) de 50 personnes vues en consultations générales sont présentés
sous forme d’une série statistique ordonnée
37 43 47 50 52 54 55 55 58 61 62 63 63 64 65 66 66 67 68 68 69 69 70 71 72 72 72 73 73 74
74 75 76 76 77 79 79 80 82 82 84 86 87 88 90 92 93 93 98 98
5- VARIABLES (6/8)

b) Les variables quantitatives continues, ce sont celles dont les


modalités forment un continuum. Ce sont celles qui peuvent prendre
n’importe quelle valeur dans un intervalle raisonnable.
Exemple 1: Note sur 20 à un examen
Modalités : 0.25, 0.5, 0.75, 1, 1.25, ………………….,19, 19.25,
19.5, 19.75, 20
5- VARIABLES (7/8)

 Le niveau quantitatif adresse les changements mesurables : nombre,


fréquence, taux, variance
Indicateur quantitatif: mesure la quantité
Méthode de collecte : analyses statistiques, questionnaires, recensements

Exemple: Taux prévalence du VIH/SIDA


5- VARIABLES (8/8)

Les variables quantitatives peuvent être


représentées/synthétisées de plusieurs manières :
a) diagramme en bâton ou histogramme
b) synthétisées grâce à des paramètres
6- AMPLITUDE DE CLASSES

•Pour
  calculer l’amplitude des classes, il faut ordonner la série statistique.

Une fois ordonnée, on applique la formule suivante afin de calculer l’amplitude :


a=
N: effectif de l’échantillon
Chaque classe est définie par ses limites, son amplitude nommée a et sa valeur centrale ou centre de classe.
Dans notre exemple, concernant les poids des 50 personnes vues en consultations générales. Il s’agit de
diviser le domaine de variation de la variable, de 37 kg à 98 kg en classes.
Chaque classe est définie par ses limites, son amplitude nommée a et sa valeur centrale ou centre de classe.
Dans notre exemple, nombre de classes== = 7, 07=7
a = = 8,71=9
CAS PRATIQUE 1

Poids en Kg Effectifs (ni)= fréquence absolue


(Classes)

TOTAL
7- FRÉQUENCES (1/2)

•1)  Fréquence absolue


La fréquence absolue est l’effectif des observations d’une classe.
2) Fréquence relative : elle est le quotient de cet effectif par celui de la population.
Le calcul des fréquences ou fi
fi correspondant à chaque valeur xi de la variable tel que fi =
le calcul des fréquences est important car il permet les comparaisons entre deux ou
plusieurs populations d’effectif différent et met en évidence la part de chaque valeur de
la variable par rapport à l’effectif total.
7- FRÉQUENCES (2/2)

3) Fréquences cumulées F1= f1


F2=f1+f2
F3=f1+f2+f3
Le calcul des fréquences cumulées et ou
.
de l’effectif cumulé.
.
.
La fréquence cumulée Fi est la somme ……………………………………..
des fréquences correspondant aux Fi=f1+f2+f3+….+fi
valeurs de la variable statistique discrète Les valeurs de Fi sont écrites entre les lignes
inferieure ou égale à xi. correspondant à la valeur de xi.
CAS PRATIQUE 2

Poids en Kg Effectifs (ni)= Fréquence relative Fréquence relative


(Classes) fréquence absolue (fi=) cumulée (Fi)
2 0,04 0,04
4 0,08 0,12
7 0,14 0,26
14 0,28 0,54
11 0,22 0,76
7 0,14 0,9
5 0,1 1
TOTAL 50 1  
8- REPRÉSENTATION TABULAIRE (1/4)

1) Cas de la variable quantitative (caractère quantitatif)


Pour avoir une idée plus claire de la répartition de ces valeurs, nous allons commencer par
l’ordonner (par valeurs croissantes).
La présentation de ces valeurs peut se faire à l’aide d’un tableau de fréquences (présentation
tabulaire).
Si la variable est continue ou discrète (avec grand nombre de valeurs distinctes, on fait un
regroupement en classes, nombre de classes compris entre 5 et 15).
Exemple : L’étude du poids (en Kg) de 50 personnes vues en consultations générales est
présentée sous forme d’une série statistique ordonnée
37 43 47 50 52 54 55 55 58 61 62 63 63 64 65 66 66 67 68 68 69 69 70 71 72 72 72 73 73 74 74
75 76 76 77 79 79 80 82 82 84 86 87 88 90 92 93 93 98 98
8- REPRÉSENTATION TABULAIRE (2/4)

Poids en Kg Effectifs (ni)= fréquence Fréquence relative (fi=)


(Classes) absolue
2 0,04
4
4 0,08
0,08
7
7 0,14
0,14
14
14 0,28
0,28
11 0,22
11 0,22
7 0,14
7 0,14
5 0,1
TOTAL 5
50 0,1
1
TOTAL 50 1
8- REPRÉSENTATION TABULAIRE (3/4)

2) Cas de la variable qualitative (caractère Sexe Ni Fi


qualitatif)
Le principe est le même pour les variables Masculin 205 0,553
qualitatives.
Exemple 1:
Féminin 166 0,447
Enfants hospitalisés au service de pédiatrie de
l’Hôpital La Paix en 2020.
La variable considérée est ici le sexe de l’enfant
Total 371 1
(masculin, féminin). C’est une variable nominale
8- REPRÉSENTATION TABULAIRE (4/4)

•2)  Cas de la variable qualitative (caractère qualitatif)


Exemple 2: Niveau
Ni Fi
d’instruction
Niveau d’instruction des femmes enceintes dans zone de
Analphabète 328 0,10
Delmas (enquête périnatale 2015)
La variable considérée ici est le niveau d’instruction Primaire 619 0,19
(variable qualitative ordinale). Chaque tableau a son titre, Moyen 965 0,30
son numéro et les notes qui l’accompagnement
Secondaire 918 0,29
ni est appelé l’effectif ou bien fréquence absolue
Supérieur 366 0,12
fi est appelé la fréquence relative avec fi=
N.B : effectif est le nombre d’individus qui ont la même Total 3196  
modalité.
9- REPRÉSENTATION GRAPHIQUE (1/9)

La représentation graphique va dépendre de la nature de la variable.


1) Indication préliminaire :
Un graphe comprend 3 parties : un titre, des coordonnées et un tracé.
1.1) Le titre
En principe, il est le même que celui du tableau dont il est issu.
Un graphique est toujours précédé d’un tableau mais un tableau peut ne pas
être suivi de graphique (mais l’inverse n’est pas vrai). Le titre comprendra
toutes les indications (où, quand, comment, qui, l’unité de mesure)
9- REPRÉSENTATION GRAPHIQUE (2/9)

1.2) Les coordonnées


a) Les axes : le plus souvent ce sont deux axes rectangulaires
b) Les échelles : elles peuvent être arithmétiques ou logarithmiques
1.3) Le tracé
Il peut être fait des points (nuage de points), de droites, de polygones, de courbes,
de surfaces.
2) Représentation graphique des distributions à un caractère :
Suivant la nature du caractère étudié, on utilise différents modes de représentation.
9- REPRÉSENTATION GRAPHIQUE (3/9)

2-1 Caractères qualitatifs Fréquence en %


On représente habituellement les distributions selon un caractère
qualitatif au moyen des secteurs circulaires ou tuyaux d’orque. Autres
16% Sein

a) Secteurs circulaires (diagramme circulaire ou [PERCENTAGE]

camembert) sont utilisés dans cas des variables


nominales. Appareil digestif
6%
Peau
On divise la surface du disque en secteurs dont l’angle au centre 20%
Thyroide
et la surface sont proportionnels aux fréquences des différentes 8%

modalités de la variable étudiée.


Exemple : répartition des principaux cancers les femmes dans le
Organes génitaux
département du Centre 30%

Sein Appareil digestif Thyroide


Organes génitaux Peau Autres
9- REPRÉSENTATION GRAPHIQUE (4/9)

b) Diagramme en bâtons Ni

Dans le cas des variables 1200

ordinales, on les représente sous


1000

800

forme de diagrammes en bâtons. 600

Les bâtons sont alors des bandes 400

verticales de même largeur (en 200

tuyaux d’orgue) 0
Analphabète Primaire Moyen Secondaire Supérieur
JOUR 3
9- REPRÉSENTATION GRAPHIQUE (5/9)

3.1) Variables quantitatives regroupées en classes


Il s’agit de variables quantitatives continues, mais également des variables
discontinues lorsque le nombre de valeurs possibles est trop élevé.
Dans ce cas, les distributions sont essentiellement représentées par
l’histogramme des fréquences et le polygone des fréquences.
9- REPRÉSENTATION GRAPHIQUE (6/9)

a) Histogramme des fréquences


En abscisses, nous représentons les
classes, et en ordonnées les effectifs (ou
encore les fréquences relatives).
Exemple : l’étude du poids de 50
patients vus en consultations générales
9- REPRÉSENTATION GRAPHIQUE (7/9)

b) Polygone des fréquences Effectifs (ni)= Fréquence absolue

Le principe est le même pour le 16

polygone des fréquences 14

12
En abscisse, on considère le centre 10
des classes (ou milieu des classes) et
8
en ordonnée les effectifs.
6

Ce polygone joint les points du milieu 4

du sommet de chaque rectangle de 2

l’histogramme des fréquences. 0


[37 46[ [46 55[ [55 64[ [64 73[ [73 82[ [82 91[ [91 100[
9- REPRÉSENTATION GRAPHIQUE (8/9)

c) Distributions cumulées
L’effectif cumulé d’un intervalle est donné par l’effectif total entre la plus
petite valeur mesurée de la série et celle correspondant à l’extrémité
supérieure de l’intervalle.
9- REPRÉSENTATION GRAPHIQUE (9/9)

3.2) Variables quantitatives discrètes, non Nombre d'épisodes de grippes au cours du mois d'Aout 2020
regroupées en classes 5

4.5
Les courbes de fréquence sont 4

essentiellement représentées par les 3.5

diagrammes en bâtons. 3

2.5

On met en abscisses les valeurs 2

prises par la variable et en ordonnées 1.5

1
les fréquences correspondantes. 0.5

0
1 2 3 4 5
10- MESURES DE TENDANCE CENTRALE (1/10)

Définition: On appelle mesures de tendance centrale,


des valeurs de la variable susceptibles de nous donner
une idée sur la donnée qui occupe le centre d’une série
statistique. On va décrire dans ce paragraphe, les trois
plus importantes mesures de tendance centrale que
sont le mode, la moyenne et la médiane.
10- MESURES DE TENDANCE CENTRALE (2/10)

a) Mode
On appelle le mode d’une variable X, la valeur de la variable qui a la plus grande
fréquence et on le note Mo(X). Le mode est une importante mesure de tendance
centrale pour les variables qualitatives nominales.
Le mode ou la valeur modale ou la valeur dominante est la valeur de la variable
de fréquence maximum.
Remarque : Une distribution peut avoir un seul mode et on dit qu’elle est
unimodale, ou plusieurs modes et on dit qu’elle est multimodale.
CAS PRATIQUE 3

Le mode ou la valeur modale ou la valeur dominante est la valeur de la variable de fréquence


maximum.
Exemple : distribution du nombre d’épisode du syndrome grippal parmi les 19 patients
Nombre d’épisodes Effectif
0 3
1 7
2 6
3 2
4 1
Total 19
Mode =1
10- MESURES DE TENDANCE CENTRALE (3/10)

Dans les séries statistiques continues, la classeTaille en Nombre de ni cum fi fi cum


qui correspond à l’effectif le plus élevé est cm nourrissons
(Classes) (ni)
appelée classe modale. Le mode est déterminé
33 33 7,5
7,5 7,5
7,5
directement en prenant le centre de la classe
10
10 13
13 25
25 32,5
32,5
modale.
99 22
22 22,5
22,5 55
55
Exemple : taille des nourrissons à la naissance 77 29 17,5 72,5
à l’Hôpital Justinien 29 17,5 72,5
7 36 17,5 90
7 36 17,5 90
Dans l’exemple de la taille des nourrissons à la 3 39 7,5 97,5
3 39 7,5 97,5
naissance, la classe modale est 50-52, le mode 1 40 2,5 100
peut être assimilé au centre de la classe 51. 1 40 2,5 100
TOTAL 40      
TOTAL 40      
10- MESURES DE TENDANCE CENTRALE (4/10)

•Pour
  plus de précision, il est calculé par méthode d’interpolation linéaire
Mode= Mo=b inf +
Mo : le mode (la valeur modale)
b inf : borne inferieure de la classe modale
d1 : l’écart (la différence) entre l’effectif de la classe modale et celui de la précédente
(10-3)
d2 : l’écart (la différence) entre l’effectif de la classe modale et la classe lui succédant
(10-9)
a : amplitude des classes (longueur de l’intervalle de classe)
 
Mo=50 +
Mo=50,25 cm
10- MESURES DE TENDANCE CENTRALE (5/10)

b) Médiane
La médiane est la valeur de la série qui divise l’ensemble des observations en parties
égales. 50% des valeurs sont inférieures à la médiane et 50% lui sont supérieures.
 Variable discontinue
Dans la série impaire 3-5-8-9-12, la médiane est égale à 8 (il y a deux valeurs à sa
droite et deux valeurs à sa gauche).
Dans la série paire : 3-5-8-9-12-13, la médiane est située entre 8 et 9 (soit 8,5 qui est
le point milieu entre 8 et 9). Il a trois valeurs à sa droite et trois valeurs à sa gauche.
La médiane est une valeur observée de rang n/2 n étant le nombre total d’observation.
10- MESURES DE TENDANCE CENTRALE (6/10)

•Variables
  continues
Lorsque les données sont groupées en classe, la médiane correspond, si on utilise les effectifs cumulés
à n/2, si on utilise les fréquences relatives cumulées à 0,50 ou 50%. Dans l’exemple de la taille des
nourrissons à la naissance à l’hôpital Justinien, la médiane appartient à la classe 52-54 cm. On peut à
priori attribuer à la médiane la valeur centrale de la classe où elle se trouve soit 53 cm.
Cependant, il serait plus juste de tenir compte de la position de la médiane dans la classe, par la
méthode d’interpolation linéaire.
Me=bmin +
Me : médiane, bmin: borne minimale de classe médiane, N : taille de l’échantillon, S : Somme
des effectifs de toutes les classes qui précèdent la classe médiane, nme: effectif de la classe
médiane, k : amplitude des classes
10- MESURES DE TENDANCE CENTRALE (7/10)

•  
Avec le même exemple de la taille des nourrissons
Me=52 +
Me =53,55 cm
JOUR 4
10- MESURES DE TENDANCE CENTRALE (8/10)

•c)  Moyenne arithmétique


C’est la plus connue et la plus précise des mesures de tendance centrale. La moyenne
arithmétique =m est la somme de chacune des valeurs observées par l’effectif total :
=m==
Soit la statistique suivante : 3, 3, 3, 3, 4, 4, 5, 5, 5, 5, 7, 9
 
La moyenne arithmétique simple pour cette série est :
(3+3+3+3+4+4+5+5+5+5+7+9)/12==4,7
10- MESURES DE TENDANCE CENTRALE (9/10)

•  
Lorsque les données sont regroupées en classe, les valeurs de la classe coïncident
avec le centre de la classe. Pour calculer la moyenne des données groupées en
classes, on applique la formule de la moyenne pondérée.
 
Comme pour les intervalles, on définit les extrémités et le centre de classe.
Par convention extrémité gauche est comprise dans la classe alors que l’extrémité
droite ne l’est pas sauf peut-être pour la dernière classe.
donc le centre de classe est
10- MESURES DE TENDANCE CENTRALE (10/10)

Taille en Nombre Centre de ni.xi


cm de classe •Calcul
  de la moyenne
(Classes) nourrisson
s (ni) m = (la somme des nixi)/N
3 49 147 m= 2156/40
10 51 510
9 53 477 m=53,9 cm
7 55 385
7 57 399
3 59 177
1 61 61
TOTAL 40   =2 156
11- MESURES DE DISPERSION (1/5)

•Il  existe
un grand nombre de mesures de dispersion. La plus simple est l’étendue.
L’étendue se définit comme étant la différence entre la plus grande valeur et la plus
petite valeur observées.
Dans notre exemple sur la taille des nourrissons à la naissance, l’étendue est égale à
62-48=14 cm.
L’inconvénient de cette mesure est qu’elle ne tient compte que des valeurs
extrêmes. C’est ainsi que la mesure la plus utilisée est la variance où l’on considère
la moyenne des différences (xi-)
11- MESURES DE DISPERSION (2/5)

•a)  Variance •=()-


 

Si la série est distribuée en classes, la Si la série est regroupée en classes


variance est donnée par : xi: centres de classes
= ni : effectif de la classe i
xi étant les centres de classes.
𝛔 est la racine carrée de la variance. 𝛔 est
appelé écart-type.
La variance peut être exprimée autrement.
Après simplification des calculs, on obtient :
11- MESURES DE DISPERSION (3/5)

Représentation tabulaire xi
(centres
type pour le calcul de la Classes de ni nixi
classes)
moyenne, de la variance  

et de l’écart-type      

Total   N ∑
11- MESURES DE DISPERSION (4/5)

•  
Exemple : Poids des 50 Poids en Kg
Effectifs
(ni)= Centres de
nixi
personnes vues en consultations (Classes) fréquence
absolue
classes (xi)

générales en kg 2 41,5 83 3444,5


4 50,5 202 10201
=()-=()- 7 59,5 416,5 24781,75

= 190,81 14 68,5 959 65691,5


11 77,5 852,5 66068,75
7 86,5 605,5 52375,75
5 95,5 477,5 45601,25
TOTAL 50   3 596 268 164,5
11- MESURES DE DISPERSION (5/5)

•b)  Ecart-type: Il est la racine carrée de la variance.


𝛔===13,81 kg
c) Coefficient de variation
Le coefficient de variation (coefficient de dispersion) est une caractéristique de dispersion relative qui sert à
comparer les dispersions de distribution qui ne sont pas de même nature. Il est défini par le rapport de l’écart-type
à la moyenne. CV=
Il est souvent exprimé sous forme de pourcentage. Dans la pratique, quand :
 CV>0,33 la distribution a une dispersion importante.
 CV<0,33 la distribution est moins dispersée.
Lorsqu’une distribution est symétrique : le mode, la médiane et la moyenne ont la même valeur puisqu’ils sont
confondus
12- MESURES DE POSITION (1/3)

Les paramètres de position donnent l’ordre de grandeur d’une série statistique.


Les paramètres de dispersion donnent le degré de dispersion des valeurs par rapport à une
valeur centrale.
a) Quartiles : les quartiles divisent la série statistique en 4 parties égales comprenant le
même nombre de sujets.
Le deuxième quartile n’est autre que la médiane.
On systématisera, dans un but de simplification, les différentes situations ainsi :
 Le premier quartile ou quartile inferieur est la note (ou valeur de la variable du 25eme sujet sur 100).
 Le deuxième quartile ou médiane est la note du 50eme sujet sur 100.
 Le troisième quartile ou quartile supérieur est la note du 75eme sujet sur 100.
12- MESURES DE POSITION (2/3)

b) Déciles : les déciles sont au nombre de 9. Ce sont des valeurs de la variable qui
partagent la série statistique en 10 parties comprenant chacune 1/10eme de l’effectif
total.
Par analogie avec les quartiles, le premier décile est la note du dixième sujet sur 100.
Le deuxième décile est la note du vingtième sujet sur 100… le cinquième décile se
confond avec le deuxième quartile et la médiane.
12- MESURES DE POSITION (3/3)

c) Percentiles : les percentiles ou centiles, au nombre de 99, sont les valeurs de la


variable qui divisent la série statistique en 100 parties contenant chacune 1/100eme
de l’effectif total.
De façon générale, les percentiles sont utilisés lorsque le nombre de valeurs de la
série statistique est supérieur à 1000.
Certains percentiles se confondent avec des quartiles déjà vus. Le dixième percentile,
par exemple se confond avec le premier décile.
Selon le même principe que pour les quartiles, les déciles et les percentiles sont
déterminés, soit par interpolation linéaire, soit graphiquement ou mieux encore par
l’utilisation des moyens informatiques.
JOUR 5
RAPPEL GÉNÉRAL

Programme du jour
Discussions/Echanges pour répondre aux questions des étudiantes, et pour
clarifier les points d’ombre.
MERCI

Vous aimerez peut-être aussi