Vous êtes sur la page 1sur 81

OFPPT-DRIF-CDCGC STATISTIQUE PAGE1

REMERCIEMENTS

La DRIF / Le CDC Gestion Commerce remercie toutes les personnes qui ont participé à l’élaboration de ce guide
de soutien.

Pour la supervision

Nom et prénom Qualité Direction


AGLAGALE MOHAMMED Directeur CDC GC DRIF

Pour la conception :

Nom et prénom QUALITE Affectation

AMIZ AZIZA Formateur CDC GC


DOURID SOUAD Formateur ISTA1, SETTAT
EL ATTITER HANANE Formateur CMC LAAYOUNE

Pour la validation :

Nom et prénom Qualité affectation

AMIZ AZIZA Formateur Animateur DRIF

IDRISSI BRI MLY Formateur DRIF


YOUNE

N.B :
Les utilisateurs de ce document sont invités à communiquer à la DRIF / CDC GESTION
COMMERCE toutes les remarques et suggestions afin de les prendre en considération pour
l’enrichissement et l’amélioration de ce manuel.

OFPPT-DRIF-CDCGC STATISTIQUE PAGE2


Module M109 : STATISTIQUES
Durée : 80 H

OBJECTIF OPERATIONNEL

COMPORTEMENT ATTENDU

Pour démontrer sa compétence, le stagiaire doit appliquer les méthodes statistiques


Selon les conditions, les critères et les précisions qui suivent.

CONDITIONS D’EVALUATION

 A partir des études de cas, mise en situation, consignes du formateur, toute documentation nécessaire
 A l’aide de : calculatrice, tableur et logiciel de statistiques,

CRITERES GENERAUX

 Respect de la démarche de calcul


 Respect des principes de gestion de temps
 Respect des pratiques et courantes et des règles établies par l’entreprise
 Exactitude des calculs
 Vérification appropriée du travail

OFPPT-DRIF-CDCGC STATISTIQUE PAGE3


PRECISIONS SUR CRITERES PARTICULIERS
LE COMPORTEMENT ATTENDU DE PERFORMANCE

A. Utilité de la statistique  Définition de la statistique


 Rôle et objectif de cette étude
 Méthodes utilisée

B. Comprendre les variables statistiques  Qualification d’une variable qualitative


 Qualification d’une variable quantitative
discrète
 Qualification d’une variable quantitative
continue
C. Réaliser des représentations graphiques

 Représentation correcte des variables


quantitatives discrètes
 Représentation correcte des variables
quantitatives continues
D. Calculer les Caractéristiques de distribution

 Calcul et interprétation juste des paramètres


de tendance centrale
a. Mode
b. Médiane
c. quartiles
d. Moyennes
 Calcul et interprétation correcte des
paramètres de dispersion
e. Étendue
f. Écart absolu moyen et écart inter
quartile
E. Déterminer les Liens entre deux variables g. Variance, écart-type et coefficient
de variation

 Traitement du cas de deux caractères


quantitatifs (coefficient de corrélation linéaire,
ajustement par la droite des moindres carrés,
rapport de corrélation)
 Traitement du cas d’un caractère quantitatif et
d’un caractère qualitatif (rapport de
corrélation)
 Traitement du cas de deux caractères
qualitatifs

OFPPT-DRIF-CDCGC STATISTIQUE PAGE4


F. Exploiter les principales fonctionnalités d’un tableur  Concevoir un questionnaire
ou d’un logiciel des statistiques. ( proposé dans ce  Diffuser et collecter les réponses
cours le logiciel sphinx )  Gérer des données et analyser des résultats Commenté [A1]:

OFPPT-DRIF-CDCGC STATISTIQUE PAGE5


CHAPITRE I : GENERALITES :

L’activité statistique est historiquement ancienne.


Aux époques les plus reculées, on trouve des exemples de dénombrement des personnes (guerre) et des biens
(impôts).
A cette époque ancienne, la statistique apparaissait sous l’aspect incomplet de dénombrement mais
progressivement avec le développement des besoins en recensement, la statistique s’intéresse de plus en plus
à l’étude de phénomènes observés qu’il faut interpréter et par la suite, rechercher les lois qui les régissent.
Exemple : (La mortalité des enfants est un fait observé et analysé pour en déterminer les causes).
Cette évolution nous conduit à distinguer les statistiques de la statique :
 Les statistiques représentent les informations chiffrées relatives à un phénomène défini.
Exemple : Notes des examens d’un groupe constitué de 5 stagiaires :
Stagiaire 1 : 15/20 ;
Stagiaire 2 : 13/20 ;
Stagiaire 3 : 12/20 ;
Stagiaire 4 : 11/20 ;
Stagiaire 5 : 9/20.

 La statistique peut être définie comme une méthode scientifique qui vise à analyser des données
quantitatives.
Exemple : Après analyse des données précédentes, on peut conclure que les stagiaires qui ont une note
supérieure à 10 représentent 80 % des éléments du groupe.

I : DEFINITION DE LA STATISTIQUE :
C’est une méthode qui étudie des phénomènes observés, à travers la collecte, le traitement et
l’interprétation de données, afin de les rendre compréhensibles.

OFPPT-DRIF-CDCGC STATISTIQUE PAGE6


II : TERMINOLOGIE ET SYSTEME DE NOTATION EN STATISTIQUE :
1) Les concepts utilisés en statistique :
La statistique utilise des concepts qui sont employés dans un sens particulier.
A) Les concepts : « Population ou univers », « Unité statistique » et « Echantillon ».
Les études statistiques portent sur de grands ensembles appelés « Univers » ou « Population ».
La population désigne, alors, tout ensemble soumis à une étude statistique.
Exemples : L’ensemble des bicyclettes d’un garage constitue une population, il en est de même de l’ensemble
des stagiaires dans une salle de cours.
Les éléments de ces ensembles sont des « Individus » ou « Unités statistiques ».
Lorsqu’on considère un petit nombre, on forme un « Echantillon ». Il s’agit donc d’un sous-ensemble de la
population qui doit être représentatif de tout l’ensemble étudié.

X X X X X X X X X X X X X X

X X X X X X X X X X X X X Population

X X X X X X X X X X X X X
Echantillon
X X X X X X X X X X X X X

X X X X X X X X X X X X X X
Unité statistique

B) Les concepts : « Caractère », « Modalité », « Variable statistique ».


Dans l’étude d’une population, l’attention se porte en général sur un trait déterminé commun à toutes les
unités statistiques. Ce trait s’appelle « Caractère ». Exemple : La taille, l’âge, le poids,…
Le caractère étudié peut apparaitre à des niveaux différents, selon les unités statistiques étudiées. Chacun de
ces niveaux est appelé : « Modalité » du caractère.
Il existe deux types de caractères :
 Le caractère est qualitatif lorsque ses modalités ne sont pas mesurables.
Exemple : Dans une population de pièces usinées par un atelier, une pièce peut être « Bonne » ou
« Défectueuse ». Le caractère comporte dans ce cas deux modalités non mesurables.
 Le caractère est dit quantitatif lorsque ses modalités sont mesurables.
Exemple 1 : Dans un immeuble, on peut classer les appartements en fonction du nombre de chambres : 2
chambres, 3 chambres, 4 chambres. Ce caractère a trois modalités.
Exemple 2 : Dans une entreprise, les individus peuvent être classés en fonction de leurs âges, (on utilisera
des tranches) : [20 ; 25[ ; [25 ; 30[ ; [30 ; 35[…

Ainsi, les modalités d’un caractère sont élaborées à partir de nombres. Ceux-ci varient et constituent ce
que l’on appelle « variable statistique ».
Une variable statistique peut prendre deux catégories de valeurs :
- Soit des valeurs isolées (souvent entières) d’un intervalle donné. Cette variable est appelée « Variable
Statistique Discrète ou Discontinue ». Exemple 1 : Nombre de chambres par appartement.
- Soit toutes les valeurs d’un intervalle (des valeurs infinies dans un intervalle donné). Cette variable est
appelée « Variable Statistique continue ». Exemple 2 : L’âge des individus est une variable statistique
continue.
OFPPT-DRIF-CDCGC STATISTIQUE PAGE7
C) Série Statistique ou Distribution Statistique.
C’est une suite de valeurs qui mesurent un caractère. La série statistique peut être une série simple ou une
série classée.

Nombre d’enfants à charge Nombre de ménages (Effectifs) (1)


0 15
1 18
2 15
3 6
4 3
5 3
60

Taille Nombre d’enfants (Effectif) (1) Fréquence (2)


[1,50 ; 1,60[ (3) 10 0,10
[1,60 ; 1,70[ (3) 30 0,30
[1,70 ; 1,80[ (3) 40 0,40
[1,80 ; 1,90[ (3) 20 0,20
(1) On appelle « Effectif » (ou Fréquence absolue), le nombre d’observations relatif à une modalité donnée.
L’effectif total est la somme des effectifs individuels ou partiels.
(2) On appelle « Fréquence » ou (fréquence relative) le rapport de l’effectif d’une modalité à l’effectif total.
(3) On appelle « Classe » le regroupement des valeurs selon des intervalles qui sont égaux ou inégaux.
Chaque classe a une limite supérieure et une limite inferieure. Ces limites définissent les intervalles de
classe. Chaque classe a un centre de classe.

2) Le système de notation en statistique :


Le caractère est désigné par x, les différentes modalités sont notées (x1 ; x2 ; x3 ; … ; xn).
Pour les séries classées, les xi désignent les centres de classe.
Les effectifs sont notés (n1 ; n2 ; n3 ;… ; nn). L’effectif total est noté : N
N = n1 + n2 + n3 + n4…+ nn
Les fréquences sont notées (f1 ; f2 ; f3 ; … ; fn). La fréquence de la modalité x3, par exemple, sera notée : f3
= n3 / N

a) Notation symbolique d’une somme :


En statistique, on utilise souvent l’opérateur « ∑ » (sigma) pour désigner la somme.
On peut écrire : n1 + n2 + n3 + …+nn = ∑𝒏𝒊=𝟏 𝒏𝒊 qui se lit : Somme des ni (i varient de 1 a n).
D’une façon générale, soit une variable x qui prend les valeurs (x1 ; x2 ; x3 ; … ; xn) :
La somme x1 + x2 +x3 +…+ xn = ∑𝒏𝒊=𝟏 𝒙𝒊
b) Notation symbolique d’un produit :
Soient n valeurs x1 ; x2 ; x3…….xn. Le produit x1 * x2 * x3…* xn = ∏𝑛𝑖=1 𝑥𝑖

OFPPT-DRIF-CDCGC STATISTIQUE PAGE8


III : LA STATISTIQUE ET LA GESTION DES ENTREPRISES :
Pour l’entreprise, la statistique a deux principales utilités :
- Le pilotage pour savoir où on en est : elle sert à satisfaire aux besoins réglementaires ou au
besoin de communiquer dans l’entreprise. Exemples : Indicateurs sur l’effectif ou la
rémunération du personnel…
- La statistique constitue un outil d’aide à la décision. En effet, La qualité des décisions
dépend, en partie, de l’analyse statistique des données recueillies.

IV : APPORT DE LA STATISTIQUE AUX ECONOMISTES :


La statistique est un outil indispensable tant aux théoriciens qu’aux praticiens de l’économie.
La statistique est utile aux théoriciens :
Elle permet de mettre en évidence (révéler) l’existence d’interdépendance entre différents
phénomènes économiques.
Elle permet de tester la validité d’une hypothèse théorique.

La statistique est utile aux praticiens de l’économie :


La statistique permet aux entrepreneurs de mieux contrôler la gestion de leurs entreprises.
Elle permet également aux pouvoirs publics de mieux définir leurs politiques économique,
fiscale, monétaire et d’emploi.

V : LES METHODES UTILISEES


Le choix d’une méthode d’analyse de données est une première étape primordiale dans
l’exploitation des données.

Dans cet objectif, plusieurs outils numériques (moyenne, mode, variance….) et graphiques (histogramme,
tuyaux d’orgue…) existent et permettent de résumer un ensemble de données et d’étudier ses caractéristiques
comme la tendance centrale et la dispersion. Ces outils peuvent être également utilisés pour décrire
l’association parmi plusieurs variables.

Le choix d’un outil de statistique descriptive peut être lié aux caractéristiques des variables, comme leur type
et leur nombre, ainsi qu’à l’objectif de l’étude.

OFPPT-DRIF-CDCGC STATISTIQUE PAGE9


VI : LES LIMITES DE LA STATISTIQUE :
La collecte des données statistiques peut présenter certaines limites :
- La contrainte de coût si la population visée est nombreuse,
- La contrainte temps,
- La qualité des données recueillies.

VII : ELABORATION DES TABLEAUX STATISTIQUES


Une étude statistique comporte généralement 3 étapes :
1ère étape : Détermination de l’ensemble à étudier
2ème étape : Choix du procédé de collecte des données: Recensement ou Echantillonnage.
Le recensement consiste à procéder à un relevé exhaustif, c’est à-dire à dénombrer et à compter toutes les
unités de la population.
L’échantillonnage consiste à faire un relevé par sondage, c’est à-dire à sélectionner une partie de la population
afin de pouvoir généraliser ses caractéristiques à l’ensemble de la population.
3ème étape : Dépouillent et présentation des résultats.
Exemple : Etude de la taille des stagiaires de la première année.
1ère étape : Définition de l’ensemble à étudier : Les stagiaires de la première année dont on va étudier la taille.
2ème étape : Collecte des données : On va procéder par échantillonnage : échantillon composé de 10 stagiaires
dont les tailles sont les suivantes :
1,60 1,70 1,52 1,60 1,52 1,73 1,76 1,75 1,60 1,80
3ème étape : Dépouillement et représentation des résultats
Classement par ordre croissant :
1,52 2
1,60 3
1,70 1
1,73 1
1,75 1
1,75 1
1,76 1
1,80 1

Présentation du tableau statistique :


Tailles Effectifs
[1,50-1,60[ 2
[1,60-1,70[ 3
[1,70-1,80[ 4
[1,80-1,90[ 1
Total 10

OFPPT-DRIF-CDCGC STATISTIQUE PAGE10


Autres exemples de tableaux statistiques :
Exemple 1 : Cas d’un caractère qualitatif :
Dans une entreprise de fabrication de matériel électronique, on dénombre 96 salariés que l’on classe en
fonction de leur qualification :
Modalités du caractère Effectifs ni Fréquences fi
Manœuvre 41 0,43
Ouvriers spécialisés 30 0,31
Cadres 17 0,18
Autres 8 0,08
Total 96 1
Le tableau montre que 43 % du personnel est composé de manœuvre, 31 % d’ouvriers spécialisés…
Exemple 2 : Cas d’un caractère quantitatif :
a) Variable statistique discrète :
Dans un ensemble résidentiel, on considère 320 appartements classés en fonction du nombre de pièces ; les
résultats sont regroupés dans le tableau suivant :
Valeurs possibles de la variable xi Effectifs ni Fréquences fi
1 47 0,15
2 63 0,20
3 152 0,47
4 38 0,12
5 20 0,06
Total 320 1
Dans le tableau, on lit que 15 % des appartements ont 1 pièce, 20 % ont 2 pièces, …
b) Variable statistique continue :
Dans une entreprise, on classe les individus en fonction de leur salaire horaire :
Classes de valeurs possibles Effectifs ni Fréquences fi
[15-20[ 23 0,24
[20-25[ 25 0,26
[25-35[ 31 0,32
[35-45[ 11 0,12
[45-50[ 6 0,06
Total 96 1
Ce tableau relève que 24 % des salariés perçoivent un salaire horaire inférieur à 20 DH, 26 % un salaire
horaire compris entre 20 et 25…

OFPPT-DRIF-CDCGC STATISTIQUE PAGE11


OFPPT-DRIF-CDCGC STATISTIQUE PAGE12
CHAPITRE II : LES REPRESENTATIONS GRAPHIQUES
L’intérêt des représentations graphiques est qu’ils
permettent de visualiser les caractéristiques générales de la
population observée. Ils jouent, en effet, un rôle de synthèse
visuelle et permettent la saisie, d’un coup d’œil, de
l’ensemble du phénomène étudié.
Le choix des graphiques à retenir dépend de la nature du
caractère retenu pour étudier la population.

I : CAS DES CARACTERES QUALITATIFS :


A. Les graphiques à secteurs : Les secteurs circulaires :
A partir d’un cercle, qui représente la population, on trace des portions (ou secteurs) correspondantes à
chacune des modalités. Il convient, donc, de déterminer l’angle au centre
𝛼 i relatif à la modalité n° i : 𝛼 i = 360 * fi
On montre qu’une fois considérées toutes les modalités du caractère, on couvre tout le cercle, en effet :
∑𝒌𝒊=𝟏 𝛼 i = ∑𝒌𝒊=𝟏 360 ∗ fi = 360 ∗ ∑𝒌𝒊=𝟏 fi = 360° .
∑𝒌𝒊=𝟏 𝛼 i = 𝟑𝟔𝟎°.

Exemple : Reprenons l’exemple précédent :


Modalités du caractère Effectifs ni Fréquences fi
Manœuvre 41 0,43
Ouvriers spécialisés 30 0,31
Cadres 17 0,18
Autres 8 0,08
Total 96 1

𝛼 1 = 360 * 0,43 = 155°


𝛼 2 = 360 * 0,31 = 111° ∑𝒌𝒊=𝟏 𝛼 i = 𝛼 1 + 𝛼 2 + 𝛼 3 + 𝛼 4 = 360°
𝛼 3 = 360 * 0,18 = 65°
𝛼 4 = 360 * 0,08 = 29°

OFPPT-DRIF-CDCGC STATISTIQUE PAGE13


Représentation graphique :

Remarque :
Lorsque le nombre de modalités est réduit,
on peut utiliser les diagrammes semi-
circulaires. A ce moment, l’angle au centre
relatif à une modalité i est égal à :
𝛼 i = 180 * fi

B. Les tuyaux d’orgue :


Les tuyaux d’orgue sont des rectangles qui ont la même base. La hauteur représente la valeur de l’effectif ou
de la fréquence. La surface est donc proportionnelle à l’effectif ou à la fréquence.
Exemple : Le tableau suivant nous donne l’état matrimonial de 100 personnes
Etat matrimonial Effectif ni Fréquences
Célibataire 30 0,30
Marié 40 0,40
Divorce 10 1,10
Veuf 20 0,20
Total 100 1,00

Représentation graphique :

Etat matrimonial de la population étudiée

OFPPT-DRIF-CDCGC STATISTIQUE PAGE14


II : CAS DES CARACTERES QUANTITATIFS :
Il est nécessaire de distinguer les variables statistiques discrètes des variables statistiques continues.
1) Variables statistiques discrètes :
Selon l’objectif de l’étude, on utilisera :
 Les diagrammes en bâtons,
 La courbe cumulative.
1.1) Les diagrammes en bâtons :
A chacune des valeurs possibles de la variable, on fait correspondre un bâton dont la hauteur est
proportionnelle à l’effectif.
Exemple : Répartition des ménages selon le nombre d’enfants à charge

Nombre d’enfants à charge xi Effectifs ni Fréquences fi


0 40 0,10
1 60 0,15
2 160 0,40
3 20 0,05
4 120 0,30
Total 400 1

OFPPT-DRIF-CDCGC STATISTIQUE PAGE15


Remarque : On peut également utiliser les fréquences pour construire le diagramme.

1.2) Les courbes cumulatives :


Dans le cas d’une variable discrète, on convient de représenter la courbe cumulative par un graphique en
escalier.
Exemple : Reprenons l’exemple de l’ensemble résidentiel composé des 320 appartements qui sont classés
en fonction du nombre de pièces.
Valeurs possibles de la Effectifs ni Fréquences fi Fréquences
variable xi cumulées
1 47 0,15 0
2 63 0,20 0,15
3 152 0,47 0,35
4 38 0,12 0,82
5 20 0,06 0,94
Total 320 1 1

La lecture du tableau donne :


 La proportion des appartements qui ont moins d’une (1) pièce est nulle.
 La proportion des appartements qui ont moins de 2 pièces est de 0,15 (15 %).
 La proportion des appartements qui ont moins de 3 pièces est de 0,35 (35 %).
 La proportion des appartements qui ont moins de 4 pièces est de 0,82 (82 %).
 La proportion des appartements qui ont moins de 5 pièces est de 0,94 (94 %).
 La proportion des appartements qui ont moins de 6, 7, …n pièces (n > 5) est égal à 1. C'est-à-dire que la
totalité des appartements observés a au plus 5 pièces (en tout cas moins de 6 pièces).

Représentation graphique :

1 -
0,94 -
0,82 -

0,35 -

0,15 -
0 -

OFPPT-DRIF-CDCGC STATISTIQUE PAGE16


0 1 2 3 4 5

2) Variables statistiques continues :


La représentation graphique de ces distributions se fait en particulier à partir :
 d’histogrammes et de polygones de fréquences,
 de courbes cumulatives.

2.1) Histogrammes et polygones de fréquences


a) Définitions :
L’histogramme permet de représenter les séries de classes. Il est constitué de rectangles juxtaposés dont la
base est égale à l’amplitude des classes. (L’amplitude représente la différence entre la valeur de fin et la valeur
de début de la classe).

La hauteur de ces rectangles fait intervenir les effectifs (ou fréquences) :


 Quand les amplitudes des classes sont égales, la hauteur pour une classe n° i, est égale à l’effectif
observé.
 Quand les amplitudes des classes sont inégales, cette hauteur est égale à l’effectif corrigé.
Pour les corrections des effectifs :
 On choisit une amplitude de référence.
 On corrige les effectifs des classes dont l’amplitude est différente de l’amplitude de base. Corriger
l’effectif consiste à le diviser par le rapport :
Amplitude de la classe / Amplitude de base.

N. B. : La surface correspondante à une classe i est proportionnelle à l’effectif ni de cette classe.

b) Exemples :
Exemple 1 : Cas où les classes ont la même amplitude
La série suivante nous donne la répartition de 12 personnes selon le salaire horaire.
Salaire horaire ni
[10-20[ 4
[20-30[ 5
[30-40[ 2
[40-50[ 1
Total 12
Représentation graphique :
ni
5 -

4 -

3 -

2 -

1 -
OFPPT-DRIF-CDCGC STATISTIQUE PAGE17
0 -
10 20 30 40 50 xi

Exemple 2 : Cas où les classes n’ont pas la même amplitude


Soit la série suivante qui donne la répartition de 11 personnes selon le salaire horaire.
Salaire horaire ni ai Effectifs corrigés
[10-20[ 4 10 4
[20-30[ 5 10 5
[30-50[ 2 20 1
Total 11 - -
Les amplitudes des classes ne sont pas égales, il convient de corriger les effectifs des classes.
On choisit comme amplitude de base la plus petite amplitude soit 10. L’effectif à corriger est n3 : L’effectif
corrigé n’3 = 2 / (20/10) = 1

Représentation graphique :
ni
5 -

4 -

3 -

2 -

1 -

0 -
10 20 30 40 50 xi

c) Tracé du polygone des effectifs ou des fréquences :


Le polygone des effectifs est la ligne brisée joignant les milieux des côtés supérieurs des différents
rectangles constituant l’histogramme. (On parle de polygone des fréquences lorsque les hauteurs des
rectangles sont mesurées par des fréquences).
La surface comprise entre le polygone est l’axe des abscisses est égale à la surface de l’histogramme.

Exemples :
Exemple 1 : Cas où les classes ont la même amplitude
On reprend l’exemple 1 précédent pour tracer le polygone des fréquences.
Salaire horaire ni
[10-20[ 4
[20-30[ 5
[30-40[ 2
[40-50[ 1
OFPPT-DRIF-CDCGC STATISTIQUE PAGE18
Total 12

Représentation graphique :
ni
5 -

4 -

3 -

2 -

1 -

0 -
10 20 30 40 50 xi

Exemple 2 : Cas où les classes n’ont pas la même amplitude


On reprend l’exemple 2 précédent pour tracer le polygone des fréquences.

Salaire horaire ni ai Effectifs corrigés


[10-20[ 4 10 4
[20-30[ 5 10 5
[30-50[ 2 20 1
Total 12 - -

Représentation graphique :
ni
5 -

4 -

3 -

2 -

1 -

0 -
10 20 30 40 50 xi
c) Tracé du polygone des effectifs ou des fréquences :

OFPPT-DRIF-CDCGC STATISTIQUE PAGE19


2.2) Courbe cumulative : Polygone des fréquences cumulées
Les effectifs (ou les fréquences) cumulés se déduisent par additions successives. On peut cumuler de deux
manières :
 Par ordre croissant : Effectifs (ou fréquences) cumulés croissants,
 Par ordre décroissant : Effectifs (ou fréquences) cumulés décroissants.
Le polygone des effectifs (ou des fréquences) cumulés croissant nous donne le nombre d’observations
inférieures à une valeur donnée du caractère, c’est pourquoi, on l’appelle « Polygone de moins de »
Le polygone des effectifs (ou des fréquences) cumulés décroissants nous donne le nombre d’observations
supérieures à une valeur donnée du caractère, c’est pourquoi, on l’appelle « Polygone de plus de »
Exemple : Reprenons le tableau relatif à la répartition des 12 employés selon le salaire horaire.
Salaire horaire ni ni cumulés croissants ni cumulés
décroissants
[10-20[ 4 4 12
[20-30[ 5 9 8
[30-40[ 2 11 3
[40-50[ 1 12 1
Total 12 - -

Représentation graphique :
ni
12 -

10 -
Courbe cumulée croissante
8 - Courbe « des moins de »

6 -

4 -
Courbe cumulée décroissante
2 - Courbe « des plus de »

0
10 20 30 40 50 xi

OFPPT-DRIF-CDCGC STATISTIQUE PAGE20


Chapitre III : LES PRANCIPALES CARACTERISTIQUES
D’UNE SERIE

INTRODUCTION :
Les représentations graphiques constituent une manière géométrique qui permet de visualiser les
caractéristiques générales d’une population. Cependant, elles présentent l’inconvénient d’avoir un certain
aspect « subjectif ».

Le présent chapitre va permettre de définir des indicateurs dont l’objet est de résumer quantitativement les
caractéristiques d’ensemble des séries statistiques.

SECTION I : LES CARACTERISTIQUES DE TENDANCE CENTRALE (OU DE


POSITION)
I/ LES MOYENNES :
A) La moyenne arithmétique :
1) Définition :
Etant donné n observations : x1, x2, ….xi, … xn connues individuellement (une par une), on appelle
moyenne arithmétique la quantité x tel que :
x = (x1 + x2 +x3 +…+ xn ) / (1+1+1+…..+1) = (x1 + x2 +x3 +…+ xn ) / n
x = (∑𝒏𝒊=𝟏 𝒙𝒊) / n
On appelle x = (∑𝒏𝒊=𝟏 𝒙𝒊) / n moyenne arithmétique simple
Si les observations ne sont pas connues individuellement mais sont groupées, chaque xi doit être pondéré par
l’effectif correspondant.
Exemple : x1, x1, x1,…..,x1 …… x2, x2,……, x2 … … xn, xn,……..,xn
n1 fois n2 fois nn fois
x = (n1x1 + n2x2 +…+ nnxn ) / (n1+ n2+…..+ nn) = (∑𝒏𝒊=𝟏 𝒏𝒊 𝒙𝒊) / (∑𝒏𝒊=𝟏 𝒏𝒊)
On appelle x = (∑𝒏𝒊=𝟏 𝒏𝒊 𝒙𝒊) / (∑𝒏𝒊=𝟏 𝒏𝒊) moyenne arithmétique pondérée.
2) Applications :
Application 1 : Les notes d’un stagiaire sont : 6 – 10 – 6 – 2 – 10 – 12 -12 - 10 :
x = (6 + 10 + 6 + 2 + 10 + 12 + 12 + 10) / 8

Notes xi Effectifs ni ni xi

OFPPT-DRIF-CDCGC STATISTIQUE PAGE21


2 1 2
6 2 12
10 3 30
12 2 24

Totaux 8 68

x = [(1x2) + (2x6) + (3x10) + (2x12)] / 8


x = 68 / 8 = 8,5

Application 2 :
Soit la série suivante qui donne la répartition de 88 personnes selon leur âge.
Age Effectifs ni xi ni xi
20-25 8 22,5 180
25-30 10 27,5 275
30-35 20 32,5 650
35-40 25 37,5 937,5
40-45 15 42,5 637,5
45-50 10 47,5 475
Total 88 3 155

x = 3 155 / 88 = 35,8 ans C’est à dire : Age moyen = 35,8 ans

3) Simplification des calculs : le calcul d’une origine provisoire :


Le principe de ces méthodes est de chercher à simplifier les x i en procédant à un changement de variables.
a) Changement de variables par changement d’origine :
xi = x0 + x’i sachant que : x0 : nouvelle origine ; x’i : nouvelle variable
Exemple 1:
16 = 4 + 12
25 = 4 + 21 xi = x0 + x’i
69 = 4 + 65

x = ∑nixi / ∑ni
= ∑ni(x0 + x’i) / ∑ni
= (x0 ∑ni + ∑nix’i) / ∑ni
= x0 + (∑nix’i / ∑ni)

x = x0 + x’ avec x0 = nouvelle origine , x’ = moyenne provisoire

Exemple 2:
Reprenons l’exemple précédent. On prendra comme x0, la valeur la plus fréquente : x0 = 37,5
Age Effectifs ni xi x’i = xi-x0 nix’i
20-25 8 22,5 -15 -120
OFPPT-DRIF-CDCGC STATISTIQUE PAGE22
25-30 10 27,5 -10 -100
30-35 20 32,5 -05 -100
35-40 25 37,5 0 0
40-45 15 42,5 5 75
45-50 10 47,5 10 100
Total 88 -145

Donc, x = 37,5 + (-145/88) = 35,8 ans

b) Changement de variables par changement d’origine et d’échelle :


Cela consiste à poser : xi = x0 + ax’i
x = ∑nixi / ∑ni
= ∑ni(x0 + ax’i) / ∑ni
= x0 + a (∑nix’i / ∑ni)

x = x0 + a x’
Exemple 2:
Reprenons l’exemple précédent. On prendra :
x0 : la valeur la plus fréquente : x0 = 37,5 et a ; Intervalle de classe = 5
Age Effectifs ni xi x’i = (xi-x0) / a nix’i
20-25 8 22,5 -3 -24
25-30 10 27,5 -2 -20
30-35 20 32,5 -1 -20
35-40 25 37,5 0 0
40-45 15 42,5 1 15
45-50 10 47,5 2 20
total 88 -29
x = x0 + a x’ Donc, x = 37,5 + 5 (-29 / 88) = 35,8 ans
4) Calcul de la moyenne à l’aide des fréquences relatives :
x = ∑ni xi / ∑ni = (n1x1 + n2x2 +…+ nnxn ) / ∑ni
= (n1x1/∑ni) + (n2x2/∑ni) + … + (nnxn/∑ni)
=f1x1 + f2x2 +…………+ fnxn
Donc, x = ∑fixi avec fi = ni / ∑ni
B) la moyenne géométrique :
1) Définition :
Etant donné n observations : x1, x2, ….xi, … xn connues individuellement (une par une), on appelle
moyenne géométrique la quantité G tel que :
𝑛
G = √x1 ∗ x2 ∗ … … … . xi ∗ … … .∗ xn
G = (∏𝑛
𝑖=1 𝑥𝑖 )
1/n
Moyenne géométrique simple
Si les xi sont groupés (répétitifs) , la moyenne géométrique s écrit

OFPPT-DRIF-CDCGC STATISTIQUE PAGE23


* x2n2 * … * xini *… * xnnn)
G = (x1n1 1/N
Moyenne géométrique pondérée
avec N = n1 + n2 + ……ni + …… nn

2) Calcul de G :
Pour calculer la moyenne G, il vaut mieux passer par le calcul de log G.
Rappels :
log an = n log a et log (a * b) = log a + log b
Nous avons :
G = √x1 ∗ x2 ∗ … … … . xi ∗ … … .∗ xn = (x1 * x2 * … * xi *… * xn) 1/n
𝑛

log G = (1/n) * [log (x1 * x2 * … * xi *… * xn)]


log G = (1/n) * (log x1 + log x2 +…….log xi +…….+ log xn)
log G = (1/n) ∑log xi

Cas de la moyenne géométrique pondérée :


G = (x1n1 * x2n2 * … * xini *… * xnnn) 1/N
Log G = (1/N) * [log (x1n1 * x2n2 * … * xini *… * xnnn)]
Log G = (1/N) * [log x1n1 + log x2n2 + … + log xini +… + log xnnn)]
Log G = (1/N) * [ n1 log x1 + n2 log x2 +……. + ni log xi +…….+ nn log xn]
Log G = ∑ (ni log xi) / ∑ ni

3) Application :

xi ni log xi ni log xi
2 1 0,30103 0,30103
6 2 0,77815 1,55430
10 3 1,00000 3,00000
12 2 1,07918 2,15836
totaux 8 7,01569
Log G = ∑ (ni log xi)/ ∑ ni
Log G = 7,015/8 = 0,876
G = 7.53
C) La moyenne harmonique :
1) Définition :
Etant donné n observations : x1, x2, ….xi, … xn connues individuellement (une par une), on appelle
moyenne harmonique la quantité H tel que :
1/H =1/n (1/x1 + 1/x2 +………. + 1/xi + ……..+1/xn)
1/H = (∑ 1/xi) / n avec H = moyenne harmonique simple
Si les xi sont groupés, la moyenne harmonique pondérée s écrit :
1/H = [(n1/ x1) + (n2/x2) + …….+ (ni/xi) + …..+ (nn/xn)] / (n1 + n2 +……….+ ni +…….+ nn)
1/H = (∑ (ni/xi)) / ∑ni

2) Application :
OFPPT-DRIF-CDCGC STATISTIQUE PAGE24
xi ni 1 / xi ni(1/xi)
2 1 0,5 0,5
6 2 0,166 0,332
10 3 0,10 0,3
12 2 0,083 0,166
total 8 1,298
1/H = (∑ (ni/xi)) / ∑ni donc 1/H = 1,298 / 8 === > H = 8 / 1,298 = 6,16

D) La moyenne quadratique :
1) Définition :
Etant donné n observations : x1, x2, ….xi, … xn connues individuellement (une par une), on appelle
moyenne quadratique la quantité Q tel que :
Q2= (1/n) * [(x12 + x22 +……….xi2 +……..+ xn2)]
Q2 = (∑ni2) / n moyenne quadratique simple
Si les xi sont groupés, la moyenne quadratique pondérée s’écrit :
Q2 = (n1 x12+ n2x22 +……….+ ni xi2 +……..+ nnxn2) /( n1 + n2+……….+ni,+…….+nn)
Q2 = [∑ (ni xI2)] / ∑ni

2) Application :

xi ni xi2 ni xi2
2 1 4 4
6 2 36 72
10 3 100 300
12 2 144 288
total 8 664
Q2 = [∑ (ni xI2)] / ∑ni = 664/ 8 = 83 == Q= √83 = 9,11

E) Conclusion :
1) Rappel de moyennes :
 Moyenne arithmétique : x = ∑nixi / ∑ni
 Moyenne géométrique : Log G = ∑ (ni log xi)/ ∑ ni
Le logarithme de la moyenne géométrique est égal à la moyenne arithmétique des log
 Moyenne harmonique : 1/H = (∑ (ni/xi)) / ∑ni
L’inverse de la moyenne est égal à la moyenne des inverses.

OFPPT-DRIF-CDCGC STATISTIQUE PAGE25


 Moyenne quadratique : Q2 = [∑ (ni xI2)] / ∑ni
Le carré de la moyenne est égal à la moyenne des carrés.
2) Comparaison entre les moyennes :
La comparaison entre les diverses moyennes donne :
H < G < x < Q En effet : 6,1 < 7,5 < 8,5 < 9,11

2) Le choix d’une moyenne :


D’un point de vue théorique, aucune moyenne n’est meilleure qu’une autre, le choix d’une moyenne dépend
du problème posé :

II/ LA MEDIANE (Me) :


A) Définition :
La médiane est la valeur de la variable statistique qui partage la population en deux effectifs égaux. Autrement
dit, c’est la valeur du caractère qui partage en deux parties égales les effectifs (50 % des observations lui sont
supérieures ,50% des observations lui sont inférieures).
B) Calcul de la médiane :
Pour déterminer la médiane, on classe au préalable, les individus de la population par valeurs croissantes (ou
décroissantes) du caractère.
B-1) Cas d’une variable discrète :
 Nombre impair de termes :
Considérons 5 stagiaires qu’on va classer en fonction de leurs notes :
14 9 12 6 2
Me = 9
2 6 ❾ 12 14
 Nombre pair de termes :
Considérons 6 stagiaires qu’on va classer en fonction de leurs notes :
2 6 9 10 12
14
Intervalle médian
On convient de prendre comme médiane le milieu de l’intervalle médian : Me = 9,5
B-2) Cas d’une série de classes :

Salaires Effectifs Effectifs cumulés croissants


10-15 9 9
15-20 25 34
20-25 32 66
25-30 16 82
Total 82
Le calcul de la médiane se fait en 2 étapes :
 1ère étape : calcul du rang de Me.
Lorsqu’on a un grand nombre d’observations (N), on convient de prendre comme rang : Rang = (N/2)ème
observation
OFPPT-DRIF-CDCGC STATISTIQUE PAGE26
N = 82  rang = 82 / 2 = 41
 2ème étape : Détermination de la classe médiane (Classe de Me)
Pour ce faire, on classe les individus par ordre croissant du salaire en construisant le tableau des effectifs
cumules par ordre croissant. On repère la classe ou se trouve le 41ème.
On constate que le 41ème individu se situe dans la classe de [20-25[ : Me = 20 + ∆
 3ème étape : L’interpolation linéaire :
Le salaire du 41ème individu est celui du 7ème individu rencontré dans la classe 20-25. Ce salaire sera
obligatoirement égal à 20 + un supplément (Me = 20 +∆) que l’on va calculer par interpolation en supposant
que les 32 individus de la classe 20-25 sont répartis d’une manière uniforme, c’est à dire qu’ils sont séparés
entre eux par la même quantité de salaire, d’où :
Si 32 individus correspondent à un accroissement de revenu de 5 DH,
32 individus 5 DH
1 individu 5/32 Un seul individu correspondra à 5/32
Et 7 individus de plus correspondent à 7 * 5/32
7 individus 7 * 5/32
D’où la médiane = Me = 20 + (7 * 5/32) = 21,09 DH
Me = 21,09 DH signifie que la moitié des salariés gagne moins de 21,09 DH et la moitié gagne plus de
21,09.DH.

Remarque : Méthode rapide de calcul


34 41 66 (41-34) / (66-34) = (Me -20) / (25-20)

20 Me Me = (5 * 7/20) + 20

20 Me 25

C) Détermination graphique de la médiane :


Pour déterminer Me graphiquement, il faut d’abord construire la courbe cumulative. La Me est l’abscisse du
point de la courbe dont l’ordonnée est égale à 50 % de l’effectif.

Représentation graphique :
ni
80 -

70 -

60 -

50 -

40 -

OFPPT-DRIF-CDCGC STATISTIQUE PAGE27


30 -

20 -

10 -

0
10 15 20 Me 25 30 xi

III/ LE MODE (Mo) :


A) Définition :
On appelle « Mode » la valeur du caractère la plus fréquente. Autrement dit, le mode d’une variable statistique
est la valeur de cette variable associée à l’effectif le plus élevé.
B) Calcul du mode :
xi ni xi ni
7 3 11 2
8 2 12 8
9 14 14 4
14 7 16 8
MO = 9
19 5
Série unimodale Mo=12 , MO=16
Série bimodale

Salaire Effectif
10-15 9 Classe modale : 20-25
15-20 25 MO = 22,5
20-25 32
25-30 16
Total 82

On peut chercher à approcher davantage la valeur du mode, plusieurs procédés peuvent être utilisés :
B-1) Détermination graphique du mode :
On trace l histogramme pour repérer le mode.

Représentation graphique :
ni
40 -
i

OFPPT-DRIF-CDCGC STATISTIQUE PAGE28


30 - d1
d2
20 -

10 -

0 -
10 15 20 Mo 25 30 xi

Mo = 21,5
Remarque : Ne pas oublier de corriger les effectifs lorsque les classes ne sont pas égales.
B-1) Détermination algébrique du mode :
Cette méthode consiste a utiliser la formule suivante : Mo= L1 +[ [d1 / (d1+d2)] * i]

L1 : limite inférieure de la classe modale.


d1 : la différence entre les effectifs de la classe modale et les effectifs de la classe précédente.
d2 : la différence entre les effectifs de la classe modale et les effectifs de la classe suivante.
i : l’intervalle de la classe modale.

Application : On reprend les données précédentes pour calculer le mode :


L1 = 20, d1 = 32 – 25 = 7 , d2 = 32 – 16 = 16  MO = 21,5
B-1) Méthode utilisant la relation entre x, Me et MO :
MO = 3Me - 2 x

OFPPT-DRIF-CDCGC STATISTIQUE PAGE29


SECTION II : LES CARACTERISTIQUES DE DISPERSION

La connaissance des valeurs centrales ne nous renseigne pas sur la structure interne d’une série.
Exemple :
Série 1 : 38 39 40 41 42
Série 2 : 30 35 40 45 50
Série 3 : 1 1 1 1 196
Nous avons la même moyenne x‾ = 40 alors que les séries sont très différentes.
Il nous faut un indicateur de la dispersion des valeurs de la série. Cet indicateur est appelé « Caractéristique
de dispersion ».
I : L’INTERVALLE DE VARIATION :
L’intervalle de variation est la différence entre la plus grande valeur et la petite valeur de la série.
Exemple : 50 58 67 80 Intervalle de variation = 80 – 50 = 30
L’intervalle de variation est insuffisant pour nous informer sur la dispersion, surtout lorsque les valeurs
extrêmes sont Aberrantes (extravagantes).
Exemple : 18 20 20 21 …………………..22  Intervalle de variation = 22 – 18 = 4
18 20 20 21 …………… 22…70  Intervalle de variation = 70 – 18 = 52

II : L’ECART INTERQUARTILES :
A) Définition :
 On appelle 1er quartile, que l’on note Q1, la valeur du caractère tel que 25 % des observations lui sont
inférieures, 75% des observations lui sont supérieures.
 Q2 = Me
 On appelle 3ème quartile que l’on note Q3, la valeur du caractère tel que 75% des observations lui sont
inferieures et 25% lui sont supérieures.
OFPPT-DRIF-CDCGC STATISTIQUE PAGE30
 L’écart interquartile = Q3 – Q1
Application :
Salaires ni ni cumulés croissants
10-15 9 9
15-20 25 34
20-25 32 66
25-30 16 82
Total 82
 Rang de Q1 = 82 /4 = 20,5
Classe de Q1 : 15-20
Interpolation : 25 5
1 5/25
(20,5 - 9) = 11,5  Q1 = 15+ [(5/25) * 11,5] = 17,3 DH
Ou bien :
(20,5 – 9) / (34 – 9) = (Q1 – 15) / (20-15)  Q1 = 17,3 DH

 Rang de Q3 = 82 * 3 / 4 = 61,5
Classe de Q3 : 20 – 25
Interpolation : 32 5
1 5/32
(61,5 - 34) = 27,5  Q3 = 20 + [(5/25) * 27,5] = 24,3 DH
Ou bien :
(61,5 – 34) / (66 – 34) = (Q3 – 20) / (25-20)  Q3 = 24,3 DH
 Q3 - Q1 = 24,3 - 17,3 = 7
Signification : Q3 - Q1 = 7 signifie que pour 50% des observations (salariés), l’écart maximum de salaires
entre les salaries est égal a 7.
Remarque : L’écart interquartile a l’inconvénient de ne tenir compte que de 50% des observations d’où l’idée
de calculer des intervalles (des écarts) inter-déciles ou inter- percentiles :
1) Ecart inter-déciles :
On appelle 1er décile « d1 », la valeur du caractère tel que 10 % des observations lui sont inférieures et 90 %
lui sont supérieures.
On appelle 9ème décile « d9 », la valeur du caractère tel que 90 % des observations lui sont inférieures et 10
% lui sont supérieures.
Remarque : d9 - d1 contient 80% des observations.
2) Ecart inter-percentiles :
On appelle 1er percentile « P1 », la valeur du caractère tel que 1 % des observations lui sont inférieures et 99
% lui sont supérieures.
Pour supprimer les valeurs aberrantes, il suffit de considérer l’intervalle inter-percentile :
OFPPT-DRIF-CDCGC STATISTIQUE PAGE31
P93 – P07

III : L’ECART ABSOLU MOYEN :


A) Définition :
On appelle écart absolu moyen, la moyenne arithmétique des écarts des valeurs du caractère par rapport à la
moyenne arithmétique.
ea = ∑ni|𝒙𝒊 − 𝐱‾| / ∑ni
B) Exemple :

Poids ni xi xi’ ni xi’ |𝒙𝒊 − 𝐱‾| ni|𝒙𝒊 − 𝐱‾|


55-60 12 57,5 -2 -24 10,25 123
60-65 17 62,5 -1 -17 5,25 89,25
65-70 36 67,5 0 0 0,25 9
70-75 24 72,5 1 24 4,75 114
75-80 11 77,5 2 22 9,75 107,25
Total 100 5 442,5
ea = ∑ni|𝑥𝑖 − x‾| / ∑ni
x = x0 + a x’ avec x0 = 67,5 a=5 x’ = ∑nix’i / ∑ni
𝐱‾ = 67,75
ea = 442,5 / 100 = 4,42
x‾ = 67,75 kg
ea = 4,42
Signification : En moyenne, le poids des individus s’éloigne de la moyenne de 4,42 kg.
C) Remarque :
Si on cherche à apprécier la dispersion d’une série ou si on cherche à comparer deux séries entre elles, on
calcule l’indice de dispersion relatif.
Indice de dispersion relatif = 4,42/67,75 = 0,066%
Exemple :
Série 1 : Poids des filles série 2 : poids des garçons
x‾ = 50 kg x‾ = 66
ea = 2 kg ea = 20
ea/ x‾= 2/50 = 0,04 = 4% ea/ x‾ = 20/66 = 0,30 = 30 %

OFPPT-DRIF-CDCGC STATISTIQUE PAGE32


III : LA VARIANCE ET L’ECART TYPE :
A) Définition :
On appelle variance la moyenne arithmétique des carrées des écarts des valeurs du caractère par rapport à la
moyenne arithmétique.
On appelle écart-type, la racine carrée de la variance.
ʋ = δ2 = ∑ni (𝒙𝒊 − 𝐱‾)2/ ∑ni
δ= √∑𝐧𝐢 (𝒙𝒊 − 𝐱‾)𝟐/ ∑𝐧𝐢
B) Application :
Poids ni xi 𝒙𝒊 − 𝐱‾ (𝒙𝒊 − 𝐱‾ )2 ni (𝒙𝒊 − 𝐱‾ )2
55-60 12 57,5 -10,25 105,06 1260
60-65 17 62,5 -5,25 27,56 468,52
65-70 36 67,5 -0,25 0,06 2,16
70-75 24 72,5 4,75 22,56 541,44
75-80 11 77,5 9,75 95,06 1045,66
Total 100 3317,78
δ2 = ∑ni(𝑥𝑖 − x‾)2/ ∑ni x‾= 67,75
ʋ = δ = 3317,78 / 100 = 33,17
2

δ = √33,17 = 5,7 kg

C) Méthode rapide de calcul :


Première méthode : Elle consiste à appliquer la formule développée qui est :

OFPPT-DRIF-CDCGC STATISTIQUE PAGE33


δ2 = (∑ni𝒙𝒊2/ ∑ni) - 𝐱‾ 2 En effet :
δ = ∑ni (𝑥𝑖 − x‾) / ∑ni = ∑ni (xi2-2xix‾+ x‾2) / ∑ni
2 2

δ2 = (∑nixi2 / ∑ni) - (2x‾ ∑nixi /∑ni) + (x‾2∑ni / ∑ni)


δ2 = (∑ni𝒙𝒊2/ ∑ni) - 𝐱‾ 2
δ2 = Moyenne des carrés – carré de la moyenne
Poids ni xi xi2 nixi2
55-60 12 57,5 3 306,25 39 675
60-65 17 62,5 3 906,25 66 406,25
65-70 36 67,5 4 556,25 164 025
70-75 24 72,5 5 256,25 126 150
75-80 11 77,5 6 006,25 66 068,75
Total 100 462 325
x‾ = 67,75
δ2 = (462 325 / 100) - (67,75)2 = 33,19
δ = 5,7

Deuxième méthode : On calcule la moyenne à l’aide du chargement d’origine et d’échelle.


x = x0 + a x’
xi = x0 + a xi’
δ2 = ∑ni (𝑥𝑖 − x‾)2/ ∑ni = ∑ni (x0 + ax’i - x0- a x‾.)2 / ∑ni
δ2 = ∑ni[a(x,i+ x‾.)2] / ∑ni = a2 ∑ni (xi’+ x‾.)2 / ∑ni
δ2 = a2 * δ’2 donc δ = a * δ’
D) Remarque : Pour apprécier la dispersion d’une série, ou pour comparer deux séries entre elles, on utilise
ce qu’on appelle le coefficient de variation = (δ/ 𝐱‾) ∗ 100
Série 1 : Salaire des femmes Série 2 : Salaire des hommes
x‾ = 5 000 x‾ = 4 500
δ = 300 δ = 2 500
Coefficient de variation = 300/5000 = 6% Coefficient de variation = 2500/4500 = 33%

OFPPT-DRIF-CDCGC STATISTIQUE PAGE34


OFPPT-DRIF-CDCGC STATISTIQUE PAGE35
CHAPITRE IV : LES SERIES DOUBLES :
REGRESSION ET CORRELATION LINEAIRE
I- NOTION DE TABLEAU DE CONTINGENCE :
A) Définition : On appelle tableau de contingence, ou tableau à doublé entrée, ou tableau croisé, ou série
statistique double, une série où les observations portent sur deux caractères à la fois.
Exemple 1 : Classement des stagiaires en fonction de la taille et du poids.
Exemple 2 : Répartition des logements selon le nombre de pièces et la superficie.
Superficie m2
10-30 30-50 50-70 70-90 Total
Nombre de pièces
1 3 1 - - 4
2 1 14 3 - 18
3 - 1 7 4 12
4 - - 10 7 17
5 - - - 6 6
total 4 16 20 17 57
N. B. : On désignera par la variable x le premier caractère et on désignera par la variable y le deuxième
caractère (superficie).
B) Les distributions marginales :
Du tableau précédent, on peut tirer les informations suivantes :
a) La répartition des logements selon le nombre de pièces :

Nombre de pièces xi Effectifs


1 4 Cette distribution est appelée distribution marginale, c’est
2 18 une distribution dont on peut calculer la moyenne (le nombre
3 12 moyen de pièces) que l’on appelle moyenne marginale et
4 17 que l’on note x=.
5 6
Total 57

b) La répartition des logements selon la surface :

Surface yi Effectif ni
10-30 4 Cette distribution est appelée distribution marginale de y,
30-50 16 dont on peut calculer la moyenne (la surface moyenne des
50-70 20 logements) appelée moyenne marginale de y et notée y̿.
70-90 17
total 57

OFPPT-DRIF-CDCGC STATISTIQUE PAGE36


c) Les distributions conditionnelles :
On peut tirer du tableau ci-dessus, les informations suivantes :
c-1) Logements de 30 a 50 m2
Nombre de pièces ni
Cette distribution est appelée distribution conditionnelle parce
1 1
que les logements doivent satisfaire la condition 30 à 50 mètres
2 14
carrées de surfaces. On peut calculer sa moyenne (nombre
3 1
moyen de pièces des logements de 30 à 50 m2) qu’on on va
2 0
appeler moyenne conditionnelle et que l’on va noter x‾ j ( j étant
5 0
la jème modalité de y).
Total 16

Remarque : Il existe autant de distributions conditionnelles relatives à « x » que « y » a de modalités.


c-2) Répartition des logements de 3 pièces :
Surfaces Effectifs
Cette distribution est appelée distribution conditionnelle par
10-30 0 ce que les logements doivent répondre à la condition 3
30-50 1 pièces. Donc on peut calculer sa moyenne qu’on va appeler
50-70 7 moyenne conditionnelle, (c’est la surface moyenne des
70-90 4 logements de 3 pièces), et que l’on va noter yi‾ (i étant la
Total 12 ième modalité de x).

Remarque : Il y a autant de distributions conditionnelles relatives à y que le caractère x a de modalités.

II- LA REGRESSION LINEEAIRE :


A) Présentation du problème :
Soit un tableau de contingence où les observations sont connues individuellement :
Q (y)
Prix 42 51 60 62 74 83
(x)
70 1
75 1
77 1
80 1
86 1
93 1

Prix (x) Q (y)


70 42
75 51
77 60
80 62
86 74
93 83

OFPPT-DRIF-CDCGC STATISTIQUE PAGE37


Représentation graphique :

Qté
100 - Nuage de points
90 -
x
80 -
x
70 -
x
60 - x
x
50 -
x
40 -
30 -
20 -
10 -
0 -
70 75 80 85 90 95 Prix
Graduation
non respectée

Nous obtenons un ensemble de points appelé « nuage statistique ».


La régression linéaire consiste à résumer ce nuage par une droite (une seule droite qui ajuste au mieux ce
nuage de points) tel que l’on puisse écrire y= a.x +b, (a et b sont les paramètres de la droite de régression).

Parmi les méthodes de régression les plus simples, on trouve la méthode des moindres carrés.

B) Calcul des paramètres de la droite de régression :


B-1) La régression par la méthode des moindres carrés
La méthode des moindres carrés, consiste à rechercher la relation liant les variables x et y, ce qui revient
à déterminer l’équation de la droite théorique du type y = ax + b, qui passe le plus près possible de tous les
points.
Cette droite rend la plus faible possible la somme des carrés des écarts des valeurs observées.
La méthode des moindres carrés est utilisée pour faire des calculs prévisionnels en se basant sur des éléments
enregistrés dans le passé.
B-2) Calcul des paramètres :
La droite de régression qui exprime y fonction de x est notée Dy (x) et a pour équation
y = a x + b avec :
a = ∑ [(xi - x‾) * (yi - y‾)] / ∑ (xi - x‾) 2
b = y‾- a x‾

OFPPT-DRIF-CDCGC STATISTIQUE PAGE38


C) Application :
Reprenons l’exemple précédent pour déterminer les paramètres de la droite de régression par la méthode des
moindres carrés :
Prix xi Quantité yi xi - x‾ yi - y‾ (xi - x‾) * (yi - y‾) (xi - x‾) 2
70 42 -10 -20 200 100
75 51 -5 -11 55 25
77 60 -3 -2 6 9
80 62 0 0 0 0
86 74 6 12 72 36
93 83 13 21 273 109
481 372 606 339
x‾ = 481 / 6 = 80 y‾ = 372 / 6 = 62
a = 606 / 339 = 1,79 b = 62 – [(1,79) * (80)]= -81
y = 1,79 x - 81
N. B. : Pour tracer la droite, il suffit de calculer les coordonnées de deux points de la droite d’ajustement.

OFPPT-DRIF-CDCGC STATISTIQUE PAGE39


III- LA CORRELATION LINEEAIRE :
De la même manière que nous avons exprimé y en fonction de x, en trouvant le droite de régression Dy(x),
nous pouvons exprimer x en fonction de y en cherchant la droite de régression Dx(y) qui a pour équation
Dx(y) = a’ y + b’ avec :
a’ = ∑ [(xi - x‾) * (yi - y‾)] / ∑ (yi - y‾) 2
b’ = x‾ - a’ y‾‾
Ainsi, nous obtenons deux droites :
Dy(x) : y = a x+b avec : Dx(y) : x = a’ y + b’ avec :
a = ∑ [(xi - x‾) * (yi - y‾)] / ∑ (xi - x‾) 2 a’ = ∑ [(xi - x‾) * (yi - y‾)] / ∑ (yi - y‾) 2
b = y‾- a x‾ b’ = x‾ - a’ y‾‾
Appelons Coefficient de Corrélation la quantité r tel que r 2 = a * a’
 r = +1 ou -1 (r 2 = a * a’ = 1) : La corrélation est parfaite :
r = 1  Corrélation parfaite positive ; c’est-à-dire que les deux variables varient dans le même sens.
r = - 1  Corrélation parfaite négative ; c’est-à-dire que les deux variables varient en sens contraire.
 0 < r < 1  Correction positive d’autant plus forte qu’on se rapproche de 1.
 -1 < r < 0  Correction négative d’autant plus forte qu’on se rapproche de -1.

Remarques :
 On estime qu’une corrélation est satisfaisante lorsque r ≥ 0,87
 On estime qu’une corrélation est parfaite lorsque r ≥ 0,96
 Quand on écrit que r 2 = a * a’ et donc que r =√𝑎 ∗ 𝑎′ qui est toujours positif, on ne peut rien dire du
sens de la corrélation. Pour savoir si une corrélation est positive ou négative on regarde le signe de a *
a’ :
 Si a et a’ sont > 0  a * a’ > 0  Corrélation positive
 Si a et a, sont < 0  a * a’ < 0  Corrélation négative
Application :
Prix xi Quantité yi xi - x‾ yi - y‾ (xi - x‾) * (yi - y‾) (xi - x‾) 2 (yi - y‾) 2
70 42 -10 -20 200 100 400
75 51 -5 -11 55 25 121
77 60 -3 -2 6 9 4
80 62 0 0 0 0 0
86 74 6 12 72 36 144
93 83 13 21 273 109 441
481 372 606 339 1 110
x‾ = 481 / 6 = 80 y‾ = 372 / 6 = 62
OFPPT-DRIF-CDCGC STATISTIQUE PAGE40
a = 606 / 339 = 1,79 a’ = 606 / 1 110 = 0,55
r2 = (606 / 339) * (606 / 1 110) d’où r = 0,98  Corrélation parfaite.

IV- FORMULES FACILITANT LES CALCULS :


r 2 = a * a’ : a = ∑ [(xi - x‾) * (yi - y‾)] / ∑ (xi - x‾) 2 = N / D
N = ∑ [(xi - x‾) * (yi - y‾)] =∑ 𝑥𝑖yi - y‾ ∑ 𝑥𝑖 − x‾ ∑ yi +∑ x‾ y‾
Or: x‾ = ∑ 𝑥𝑖 / n  ∑ 𝑥𝑖 = n x‾
y‾ = ∑ 𝑦𝑖 / n ∑ 𝑦𝑖 = n y‾
N = ∑ 𝑥𝑖 𝑦𝑖 − n x‾ y‾ − n x‾ y‾ + n x‾ y‾
N = ∑ 𝒙𝒊 𝒚𝒊 − 𝐧 𝐱‾ 𝐲‾
D = ∑ (𝑥𝑖 − x‾)2 = ∑ (xi2 – 2 xi x‾ + x‾2) = ∑ xi2 - 2 x‾ ∑xi + n x‾2
D =∑ xi2- 𝐧 𝐱‾2
a = ∑ 𝒙𝒊 𝒚𝒊 − 𝐧 𝐱‾ 𝐲‾ / ∑ xi2- 𝐧 𝐱‾2
On calcule a’ : a’ = ∑ 𝒙𝒊 𝒚𝒊 − 𝐧 𝐱‾ 𝐲‾ / ∑ yi2- 𝐧 𝐲‾ 2
r = √(∑ 𝑥𝑖 yi − n x‾ y‾ / ∑ xi2 − nx‾2)( ∑ 𝑥𝑖 yi − n x‾ y‾ / ∑ yi2 − ny‾2)

Canevas de calcul du coefficient de corrélation :

xi yi xi yi xi2 xi2

∑𝒙𝒊 ∑ 𝒚𝒊 ∑𝒙𝒊yi ∑ xi2 ∑ xi2

x‾ = ∑ 𝑥𝑖 / n y‾ = ∑ 𝑦𝑖 / n
Remarque :
On peut également écrire :
a = ∑ [(xi - x‾) * (yi - y‾)] / ∑ (xi - x‾) 2 ce qui correspond à
Covariance de (X, Y) / Variance de (X) Cov (X, Y) / Var (X)
En effet, Cov (X, Y) = 1/n * ∑ [(xi - x‾) * (yi - y‾)]
Et Var (X) = 1/n * ∑ (xi - x‾) 2
a = Cov (X, Y) / Var (X)

OFPPT-DRIF-CDCGC STATISTIQUE PAGE41


CHAPITRE V : LOGICIEL D’ENQUETE : SPHINX
PRESENTATION

PARTIE I : ELABORATION DU QUESTIONNAIRE :


1. Créer une nouvelle enquête
2. Rédiger une question
3. Ajouter un groupe de questions
4. Enregistrer un questionnaire
5. Mettre en page un questionnaire
6. Publication d’un questionnaire sur Internet
Téléchargement gratuit

PARTIE II : COLLECTE DES REPONSES :


1. Saisie rapide (Saisie classique)
2. Saisie Directe
3. Saisie par tableur

PARTIE III : TRAITEMENT ET ANALYSE :


1. Dépouillement automatique
2. Analyser les relations entre deux variables

PARTIE IV : ELABORATION DU RAPPORT :


1. Introduction
2. Méthode

OFPPT-DRIF-CDCGC STATISTIQUE PAGE42


Séquence Objectifs et contenus Masses horaires
Théorie Pratique
Séquence 1 : 1. Présenter le logiciel SPHINX 1 heure -
Présentation 2. Présenter les composantes du logiciel :
 Sphinx Primo
 Sphinx Plus²
 Sphinx Lexica

Séquence 2 : 1 heure 5 heures


Elaboration du 1. Créer une nouvelle enquête
questionnaire 2. Rédiger une question
3. Ajouter un groupe de questions
4. Enregistrer un questionnaire
5. Mettre en page un questionnaire
6. Publier un questionnaire sur Internet

Séquence 3 : Procéder par : 1 heure 4 heures


Collecte des 1. Saisie rapide (Saisie classique)
réponses 2. Saisie Directe
3. Saisie par tableur
Séquence 4 : 1 heure 5 heures
Traitement et 1. Dépouillement automatique
analyse  Tableaux à plats
 Graphiques
 Strates
2. Analyser les relations entre deux variables
 Tableaux croisés
 Corrélation

Séquence 5 : - 2 heures
Elaboration du Présenter la méthode d’élaboration des rapports
rapport

20 heures

OFPPT-DRIF-CDCGC STATISTIQUE PAGE43


PRESENTATION :

Sphinx est un logiciel de traitement d’enquête qui propose un ensemble d’outils de conception de
questionnaires, de collecte, de partage et d’analyse de données.
Il assiste ses utilisateurs dans chacune des quatre grandes étapes de réalisation d'une enquête :
 La réalisation du questionnaire (création, rédaction, impression)
 La saisie des réponses
 Les traitements quantitatifs des données et l'analyse des données qualitatives
 La rédaction du rapport d'étude

Sphinx est composé de 3 logiciels :


- Le Sphinx Primo : il permet de concevoir un questionnaire, de saisir et dépouiller les réponses et d'explorer
les données enregistrées.
- Le Sphinx Plus² : il offre les mêmes fonctionnalités que "Primo" mais intègre des techniques d'analyse
multidimensionnelle plus avancées (analyse factorielle, typologie, etc.) et permet d'analyser tout fichier
contenant des nombres et/ou du texte, quel que soit son origine.
- Le Sphinx Lexica : il permet d'enrichir les possibilités d'analyse lexicale et de contenu existantes dans
"Primo" ou "Plus²" (traitement des questions ouvertes, des interviews non directives ou de tout autre texte
quelle que soit son origine).
Chacun de ces logiciels permet d'accomplir toutes les étapes d'une étude (élaboration du questionnaire, saisie
réponses, traitements quantitatif et qualitatifs), mais ils se distinguent par :
 Leur capacité de traitement : (compétences plus étendues en analyses quantitative pour "Plus²" et en
analyse lexicale pour "Lexica"),
 Leur degré d’ouverture à des données externes (Primo ne traite que les données saisies par son
intermédiaire, alors que "Plus²" peut traiter des bases de données déjà existantes et "Lexica" n'importe quel
texte).
OFPPT-DRIF-CDCGC STATISTIQUE PAGE44
Dans ce document, on va tenter de présenter les fonctions de base du logiciel Sphinx Plus² afin qu’ensuite, et
selon leurs besoins, les stagiaires puissent découvrir eux-mêmes, ses nombreuses fonctionnalités.

N. B. : Suivant la version du logiciel, la présentation générale de certaines pages peut


légèrement différer de celles reproduites dans ce document, toutefois leur structure et
leur logique restent inchangées.

OFPPT-DRIF-CDCGC STATISTIQUE PAGE45


PARTIE I : ELABORATION DU QUESTIONNAIRE :
1. Créer une nouvelle enquête :

 Choisissez « Plus² »,
 Puis, cliquez sur « Ok ».

OFPPT-DRIF-CDCGC STATISTIQUE PAGE46


 Cliquez sur le bouton « Nouvelle enquête ».

 Choisissez l’option « Créer un nouveau questionnaire »


 Cliquez sur le bouton « Suivant ».

OFPPT-DRIF-CDCGC STATISTIQUE PAGE47


 Remplissez les champs suivants, qui pourront être repris automatiquement dans la mise en forme du
questionnaire / formulaire :
 Titre : Intitulé de l’enquête ;
 Commentaire : correspond à l’introduction de l’enquête ;
 Organisme : référence du commanditaire ;
 Période : Période de réalisation de l’enquête.
Ensuite,
 Cliquez sur le bouton « Suivant ».

 Choisissez « Rédiger la première question » ;


 Cliquez sur le bouton « Terminer ».

N. B. : Si vous divisez votre questionnaire en parties, choisir le bouton « Définir les


grandes parties ».

OFPPT-DRIF-CDCGC STATISTIQUE PAGE48


2. Rédiger une question :

OFPPT-DRIF-CDCGC STATISTIQUE PAGE49


 Remplissez le Libellé de la question: texte de la question posée au répondant ;
 Remplissez le nom de Variable, c'est l'identifiant de la question
Remarque :
La "Bibliothèque" est
une liste de questions
"toutes prêtes"
proposées par Sphinx,
parmi lesquelles vous
pouvez,
éventuellement,
choisir une question
sans avoir à la rédiger.

Il est possible
d'enrichir la
bibliothèque à partir
de ses propres
questions.

OFPPT-DRIF-CDCGC STATISTIQUE PAGE50


 Type de la question : On distingue différents types de questions :
 Fermée (unique) : une seule réponse possible parmi les modalités proposées (ex : Homme ; Femme)
 Fermée (multiple) : plusieurs réponses possibles parmi les modalités proposées ;
 Fermée (échelle) : une seule réponse possible parmi les modalités proposées, avec des modalités
s’étalant sur une échelle de valeurs (ex : Pas du tout ; Plutôt non ; Plutôt oui ; Tout à fait)
 Numérique : question ouverte où la réponse sera sous la forme de valeurs numériques (ex : 1, 2, 3, etc.)
;
 Texte : question ouverte où la réponse sera sous la forme de caractères alphanumériques (ex : a, b, c,
etc.) ;
 Code : question ouverte où la réponse sera sous forme d'un "code" à définir (par exemple : N°
département, code postal, etc.)
 Date / heure : question ouverte où la réponse correspondra à un format de date et/ou heure déterminé
au préalable.

 Suivez la consigne en bleu qui indique les paramètres du type de question


 Passez à une autre question en cliquant sur « Nouvelle question » ;
 Bouton « Contrôle ».

OFPPT-DRIF-CDCGC STATISTIQUE PAGE51


Après avoir cliqué sur le bouton « Contrôle », l’écran suivant est obtenu :

 Si vous voulez associer une question texte "Autre, préciser", cochez la case « Associer une question
ouverte texte ‘Autre, préciser’ ».
N. B. : Attention, il faut ajouter la modalité Autre avant d’activer l’option.
Si on valide par «Ok », l’écran suivant est obtenu :

OFPPT-DRIF-CDCGC STATISTIQUE PAGE52


3. Ajouter un groupe de questions :
L’objectif du groupe de questions est double :
 Dans la présentation du questionnaire/formulaire, on peut faire apparaître les questions dans un seul et
même tableau afin d'en clarifier l'aspect (les modalités ne sont citées qu'une seule fois en tête de colonne)
;
 Lors de l’analyse, l’automatisation de la réalisation du tableau facilite l’analyse.

 Cliquez sur Menu « Rédiger », puis cliquez sur « Nouveau groupe de questions »

Le logiciel ouvre, ensuite, la boite de dialogue de création de groupe :

OFPPT-DRIF-CDCGC STATISTIQUE PAGE53


 Titre : Intitulé du groupe de questions
 Libellé : On rédige la question
 Modalités : On écrit les modalités de la question
 On clique sur « Ajouter » pour ajouter une d’autres questions

OFPPT-DRIF-CDCGC STATISTIQUE PAGE54


Après validation par « Ok », on obtient l’écran suivant :

Après validation par « OK », les questions apparaissent groupées. Le groupe est matérialisé par le trait bleu
reliant l’ensemble des questions du groupe ;
Lors de l’établissement du formulaire, les questions apparaîtront dans un seul tableau.

OFPPT-DRIF-CDCGC STATISTIQUE PAGE55


4. Enregistrer un questionnaire :
Après avoir ouvert l’enquête, cliquez sur « Fichier / Faire une sauvegarde, Exporter » depuis l’écran
central.

OFPPT-DRIF-CDCGC STATISTIQUE PAGE56


N. B. : Pour faire une copie de sauvegarde :
Cliquez sur « Fichier / Faire une sauvegarde, Exporter »
Puis cochez la case « Faire une sauvegarde de l’enquête ».
Ensuite cliquez sur Enregistrer en mentionnant un nom pour le fichier.

OFPPT-DRIF-CDCGC STATISTIQUE PAGE57


5. Mettre en page un questionnaire :

 Choisissez la case Ouvrir une enquête

OFPPT-DRIF-CDCGC STATISTIQUE PAGE58


Pour mettre en page le questionnaire :

 Cliquez sur le menu « Fichier », sélectionnez l’option Mettre en page

OFPPT-DRIF-CDCGC STATISTIQUE PAGE59


 Bouton « Mise en page ».

Pour obtenir les options de


mise en page, cliquez sur
le bouton Mise en page :

 Présentation du
questionnaire sur
plusieurs colonnes ;

 Contenu de l’en-tête du
questionnaire ;

 Numérotation des
questions et des
modalités de réponses ;
 Choix des polices pour
chaque partie du
questionnaire, etc.

 Ensuite, validez par « Ok » et cliquez sur le bouton « Imprimer».

6. Publication d’un questionnaire sur Internet :


On peut aussi administrer le questionnaire via Internet, ce qui permet la récupération de toutes les réponses
dans un fichier Sphinx qui peut être directement dépouillé.
Pour ce faire, les étapes à suivre sont :
Etape n° 1 :

OFPPT-DRIF-CDCGC STATISTIQUE PAGE60


 Cliquez sur Menu « Stade », puis cliquez sur « Elaboration du questionnaire »

Etape n° 2 :

 Cliquez sur « Formulaire multimédia »

Etape n° 3 :

OFPPT-DRIF-CDCGC STATISTIQUE PAGE61


 Choisissez « Internet » puis cliquez sur « Suivant »

Etape n° 4 :

 Cliquez sur « Arobase » puis sur « Terminer »

Etape n° 5 :

OFPPT-DRIF-CDCGC STATISTIQUE PAGE62


 Validez par « Ok »

Etape n° 6 :

OFPPT-DRIF-CDCGC STATISTIQUE PAGE63


 Cliquez sur « Fermer »
Etape n° 7 :

 Cliquez sur Menu « Fichier », puis cliquez sur « Publier l’enquête sur Internet »

OFPPT-DRIF-CDCGC STATISTIQUE PAGE64


Etape n° 8 :

Cliquez sur :
« Suivant »

Etape n° 9 :

N. B. :
Serveur : Sphinx Online

 Cliquez sur : « Suivant »

OFPPT-DRIF-CDCGC STATISTIQUE PAGE65


Etape n° 10 :

Cliquez sur :
« Terminer »

PARTIE II : COLLECTE DES REPONSES :


La partie collecte des réponses permet de collecter tous les résultats de l’enquête : la saisie des réponses, aussi
leur gestion, leur consultation et leur modifications.
1. Saisie rapide (Saisie classique) :

 Depuis l’écran central, se placer au stade «Collecte des réponses » ; ou «Saisie rapide». En effet, le mode de
saisie par défaut est le « mode rapide ».

OFPPT-DRIF-CDCGC STATISTIQUE PAGE66


 Pour remplir les observations, saisissez au clavier les numéros des modalités ou cliquez sur les modalités
dans la liste à droite.
 Après avoir rempli les observations (dans notre exemple 5 observations), on clique sur
« Terminer ».
 Ensuite, la boite de dialogue suivante est ouverte.

 Dans notre exemple, on ne veut pas ajouter une sixième observation avec des non-réponses, donc on clique
sur « Non ».

OFPPT-DRIF-CDCGC STATISTIQUE PAGE67


Après avoir terminé la saisie des observations et si l’on revient à la «Collecte des réponses » depuis l’écran
central, on obtient l’écran suivant :

Permet de supprimer les observations Des modifications peuvent être


apportées aux observations
Permet de passer au « Mode direct » ou au « Mode tableur ».

2. Saisie Directe :

 On clique sur « Saisie Directe »

OFPPT-DRIF-CDCGC STATISTIQUE PAGE68


Cliquez pour passer aux questions suivantes.

Cliquez pour passer aux observations suivantes.

OFPPT-DRIF-CDCGC STATISTIQUE PAGE69


3. Saisie par tableur :

 Depuis l’écran central, se placer au stade «Collecte des réponses » ;


 Saisir les observations ;
 Cliquer sur « Options » :
 Choisir le « Mode tableur »
 Cliquer sur « Ok » puis « Terminer ».

OFPPT-DRIF-CDCGC STATISTIQUE PAGE70


Depuis l’écran central, si l’on clique sur «Collecte des réponses », on obtient l’écran suivant :

Les observations peuvent être modifiées.

PARTIE III : TRAITEMENT ET ANALYSE :


La partie «Traitements et analyses» permet de faire parler les données, de les rendre intelligibles (tableaux
à plats, tableaux croisés…), et de les communiquer de manière efficace.
1. Dépouillement automatique :
Le dépouillement automatique permet de consulter rapidement l’ensemble des résultats de premier niveau
sous forme de tableaux, graphiques ou listes, de définir des plans de dépouillement, et de lancer la production
de rapports.
Analyse uni variée :
Les tris à plats permettent de choisir une variable pour l’analyser : calculer des pourcentages, des écarts types
et des intervalles de confiance, etc.
Les résultats des tris à plat apparaissent dans des tableaux mais vous pouvez aussi choisir de les présenter
dans un des nombreux graphiques proposés.

OFPPT-DRIF-CDCGC STATISTIQUE PAGE71


Depuis l’écran
central, cliquez
sur :
«Traitements
et Analyses » ;
ou «Résultats».

 Tableaux à plats :

N. B. : Si on clique sur « Tableaux Pour visualiser les autres


récapitulatifs » on peut avoir des variables
tableaux qui résument et visualisent
toutes les observations.

OFPPT-DRIF-CDCGC STATISTIQUE PAGE72


N. B. : Pour supprimer une classe dans le tableau :

 On clique sur « Analyser le tableau », puis :

 On sélectionne la ligne à supprimer ;


 Ensuite, on clique sur le bouton « Supprimer ».

N. B. : On peut obtenir un graphique en cliquant sur le bouton « Graphique ».

OFPPT-DRIF-CDCGC STATISTIQUE PAGE73


 Graphiques :

Cochez la case correspondant aux « Graphiques ».

 Strates :
Définition :
Un questionnaire est soumis à un ensemble d’individus.
La strate est une partie de cet ensemble qui présente un certain profil.

Tableau avant application de


la strate.

OFPPT-DRIF-CDCGC STATISTIQUE PAGE74


 Cliquez sur Dépouiller (menu) ;
 Sélectionnez l’option Strate ;

Cliquer sur le bouton « Nouvelle »

OFPPT-DRIF-CDCGC STATISTIQUE PAGE75


 Renseignez les
champs dans la
fenêtre « Définir une
strate »
 Validez par
« Appliquer »

Tableau après application de


la strate.

2. Analyser les relations entre deux variables :


 Tableaux croisés :
Pour étudier la relation entre deux variables nominales, on utilise la fonction « Tableaux croisés » qui
permet de sélectionner les deux variables à analyser. Les résultats sont présentés dans un tableau, dans un
graphique ou, sur une carte d’analyse factorielle des correspondances.

OFPPT-DRIF-CDCGC STATISTIQUE PAGE76


Depuis l’écran
central, cliquez
sur :
«Traitements
et Analyses » ;
puis
«Tableaux
croisés».

 Renseignez les champs dans la fenêtre


« Programmer des tris croisés »
 « Fermer »

Si l’on revient sur l’écran central et on clique sur « Tableaux croisés », la fenêtre suivante est ouverte :

OFPPT-DRIF-CDCGC STATISTIQUE PAGE77


Cliquez sur la zone sélectionnée en bleu

Tableau croisé

 Corrélation :
OFPPT-DRIF-CDCGC STATISTIQUE PAGE78
La Corrélation du menu « Analyser » permet d’étudier les relations entre deux variables numériques et
de rechercher s’il existe une relation mathématique entre celles-ci.

On valide par
« Ok ».

PARTIE IV : ELABORATION DU RAPPORT :


1. Introduction :
L’objectif de chaque enquête est de présenter, à la fin, un rapport d’étude contenant des résultats significatifs.
Cette phase ultime du travail est considérablement facilitée par des procédures qui automatisent la
communication des résultats de Sphinx vers un traitement de textes.

2. Méthode :

OFPPT-DRIF-CDCGC STATISTIQUE PAGE79


 Choisissez le menu
« Dépouiller »,
 Puis cliquez sur ‘ Plan
de dépouillement’

 Sélectionnez la ligne « Tableaux à plats » ;


 Cliquez sur le bouton « @ » afin de sélectionner tous les variables ;
 Cochez la case « Graphique » et choisissez le type de graphique qui vous convient (histogrammes, secteurs,
barres, profils, aires, radars, anneaux) ;
 Sélectionnez les cases : Titre, Sous-titre et Légende.

OFPPT-DRIF-CDCGC STATISTIQUE PAGE80


 Ensuite cliquez sur le bouton Exécuter.

 Choisissez le bouton
« Tableau Word »,
 Validez par le bouton
Ok.

 Donnez un Nom à votre fichier Word ;


 Cliquez sur Enregistrer. Les éléments souhaités sont transférés dans Word.

Puis répéter les mêmes procédures pour les tableaux croisés.

OFPPT-DRIF-CDCGC STATISTIQUE PAGE81

Vous aimerez peut-être aussi