Vous êtes sur la page 1sur 41

CHAPITRE I :

INDICATEURS DE TENDANCE CENTRALE ET INDICE

Objectif terminal : Au terme de ce module, l’étudiant de la première année GACO de


l’IUSO doit être capable de traiter quantitativement l’information.

INTRODUCTION

La statistique est l’étude de la collecte de données, leur analyse, leur traitement,


l’interprétation des résultats et leur présentation afin de rendre les données compréhensibles
par tous. C’est à la fois une science, une méthode et un ensemble de techniques. L’analyse des
données est utilisée pour d’écrire les phénomènes étudiés, faire des prévisions et prendre des
décisions à leur sujet. En cela, la statistique est un outil essentiel pour la compréhension et la
gestion des phénomènes complexes. Dans ce module nous nous intéressons à la statistique
descriptive.

SECTION I : INDICATEURS DE TENDANCE CENTRALE

A- Caractères quantitatifs discrète

Une variable quantitative est dite discrète si l’étendue des valeurs possibles est dénombrable,
c’est à-dire si les valeurs peuvent être énumérées sous la forme d’une liste de chiffres (a1,
a2,… an) ou plus souvent d’entiers naturels (0, 1,2…).

1. Exemple :

Considérons l'exemple suivant : on a interrogé 20 familles d'un immeuble sur leur nombre
d'enfants, les résultats sont indiqués dans le tableau suivant :

Nombre d’enfants 0 1 2 3 4 Total


Nombre de familles 3 5 9 2 1 20

Les 20 familles constituent la population étudiée. Chaque famille représente un individu.

Le nombre d'enfants est le caractère étudié. Les chiffres 0, 1, 2, 3 et 4 s'appellent les


modalités, ce sont les différentes valeurs prises par le caractère. Puisque les modalités sont
numériques, on dit que le caractère est quantitatif. Comme les modalités sont en nombre fini
(il y a 5 modalités différentes), on dit qu'on a affaire à un caractère discret.

1
Nous allons étudier un certain nombre de notions et de calculs concernant les caractères
quantitatifs discrets : Les valeurs 3, 5, 9, 2 et 1 s'appellent les effectifs, c'est à dire le nombre
d'individus dans la population possédant la modalité considérée du caractère étudié.

La donnée des modalités et des effectifs s'appelle une série statistique simple (qui, en général,
est donnée, comme dans l'exemple sous forme d'un tableau dit tableau à simple entrée).

20 représente ce qu'on appelle l'effectif total

Le rapport entre l'effectif et l'effectif total s'appelle la fréquence : 3/20, 5/20, 9/20, 2/20, 1/20.

On exprime en général les fréquences en pourcentages : 15% , 25%, 45%, 10%, 5%. La
somme des fréquences vaut 1 (ou 100%).

Fréquence 3/20 5/20 9/20 2/20 1/20


Pourcentage 15% 25% 45% 10% 5%

2. Caractéristiques de position ou tendances centrale

2.1 Le mode

La valeur la plus fréquente d'une série statistique — C'est la (ou les) valeur(s) du caractère
dont l’effectif est le plus grand.

Exemple : le mode de la série (4, 2, 4, 3, 2,2) est 2 car il apparaît trois fois. 2 est la valeur qui
a le plus grand nombre d'occurrences.

Le mode pour un caractère discret est la valeur du caractère qui correspond à l'effectif le plus
grand. Pour un caractère continu, on parle de classe modale. Le mode est pertinent lorsque
dans la série, certaines valeurs sont répétées plusieurs fois. Il peut y avoir aucun, un seul ou
plusieurs modes.

Exemple 1

Madame NKI a interrogé ses élèves sur le nombre de leurs frères et sœurs.

Calculer le mode du nombre de frères et sœurs :


0, 0, 1, 1, 1, 1, 1, 1, 2, 2, 2, 3, 5

2
On détermine la valeur la plus fréquente :
0, 0, 1, 1, 1, 1, 1, 1, 2, 2, 2, 3, 5

Le mode est de 1 frère et sœur.

Exemple 2

Madame SINGA a interrogé ses élèves sur le nombre de leurs frères et sœurs.

Calculer le mode du nombre de frères et sœurs :


0, 0, 0, 1, 1, 1, 1, 2, 2, 2, 2, 4

On détermine la valeur la plus fréquente :


0, 0, 0, 1, 1, 1, 1, 2, 2, 2, 2, 4

Cette série a deux modes.

Les deux modes sont 1 et 2 frères et sœurs.

2.2 La médiane

La valeur centrale d'une série statistique dont les valeurs observées ont été rangées dans
l'ordre croissant, est la valeur qui partage la population étudiée en deux sous-ensembles de
même effectif (si le nombre d'observations n est pair, la médiane est la demi-somme des
termes de rang n et n + 1).

Exemple : La médiane de la série : 4, 1, et 7 est 4 car, lorsqu'on ordonne les valeurs de la série
dans l'ordre croissant (1, 4, 7), 4 est la valeur qui divise la série en deux moitiés égales.

Si la série est pair de valeurs, on a donc 2 valeurs centrales. La médiane est alors la moyenne
de ces deux valeurs.

10, 20, 40, 50

Médiane =

La médiane est 30.

2.3. Les moyennes

La valeur « moyenne » est égale au quotient de la somme de toutes les valeurs de la série par
l’effectif total.

3
Exemple: La moyenne de la série 4, 1, et 7 est (4+1+7)/3 = 12/3 = 4.

C'est le calcul habituel de la moyenne; en fait, ce n'est pas la seule moyenne, on l'appelle la
moyenne arithmétique.
Quand on dira
"moyenne" sans
préciser, il s'agira
toujours de celle-ci.

3. Les caractéristiques de dispersion

3.1. Ecart-type

La caractéristique de dispersion la plus usuelle est en effet l’écart-type. Puisque la moyenne


arithmétique des écarts à la moyenne est nulle, on a recours à la moyenne quadratique de ces
écarts. On définit

- la variance d’une série : c’est une moyenne arithmétique des carrés des écarts à la moyenne :

4
- L’écart type d’une série : c’est la moyenne quadratique des écarts à la moyenne, autrement
dit, c’est la racine carrée de la variance.

B- Caractères quantitatifs continus

1. Définition

Une variable quantitative continue peut prendre n’importe quelles valeurs à l’intérieur d’un
certain intervalle de variation qui lui est associé. Les observations obtenues à partir d’une
variable continue sont donc espacées. Leur organisation sous la forme d’un tableau statistique
consiste à délimiter au préalable l’intervalle de variation.

Considérons l'exemple suivant : on s'intéresse aux salaires mensuels dans une entreprise de
200 personnes, les résultats sont consignés dans le tableau suivant.

Moins de de 400 à de 600 à de 1000 à de 2000 à


400F 600F 1000F 2000F 5000F
Effectifs 40 100 50 8 2 20
des classes
Fréquences 20%=40/200 50% 25% 4% 1% 100%

5
Le caractère étudié, c'est ici le salaire mensuel. La population est composée de 200 individus.

Le caractère a été regroupé en intervalles (qu'on appellera des classes) car il aurait été
impossible de faire un tableau à simple entrée du type de celui qu'on a vu pour les caractères
discrets du fait du trop grand nombre de salaires possibles.

Quand un caractère présente un nombre infini (ou très grand) de modalités, on dit qu'on a
affaire à un caractère continu.

0, 400, 600,1000, 2000, 5000 sont appelées les extrémités de classes.

On remarque que toutes les classes n'ont pas forcément la même "largeur" (on parlera
d'amplitude) : la première a une amplitude de 400, la deuxième de 200, les autres de
400,1000, 3000.

Le centre d'une classe sera le "milieu" de l'intervalle, la demi-somme des extrémités. Ici, les
centres des classes vaudront : 2000, 5000, 8000, 15000, 35000.

2. Mode

Si la variable est continue, ses modalités sont des classes de valeurs. Le mode de distribution
ne pourra pas être une modalité représentant une valeur précise de cette variable mais sera une
classe de valeurs. On appelle alors classe modale la classe constituant le mode de la
distribution.
Exemple :
soit la distribution statistique d'une population de 30 élèves d'une classe selon leur taille :

6
L'effectif ni ou la fréquence fi les plus élevés montrent que le mode est ici la classe [1,70-
1,80[.
3. Médiane
Il n'y a, pour le calcul de la médiane, aucune différence selon que les classes de la variable
sont d'amplitudes constantes ou variables. La variable étant continue, il devient possible,
contrairement au cas précédent, d'évaluer précisément la valeur de la médiane.
Le calcul de la médiane se fait alors en deux temps :
• détermination de la classe médiane : la classe médiane est la classe de valeurs de la
variable contenant la médiane. Elle est déterminée de la même manière que la médiane dans
le cas d'une variable discrète, à partir des effectifs et de fréquences cumulées.

On a : N = 30, et N / 2 = 15. Dans cette population, 8 individus prennent une valeur inférieure
à 1,60 m et 17 individus une valeur de la variable inférieure à 1,70 m. La médiane est donc
comprise entre 1,60 m et 1,70 m.
La classe [1,60-1,70[est la médiane de la distribution.
• détermination de la médiane : cette seconde étape cherche à découvrir la valeur précise de la
médiane à l'intérieur de la classe médiane. La méthode généralement utilisée pour ce faire est
celle de l'interpolation linéaire ; c'est mathématiquement une application simple du théorème
de Thalès.
Soit [xi; xj [la classe médiane déterminée à l'étape précédente. Appelons respectivement Ni et
Nj les effectifs cumulés associés aux deux bornes de cette médiane : xi et xj.
On peut représenter, de part et d'autre d'un même axe, les valeurs de la variable (au-dessus)
les effectifs cumulés associés (en-dessous), cela pour les deux bornes de la classe médiane et
pour la médiane elle-même :

7
Exemple : dans l'exemple précédent, on a : xi = 1,60 m et xj = 1,70 m (bornes de la classe
médiane) ; on a aussi : Ni = 8 et Nj = 17 (effectifs cumulés associés) ; on peut alors construire
l'axe suivant, soit :

D’où : Me = 1,68

8
SECTION II : INDICES SIMPLES

1. Définition
Un indice peut se définir comme étant un nombre qui exprime un rapport entre deux
grandeurs ; rapport qui montre une évolution entre les quantités ou les prix.

2. Intérêt
Les indices permettent d’apprécier l’évolution des prix au cours des années et, par
conséquent, de justifier les fluctuations (variation) des chiffres d’affaires dans le temps. Les
indices servent également à évaluer ou annuler l’impact de la hausse du niveau général des
prix sur l’évolution d’un chiffre d’affaires.

3. Méthodes de calcul
a. Formule générale des indices
Soit X une variable quantitative. Soit la valeur prise par la variable X a la situation t et
la valeur prise par la variable X a la situation 0. On appelle indice simple (ou élémentaire) de
la variable X à la situation t par rapport à la situation 0, et on note I le rapport défini par

La situation 0 est dite de base ou de référence


La situation t est dite courante

NB : L’année de base est une année qu’on fixe avant tout calcul ; c’est l’année de référence.
Son indice, par convention, est toujours égal à 100. Les indices peuvent être supérieurs ou
inférieurs à 100. S’ils sont supérieurs à 100, ils traduisent une augmentation de prix sur la
période concernée. En revanche, s’ils sont inférieurs à 100, ils indiquent une diminution de
prix.

9
b. Formule de passage des CA en francs courants au CA en francs constants.

NB : Les chiffres d’affaires courants sont des chiffres d’affaires qui tiennent compte de
l’évolution des prix ; ce sont les valeurs qu’on nous communique généralement dans les
exercices qui nous sont proposés.

Par ailleurs, les CA constants sont des valeurs qui ont été diminuées de la hausse des prix ;
c’est-à-dire qu’on considère qu’il n’y a pas eu de variation de prix d’une période à une autre.

c. Formule de passage des CA constants aux CA courants


Connaissant les CA constant, il est possible de déterminer les CA courants en inversant la
formule précédente.

1) Exemple
L’entreprise « Nouvelle collection », spécialisée dans la commercialisation des vêtements, a
réalisé sur sept (7) ans les CA suivants, en millions de francs :

Années 2007 2008 2009 2010 2011 2012 2013


CA 5 000 8 000 10 000 15 000 15 000 19 000 25 000

Travail à faire :
- Calculer les indices des prix de « nouvelle collection » de 2007 à 2013.
NB : 2007 représente l’année de base.

Résolution
L’année de base ayant été fixé, son indice ne se calcul plus. Il est égal à 100 par convention.
Les autres, pour leur part, se calculent à partir de l’année de base selon la formule donnée.

Exemple de calcul pour l’année 2008 :

Années 2007 2008 2009 2010 2011 2012 2013


CA 5 000 8 000 10 000 15 000 15 000 19 000 25 000
Indice ------ 160 200 300 300 380 500

10
CHAPITRE II
AJUSTEMENT LINAIRE ET CORRELATION

SECTION I : AJUSTEMENT LINAIRE

I- DEFINITION

L’ajustement linéaire consiste à construire une courbe qui soit située le plus près possible des
points réels pour satisfaire à l’impératif de régularité. En d’autres mots, le problème de
l’ajustement linéaire consiste à étudier deux variables quantitatives, dont l’une, appelée
variable expliquée, est considérée comme dépendante de l’autre, appelée variable explicative
ou indépendante. On note habituellement la variable expliquée Y, et la variable explicative X.

Aussi les hommes de statistique s’efforcent de trouver algébriquement et graphiquement s’il


existe une relation entre x et y ; à cet effet il peut utiliser :

a- L’ajustement graphique

b- L’ajustement mécanique

c- L’ajustement analytique

I-1) L’ajustement graphique

C’est un diagramme de dispersion qui représente tous les points de la série statistique. Ces
points constituent le nuage des points. Le statisticien y trace une courbe aussi simple que
possible qui traverse le nuage de points et le partage en deux parties comprenant sensiblement
de même nombres de points

11
Remarque : il est plus facile de trace la courbe dans ces nuages de points effilés que celui se
présentant sous forme de disque. On y place généralement le point G qui représente le
couple ( ; )

Application

Les ventes d’un produit au cours des dix années sont consignées dans le tableau suivant :

Années 2002 2003 2004 2005 2006 2007 2008 2009 2010 2011
xi
Ventes 70 88 92 82 100 110 97 110 92 115
yi

TRAVAIL A FAIRE
1) représenter le nuage de points de cette série statistique
2) déterminer les coordonnées du point G

12
I-2) l’ajustement mécanique
I-2-1) Principe
L’ajustement mécanique consiste à ajuster mécaniquement au nuage de point de
coordonnées xi yi une droite de la forme y = a x + b minimisant autant que possible
l’existence des points de part et d’autre de la droite.
Son objectif est d’obtenir rapidement une prévision du phénomène observé par
projection ainsi nous retrouverons la méthode des moyennes mobiles et aussi la méthode des
totaux mobiles.

I-2-2) Totaux mobiles


a- Principe

13
Cette méthode combine efficacement dans le cas des séries chronologiques ; la prise en
compte d’une variation saisonnière et la recherche d’une tendance générale.
L’application de cette méthode consiste après avoir fixé la valeur du paramètre X à remplacer
chaque observation par le total des n dernières observations. Le nombre de totaux mobiles à
étudier porte sur plusieurs années, le total des observations de la première année forme le
premier total (la valeur du paramètre X est égale au nombre d’observation de la première
année) par exemple : X = 12 si les observations sont mensuelles ; X = 2 si elles sont
semestrielles.

b- Application
Les ventes mensuelles en kilo pour les exercices de 2015 et 2016 se présentent comme suit :

Mois
Janvier Févier Mars Avril Mai Juin Juillet Août Sep. Oct. Nov. Déc.
Années
2015 24 18,5 32 43,5 25 27,5 28 23 31,5 34,5 25,5 37
2016 23 20,5 33 40,5 33 29,5 26 28,5 28,5 41 27,5 41
Travail à faire
1. Calculer les totaux mobiles mensuels 2016.

I-2-3) Méthode des moyennes mobiles


a- Principe
Il consiste graphiquement un nuage de point auxiliaire que nous allons appeler Xi Yi constitué
en abscisse par les observations Xi auxquelles on observe la 1ère et la dernière observation et
en ordonnée par les moyennes mobiles Yi.
A partir des totaux mobiles mensuels (TMM) on peut déduire les moyennes mobiles
mensuelles (MMM) par la formulation suivante :
14
MOYENNE Mobile Mensuelle (MMM) =

si on est dans un tableau trimestriel :

MOYENNE Mobile trimestriel (MMT) =

b- Application
Reprenons le cas précédant et procédons à la méthode des moyennes mobiles et
représentons
Critique : les ajustements graphiques et mécaniques permettent de déterminer la tendance générale
du phénomène observé mais ils sont assez imprécis, c’est pour cela qu’il est préférable de procéder à
l’ajustement analytique.

I-3) Ajustement analytique


Le statisticien ne résout plus le problème graphiquement ou mécaniquement mais il s’efforce
de déterminer les paramètres de la fonction Y = f(x) dont la courbe représentative passera par
les points ajustés.
Il existe trois méthodes
 La méthode des points extrêmes
 La méthode de la double moyennes ou MAYER ou méthode des points médians
 La méthode des moindres carrés.

I-3-1) Méthode des points extrêmes


I-3-1-1) Principe

Cette méthode consiste à ajuster au nuage de points Xi Yi une droite de la forme


Y = ax + b passant par les deux points extrêmes M (X1 ; Y1) et N (Xn ; Yn)
En ce qui concerne les séries chronologiques les points M et N représentent les deux
extrémités. Pour les séries spéciales, les points M et N représentent les valeurs les moins
élevées et celles les plus élevées.
Le statisticien s’applique à déterminer les valeurs du coefficient directeur a et de
la constante b par la résolution du système d’équation suivante :

a +b=
a +b=

I-3-1-2) Application
La production d’une entreprise de la manière suivante au cours des 8 dernières années

15
Années 99 00 01 02 03 04 05 06
P° 100 200 40 10 150 300 400 120

TAF :
1. Déterminer l’équation de la droite de tendance de la production de cette entreprise par
la méthode des points extrêmes
2. Prévoir la production en 2007
SOLUTION
1. Déterminons l’équation de la droite de tendance
En se basant sur le principe, nous allons trouver les coordonnés de M (x1 ; y1) et N (xn ;
yn) d’où : M (1 ; 100) et N (8 ; 120). Ce qui renvoie au système suivant :
1a + b = 100 (1)
8a + b = 120 (2)
Nous allons résoudre ce système par combinaison en multipliant (1) par -1 afin d’éliminer b et
déterminer a.
(-1) -1a - b = - 100 (1)
8a + b = 120 (2)
7a + 0 = 20 d’où a = 20/7 a = 2,86
Remplaçons a dans (1) pour trouver b
2,86 + b = 120 → b = 120 – 2,86 → b = 97,14
Après avoir déterminer a et b, l’équation de la droite est la suivante :
Y = 2,86x + 97,14
2. Trouvons la production prévisionnelle de 2010
Ici, il suffit tout simplement de remplacer x par le rang de 2010 qui est 12 car c’est la
douzième année en partant de 1999.
Y = 2,86(12) + 97,14 → y = 34,32 + 97,14 → y = 131,46 tonnes

I-3-2) La méthode de MAYER ou de la double moyenne ou des points moyens


La méthode des points extrêmes a permis d’obtenir l’équation de la droite de tendance, mais
elle n’a pas tenu compte de toutes les observations.
La méthode de MAYER reprend le nuage des points et le subdivise en deux sous-ensembles
et détermine le point G1 du premier sous ensemble et le point G2 du deuxième sous ensemble.

16
Il établit par la suite l’équation de la forme y = ax + b et déterminer les valeurs du coefficient
directeur (a) et la constante (b) par la résolution du système suivant :
1=a 1+b
2=a 2+b
Application
Reprenons l’exercice précédent et déterminons l’équation de la droite de tendance par la
méthode de MAYER et déterminons la prévision de 2008.
Solution
Etant donné que la série est paire nous allons scinder en sous ensemble de 4 observations
comme suit :

Pour la résolution de ce système, nous procédons toujours par combinaison en multipliant (l) par -1
pour déterminer a comme suit :

(-1) - 87,5 = -2,5a – b (1)


242,5 = 6,5a + b (2)
155 = 4a + 0 d’où a = 155/4 a = 38,75
Déterminons ensuite b en remplaçant a dans (1)
(1) : 87,5 = 2,5 (38,75) + b → b = 87,5 – 96,875 → b = - 9,375

17
L’équation de la droite dévient : y = 38,75x – 9,375
 Déterminons la production prévisionnelle de 2008
Y = 38,75 (10) – 9,375 → y = 378,125 tonnes

I-3-3) La méthode des moindres carrés


 Principe :
Elle consiste à rechercher l’équation de la droite de tendance Y = a x + b passant le plus près
possible de tous les différents points de la série statistique. Cette méthode permet de
minimiser les écarts entre les observations brutes xi et les observations corrigées de telle
manière que la somme des écarts entre les xi et les soit nulle. Mathématiquement nous
pouvons écrire écart = (xi–x) donc ∑ (xi– x) = 0. Ce procédé semble plus réaliste et meilleur
que les deux précédents. La détermination de a et b s’obtient à partir des formules connues et
à partir d’un tableau d’étude dont voici la configuration :

Il existe également un autre procédé de calcul des paramètres a et b qui s’obtiendront à partir
du tableau d’étude suivant :
Application :
M. THERMANN a décidé de vendre les chemises. Pour mieux envisager ses prévisions il
décide de vous communiquer la série statistique suivante :

Travail à faire :

18
1. Calculer la droite de tendance par la méthode des moindres carrés
2. Calculer les prévisions de la 6 e et de la 7ème année
SOLUTION
1. Calculons la droite de tendance par la méthode des moindres carrés
Tableau d’exploitation

SECTION II : LA CORRELATION LINEAIRE


La corrélation est une dépendance plus ou moins grande entre deux variables statistiques
I. Les droites de régression
Elles permettent de mesurer le degré de dépendance entre deux phénomènes Xi ; Yi. On
distingue deux types de droites de régression à partir de la méthode des moindres carrés.
La droite de régression de Y en X est Dy/x et la droite de régression de X en Y notée Dx/y.
I.1. La droite de régression de Y en X
Elle est de la forme y = ax + b et permet d’estimer ou de déterminer la valeur de Yi
connaissant celle de Xi

19
I.2. la droite régression de X en Y
Elle permet d’estimer ou de déterminer la valeur de Xi connaissant Yi ainsi :

II. Le coefficient de corrélation linéaire


II. 1. Définition et intérêt de la corrélation
II.1.1. Définition de la corrélation
C’est le lien de dépendance ou la relation qui existe entre deux variables (xi et yi) étudiées ou
observées simultanément c’est-à-dire au même moment

NB : la variable temps n’intervient pas facilement dans la corrélation


II.1.2. Intérêt de la corrélation
Elle permet d’apprécier le degré ou l’intensité de dépendance entre deux variables à savoir :

 La variable explicative (xi) c’est celle qui se situe à l’axe des abscisses et qui permet
à la variable expliquée d’évoluer.
 La variable expliquée (yi) c’est celle qui se situe à l’axe des ordonnées et qui évolue
en fonction de la variable explicative.
L’intensité de cette interdépendance se mesure en calculant un indicateur appelé coefficient
de corrélation noté « r » ou ‘R’
II.2. Calcul et interprétation du coefficient de corrélation
II.2.1. Calcul du coefficient de corrélation
A partir d’un tableau des moindres carrés complets on peut calculer le coefficient de
corrélation de deux manières :

20
II.2.2. Interprétation du coefficient de correction
Le coefficient de corrélation a toujours une valeur comprise entre (1 et -1). Il peut
donc s’interpréter de trois façons :
 Si R ‹ 0, on dit qu’il n’existe pas de corrélation entre les xi et yi. Autrement dit les
deux phénomènes évoluent en sens contraire ou opposé
 Si R › 0 on dit qu’il existe une corrélation entre les deux phénomènes xi et yi.
Autrement dit, les deux phénomènes évoluent dans le même sens
 Lorsque R est proche de 1 on dit qu’il existe une parfaite corrélation entre les deux
phénomènes xi et yi. Autrement dit les deux variables sont fortement liées l’une à
l’autre
Application
Pour le produit Coca-Cola, la directrice veut vérifier s’il existe une corrélation entre les
chiffres d’affaires et les budgets publicitaires.
Evolution globale des ventes de l’entreprise (en millions de francs cfa)
Années 1 2 3 4
Chiffres d’affaires 120 240 440 580
Budgets publicitaires 4 10 18 24

21
CHAPITRE III
ENQUÊTE PAR QUESTIONNAIRE

I. L’étude quantitative :
L’approche quantitative est fondée sur l’utilisation de méthodes statistiques. Elle peut
répondre à des objectifs variés allant de la description à l’explication de phénomène
mesurable.
En entrée, elle se nourrit de données chiffrées et en sorte, elle fournit des résultats sous forme
de tableaux de valeurs numériques ou de graphiques représentant des relations mathématiques
entre variables quantitatives.

A. Les enquêtes quantitatives ponctuelles :


Ces études consistent à collecter sur le terrain des informations précises et chiffrées sur la
population dont on veut connaître et dénombrer les caractéristiques, les opinions, les attentes.
Réalisées à l’aide d’un questionnaire, elles sont menées soit :

- Par recensement ou enquête exhaustive qui consiste à interroger toutes les individus
d’une population lorsque celle-ci est peu nombreuse, (en général inférieur à 1000
individus).
Exemple : enquête auprès de tous les commerçants d’un quartier.
- Par sondage auprès d’un échantillon représentatif lorsque la population mère est trop
importante et/ou les budgets et le délai de réalisation sont limité.
Avant de recourir à ce type d’étude, il conviendra de s’assurer que l’entreprise dispose du
temps et du budget nécessaire pour les mettre en œuvre.

Méthodologie :

Définition des objectifs de l’enquête

Constitution de l’échantillon

Détermination du mode d’administration du questionnaire

Rédaction du questionnaire

Conduite de l’enquête

Traitement de l’information collectée

Elaboration du rapport de synthèse.

22
Les différentes étapes :

I. La définition des objectifs :


Elle va permettre d’élaborer le cahier des charges de l’enquête en listant les informations
essentielles à recueillir. On peut distinguer deux types d’objectifs :
- Ceux qui vont permettre de confirmer une hypothèse formulé à la suite de l’étude
documentaire et/ou l’étude qualitative.
- Ceux qui vont permettre de recueillir les informations manquantes.
Les objectifs de l’enquête quantitative doivent être suffisamment précis pour permettre par la
suite de prendre une décision.

II. La constitution de l’échantillon :


L’échantillon représente un sous ensemble de la population à étudier pour le bâtir, il faut
procéder aux prélèvements d’un certain nombre d’éléments de cette population, il doit la
représenter aussi fidèlement que possible de façon à ce que le résultat de sondage sera proche
le plus possible de ce que l’on aurait obtenu si l’on avait pratiquer un recensement.
Avant de procéder à un échantillonnage, il faut définir et déterminer la population mère ainsi
que les unités de sondage que l’on souhaite interroger.
- La population mère (ou base de sondage) : dans certains cas, elle est possible de
l’identifier nominativement, exemple : liste des abonnés à une revue, dans
d’autres cas cette identification est impossible, exemple : clientèle d’un
hypermarché.
- L’unité de sondage : c’est l’entité à interroger, elle peut être l’individu, le ménage,
l’entreprise, le point de vente, selon les besoins de l’enquête.
Une erreur dans la définition de la population ou de l’unité de sondage peut altérer gravement
le résultat et l’interprétation de l’étude de marché.

 Les méthodes d’échantillonnage :


Il existe deux types de méthode d’échantillonnage : les méthodes probabilistes, et les
méthodes no probabilistes (ou empiriques).

A. Les méthodes probabilistes :


Lorsqu’on dispose de la liste exhaustive de la base de sondage, on peut prélever au hasard
parmi elle des unités de sondage et constituer ainsi l’échantillon souhaité.
Chaque unité de cette base dans ce cas une probabilité connue non nulle d’être sélectionné, il
y a plusieurs méthodes probabilistes :

1. Le sondage aléatoire (ou élémentaire) :


A partir de la base de sondage retenu, on organise un tirage au sort :
 Soit par tirage systématique : cette méthodes très simple ne peut être utilisé que si
les unités de la liste sont classées de manière aléatoire. Exemple : si N taille de la
population est égale à 1000, si n taille de l’échantillon souhaitée, le taux de sondage
n/ N est égale à 100/1000 soit 1/10, on procède de la façon suivante : on tire d’abord
au hasard la première unité comprise entre la première et la deuxième place
(hypothèse 3) on sélectionne ensuite les unités à interroger qui sont dans ce cas les 3 e,
13e, 23e,… jusqu’à arriver à 100unités.
23
 Soit au moyen d’une table de nombre au hasard :
Extrait de la table de nombre au hasard, exemple d’utilisation :

13100, 63933, 07302, 89521, 07910, 03230, 17163, 13913, 83881,


42522, 98505, 42693, 34714, 41842, 12051, 05483, 11279, 45705,
10644, 17043, 04274, 62158, 63966, 36968, 05792, 14755, 91042,
78940, 55215, 92301, 68619, 63767, 65875, 39595, 78211, 45903,
52216, 29857, 14521, 79177, 95177, 95445, 76259, 32635, 45960,
62614, 40656, 62956, 93663, 40034, 49455.

Pour extraire 200 noms d’un fichier de 9000 entreprises, il convient :


- Numéroter chaque entreprise de 000 à 8999 ;
- Choisir au hasard dans la table une ligne et une colonne par exemple 3e ligne première
colonne ;
- De lire par groupe de 4 chiffres les nombres sélectionnés de gauche à droite.
Dans tel exemple, on retient donc les entreprises ayant les numéros :
1064, 4170, 4304, 2746, 2158, 6993, 3962, 6805, 7921, 4755, 9104.
9104 est supérieur à 8999, don on retient le reste de la division de 9104/8999 soit 0,105 –
2789.
Les numéros qui pourraient se répéter sont simplement éliminés.

2. Le sondage stratifié :
Ce type de sondage est souvent utilisé lorsque la population mère est divisible en groupe
homogène (appelé strate), dans chaque strate définie préalablement on réalise un sondage
aléatoire. L’addition de ses sous échantillons va constituer l’échantillon total.
Exemple : dans un fichier de 1000 entreprises clientes par exemple que l’on veut sonder, on
définit d’abord 3 strates distinctes : les petits clients, les moyens clients et les gros clients,
puis dans chacune des strates on pratique un tirage eu hasard.
Il existe deux types de sondage stratifié :

 Le sondage stratifié proportionnel : où le taux de sondage par strate est identique,


exemple : on veut constituer un échantillon de 100 entreprise parmi une liste de 1000,
taux de sondage 1/10 et la répartition est la suivante :
- 600 entreprises petits clients
- 300 entreprises moyens clients
- 100 entreprises gros clients.
On prélève au hasard 60 petits clients, 30 moyens clients et 10 gros clients.
 Le sondage stratifié non proportionnel : (appelé aussi sondage à fraction sondée
variable), cette méthode consiste à appliquer un taux de sondage différent pour
chacune des strates définis préalablement, elle est utilisée lorsque la population mère
est hétérogène (c’est le cas pour les enquêtes au milieu industriel, ou des différences
de taille d’activité de chiffres d’affaires parmi les entreprises à interroger, on peut
appliquer aux grandes entreprises un taux de sondage supérieur à celui appliquer aux
petite entreprises.

3. Le sondage à plusieurs degrés (ou par étape) :


Cette méthode est utilisée surtout dans les sondages politiques, il consiste à effectuer plusieurs
tirages au sort successif, exemple : pour estimer les résultats s’un scrutin national, on va
constituer l’échantillon à sonder de la façon suivante : tirage au sort des départements, dans

24
les départements sélectionnés, tirage au sort au sort des villes, dans les villes retenues, tirage
au sort des bureaux de vote, dans ces bureaux de vote, tirage au sort des électeurs.

4. Le sondage en grappes :
Cette méthode consiste à choisir aléatoirement des sous-groupes (appelés grappes) parmi la
population mère est à interroger toutes les unités de chaque grappe : le nombre de grappe doit
être au minimum 30, lorsque les grappes soient constituées de zones géographiques, le
sondage est dit aréolaire, il consiste à découper le territoire ou l’enquête est menée en quartier
ou zone de taille équivalente, puis à procéder au tirage au hasard de ses quartiers, il suffit
ensuite d’établir la liste des unités statistiques y résidants et de les interroger.

B. Les méthodes non probabilistes (ou empiriques) :


Contrairement aux méthodes probabilistes qui utilisent des listes dans laquelle on prélève
aléatoirement des unités d’échantillon, les méthodes non probabilistes empiriques ou
raisonné : les deux méthodes les plus utilisées sont les suivantes :

1. La méthode des itinéraires (ou la méthode de Potiz):


Dans ce cas les enquêteurs se voient imposés un itinéraire très précis sur lequel ils vont
constituer leurs échantillons. Cette méthode permet d’éviter qu’ils choisissent les unités
assemblées d’une façon subjective et élimine en principe ce risque de biais (ce risque
d’erreur), exemple d’itinéraire, pour le rue X, interroger tous les quatre numéros d’habitation
(1, 4, 8, 12,…), les personnes habitants le 2ème étage si absente ou inexistante passé au numéro
suivant. Pour le super marché ACIMA, interroger une personne tous les quatre à la caisse 5 de
10h à midi, une personne toute les quatre à 14h à la caisse 8.

2. La méthode des quotas :


Cette méthode est fondée sur le principe suivant : si l’échantillon a la même structure suivant :
des critères, tel l’âge, le sexe, la rémunération que la population a étudié, les caractéristiques :
attitude, comportement… relevé lors de l’enquête seront les mêmes que celle de cette
population.
La méthode des quotas consiste donc :

- Tout d’abord, à définir une stratification dans la population de base au moyen de


critères près déterminés qui constituent à priori des facteurs
explicatifs de son comportement (âge, sexe, type d’habitat…) ;
- Ensuite, à appliquer cette stratification à l’échantillon que devront sonder les
enquêteurs ;
- Enfin, à procéder à un prélèvement non aléatoire des unités de l’échantillon.
L’oublie d’un critère important, ou le choix d’un critère non pertinent, est un billet
systématique de l’échantillon.
Exemple : dans le cas d’une population de base que l’on veut sonder, on considère que le
sexe, l’âge et la catégorie socioprofessionnelle sont les critères déterminants, d’après les
statistiques fiable cette population de base à la structure suivante :
- Sexe : 40 % hommes, 60 % femmes ;
- Tranches d’âge :
A : 18 – 34  30 %
B : 35 – 44  30 %
C : 45 – 65  26 %
D : 65 et plus 14 %
- Catégorie socioprofessionnelle :
25
1- Agriculteur : 4 %
2- Artisan, commerçant, chef d’entreprise : 6 %
3- Cadre et profession intellectuelle supérieur : 8 %
4- Profession intermédiaire : 18 %
5- Employé : 24 %
6- Ouvrier : 30 %
7- Retraité : 6 %
8- Autre actif : 4 %

Si la taille de l’échantillon est fixée à 1000 personnes, le plan de sondage sera le suivant :

1 2 3 4 5 6 7 8
H F H F H F H F H F H F H F H F
A
B
C
D

 Le calcul de la taille de l’échantillon :

 Echantillon constitué au moyen d’une méthode probabiliste


Sa taille est déterminée mathématiquement. Dans ce cas, la taille de l’échantillon est donnée
par la formule n = t². p. q .

Où t : est un coefficient dont la valeur dépend du seuil de confiance (exprimé en pourcentage)
retenu.

Seuil de confiance Valeur de t


68 % 1
90 % 1.65
95 % (le plus utilisé) 1.96
99 % (de haute précision) 2.58

Choisir un seuil de confiance à 99 %, signifie qu’en tirant 100 fois de suite un échantillon de
la population à étudier sur les 100, ainsi retenu il n’y aurait qu’un dont les résultats risquerait
d’être différent des résultats des 99 autres. En général, dans les études marketing on se
contente d’un seuil de confiance de 95 %.

 Marge d’erreur :
Exprimé en pourcentage représente la précision désirée ou intervalle de confiance (ainsi dans
l’hypothèse ou la marge d’erreur accepté et de 4 %, où les résultats à une question posée à
l’échantillon sont oui 40 %, non 60 % dans la population mère. Les oui seront compris entre
36 et 44 %, et les non entre 56 et 64 %. En général, la valeur E retenue est comprise entre 2 et
6 %.

P : représente la proportion des individus présentant une caractéristique donnée que l’enquêté
est chargé d’estimer et Q = 1- P, représente la proportion des individus ne représentant pas la
dite caractéristique.

26
Quand dans la plupart des cas, cette proportion est inconnu, on prend l’hypothèse la plus
défavorable pour laquelle la population se répartie en part égale soit P = Q = 50 %.

III. Détermination du mode d’administration

A. Les différents modes d’administration possibles :

Mode Avantages Inconvénients


d’administration
Dans la rue, dans un - rapidité d’exécution ; - indisponibilité des personnes
lieu public. - coût ; interrogées ;
- possibilité de recueillir des - influence des conditions
impressions (à chaud) des météorologiques ;
personnes interrogées (visiteurs - nécessité d’élaboration de
d’une manifestation commerciale, questionnaire ;
client d’un point de vente). - risque de non représentativité
de l’échantillon.
Au domicile ou sur le -possibilité de poser un grand - taux de refus parfois important
lieu de travail. nombre de question et notamment (jusqu’à 50 %) ce qui altère la
des questions ouvertes appelant la représentativité de l’échantillon,
réflexion ou la recherche de la (sauf à annoncer la visite de
part de l’enquêter ; l’enquêteur par téléphone ou par
- contrôle plus facile pour les courrier) ;
enquêteurs. - coût.
Par téléphone. - rapidité d’exécution quel que - difficultés d’entrer en relation
soit la location géographique des avec l’enquêté (liste rouge,
enquêtés ; barrage secrétaire) ;
- coût ; - absence d’identification de la
- absence physique de personne interrogée ;
l’enquêteur, ce qui peut favoriser - temps limité de l’enquête (15
la sincérité des réponses ; minutes maximum).
- contrôle aisé des enquêteurs.
Par voie postale. - possibilité d’interroger des - taux de retour faible (10 à 20
individus très dispersés %) qui peut être augmenté par
géographiquement à moindre des incitations à répondre
coût ; (cadeaux et bon d’achat) ;
- grande liberté de réponse laissée - représentativité incertaine de la
à l’enquêter ; population mère ;
-possibilité de poser un grand - délai de réception de réponses.
nombre de questions.
Par minitel. - faible coût de revient ; - risque de non représentativité
- saisie automatique de réponse ; de l’échantillon ;
- rapidité d’exécution. - taux de refus important en
raison des coûts de l’utilisation
de minitel par enquêter.

27
B. Le choix du mode d’administration :
Ce choix dépend de plusieurs facteurs.

 Le budget consacré à l’étude :


Le budget réduit conduira à privilégier des modes d’administration peu coûteux, tel que
l’enquête par voie postale ou dans la rue.

 Le délai de réalisation :
Si le délai réalisation qu’on on dispose est court, et qui conviendra de choisir un mode
d’administration permettant une collecte rapide d’information, une enquête administrée par
téléphone sera dans ce cas recommandée.

 Les objectifs de l’étude :


Si les informations à collecter sont nombreuses et nécessitent une réflexion de la part de
l’enquêter. Si certaines questions nécessitent la présentation du produit et de conditionnement,
si l’instauration d’un climat de confiance entre enquêté et enquêteur est indispensable pour
recueillir le maximum d’informations fiables, il convient d’administrer le questionnaire au
domicile ou sur le lieu de travail de l’enquêter.

Dans le cas ou l’échantillon est composé de chef d’entreprise, administrer le questionnaire


dans la rue sera absurde, dans ce cas, il faudra choisir en fonction des autres éléments entre
l’enquête sur le lieu de travail, par téléphone ou par voie postale.

Si la méthode retenue est probabiliste, il n’est pas réaliste de retenir le mode d’administration
dans la rue, dans ce cas, il faudra recueillir les informations par téléphone ou au domicile de
l’enquêter.
Si la taille de l’échantillon est réduite, il faudra éliminer l’enquête par voie postale en raison
du faible taux de retour de réponse.

C. La rédaction du questionnaire
Pour obtenir de bonnes réponses il faut poser les bonnes questions, une question mal
formulée, donc mal comprise par l’enquête. Un questionnaire mal adapté en mode
d’administration ou en mode de traitement retenue est des causes qui peuvent être altéré. La
qualité des informations recueilli et leurs interprétations, les questions non indispensables ou
dans la réponse peut être obtenu par d’autre moyen (exemple : recherche documentaire),
peuvent entraîner un refus de répondre ou des réponses manquants de sincérité.

 Les différentes formes de question :


Quel que soit la forme retenu, il est impératif que les questions soient comprises le plus
clairement possible.
- Les questions fermées : ces questions ne laissent qu’un choix limité de réponses
elles peuvent être :

28
Types de questions Exemples Avantages Inconvénients
Dichotomique : Etes-vous marié ? - Simple à poser à - Ne permet de
choix entre 2 oui non dépouiller et à traiter. recueillir que peu
réponses proposées. d’information.
A choix unique : Etes-vous propriétaire - Simple à - Choix par fois limité
sélection d’une de votre logement comprendre par donc difficile de
réponse parmi un depuis ? l’enquêter ; réponse par l’enquêté.
nombre limité de 1 an 2 ans - Facile à poser, à
réponse possible 3 ans +. de 3 ans dépouiller et à traiter.
supérieur à 2.
A choix multiples Parmi les marques -simplicité de recueil - la liste proposée
(QCM) : choix d’une suivantes, quelles sontet de traitement de risque d’influencer
ou plusieurs celles que vous l’information ; l’enquêté ;
réponses parmi connaissez ? -facilite à comprendre - risque de réponse
plusieurs réponses - marque A par l’enquêter, non sincère, l’enquêté
possibles. - marque B notamment dans le ne souhaite pas
- marque C cas de questionnaire montré qu’il ne peut
administré par voie donner aucune
postale. réponse.
Avec classement : Classer par ordre Possibilité de - difficulté pour
demande est faite à décroissant de déterminer le choix l’enquêté de classer
l’enquêté de classer préférences vos des enquêtés à partir au-delà de 4 critères ;
les différentes critères de choix de plusieurs critères - risque que l’enquêté
réponses possibles d’une grande surface : (la liste des critères ne puisse mémoriser
dans l’ordre de ses -prix + accueil ; ayant été déterminé tous les critères
préférences. - assortiment ; auparavant par une proposés (d’où la
- facilité d’accès ; prés enquête nécessité de les lui
qualité des produits ; qualitative ou par faire lire et non de les
- autres (à préciser). l’expérience). énoncer ;
- l’ordre des critères
risque d’influencer
l’enquêté.
Avec notation : il est Donner une note de 0 - grande liberté - système
demandé aux à10 à chacun des d’appréciation laissé à d’évaluation propre à
enquêtés d’attribuer critères suivants l’enquêter pour chaque enquêté, d’où
une note (de 0 à 5) (s’agissant d’une chacun des critères risque d’hétérogénéité
ou (de 0 à 10) aux voiture par exemple) : proposés ; des réponses ;
critères qui leurs confort, esthétique, - nombreuse - risque de voir les
sont proposés. nervosité, sécurité, exploitation réponses se situer à la
agrément de conduite. statistique possible. moyenne (autour de la
moyenne).

- Les échelles d’attitude : conçues à la base par des psychologues et des sociologues,
elles permettent d’évaluer les niveaux d’acceptation de l’enquêté par rapport à une
proposition qui lui est faite. En mercatique, les échelles les plus souvent utilisées sont celles
de LIKERT et d’OSGOOD.
 L’échelle de LIKERT : elle permet de mesurer le degré d’accord ou de
désaccord de l’enquête par rapport à une affirmation par l’enquêteur

29
Exemple : le personnel de votre agence bancaire est compétent, êtes-vous :

Pas du tout Pas d’accord Sans opinion D’accord Tout a fait


d’accord d’accord
1 2 3 4 5

Avec cette affirmation ?


Chaque réponse étant affectée d’une autre, il suffira de faire la somme des notes attribuées par
chaque enquêté pour calculer le score de la proposition.
 L’échelle d’OSGOOD : (appelé aussi sémantique différentielle).
L’attitude des enquêtés est mesurée à partir d’une échelle bipolaire
opposant deux affirmations contraires.
Exemple : comment appréciez-vous l’accueil de notre vente ?

Mauvais Bon
1 2 3 4 5 6

- Les questions ouvertes : souvent utilisées pour connaître l’opinion du


consommateur sur tel ou tel sujet, elle laisse toute liberté de réponse à l’enquêté.
Exemple : que pensez-vous de la publicité à la télévision ?
Dans l’hypothèse où le questionnaire est administré par un enquêteur, et afin d’obtenir
plusieurs précisions, cette question pourra être suivie par une autre question de type : c’est-à-
dire ? Pourquoi ? Mais encore ?… ces questions permettent d’obtenir des réponses spontanées
et souvent riches d’information. Cependant, si le questionnaire est au tout administré, le taux
de non réponse est en général élevé.
- La formulation des questions : quel que soit la forme de la question, il convient de
la formuler de façon à obtenir des réponses le plus claire possible, facilement exploitable par
la suite.

Exemple de la formulation à éviter Exemple de formulation à employer


« ne pensez-vous que… ? » « pensez-vous que… »
« venez-vous au magasin
- moins d’une fois une semaine ?
- plus d’une fois une semaine ? »
« utilisez-vous fréquemment votre voiture et « utilisez-vous votre voiture tous les jours ?
prenez-vous souvent le bus ? » oui non
« prenez-vous le bus
- moins d’une fois par jour ?
- une fois par jour ?
- plus d’une fois par jour ?
« combien gagnez-vous par mois ? « dans quel tranche se situe votre salaire ?
- de 8000 à 10000 FCFA
- de 10000 à 12000 FCFA
-plus de 12000 FCFA
Pour s’assurer de la sécurité des réponses, il est parfois utile de poser des questions de
couleurs appelées également question piège.
Exemple : pour contrôler la réponse à la question, « combien parcourez-vous de kilomètre en
moyenne chaque année. »
Il est possible de poser des questions de contrôle suivantes : « combien dépensez-vous de
carburant en moyenne par an ? ».

30
Pour éviter d’interroger des personnes n’appartenant pas à la population mère, il convient de
le prévoir en début du questionnaire.

- Une question filtre : ainsi par exemple, lors d’une étude sur les transports en
commun d’une ville, la population mère est constituée de l’ensemble des habitants.
C’est pourquoi, si on administre le questionnaire dans la rue, il convient de poser la question
filtre suivante : « habitez-vous à …? », de façon à ne pas interroger pour rien les personnes
qui sont de passage et qui, de ce fait n’appartiennent pas à la population mère.

IV. La structure et la présentation du questionnaire :


 Prévoir une phase de présentation pour informer l’enquêté du but de l’enquête.
(n’oubliez pas de se présenter) ;
 Classer les questions par thème. Pour préparer les questions, il faut suivre la
méthode entonnoir qui consiste à aller du général au particulier ;
 Prévoir suffisamment de place pour saisir les réponses aux questions ouvertes ;
 Alterner autant que possible les questions ouvertes aux questions fermées ;
 Poser à la fois les questions d’identification (catégorie socioprofessionnelle,
niveau de revenu, composition des foyers, types d’habitat) ;
 Ne pas oublier une phase de remerciement enfin du questionnaire.

- Le test du questionnaire : il est conseillé de tester le questionnaire avant de


commencer l’enquête pour :

 S’assurer de la bonne compréhension et de la cohérence de l’ensemble des questions ;


 Vérifier que sa longueur ne lasse pas l’enquêté.

Ce test réalisé en général auprès de 10 % de l’échantillon, conduit souvent à modifier


certaines questions ou à en réduire le nombre.

V. Traitement de l’information collectée :


L’administration des questionnaires a permis de collecter les informations recherchées. Il va
s’agir maintenant de dépouiller les questionnaires, et traiter les données enregistrées.

1. Le dépouillement des questionnaires :


Chaque questionnaire doit d’abord être vérifié scrupuleusement et être éliminé s’il est
incomplet ou suspect (réponses aberrantes à des questions pièges de vérification). Une fois ce
travail est achevé, il va falloir procéder à la préparation du plan de dépouillement (ou
codification).

a. Le plan de dépouillement :
Lorsque l’outil informatique est utilisé (tableurs ou logiciels spécialisés du types Chadoc ou
Sphinx), ce travail préparatoire va consister à concevoir une codification pour chaque
question et chaque réponse et à prévoir les traitements statistiques à réaliser (types de tri,
d’analyses,…).

Exemple de codification :
Question : êtes-vous favorable à la mise en place d’un service de livraison à domicile ?
OUI NON
Pour cette question, la codification retenue pourra être : LIVR.
31
Pour les réponses, la codification retenue pourra être : OUI = 1, NON = 2.
Pour la saisie informatique, on aura le choix entre LIVR1 ou LIVR2.
Pour les questions ouvertes, il convient de regrouper les réponses obtenues et les classer par
thèmes qui seront ensuite codifiés.

b. Le codage :
Une fois le plan de dépouillement prévu initialement mis en place, il faut coder chaque
questionnaire.
Il est donc souhaitable de prévoir, lors de sa conception, une zone de codage pour chaque
question.

Est-ce la première fois que vous fréquentez notre point de vente ?


OUI NON ……………….
Zone de codage.

La saisie informatique suit la phase de codage. Elle doit impérativement faire l’objet d’un
contrôle rigoureux.

2. Le traitement des données enregistrées :


Selon le plan de dépouillement prévu initialement, il peut comprendre : un tri à plat, et, en
fonctions des informations recherchées, un tri croisé, et d’autres traitements statistiques.

a. Le tri à plat :
Il permet de dénombrer les réponses à chaque question et d’en calculer le « poids » en
pourcentage.

Question : utilisez-vous le minitel pour passer vos commandes ?


Réponses Effectifs Poids en %
Jamais 100 20
Moins de 5 fois par an 250 50
Plus de 5 fois par an 150 30
Total des répondants 500 100

Lorsque l’analyse nécessite, certains calculs peuvent également être effectués (moyenne,
médiane, variance, écart type…).
Le tri à plat peut tenir compte des questions filtres et ne dénombrer que les répondants
concernés.
Si l’on prend l’exemple cité ci-dessus, on peut imaginer que la question-filtre
était : « possédez-vous un minitel ? ».
Les logiciels de dépouillement permettent de visualiser les résultats obtenus sous forme de
représentations graphiques (histogrammes, diagrammes en bâtons, « camemberts »).
Il arrive que le tri à plat des questions signalétiques (âge, sexe,…) fasse apparaître des
différences notables entre la répartition au sein de l’échantillon et celle au sein de la
population à étudier. Dans ce cas, il est conseillé de procéder à un redressement
d’échantillon. Cette opération consiste à supprimer (par tirage au sort) des questionnaires
dans les catégories surreprésentées et/ou à dupliquer (par tirage au sort) des questionnaires
dans les catégories sous-représentées.

b. Le tri croisé :

32
Prévu en principe lors de l’élaboration du plan de dépouillement, il va permettre de comparer
les réponses à une question aux réponses à une autre question.
Il va permettre de vérifier notamment l’existence d’une relation entre la réponse à une
question de comportement ou d’attitude – variable à expliquer – et la réponse à une question
signalétique (sexe, âge,…) – variable explicative.

Exemple :
Supposons que l’on croise la question : « utilisez-vous le minitel pour passer une
commande ? ».
Avec la question : « exercez-vous une activité professionnelle ?».
Le tri croisé pourrait présenter les résultats suivants :

Activité professionnelle Non Oui Total


Utilisez-vous le minitel ? (inactif) (actif)
Jamais 80 20 100
Moins de 5 fois par an 40 210 250
Plus de 5 fois par an 30 120 150
Total 150 350 500

A partir de ce croisement, il est possible de calculer le poids des effectifs en lignes et


d’obtenir la répartition suivante :

Activité professionnelle Non Oui Total


Utilisez-vous le minitel ? (inactif) (actif)
Jamais 80 % 20 % 100 %
Moins de 5 fois par an 16 % 84 % 100 %
Plus de 5 fois par an 20 % 80 % 100 %

L’interprétation des poids en lignes ainsi obtenue sera la suivante :


Sur 100 personnes n’utilisant jamais le minitel pour passer commande 80 % sont des inactifs
20 % des actifs…
Toujours à partir du croisement réalisé, il est possible de calculer le poids des effectifs en
colonnes et d’obtenir la répartition suivante :

Activité professionnelle Non Oui


Utilisez-vous le minitel ? (inactif) (actif)
Jamais 53 % 6%
Moins de 5 fois par an 27 % 60 %
Plus de 5 fois par an 20 % 34 %
Total 100 % 100 %

L’interprétation des poids en colonnes ainsi obtenue sera la suivante :


Sur 100 inactifs, 53 % n’utilisent jamais le minitel pour passer commande,
Sur 10 actifs, 6 % n’utilisent jamais le minitel pour passer commande…

Il faut toutefois se garder de conclure qu’il existe une relation entre ces variables (dans le cas
ci-dessus, on remarque notamment que le fait d’être actif pourrait encourager l’utilisation du
minitel pour passer commande) sans avoir au préalable des tests statistiques qui permettent :
1. De mesurer la réalité de la dépendance entre ces variables avec le test du KHI 2 ;
2. De mesurer ensuite l’intensité de la corrélation entre elles avec le calcul du coefficient r.
33
c. Les autres traitements statistiques :
Les tris à plat et croisés sont les plus utilisés dans la pratique.
On peut également, lorsque cela s’avère utile et possible (utilisation indispensable d’un outil
informatique), réaliser des analyses multidimensionnelles descriptives (segmentation…).

Application 1

Cas « IDAGHA »
La Société IDAGHA est une entreprise au capital de 1.558.230.000 FCFA, commercialise la
marque SUZUKI dans les secteurs de motos. Cette entreprise compte trois succursales dans
l’Estuaire, une dans la zone de Libreville, Akanda et Owendo. La société IDAGHA souhaite
s’implanté à Port-Gentil.
La responsable de la représentation Gabon, Mlle MOUTSINGA, pense qu’avant toute
nouvelle implantation, un diagnostic interne et externe s’impose pour connaitre s’il est
judicieux de se lancer sur ce marché.
En stage dans cette entreprise, votre responsable vous remet 3 dossiers dont le traitement
permettra à l’entreprise IDAGHA de prendre des mesures appropriées par rapport à
l’implantation d’un point de vente dans la province de l’Ogooué maritime.
Afin d’avoir une idée sur les chances de réussite d’une telle ambition, la responsable vous
confie la réalisation d’un questionnaire dont le dépouillement est rapide et le coût faible.
Travail à faire :
1) Quel type d’informations souhaiteriez-vous collecter ?
2) Rédiger le questionnaire de l’entreprise IDAGHA.

34
CHAPITRE IV
INTRODUCTION AUX GRAPHIQUES AVEC TABLEUR

I. Construction de la feuille de calcul :

Stéphanie a rassemblé ses dépenses de l’an dernier, en FCFA, dans le tableau ci-
dessous. Elle souhaite utiliser le tableur Excel pour faire des représentations graphiques de ses
dépenses afin de mieux les connaître et de mieux les maîtriser.

Janv. Févr. Mars Avril Mai Juin Juil. Août Sept. Oct. Nov. Déc.
Jeux, vidéo 50 45 8 60 10 25 75 0 15 20 15
Livres,
5 15 6 9 18 10 3 15 25 15 10
revues
Spectacles 15 5 0 6 18 6 15 15 9 25 20
Restauratio
20 12 10 7 15 9 15 18 8 14 12
n
Transports 22 18 20 15 15 16 7 14 18 10 20

Ouvrir le fichier Excel, dans la feuille1, entrées les données.


1. Présentation du tableau :
1.1. Déterminer le pourcentage, ajuster la largeur des colonnes pour que le tableau
tienne sur un seul écran.
1.2. Centrer l’affichage des mois et des nombres, les rubriques des dépenses restant
alignées à gauche. Les nombres doivent s’afficher en valeurs entières.
1.3. Dessiner les traits de lignes et de colonnes de ce tableau en utilisant l’icône :
ou le menu Format\Bordure et trame.
Le résultat final doit ressembler le plus possible au modèle ci-dessus.

2. Données complémentaires :
2.1. Stéphanie désire connaître le montant de ses dépenses mois par mois, qu’elle
inscrit dans les cellules B7 à M7. Pour cela, elle peut utiliser la formule qui
donne la somme des nombres contenus dans les cellules sélectionnées. Il existe
une autre démarche, automatisée : sélectionner les cellules B2 à B6 et cliquer sur
l’icône :

Compléter la ligne 7.

2.2. Stéphanie désire maintenant estimer le montant des dépenses de décembre. Elle
pense que la meilleure façon est de prendre la moyenne des dépenses des autres
mois, pour chaque rubrique, et de l’inscrire en décembre.

La syntaxe est : =moyenne (B2:L2)


Attention : si vous tapez B2;L2 vous obtiendrez la moyenne des deux
quantités inscrites dans ces deux cellules ! Pour obtenir la moyenne des 11
données, c’est le double point qu’il faut saisir : regardez bien vos écritures !!!!!
Compléter alors, avec cette méthode, les cellules M2 à M6 (les nombres
seront arrondis à l’unité si besoin).
35
2.3. Stéphanie désire connaître le montant des dépenses annuelles, rubrique par
rubrique. Complétez alors les cellules N2:N6. Combien peut-elle alors estimer
avoir dépensé au total cette année-là ? Inscrire ce total en N7.

II. Graphiques circulaires :

Ses dépenses réelles sont celles du tableau de la feuille Tableau-2. Vous allez
travailler maintenant à partir de ces données.

Pour avoir une meilleure idée de ses dépenses par rubrique Stéphanie décide alors de
donner une représentation graphique des totaux de la colonne N, lignes 2 à 6.

Sélectionner ces cellules et cliquer sur l’icône suivante :

Vous venez de rentrer dans l’assistant graphique du logiciel. Diverses options vous
seront proposées. Choisir, en prenant le temps nécessaire pour regarder et tester les options
offertes, celles qui permettent d’obtenir un graphique de la forme ci-dessous (les données ne
sont pas nécessairement exactes, les bulles de texte sont là pour vous aider à choisir les
options du graphique).
N’oubliez pas d’utiliser aussi le clic droit de la souris.

Titres

Dépenses en rubriques

Etiquettes de
19% données
33%

17%

15% 16%

Jeux, vidéo Livres, revues Spectacles Restauration Transports

Légende, à modifier, voir ci-dessous


Graphique 1

Il serait souhaitable que, dans la légende, les rubriques elles-mêmes soient inscrites et
non un numéro. Voici les démarches pour y arriver :
a) Sélectionner tout le graphique.
36
b) Clic droit à la souris puis sur Données sources.
c) Dans l’onglet Série, fenêtre Série, cliquer sur ajouter.
d) Cliquer dans la sous-fenêtre Etiquettes de catégorie, y laisser le curseur de
la souris.
e) Sélectionner alors les cellules A2:A6.
f) Cliquer sur OK.

Exercices : modifier les options de ce graphique (sans changer les données) pour obtenir,
successivement, les deux formes ci-dessous :
Dépenses en rubriques Dépenses en rubriques

200 200
433
168
433
148 151
168

148
151

II. COURBES :

A partir des données inscrites sur cette feuille, Stéphanie voudrait connaître le montant
de ses dépenses mensuelles et visualiser de façon rapide les variations de ces dépenses.
Compléter le tableau et construire un graphique, en utilisant l’assistant, qui réponde au
mieux à ce souhait.

III. CAMENBERT :

A partir des données inscrites sur cette feuille, Stéphanie voudrait connaître la
répartition mensuelle, en pourcentage, de ses dépenses. Utiliser l’assistant pour
construire un graphique qui réponde au mieux à ce souhait.

IV. HISTOGRAMME :

A partir des données inscrites sur cette feuille, Stéphanie voudrait connaître
rapidement les mois de forte dépense. Construire un histogramme qui réponde au
mieux à ce souhait. Utiliser l’assistant graphique et l’annexe « Tracer un bel
histogramme avec Excel ».

V. DONNEES CUMULEES :

A la fin de chaque mois, Stéphanie voudrait connaître le montant total de ses dépenses
depuis le début de l’année. Elle va donc construire un tableau des valeurs cumulées et
en donner une représentation graphique en courbe. Aidez-là à effectuer ce travail.
Quel mois a-t-elle dépensée la moitié de son budget ? Les trois quarts ?

37
38
Tracer un bel histogramme avec EXCEL

1. Entrer la série statistique :


Entrer la série statistique ci-dessous. Le crochet s'obtient en appuyant simultanément
sur les touches CTRL ALT et 5 ou ° selon le crochet que vous voulez faire.

2. Tracé de l'histogramme :
 Sélectionner les cellules B1 à K2 ;
 Cliquer sur "l'assistant graphique" et sélectionner Histogramme groupé… (premier
histogramme).
 Cliquer deux fois sur SUIVANT.

 Sous l'onglet "Titres" entrez le titre "Histogramme" suivi de votre prénom et de votre
initiale.
 Sous l'onglet "Axes", enlevez la sélection "Axe des ordonnées" ;
 Sous l'onglet "Etiquettes de données" cocher "Afficher la valeur" ;
 Sous l'onglet "Quadrillage", enlever la sélection "Quadrillage principal" ;
 Sous l'onglet "Légende", enlever la sélection "Afficher la légende".
 Cliquer sur "SUIVANT", assurez-vous que "En tant
qu'objet sur feuille 1 est sélectionné, puis cliquer sur "FIN".

L'histogramme que vous obtenez n'est pas un bel histogramme.


Même si l'axe des ordonnées n'apparaît pas, ce qui est normal puisque dans un histogramme
ce sont les aires des rectangles qui nous intéressent, un bel histogramme ne doit pas être
constitué de rectangles séparés.

3. Amélioration du graphique :
 Commencez par améliorer votre graphique comme vous l'avez fait lors de précédents
graphiques :
– Zone de traçage blanche (ou claire) ;
– Agrandir la zone de graphique ;
– Police et corps en cliquant sur la "zone de graphique" ;
 La bordure de la zone de traçage gêne :
Cliquer sur la zone de traçage et, dans "Format de la zone de traçage", dans le cadran
"Bordure", sélectionnez "Aucune".
 Cliquez sur un des rectangles avec le bouton droit de la souris puis dans "Format de série
de données", sous l'onglet "Option", ramener la largeur de l'intervalle à 0. Puis dans
l'onglet "Motifs" puis dans le cadran "Aires", sous "Motifs et textures" dans l'onglet
"Motifs" (encore), choisir un motif qui convient.

39
Votre histogramme est maintenant un bel histogramme.

1. Étiquette :
Sur son graphique circulaire, les données des mois de l’année dernière se sont
malencontreusement effacées. Stéphanie a seulement retrouvé les montants des
dépenses, en désordre. Après les avoir classées, en ordre croissant, Stéphanie a
noté : 25 38 50 60 68 75 90 98 105 110
125 150

Pouvez-vous rattraper cette erreur en complétant les étiquettes du schéma ci-


dessous ?

Janv………...
Févr………...

Déc………. Mars……….

Nov………..
Avril……….

Mai…………..

Oct……….. Juin………...

Sept……... Juil……….

Août……….

40
Lecture graphique :
Cette fois, Stéphanie veut faire une étude plus mathématique de ses dépenses à
partir de la courbe ci-dessous.

140
130
120
110
100
90
80
70
60
50
40
30
20

Compléter alors le tableau suivant :

Janv Févr Mar Avri Aoû Sept Nov


Mai Juin Juil. Oct. Déc.
. . s l t . .
Monta
nt

3.1. Quel mois a-t-elle dépensé le plus ? Et combien ?


Réponse(s) :
3.2. Quel mois a-t-elle dépensé le moins ? Et combien ?
Réponse(s) :
3.3. Quels mois a-t-elle dépensé moins de 80 FCFA ?
Réponse(s) :
3.4. Quel(s) mois a-t-elle dépensé 100 FCFA ou plus ?
Réponse(s) :

3.5. Faire le tableau des variations de ses dépenses.

41

Vous aimerez peut-être aussi