Vous êtes sur la page 1sur 22

Chapitre

1 Méthodologie et analyse
descriptive des données
Sommaire
Contexte d’application : Des faits sur les conditions de travail dans les PME - Analyse
du sondage sur les ressources humaines dans les PME du Québec
Liste des feuilles Excel - Chapitre 1

Objectifs pédagogiques 1.12 Courbe de fréquences cumulées


1.1 Introduction  Exercice résolu 1.2
1.2 L’information numérique et la statistique  Appliquer vos connaissances - Série 1.4
1.3 Types de recherche et collecte de données  Appliquer vos connaissances - Série 1.5
1.4 Statistique descriptive et statistique 1.13 Outil de collecte de données : le
inférentielle questionnaire
1.5 Quelques notions fondamentales
 Appliquer vos connaissances - Série 1.6
1.5.1 Ensemble statistique - Population
statistique - Unité statistique 1.14 Démarche et différents types de questions
1.5.2 Variables (caractères) 1.15 Codage de modalités de réponses
1.5.3 Caractère quantitatif - Caractère 1.16 Exploitation de données nominales et
qualitatif ordinales
1.5.4 Modalités des caractères 1.17 Diagrammes à secteurs et diagrammes à
1.5.5 Variable statistique - Variable
barres
discrète - Variable continue
1.5.6 Variable indépendante et variable  Exercice résolu 1.3
dépendante 1.18 Présentation des résultats dans un tableau
 Exercice résolu 1.1 croisé
 Appliquer vos connaissances - Série 1.1 1.19 Source de données et site Internet
1.5.7 Les échelles de mesure 1.20 Le rapport d’une étude statistique
 Appliquer vos connaissances - Série 1.2 1.21 Exemple d’application d’un rapport
1.5.8 Échantillon - Échantillon aléatoire d’étude
1.5.9 Unité de mesure 1.22 Résumé, glossaire et synthèse des
1.5.10 Fréquence absolue - Fréquence relative principales formules
1.6 Exploitation de données d’intervalles/rapport 1.23 Exercices d’application
1.7 Dépouillement selon une distribution de 1.24 Exercices de révision et de synthèse
fréquences absolues avec données groupées en Test éclair - Test no 1 (en ligne)
classes Solutions au Test éclair no 1 (en ligne)
1.8 Autre forme de dépouillement élémentaire : le Grille d’évaluation des notions à maîtriser
diagramme en feuilles
CAS PRATIQUE - Activité de synthèse no 1
 Appliquer vos connaissances - Série 1.3
Analyse descriptive concernant le profil
1.9 Distribution de fréquences absolues : cas où le
caractère étudié est discret d’entreprises et des répondants utilisant
1.10 Distribution de fréquences absolues avec des systèmes d’information de gestion
classes ouvertes de projet
1.11 Principales représentations graphiques Corrigé des exercices d’application
1.11.1 Diagramme en bâtons des connaissances
1.11.2 Histogramme et polygone de
fréquences
d’application

Contexte
Des faits sur les conditions de travail dans les PME* - Analyse
du sondage sur les ressources humaines dans les PME du Québec

Ce sondage effectué auprès de 1 021 chefs d’entreprise du Québec permet


de résumer une information statistique importante concernant « l’emploi dans
les PME québécoises », « les ressources humaines dans les PME » et « la
rémunération dans les PME ».
Certains résultats du sondage sont illustrés à l’aide de diagrammes à
secteurs et à barres verticales.
Les PME procurent environ trois emplois sur cinq au Québec
Analyse descriptive de données

Si vous prévoyez embaucher au cours des 12 prochains mois, quels types de


postes aurez-vous à combler?

Un des objectifs de ce chapitre est de résumer l’information statistique à


l’aide de divers graphiques pour mieux la visualiser et saisir l’essentiel.
* Source : Vincent, F. Des faits sur les conditions de travail dans les PME. Fédération canadienne
de l’entreprise indépendante, janvier 2015.
1 Liste des feuilles Excel (en ligne)

Chapitre 1- Méthodologie et analyse


decriptive des données

- CONDITIONS TRAVAIL DANS LES PME - EXEMPLE 1.18


- EXEMPLE 1.1b - APP SÉRIE 1.6
- EXEMPLE 1.1c - EXEMPLES 1.19-1.20
- EXEMPLE 1.7 - EXERCICE RÉSOLU 1.3
- EXEMPLE 1.8 Exercices d’application
- EXEMPLE 1.9a) - EXERCICES NO 1.2 à 1.22
- EXEMPLE 1.9b) Exercices de révision et
- APP SÉRIE 1.3 de synthèse
- EXEMPLE 1.10 - EXERCICES NO 1.23 à 1.27
- EXEMPLE 1.11 - CAS PRATIQUE - ACTIVITÉ DE
- EXEMPLE 1.12 SYNTHÈSE NO 1
- EXEMPLE 1.13
Analyse descriptive concernant le
- EXEMPLE 1.14
profil d’entreprises et des répondants
- EXERCICE RÉSOLU 1.2
utilisant des systèmes d’information
- APP SÉRIE 1.4
de gestion de projet
APP SÉRIE 1.5
4 MÉTHODES STATISTIQUES EN GESTION

Chapitre 1
Méthodologie et analyse
descriptive des données
Objectif général. Ce chapitre présente certains éléments de méthodologie et
Objectifs
Pour une utilisation exclusive par le prof. Mohamed Dia U d’Ottawa ADM 2703 automne 2021

pédagogiques traite de l’essentiel des notions statistiques concernant l’analyse descriptive des données.
Objectifs spécifiques. Lorsque vous aurez complété l’étude du chapitre 1,
vous pourrez :
1 Mieux saisir l’importance de la notion « statistique ».
2 Distinguer entre les différents de types de recherche et connaître la méthodologie qui est associée à
chaque type de recherche.
3 Distinguer entre la statistique descriptive et la statistique inférentielle.
4 Préciser ce qu’on entend par population, unité statistique, caractères, modalités, variable statistique.
5 Identifier les différents types de données et échelles de mesure.
6 Préciser ce qu’on entend par échantillon, échantillon aléatoire, fréquence absolue...
7 Dépouiller les données d’une variable quantitative selon une distribution de fréquences absolues.
8 Dépouiller une série de données selon un diagramme en feuilles.
9 Tracer les principales représentations graphiques associées aux différents de types de dépouillement.
10 Tracer la courbe cumulative croissante
11 Structurer une démarche à suivre pour élaborer une enquête à l’aide d’un questionnaire.
12 Distinguer entre une question fermée et une question ouverte.
13 Coder correctement les modalités de réponse d’un questionnaire et effectuer la saisie des données
dans un fichier.
14 Dépouiller des données de types nominale et ordinale.
15 Tracer les diagrammes appropriés pour des données nominales et ordinales.
16 Interpréter les résultats dans un tableau croisé.
17 Distinguer entre données primaires et données secondaires.
18 Préciser en quoi consiste les principaux éléments d’un rapport d’étude.

1.1 Introduction
On peut définir la statistique descriptive comme l’instrument statistique qui permet de donner un
sens, une expression à l’information recueillie. Elle rend plus intelligible une série de données en
permettant de dégager les caractéristiques essentielles qui se dissimulent dans une masse de données.
Nous obtenons donc par la statistique descriptive une image concise et simplifiée de la réalité : un
résumé statistique qui caractérise l’essentiel.

1.2 L’information numérique et la statistique


L’information numérique  ou données  s’apparente dans le langage courant à ce que nous
appelons des statistiques. Cette conception populaire des statistiques de résumer un ensemble de
Objectif 1 données soit par des tableaux ou graphiques, ou encore par des pourcentages ou moyennes ne
Mieux saisir l’importance représente qu’une minime partie du domaine de la statistique.En effet, le mot statistique, lorsque
de la notion « statis-
tique »
pris sous forme singulière est une science qui englobe un ensemble de méthodes et de théories
appliquées à l’analyse de phénomènes et de données dont le comportement ne peut être décrit avec
CHAPITRE 1 : MÉTHODOLOGIE ET ANALYSE DESCRIPTIVE DES DONNÉES 5

exactitude, mais plutôt être analysé dans un contexte d’incertitude. Le but ultime de l’utilisation de
ces méthodes et modèles est d’arriver à des conclusions pratiques pour éventuellement proposer
des recommandations et des mesures correctives s’il y a lieu ou encore pour mieux comprendre
ces phénomènes et éventuellement en prévoir le comportement.

On désigne aussi sous le vocable statistique une quantité particulière calculée à partir des données
 Statistique d’un échantillon comme la moyenne arithmétique, l’écart-type, la proportion de PME possédant un

Pour une utilisation exclusive par le prof. Mohamed Dia U d’Ottawa ADM 2703 automne 2021
site Web...
L’application des outils statistiques est courante. Elle fait fréquemment partie d’un travail
d’investigation expérimentale où l’on doit recueillir, analyser et interpréter des données avec des
outils objectifs pour être en mesure de tirer des conclusions valables et d’en dégager les
recommandations pratiques qui s’imposent.
L’objectif de cet ouvrage est de présenter un certain nombre d’outils statistiques et probabilistes en
insistant sur l’utilisation que l’on peut en faire dans différents secteurs des sciences de la gestion à
l’aide d’applications diverses.
Voici trois exemples comportant divers types de données et dont l’analyse nécessite les techniques
appropriées.

Exemple 1.1 Divers types de données selon le type d’études

a) Les PME québécoises et leurs différents enjeux


Lors d’une étude réalisée en avril 2019 auprès de 300 dirigeants de PME québécoises*, on constate
que, dans le cadre de la mise en place de nouvelles technologies, 17 % ont opté pour la technologie
infonuagique (y compris Microsoft 365), alors que 12 % ont opté pour de nouveaux logiciels et ceci en
 Données réponse à la question « Quelles innovations votre entreprise a-t-elle mises en place dans le cadre du
qualitatives et virage numérique? »
données quanti-
* Source : Rapport - Les PME québécoises et leurs différents enjeux, Raymond Chabot Grant Thornton, 8 avril 2019.
tatives

b) Recherche sur la pratique de gestion financière : caractéristiques personnelles de


dirigeants de PME
Dans une recherche visant à mettre en relation les pratiques de gestion financière à court terme et
la vulnérabilité financière des PME, on a obtenu les données de la page suivante (présentées dans
une feuille Excel) sur les caractéristiques personnelles de 85 dirigeants de PME dont l’existence
est de 10 ans et moins*.
*Source : Adapté de Therrien, C. L’effet de l’utilisation de pratiques de gestion financière à court terme sur la vulnérabilité
financière en fonction de l’âge des PME. Mémoire de recherche, Université du Québec à Trois-Rivières.

Âge : Âge de l’entrepreneur (années)


Direction : Nombre d’années passées à la direction de la présente entreprise
Expérience : Nombre d’années d’expérience dans le secteur d’activités
Scolarité : Niveau de scolarité le plus élevé atteint comme indicateur du
degré de formation
1. Primaire 
2. Secondaire 
3. Collégial 
4. Universitaire 
Spécialisation : Spécialisation en comptabilité ou en finance à titre de mesure
de compétences en gestion financière
Oui Non
6 MÉTHODES STATISTIQUES EN GESTION

Exemple
1.1 b)
Extrait du
fichier de
données

Logiciels de
traitement
de données

Il existe sur le marché


plusieurs logiciels statisti-
Pour une utilisation exclusive par le prof. Mohamed Dia U d’Ottawa ADM 2703 automne 2021

ques, dont SPSS,


MINITAB, SAS, Sta-
tistica...
Nous ferons usage dans
cet ouvrage, du tableur
Excel de Microsoft. c) Postulants à un poste d’opérateur : résultats à un test d’aptitude - test de spatialisation (1)
Les données* suivantes correspondent aux résultats obtenus au test de spatialisation par des postulants
à un poste d’opérateur dans une usine de transformation de la région de l’Estrie (test faisant partie
de la batterie de tests connue sous le nom de BGTA : batterie générale de tests d’aptitudes).
S u je t Sc o re S u je t Sc o re S u je t Sc o re S u je t Sc o re S u je t Sc ore

Exemple 1 79 15 105 29 99 43 96 57 79
1.1 c) 2 148 16 135 30 134 44 109 58 73
3 109 17 92 31 76 45 63 59 102
4 82 18 105 32 76 46 82 60 79
5 109 19 122 33 92 47 73 61 102
6 118 20 115 34 79 48 89 62 86
7 109 21 99 35 122 49 109
*
8 86 22 96 36 112 50 82 Source : Nous remer-
9 96 23 112 37 80 51 86 cions le professeur
10 102 24 102 38 109 52 102
Normand Pettersen du
département des scien-
11 128 25 82 39 102 53 89
ces de la gestion de
12 118 36 125 40 79 54 86
l’UQTR d’avoir fourni
13 125 27 86 41 102 55 112
les données.
14 107 28 80 42 132 56 66
Le test de spatialisation permet de mesurer l’aptitude à concevoir visuellement des formes géométriques
(1)

et à comprendre la représentation d’objets en deux dimensions, à distinguer les rapports qui résultent du
mouvement d’objets dans l’espace.

 Comment peut-on rendre plus intelligible cette série de données?


 Quelles sont les représentations graphiques qui sont requises pour mieux visualiser le
comportement de cette variable et quelle interprétation peut-on en faire?
 Existe-t-il des valeurs typiques qui permettraient de résumer l’ensemble des données?
 Existe-t-il des valeurs aberrantes? Une valeur aberrante ici (sur le côté supérieur) pourrait vouloir
dire une candidature exceptionnelle!
d) Sondage pour mieux cerner les besoins en nouvelles technologies
Voici quelques questions utilisées lors d’un sondage pour mieux répondre aux besoins de nouvelles
technologies.
La première question requiert le degré d’accord sur les nouvelles technologies.
 a) Il est important pour vous de connaître les nouvelles technologies dès
qu’elles sont disponibles sur le marché.
Totalement  Assez  Assez en Totalement d’accord
d’accord désaccord en désaccord

b) En général, vous êtes parmi les premières personnes à utiliser les nouveautés
technologiques.
Totalement Assez Assez en Totalement
d’accord d’accord désaccord en désaccord
CHAPITRE 1 : MÉTHODOLOGIE ET ANALYSE DESCRIPTIVE DES DONNÉES 7

 Quel est votre degré d’intérêt pour une carte à puce offrant de multiples fonctions?
Très Assez  Peu Pas du tout
intéressé intéressé intéressé intéressé
 Incluant vous-même, combien de personnes vivent actuellement chez vous?
1 2 3 4 5 6 7 8
 À quel groupe d’âge appartenez-vous?

Pour une utilisation exclusive par le prof. Mohamed Dia U d’Ottawa ADM 2703 automne 2021
Moins de 18 ans De 45 à 54 ans
De 18 à 24 ans De 55 à 64 ans
De 25 à 34 ans 65 ans ou plus
De 35 à 44 ans
Adapté d’un Sondage de la compagnie Bell.

Quelle échelle de mesure correspond à chacune de ces questions? Quel traitement statistique est
approprié pour chacune des questions? Quels sont les diagrammes appropriés pour visualiser les
résultats?
Ces aspects sont traités à l’aide de méthodes utilisées en analyse descriptive de données. L’analyse
descriptive des données permet de donner un sens, une expression à l’information recueillie.

1.3 Types de recherche et collecte de données


Une étude statistique requiert une démarche structurée. Les diverses étapes d’une étude statistique
peuvent se résumer comme suit :
 Étapes à  Analyse de la situation. Il faut d’abord identifier la situation problématique (par exemple,
suivre pour réali- un changement dans les habitudes de consommation qui affecte le volume des ventes).
ser l’élaboration
d’une étude statis-  Identification des informations à recueillir. Identifier les informations pertinentes qui
tique peuvent être liées à la situation problématique. Par exemple qu’est-ce qui explique la baisse
du chiffre d’affaires d’un certain produit? Profil socio démographique des consommateurs,
Objectif 2
style de vie, parts de marché des concurrents...
Distinguer entre les  Choix du type de recherche et de la méthode de collecte de données . Doit-on effectuer
différents de types de une recherche exploratoire? (Recherche qui permet d’analyser la situation problématique
recherche et connaître
et qui vise à préciser des hypothèses possibles sur les causes du problème ou de
la méthodologie qui est
associée à chaque type l’insatisfaction). Doit-on effectuer une recherche descriptive? Recherche qui consiste à
de recherche décrire une situation par exemple quelles sont les habitudes de consommation d’un certain
groupe d’âge, le profil sociodémographique de propriétaires de cinéma maison...
L’enquête à l’aide d’un questionnaire est l’outil de mesure approprié pour ce type de
recherche, celle-ci pouvant être par correspondance, par téléphone, en milieu de travail,
par Internet...
Le troisième type de recherche consiste en la recherche causale ou explicative dont
l’objectif est de déterminer si les variations d’une variable ont un effet sur une autre variable
ou encore si on peut expliquer le comportement d’une variable à l’aide d’une autre variable.
Par exemple, quel est l’impact sur les ventes d’un magasin d’une campagne de publicité?
Nous résumons ci-après les principales caractéristiques des divers types de recherche
(objectifs, nature des données à recueillir, méthodologie de la recherche).
 Identification des outils d’investigation et plan de sondage. Cette étape consiste à préciser
l’instrument de mesure de l’information qu’on veut recueillir. Cet instrument peut se présenter
sous forme d’étude documentaire (surtout utilisé dans une recherche exploratoire pour
améliorer la connaissance du sujet), sous forme d’une grille d’observation (surtout utilisé
8 MÉTHODES STATISTIQUES EN GESTION

Tableau 1.1 Méthodologie


Caractéristiques Types de Nature
Objectifs
de divers types recherche des données Sources d’information Échantillonnage
de recherche
 Recherche  Découvrir Souvent de  Entrevues avec des per-  Petits échan-
exploratoire la nature gé- nature quali- sonnes-ressources tillons représen-
nérale du pro- tative  Fichiers clients tatifs ou non
blème  Analyse documentaire  Échantillon vo-
 Formuler  Web lontaire
des hypothè-
ses
Pour une utilisation exclusive par le prof. Mohamed Dia U d’Ottawa ADM 2703 automne 2021

 Recherche  Caractériser De nature  Enquêtes diverses à  Échantillon impor-


descriptive quantitative- quantitative l’aide d’un questionnaire tant et généralement
ment une  Observation directe représentatif de la
situation avec une grille d’obser- population
donnée vation
 Estimer cer-
tains paramè-
tres de la po-
pulation
É v a l u e r
qu antitative-
ment l’occu-
rence d’un
fait, d’un com-
portement

 Recherche  Tester des Surtout de na-  Enquêtes à l’aide d’un  Échantillon repré-
causale ou hypothèses ture quantita- questionnaire sentatif de la popu-
explicative statistiques tive  Expérimentation (soit en lation
 Déterminer laboratoire, soit sur le ter-  Collecte de don-
les variables rain) nées à l’aide d’un
explicatives plan d’expérience
significatives (méthode avancée)
 Déterminer la
force du lien
entre deux va-
riables

 Identification des outils d’investigation et plan de sondage (suite).


dans une recherche descriptive pour décrire le comportement et les habitudes de
consommateurs, analyser la fréquence des comportements...), sous forme d’enquête soit par
l’entretien (individuel ou en groupe), soit par le questionnaire. Cette dernière forme de
recherche est utilisée dans une recherche descriptive ou une recherche causale.
L’élaboration du plan de sondage repose sur certaines considérations de nature statistique et
probabiliste. Il faut d’abord bien identifier le cadre de référence de la population qu’on veut
sonder (les bases de données de divers organismes sont un outil précieux, si vous pouvez y
avoir accès), déterminer la taille d’échantillon (qui est habituellement fixée pour ne pas excéder
une certaine marge d’erreur statistique dans les estimations qu’on fera lors de l’analyse des
données), préciser la méthode d’échantillonnage des unités statistiques (qui correspondent
dans la plupart des cas à des individus) pour constituer l’échantillon.
La méthode d’échantillonnage peut être probabiliste ou non probabiliste. Ces différents aspects
du plan d’échantillonnage (construction de l’échantillon, méthodes d’échantillonnage et taille
de l’échantillon requis pour estimer une proportion ou une moyenne) sont traités abondamment
au chapitre 6.
 Traitement statistique et codage des données. Cet aspect est fondamental et est lié
directement à la rédaction du questionnaire. Il faut préparer un plan de traitement statistique
pour s’assurer que les réponses fournies par l’enquête se présentent dans une forme adéquate
pour le traitement et l’analyse des données.
CHAPITRE 1 : MÉTHODOLOGIE ET ANALYSE DESCRIPTIVE DES DONNÉES 9

 Traitement statistique et codage des données (suite).


Les outils statistiques et graphiques utilisés pour l’analyse des données sont en fonction du
type de données recueillies. La formulation des questions doit tenir compte du traitement
statistique éventuel et répondre aux objectifs de la recherche.
Pour procéder à un traitement informatique des résultats du sondage, il faut être en mesure
d’associer un code numérique à chaque réponse, à moins que celle-ci soit de nature textuelle.

Pour une utilisation exclusive par le prof. Mohamed Dia U d’Ottawa ADM 2703 automne 2021
La tâche est facilitée grandement si les réponses sont de nature numérique ou que les modalités
Nous présentons à la sec-
de réponses sont fixées au préalable (avec codification).
tion 1.20, les principaux  Rédaction du rapport d’étude. Une fois l’analyse des données complétée, on doit effectuer
éléments requis dans un
rapport basé sur une étude
une synthèse des résultats et les mettre en relation avec les objectifs de l’étude. Il ne faut pas
statistique. oublier que ce rapport d’étude s’adresse habituellement à des gestionnaires; le rapport doit
être écrit dans une perspective managériale. Il doit servir comme outil de référence d’aide à
la décision.

1.4 Statistique descriptive et statistique inférentielle


L’analyse des données peut comporter plusieurs aspects qui sont habituellement regroupés sous
deux thèmes soit la statistique descriptive et la statistique inférentielle.
Objectif 3
Distinguer entre la La statistique descriptive permet de rendre plus intelligible une série d’observations en permettant
statistique descriptive et de dégager les caractéristiques essentielles (moyenne, médiane, écart-type, proportion...) qui se
la statistique inférentielle dissimulent dans une masse de données. La présentation sous forme de tableaux, de diagrammes
ou de graphiques permet d’illustrer l’essentiel des résultats d’une enquête.
La statistique inférentielle, par contre, permet de tirer des conclusions sur tout le phénomène ou
 Statistique descrip-
tive et statistique infé- encore d’effectuer une analyse statistique plus approfondie avec les techniques statistiques
rentielle appropriées (estimation par intervalle de confiance, tests d’hypothèses statistiques, analyses de
corrélation et de régression, analyse statistique de tableaux croisés...) pourvu que certaines règles
et conventions (par exemple le choix de l’échantillon, aspect que nous traitons subséquemment)
aient été respectées. Ces conclusions comportent une marge d’erreur statistique qui peut être
calculée.
Nous schématisons à la page 11, les principaux éléments qui constituent la statistique descriptive
et la statistique inférentielle.
Dans le cas d’études de marché utilisées en recherche marketing, on utilise également les termes
 Analyse univariée analyse univariée , lorsque les données associées aux diverses questions sont analysées
et analyse bivariée individuellement (dépouillement, statistiques descriptives, intervalle de confiance sur certains
paramètres), analyse bivariée lorsqu’une variable est associée à une autre variable lors du traitement
statistique des données (tableau croisé, analyse de corrélation).

1.5 Quelques notions fondamentales


Avant d’aborder les différents types d’échelles de mesure utilisées dans le domaine de la statistique,
précisons certains termes qui seront utilisés subséquemment. Nous ne donnons ici qu’un vocabulaire
de base; d’autres termes associés à la statistique seront définis au moment opportun.

1.5.1 Ensemble statistique - Population statistique - Unité statistique


Un des objectifs de la statistique est d’étudier les propriétés numériques d’ensembles comportant
de nombreux individus ou unités statistiques. Ainsi la réunion de toutes les unités statistiques
Objectif 4
possibles (ou éléments ou individus) constitue l’ensemble statistique ou la population statistique.
Préciser ce qu’on
entend par population, Ce sont sur les unités statistiques (ou individus au sens large) que sont recueillies les données. Il
unité statistique. est important que la population étudiée soit définie correctement pour que l’on puisse dire si une
10 MÉTHODES STATISTIQUES EN GESTION

unité statistique appartient ou non à la population.


Voici quelques exemples de populations et d’unités statistiques.
Exemple 1.2 Description de population statistique et d’unités statistiques

a) Une association professionnelle regroupe 3 000 membres. On veut effectuer une étude auprès des
membres sur l’impact humain des nouvelles technologies. Les 3 000 membres constituent la
population statistique; chaque membre est une unité statistique de cette population.
b) Une étude porte sur les profits des usines établies au Québec et employant plus de 100 personnes.
Statistique Canada définit une
L’ensemble des usines établies au Québec et employant plus de 100 personnes constitue la
Pour une utilisation exclusive par le prof. Mohamed Dia U d’Ottawa ADM 2703 automne 2021

unité statistique comme suit :


une unité statistique est une population statistique; chaque usine de cette population constitue une unité statistique.
unité d’observation ou de me-
sure pour laquelle les données
c) Un sondage a été effectué par Ipsos-Reid et réalisé auprès de 1 500 travailleurs bénéficiant d’un
sont recueillies ou dérivées.
(http://www.statcan.ca/) régime d’assurance collective. On veut évaluer, pour ces travailleurs le niveau de stress au travail.
La population est constituée de l’ensemble des travailleurs bénéficiant d’un régime d’assurance
On pourrait également
collective; chaque travailleur bénéficiant d’un régime d’assurance collective constitue une unité
interpréter la population statistique.
comme étant l’ensemble des d) Le ministère de L’Économie et de l’Innovation (MEI) souhaitait réaliser une enquête pour dresser
mesures observées mais il un portrait de l’industrie 4.0 dans le secteur manufacturier. Le mandat a été donné à la maison de
semble plus pratique et
compréhensible de se référer
sondage Léger et l’enquête a été réalisée par voie téléphonique auprès d’un échantillon de 401
à l’ensemble des unités petites ou moyennes entreprises du secteur manufacturier québécois. Ces entreprises étaient un
statistiques (tels les échantillon représentatif de 6 050 PME québécoises. La population est constituée de 6 050 PME
individus) au lieu de mesures québécoises; chaque PME est une unité statistique.
(valeurs) prises par ces
unités statistiques, bien que * Source : L’industrie 4.0. Sondage auprès de PME québécoises du secteur manufacturier. Léger, décembre 2019.
l’intérêt fondamental soit
De ces exemples, on constate qu’une population présente des caractères propres qui se retrouvent
toujours sur les valeurs
prises par les unités chez toutes les unités statistiques qui la composent.
statistiques et non sur les Ainsi les membres de l’association professionnelle se caractérisent par leur rémunération; les
unités elles-mêmes.
usines se caractérisent par leur profit. La population est donc constituée d’un ensemble d’unités
statistiques satisfaisant à une définition commune et constituant la collectivité à laquelle on
s’intéresse.

1.5.2 Variables (caractères)


Objectif 4 (suite) Dans une étude spécifique, on peut s’intéresser à certaines particularités des unités statistiques (ou
Préciser ce qu’on entend des individus). Ces particularités que nous appelons variables (ou caractères) seront également
par caractères, modali- celles de la population. On peut aussi mesurer sur la même unité statistique plusieurs variables.
tés, variable statistique
Ces caractères peuvent être l’âge d’un individu, la taille, l’âge d’une entreprise, le quotient intellectuel,
l’état matrimonial, le lieu d’habitation, l’évaluation du rendement, le nombre de transactions
Une variable est dite quali- bancaires, le temps d’exécution d’une tâche répétitive, le niveau de responsabilité des cadres
tative lorsqu’on ne peut
d’entreprises, le nombre de pièces non conformes, la couleur d’un tissu, le chiffre d’affaires, le
qu’identifier son état, sa
nature. nombre de travaux exécutés par un service d’informatique, le nombre de transmissions de commande,
Une variable est dite quan- le nombre d’heures de travail, le nombre de visites sur un site Internet...
titative lorsque les valeurs Dans cette liste, on remarque que certains caractères sont mesurables, d’autres non. Ceci nous
obtenues pour cette varia-
amène à apporter la distinction suivante.
ble correspondent à une
mesure vraie, définissant
une valeur numérique.
1.5.3 Caractère quantitatif - Caractère qualitatif
Les résultats de l’observation d’un caractère (d’une variable) pourront s’exprimer d’une manière
quantitative ou qualitative selon qu’ils sont mesurables ou non.

1.5.4 Modalités des caractères


Les caractères peuvent présenter plusieurs modalités c.-à-d. des spécificités, états ou valeurs qui
leur sont propres. Les modalités d’un caractère doivent être définies de telle sorte que toute unité
statistique appartienne à une modalité et à une seule. Il est donc nécessaire que les modalités que
peut présenter un caractère soient incompatibles et exhaustives.
CHAPITRE 1 : MÉTHODOLOGIE ET ANALYSE DESCRIPTIVE DES DONNÉES 11

Schématisation
des principaux élé-
ments de la statisti- Analyse de données
que descriptive et de
la statistique
inférentielle

Pour une utilisation exclusive par le prof. Mohamed Dia U d’Ottawa ADM 2703 automne 2021
Statistique Statistique
descriptive inférentielle

Collecte de données Appliquer des méthodes


d’échantillonnage
Tri de données appropriées à une
population donnée
Dépouillement selon Estimer les paramètres
une distribution de de la population
fréquences (moyenne, variance,
proportion...) par
Visualisation selon intervalle de confiance
divers diagrammes Formuler des hypothèses
et les confirmer avec des
Construction de tests statistiques
tableaux croisés Vérifier les hypothèses
fondamentales requises
Calculs de mesures par le test statistique
de tendance centrale Établir des relations
entre variables
Calculs de mesures
Comparer les paramètres
de dispersion
de plusieurs populations
Effectuer des prévisions

Population
Schématisation
Population
et
unités statistiques

Unités statistiques
12 MÉTHODES STATISTIQUES EN GESTION

Exemple 1.3 Modalités de différents caractères

a) Dans le cas d’un caractère qualitatif, les modalités ne sont pas mesurables. Par exemple, dans
une étude sur la dextérité manuelle, on pourrait classer les individus selon trois modalités :
plus habile de la main gauche, ambidextre, plus habile de la main droite.
b) Dans une enquête sur la perception des nouvelles technologies, on demande d’indiquer « À
quel groupe d’âge appartenez-vous? ».
Les classes suivantes sont indiquées :
 Moins de 18 ans(1)  De 35 à 44 ans (4)
Pour une utilisation exclusive par le prof. Mohamed Dia U d’Ottawa ADM 2703 automne 2021

 De 18 à 24 ans (2)  De 45 à 54 ans (5)


 De 25 à 34 ans (3)  55 ans et plus (6)
Ces catégories d’âges constituent les modalités ou valeurs du caractère « Âge ».
c) Dans une recherche sur la prise en charge multidisciplinaire des travailleurs atteints de maux
de dos qui provenaient de l’une ou l’autre des 30 entreprises de la région de Sherbrooke, on a
relevé le nombre de travailleurs restant absents de leur poste régulier un an après leur arrêt de
travail pour cause de maux de dos. Les modalités du caractère « nombre de travailleurs restant
absents » sont les valeurs prises par ce dernier.
d) Dans un effort d’amélioration continue, l’entreprise Westpak prélève au hasard un certain nombre
de bons de commande préparés par les employés du département des achats pour vérifier s’ils
comportent des non-conformités (date manquante ou incomplète, adresse erronée, no de produit
inexact...). Les modalités du caractère « nombre de non-conformités par bon de commande
sélectionné » sont les valeurs prises par le caractère.

1.5.5 Variable statistique - Variable discrète - Variable continue


Un caractère qui fait le sujet d’une étude est également connu sous le nom de variable statistique.
 Notion de variable Lorsque cette variable n’est pas susceptible d’une mesure, elle est dite qualitative.
statistique
Lorsque, au contraire, cette variable peut être exprimée numériquement, elle est dite quantitative
Objectif 4 (suite)
(ou mesurable).
Préciser ce qu’on entend Dans le cas d’une variable quantitative, son intensité peut être soit mesurée, soit repérée par un
par variable statistique, nombre qu’on appelle valeur de cette variable. Dans le cas d’une variable qualitative, on ne peut
variable discrète, varia- qu’identifier sa nature; toutefois, la nature de la variable peut être définie par un code (une
ble continue
valeur numérique arbitraire). Nous discutons à la section 1.5.7, de façon plus détaillée, du type
de données et des échelles de mesure.
Une variable quantitative peut être discrète ou continue. Elle est discrète si elle ne peut prendre
qu’un nombre limité de valeurs (souvent des valeurs entières). Lorsque la variable quantitative peut
prendre toutes les valeurs d’un intervalle fini ou infini, elle est alors dite continue.

Exemple 1.4 Identification de divers types de variables

a) Dans une étude sur la psychologie du consommateur, on veut connaître l’effet sur les ventes de
l’utilisation d’une musique douce comparativement à une musique forte comme musique
d’ambiance dans une boutique spécialisée. Le type de musique est une variable de nature
qualitative. On ne peut qu’identifier le type utilisé.
b) Dans une entreprise de service, on veut évaluer le temps (en minutes) requis pour répondre à un
type de requêtes qui exige une recherche spéciale. La variable « temps requis » est une variable
quantitative de nature continue.
c) On veut analyser le nombre de plaintes reçues par le service à la clientèle d’une grande entreprise.
La caractéristique « nombre de plaintes » est une variable quantitative de nature discrète.
d) Dans une étude sur le stress chez les gestionnaires en ressources humaines, on veut connaître,
parmi une liste de tâches, le nombre de tâches qu’effectue le gestionnaire en ressources humaines.
Ce caractère est une variable quantitative de nature discrète.
CHAPITRE 1 : MÉTHODOLOGIE ET ANALYSE DESCRIPTIVE DES DONNÉES 13

e) Dans un sondage* portant sur l’apprentissage des dirigeants et des cadres supérieurs des
organisations membres du Centre francophone d’informatisation des organisations (CEFRIO)
et dont l’objectif était d’évaluer l’importance qu’ils accordent à l’amélioration de leurs
compétences professionnelles, et de connaître le moyen qu’ils utilisent pour se former et
s’informer, on veut connaître le temps consacré au développement des compétences
professionnelles. La variable « temps consacré au développement des compétences
professionnelles » est une variable quantitative de nature continue.

Pour une utilisation exclusive par le prof. Mohamed Dia U d’Ottawa ADM 2703 automne 2021
*Source : Audet, M.et S. Lépinay. L’acte d’apprendre: passion ou obligation. CEFRIO, volume 1, n°2.

1.5.6 Variable indépendante et variable dépendante


Lorsque la recherche ou l’expérimentation vise à établir des relations, un des principaux éléments
consiste à observer ou à manipuler une ou plusieurs variables et à en examiner l’effet sur une autre
variable (par exemple, l’effet sur les ventes hebdomadaires selon le type de publicité et la politique
de prix...).
Variable indépendante Ceci nous amène à identifier et à classifier les variables (qu’elles soient qualitatives ou quantitatives)
(variable explicative) et va- en deux catégories selon leur rôle dans l’expérimentation. On distingue les variables indépendantes
riable dépendante
(variable expliquée)
(ou explicatives) et les variables dépendantes (ou expliquées).

Variable indépendante. La variable indépendante est une caractéristique qui est censée avoir
un effet ou une influence systématique sur une autre variable. La variable indépendante est
Les notions de variable observée directement ou manipulée expressément par l’expérimentateur . Les valeurs que peut
indépendante et de variable
dépendante sont importantes
prendre la variable indépendante sont appelées modalités (ou niveaux) de cette variable et une
lorsqu’on s’intéresse à établir variable indépendante comporte au moins deux modalités. On parlera par exemple, d’une variable
s’il existe un lien entre deux indépendante à 2 modalités si elle peut prendre 2 valeurs différentes comme la variable « Sexe
caractères (tableau croisé, de l’employé » (dont les valeurs sont masculin et féminin) ou à 3 modalités (ou niveaux) si elle
chapitre 9) ou qu’on désire
développer un modèle de
peut prendre 3 valeurs différentes comme la variable « Aménagement de l’espace de travail »
prédiction pour prévoir les (dont les valeurs pourraient être Aménagement A, Aménagement B, Aménagement C) et ainsi de
valeurs d’une variable dépen- suite.
dante en fonction d’une ou
plusieurs variables indépen- Variable dépendante (ou réponse). La variable dépendante est une caractéristique dont on
dantes (régression, chapitres observe les variations et dont on tente d’expliquer le comportement à partir d’une ou de plusieurs
11 et 12). variables indépendantes. C’est la variable dont on veut comprendre les différents états et dont
l’expérimentateur enregistre les résultats (par exemple « Le temps d’assemblage d’un sous-
produit selon l’aménagement de l’espace de travail »).

Exemple 1.5 Identification de variable dépendante et de variables indépendantes

Une recherche* est effectuée auprès des PME manufacturières qu’elles soient ou non utilisatrices
d’une innovation technologique (le contrôle numérique) et auprès des ateliers d’usinage.
Cette recherche vise à identifier, à étudier et à hiérarchiser certaines caractéristiques
organisationnelles et managériales qui différencient ces trois secteurs au niveau de l’utilisation
(ou de la non-utilisation) d’au moins une innovation technologique.
*Source : Julien, P.A., Carrière, J.B., Hébert, L. La diffusion des nouvelles technologies dans trois secteurs industriels. Conseil
de la science et de la technologie, Document no 88-03.

•Variable dépendante. Présence ou absence d’équipement doté du contrôle numérique par


ordinateur au niveau de n’importe lequel des segments de production de
l’entreprise. Cette variable prend en fait deux valeurs : la valeur « 1 » lorsque
l’entreprise possède au moins un équipement et la valeur « 0 » lorsque ce
n’est pas le cas.
On a regroupé en quatre catégories les facteurs importants associés à l’adoption d’une innovation
technologique en milieu industriel comme suit :
14 MÉTHODES STATISTIQUES EN GESTION

•Variables indépendantes.  Le profil du propriétaire dirigeant


 Le profil des cadres
 Les caractéristiques générales et structurelles de la
firme
 Les caractéristiques organisation
Dans la catégorie « profil du propriétaire dirigeant » on retrouve les variables suivantes : l’âge du
propriétaire dirigeant, son niveau de scolarité, s’il possède ou non une formation en génie et son
attitude face aux changements technologiques.
Pour une utilisation exclusive par le prof. Mohamed Dia U d’Ottawa ADM 2703 automne 2021

Exercice résolu 1.1


Identification de variable dépendante et de variables indépendantes
La vice-présidente aux ressources humaines de l’entreprise JPX, veut connaître le niveau de
satisfaction au travail des cadres de niveau intermédiaire de l’entreprise, et ceci à l’aide d’un
questionnaire établi par un expert-conseil en psychologie industrielle. On a prélevé un échantillon
aléatoire de 20 cadres intermédiaires pour participer à cette étude. On a également relevé dans le
fichier du personnel, certaines caractéristiques pouvant être liées au niveau de satisfaction au
travail soit la rémunération, l’âge, les années de service avec l’entreprise, le nombre d’années
d’expérience associé à la fonction avant l’engagement chez JPX.
Identifiez dans ce contexte la variable dépendante et les variables indépendantes.
Solution

•Variable dépendante
 Niveau de satisfaction au travail
•Variables indépendantes (ou explicatives)
 La rémunération (en milliers de dollars)
 L’âge (en années)
 Les années de service avec l’entreprise
 Le nombre d’années d’expérience associé à la fonction
avant l’engagement chez JPX.
L’objectif de cette étude est d’établir une relation statistique entre le niveau de satisfaction au
travail (variable dépendante) et les quatre variables explicatives mentionnées ci-haut.

1.5.7 Les échelles de mesure


Dépendant des buts fixés, dépendant de la qualité de l’information accessible ou disponible, la
 Échelle nominale, mesure d’un caractère peut être plus ou moins précise et cette précision de la mesure affectera le
échelle ordinale, échelle traitement statistique qui suivra.
d’intervalles et échelle de
rapport Il existe quatre types d’échelles de mesure : l’échelle nominale, l’échelle ordinale, l’échelle
Objectif 5 d’intervalles et l’échelle de rapport. Il est essentiel de saisir la subtilité entre ces échelles de
Identifier les différents mesure et le type de données correspondant dans le cas d’une enquête ou d’un suivi concernant par
types de données et exemple la qualité d’un service ou d’un sondage concernant la satisfaction d’un produit ou encore
échelles de mesure pour évaluer la perception d’une marque de commerce...
Comme nous l’indiquerons subséquemment, le type d’analyse statistique dépend du type de données.
CHAPITRE 1 : MÉTHODOLOGIE ET ANALYSE DESCRIPTIVE DES DONNÉES 15

Appliquer vos Pour les cas suivants,


connaissances  spécifiez l’unité statistique,
Série 1.1  identifiez la variable statistique sur laquelle porte l’étude,
 mentionnez le type de variable (quantitative ou qualitative)
 et précisez, dans le cas où la variable est quantitative, si elle est continue ou discrète.

Pour une utilisation exclusive par le prof. Mohamed Dia U d’Ottawa ADM 2703 automne 2021
Identification de Étude Unité Variable Type de variable Variable quantitative
différents types de
statistique statistique Quantitative Qualitative Continue Discrète
variables

a) Âge d’une Entreprise Âge  


entreprise
b) Chiffre d’affaires
d’une entreprise
c) Nombre d’heures
de travail d’un
dirigeant
d) Ancienneté d’un tra-
vailleur en mois
e) Salaires annuels
d’une main-d’œuvre
spécialisée
f) Nombre de tubes de
verre non conformes
g) Domaine de spécia-
lisation du répondant

Définitions des types d’échelle de mesure Exemples

 L’échelle nominale. Une variable est mesurée Les enquêtes comportent fréquemment des variables
Types d’échelle de sur une échelle nominale si les codes utilisés ne servent mesurées sur une échelle nominale.
mesure qu’à identifier la modalité à laquelle appartient l’unité Sexe de l’individu : féminin, masculin
statistique. Sur cette échelle, il n’y a pas de relation Statut : Célibataire, marié(e), veuf...
d’ordre entre les codes. Les données correspondantes Région : urbaine, semi-urbaine, rurale, éloignée
sont dites données nominales. Rôle organisationnel : cadre supérieur, intermédiaire...
Classification d’un produit: conforme, non conforme.
On ne peut effectuer aucune opération arithmétique avec des données nominales; on ne peut qu’identifier sa modalité.

 L’échelle ordinale. Une variable est mesurée Les exemples suivants illustrent des variables mesurées sur
sur une échelle ordinale si les codes utilisés permettent une échelle ordinale.
non seulement d’identifier la modalité à laquelle Potentiel entrepreneurial : faible, moyen, élevé
appartient l’unité statistique, mais également d’établir Groupe d’âge : moins de 18, de 18 à 24, de 25 à 29, de
une relation d’ordre entre les modalités observables et 30 à 34, de 35 à 44, de 45 à 54...
par le fait même, entre les unités statistiques. Les Niveau de scolarité : primaire, secondaire, collégial,
données recueillies dans l’échantillon sont dites universitaire
données ordinales. Niveau d’appréciation d’un produit : Très bonne
On ne peut que mettre en ordre les différentes modalités. qualité, bonne qualité, qualité moyenne...

(suite, page 16).


16 MÉTHODES STATISTIQUES EN GESTION

Définitions des types d’échelle de mesure Exemples

 L’échelle d’intervalles. Une variable est L’exemple suivant permet de mieux saisir l’échelle
Types d’échelle mesurée sur une échelle d’intervalles si les codes utilisés d’intervalles.
permettent non seulement d’identifier la modalité à Dans une étude sur la consommation d’énergie
de mesure
laquelle appartient l’unité statistique et d’établir un ordre électrique, on a posé la question suivante:
(suite) entre les modalités observables, mais aussi s’ils nous À quelle valeur réglez-vous normalement
informent de l’écart (la distance) séparant deux votre thermostat durant le jour? ____0 C.
modalités (ou deux unités statistiques). Elle suppose Le caractère quantitatif « réglage du thermostat » est
le choix d’une unité de mesure qui est répartie mesuré sur une échelle d’intervalles.
uniformément sur l’échelle. Un écart d’une unité ou La valeur 0o C ne veut pas dire absence totale
Pour une utilisation exclusive par le prof. Mohamed Dia U d’Ottawa ADM 2703 automne 2021

de dix unités (en terme de distance) fournit la même de chaleur. Ici le zéro est un point de référence arbitraire.
information, peu importe où l’on se situe sur l’échelle Notons qu’un écart de 10o C entre 15o C et 25o C
de mesure. Sur cette échelle, la position du zéro est a la même signification qu’un écart de 10o C entre
arbitraire. Les données recueillies dans l’échantillon 20o C et 30o C.
sont dites données d’intervalles.
On peut additionner et soustraire les données d’intervalles.

 L’échelle de rapport. Une variable est mesurée Les exemples suivants illustrent des variables mesurées sur
sur une échelle de rapport si les codes correspondants une échelle de rapport.
possèdent les propriétés des codes d’une échelle Chiffre d’affaires d’une entreprise
d’intervalles et si le zéro constitue un zéro absolu. La Nombre de mois d’ancienneté
valeur 0 indique l’absence complète du caractère que Nombre d’employés d’une entreprise
l’on mesure. C’est l’échelle de mesure avec laquelle Nombre d’heures de travail
nous sommes le plus familier dans la vie courante. Les Nombre d’années passées à la direction d’une entreprise
données correspondantes sont dites données de rapport. Coût d’un système de gestion de la qualité ISO.

On peut additionner, soustraire, multiplier et diviser les données de rapport.

Échelle nominale,
échelle ordinale, Échelles de mesure et type de données
échelle d’intervalles
et échelle de rapport

Données qualitatives Type de données Données quantitatives

Données d’in- Données de


Données Données Échelles de mesure
tervalles rapport
nominales ordinales des données

Données nominales : Forme légale d’une entreprise dont les modalités sont codées 1, 2, 3.

(1 Propriétaire unique 2 Société avec associés 3 Compagnie avec actionnaires)


Données ordinales : Âge moyen du personnel dont les valeurs sont présentées sous forme de catégories

20-24 25-29 30-34 35-39 40-44


45-49 50-54 55-59 60-65
Données d’intervalles : Résultat à un test d’intelligence. Bien qu’un résultat 0 est possible, ceci ne veut
pas dire que vous avez 0 intelligence.
Données de rapport : Revenu annuel d’une dirigeante du secteur des transports.
CHAPITRE 1 : MÉTHODOLOGIE ET ANALYSE DESCRIPTIVE DES DONNÉES 17

Exemple 1.6 Questions et échelles de mesure

Dans le but de mieux servir ses lecteurs et lectrices et de cerner une partie de son marché, voici
quelques questions qui ont été posées dans un magazine d’une compagnie aérienne.

Q1) Sexe 1 Masculin 2 Féminin


Q2) Âge 1 18-24 2 25-54 3 55+
Q3) But du voyage 1 Affaires 2 Agrément/Vacances 3 Personnel

Pour une utilisation exclusive par le prof. Mohamed Dia U d’Ottawa ADM 2703 automne 2021
Q4) Est-ce que votre destination est : 1 à l’intérieur du Canada? 2 à l’extérieur du Canada?
Q5) Nombre de voyages aériens effectués au cours de la dernière année
Une variable qui est mesu- 1 1-2 2 3-6 3 7-10 4 11-14 5 15+
rée sur une échelle nominale
est de nature qualitative. Q6) Revenu familial annuel :
Une variable qui est mesu- 1 moins de 75 000 $ 2 75 000 $ - 99 999 $
rée sur une échelle d’inter- 3 100 000 $ -149 999 $ 4 150 000 $+
valles ou de rapport est de
nature quantitative. Les échelles de mesure utilisées pour chacune des questions sont les suivantes :
Une variable qui est mesu- Questions Échelle de mesure
rée sur une échelle ordinale
Q1 Nominale
peut être de nature qualita-
tive (degré d’appréciation Q2 Ordinale
d’un produit) ou de nature Q3 Nominale
quantitative (catégories Q4 Nominale
salariales). Q5 Ordinale
Q6 Ordinale

Appliquer vos Dans une recherche effectuée auprès de deux entreprises du secteur des pâtes et papier de la région de
connaissances
l’Estrie, on a mesuré à l’aide d’un questionnaire divers aspects concernant la satisfaction au travail de
Série 1.2 contremaîtres.
Dans une section du questionnaire concernant l’emploi, on a posé les questions suivantes :
Échelles de mesure Q1 : Quel emploi ou profession exercez-vous présentement?
pour diverses variables
Veuillez préciser :

Q2 : Depuis combien de temps êtes-vous sur le marché du travail?

Moins de 1 an 1 De 10 à moins de 13 ans 5


De 1 à moins de 4 ans 2 De 13 à moins de 16 ans 6
De 4 à moins de 7 ans 3 16 ans et plus 7
De 7 à moins de 10 ans 4
Q3 : Depuis combien de temps êtes-vous à l’emploi de l’organisation pour laquelle
vous travaillez actuellement?

Moins de 1 an 1 De 10 à moins de 13 ans 5


De 1 à moins de 4 ans 2 De 13 à moins de 16 ans 6
De 4 à moins de 7 ans 3 16 ans et plus 7
De 7 à moins de 10 ans 4
Q4 : Depuis combien de temps occupez-vous le poste que vous détenez actuellement?
Moins de 1 an 1 De 10 à moins de 13 ans 5
De 1 à moins de 4 ans 2 De 13 à moins de 16 ans 6
De 4 à moins de 7 ans 3 16 ans et plus 7
De 7 à moins de 10 ans 4
18 MÉTHODES STATISTIQUES EN GESTION

Appliquer vos Q5 : Dans l’organisation ou l’entreprise où vous travaillez présentement, votre salaire est de :
connaissances 39 999 $ et moins 1
Série 1.2 (suite) 40 000 à 49 999 $ 2
50 000 à 59 999 $ 3
60 000 à 69 999 $ 4
Échelles de mesure
70 000 $ et plus 5
pour diverses variables

Q6 : S’agit-il d’un travail


Pour une utilisation exclusive par le prof. Mohamed Dia U d’Ottawa ADM 2703 automne 2021

À temps plein? 1 À temps partiel? 2


a) Pour chacune des questions posées, identifier le type de variable qui est concerné.
b) Pour chacune des questions posées, préciser l’échelle de mesure utilisée.

1.5.8 Échantillon - Échantillon aléatoire


Objectif 6 Un échantillon est un groupe restreint (ou sous-ensemble) d’unités statistiques tirées de la population
Préciser ce qu’on (dite également population mère ou parente) préalablement définie. Le nombre d’unités détermine
entend par échantillon, la taille de l’échantillon.
échantillon aléatoire,
fréquence absolue... Un échantillon aléatoire est un sous-ensemble d’unités statistiques recueilli d’une manière telle
que les résultats de l’analyse pourront être étendus (on emploie également le terme inférer) à la
population. Nous traiterons, d’une façon plus approfondie, de cet aspect important de la statistique
dans la partie « inférence statistique » de cet ouvrage (chapitre 6 et les suivants). Mentionnons
toutefois qu’une méthode d’échantillonnage très répandue consiste à obtenir un échantillon en
prélevant au hasard un sous-ensemble d’unités statistiques de la population.
Diverses méthodes sont utilisées pour construire un échantillon, entre autres une table de nombres
aléatoires (ou un programme d’ordinateur conçu à cet effet) ou encore par tirage systématique
(voir chapitre 6).
1.5.9 Unité de mesure
L’intensité de la variable qui se retrouve à des niveaux différents chez toutes les unités statistiques
qui constituent la population (ou l’échantillon) est évaluée avec la même unité de mesure, c.-à-d.
avec une grandeur finie servant de base à la mesure de toutes les unités statistiques de même espèce.
Par exemple, le mètre peut servir comme unité de longueur, le kilogramme comme unité de masse,
la seconde comme unité de temps.

1.5.10 Fréquence absolue - Fréquence relative


La fréquence absolue (ou effectif) associée à une valeur d’une variable statistique est le nombre
de fois que cette valeur se rencontre dans l’échantillon observé (ou dans la population). Dans le cas
d’une distribution par classe, la fréquence absolue d’une classe correspondra au nombre de mesures
dont les résultats appartiennent à cette classe particulière (nous traitons de cette notion dans une
section subséquente).
Fréquence relative : La fréquence relative associée à une valeur d’une variable statistique est le rapport entre la fréquence
Fréquence absolue absolue correspondant à cette valeur et le nombre total de valeurs qui ont été observées sur les
Nombre total de données unités statistiques. Dans le cas d’une distribution par classe, la fréquence relative sera le rapport
entre la fréquence absolue d’une classe et la somme des fréquences absolues de toutes les classes
(le nombre total de données).
Convention
Nous adopterons comme convention (sauf avis contraire) d’identifier une variable statistique par
une lettre majuscule (X, Y, Z...) et les observations de cette variable par une lettre minuscule. Il est
fréquent d’employer X pour identifier une variable statistique et x1, x2, ..., xn pour identifier les n
observations de cette variable.
CHAPITRE 1 : MÉTHODOLOGIE ET ANALYSE DESCRIPTIVE DES DONNÉES 19

1.6 Exploitation de données d’intervalles/rapport


Nous abordons d’abord l’exploitation des données associées à des variables quantitatives mesurées
sur une échelle d’intervalles/rapport. Il existe diverses formes de dépouillement de ce type de
données; nous traitons ici du dépouillement des données par valeurs, du dépouillement selon une
distribution de fréquences absolues avec données groupées en classes ainsi que du dépouillement

Pour une utilisation exclusive par le prof. Mohamed Dia U d’Ottawa ADM 2703 automne 2021
selon un diagramme en feuilles.
Il existe divers logiciels qui permettent le dépouillement rapide d’une série de données selon une
distribution de fréquences absolues; on peut effectuer divers traitements, dont un tri des données
 Tri de données
(en ordre croissant ou décroissant). Ce tri peut être une première étape dans le dépouillement
d’une série statistique.
Donnons un premier exemple.

Exemple 1.7 Tri de données de rapport et dépouillement

Utilisons la variable Direction : nombre d’années passées à la direction de la présente entreprise de


l’exemple 1.1b) (caractéristiques personnelles de dirigeants de PME*).
Exemple Nous présentons à nouveau les données de cette variable pour les 85 dirigeants dont l’existence des
1.7
entreprises était de 10 ans et moins.
Dirigeant Direction Dirigeant Direction Dirigeant Direction Dirigeant Direction
1 9 23 7 45 9 67 8
2 7 24 8 46 9 68 9
3 6 25 7 47 6 69 8
4 8 26 8 48 6 70 8
5 8 27 7 49 8 71 7
Tableau 1.2
6 8 28 6 50 7 72 7
Données asso-
7 6 29 8 51 6 73 7
ciées à la variable
Direction 8 8 30 7 52 7 74 8
9 7 31 7 53 6 75 6
10 6 32 8 54 6 76 6
11 7 33 7 55 7 77 7
12 6 34 7 56 5 78 7
13 8 35 8 57 8 79 7
14 7 36 7 58 7 80 6
15 5 37 7 59 8 81 7
16 7 38 7 60 7 82 7
17 6 39 7 61 8 83 7
18 7 40 7 62 9 84 8
19 8 41 9 63 9 85 6
20 10 42 6 64 9
21 8 43 5 65 7
22 7 44 7 66 7

*Source : Adapté de Therrien, C. L’effet de l’utilisation de pratiques de gestion financière à court terme sur la vulnérabilité
financière en fonction de l’âge des PME. Mémoire de recherche, Université du Québec à Trois-Rivières.

Si nous ordonnons les valeurs obtenues en ordre croissant, on obtient la série de la page suivante.
20 MÉTHODES STATISTIQUES EN GESTION

Tableau 1.3 Dirigeant Direction Dirigeant Direction Dirigeant Direction Dirigeant Direction

Valeurs ordonnées 15 5 14 7 65 7 35 8
du nombre d’an- 43 5 16 7 66 7 49 8
nées passées à la
direction de la
56 5 18 7 71 7 57 8
présente entre- 3 6 22 7 72 7 59 8
prise 7 6 23 7 73 7 61 8
10 6 25 7 77 7 67 8
12 6 27 7 78 7 69 8
17 6 30 7 79 7 70 8
Pour une utilisation exclusive par le prof. Mohamed Dia U d’Ottawa ADM 2703 automne 2021

28 6 31 7 81 7 74 8
42 6 33 7 82 7 84 8
47 6 34 7 83 7 1 9
48 6 36 7 4 8 41 9
51 6 37 7 5 8 45 9
53 6 38 7 6 8 46 9
54 6 39 7 8 8 62 9
75 6 40 7 13 8 63 9
76 6 44 7 19 8 64 9
80 6 50 7 21 8 68 9
85 6 52 7 24 8 20 10
2 7 55 7 26 8
9 7 58 7 29 8
11 7 60 7 32 8
Nous constatons que le nombre d’années minimal qui a été observé est 5 ans, alors que le nombre
maximal est 10.
Dépouillement des données par valeurs
On peut, à partir du tri que nous venons d’effectuer, dépouiller les données par valeurs; il s’agit
simplement de noter le nombre de fois qu’apparaît chaque donnée dans la série.
À partir du tableau 1.3, on obtient la répartition suivante :
Valeurs Fréquences Visualisation (pictogramme)
absolues

5 3 

6 16 

7 36 

8 21 

9 8 

10 1 

On constate que la valeur qui revient le plus fréquemment est 7 ans. On a visualisé l’allure de la
répartition des fréquences absolues en utilisant un point () pour chaque valeur notée (on pourrait
également utiliser un x). Un logiciel statistique pourrait donner le dépouillement suivant :
Compilation
Variable : direction de l'entreprise (années)
Valeurs (années) Fréquence absolue Pour cent Pour cent cum.
5 3 3,5% 3,5% De cette compilation, on
6 16 18,8% 22,4% peut lire que 36 dirigeants
(soit 42,4 %) ont 7 années
7 36 42,4% 64,7% passées à la direction de la
8 21 24,7% 89,4% présente entreprise, alors
9 8 9,4% 98,8% que 8 ont 9 années passées
10 1 1,2% 100,0% à la direction de l’entreprise.
Total : 85
CHAPITRE 1 : MÉTHODOLOGIE ET ANALYSE DESCRIPTIVE DES DONNÉES 21

1.7 Dépouillement selon une distribution de fréquences absolues avec


données groupées en classes
La façon la plus courante de dépouiller une série de données d’une variable quantitative est de grouper
les données en classes en utilisant certaines règles pratiques. Si on effectue ce dépouillement de
Objectif 7 façon manuelle, on doit procéder comme suit. On suppose que les données ont d’abord été ordonnées

Pour une utilisation exclusive par le prof. Mohamed Dia U d’Ottawa ADM 2703 automne 2021
Dépouiller les données
d’une variable quanti-
pour en faciliter le dépouillement.
tative selon une distri-
bution de fréquences Dépouillement des données et distribution de fréquences absolues. Le groupement des
absolues données en classes dans lequel on indique par un trait vertical chaque donnée appartenant à sa
classe respective s’appelle dépouillement des données. Il est également de pratique courante
de dépouiller les données par bloc de 5 (s’il y a lieu) en marquant d’un trait oblique (ou horizontal)
un ensemble de 4 traits verticaux déjà notés. La somme du nombre de traits appartenant à chaque
classe donne la fréquence absolue de cette classe (ce qui correspond au nombre de données
appartenant à cette classe). La répartition des données dans les classes accompagnées des
 Distribution de fréquences absolues respectives s’appelle la distribution de fréquences absolues ou distribution
fréquences absolues des effectifs.

Les nombres entre lesquels sont classées les données s’appellent limites des classes. De plus les
classes sont définies en ordre croissant. En regroupant ainsi les valeurs de la série numérique,
nous obtenons une série classée.
La valeur centrale d’une classe ou centre de classe (ou point milieu) est simplement la somme
des limites de chaque classe divisée par 2.
Considérations pratiques dans l’élaboration d’une distribution de fréquences absolues
Lorsqu’on veut grouper une série numérique suivant une distribution de fréquences absolues, on
doit fixer au préalable le nombre de classes dans lesquelles les valeurs sont réparties. Un peu
d’expérience et les quelques conseils qui suivent peuvent faciliter la tâche.
a) Détermination du nombre de classes
Mentionnons d’abord que le nombre de classes ne devrait, en général, être ni inférieur à 5 ni supérieur
à 20. De préférence, il variera entre 6 et 12 classes.
Ce choix est fonction évidemment du nombre de données à dépouiller et de l’éparpillement de ces
données.
En pratique, on peut utiliser une formule pour déterminer le nombre souhaitable de classes, c’est la
formule de Sturges.

b) Détermination de l’amplitude de chaque classe


 Règle de Sturges
Soit n, le nombre de données à dépouiller; selon la règle de Sturges, le nombre souhaitable k de
classes à utiliser est donné par la formule : k  1 + 3,322 log10n.
Tableau 1.4 Encore là, le choix définitif du nombre de Nombre de données Nombre souhaité de
Nombre souhaité classes sera dicté par un souci de clarté à dépouiller : classes :
de classes selon dans la présentation. Cette formule, qui
le nombre de don- 10 4
nées
peut paraître rébarbative, a permis d’obtenir
10 < n  22 5
le tableau ci-contre qui indique le nombre
de classes que l’on pourrait utiliser pour 22 < n  44 6
différents nombres de données à 44 < n  90 7
dépouiller. 90 < n  180 8
180 < n  360 9
360 < n  720 10
720 < n  1000 11

Vous aimerez peut-être aussi