Académique Documents
Professionnel Documents
Culture Documents
1 Méthodologie et analyse
descriptive des données
Sommaire
Contexte d’application : Des faits sur les conditions de travail dans les PME - Analyse
du sondage sur les ressources humaines dans les PME du Québec
Liste des feuilles Excel - Chapitre 1
Contexte
Des faits sur les conditions de travail dans les PME* - Analyse
du sondage sur les ressources humaines dans les PME du Québec
Chapitre 1
Méthodologie et analyse
descriptive des données
Objectif général. Ce chapitre présente certains éléments de méthodologie et
Objectifs
Pour une utilisation exclusive par le prof. Mohamed Dia U d’Ottawa ADM 2703 automne 2021
pédagogiques traite de l’essentiel des notions statistiques concernant l’analyse descriptive des données.
Objectifs spécifiques. Lorsque vous aurez complété l’étude du chapitre 1,
vous pourrez :
1 Mieux saisir l’importance de la notion « statistique ».
2 Distinguer entre les différents de types de recherche et connaître la méthodologie qui est associée à
chaque type de recherche.
3 Distinguer entre la statistique descriptive et la statistique inférentielle.
4 Préciser ce qu’on entend par population, unité statistique, caractères, modalités, variable statistique.
5 Identifier les différents types de données et échelles de mesure.
6 Préciser ce qu’on entend par échantillon, échantillon aléatoire, fréquence absolue...
7 Dépouiller les données d’une variable quantitative selon une distribution de fréquences absolues.
8 Dépouiller une série de données selon un diagramme en feuilles.
9 Tracer les principales représentations graphiques associées aux différents de types de dépouillement.
10 Tracer la courbe cumulative croissante
11 Structurer une démarche à suivre pour élaborer une enquête à l’aide d’un questionnaire.
12 Distinguer entre une question fermée et une question ouverte.
13 Coder correctement les modalités de réponse d’un questionnaire et effectuer la saisie des données
dans un fichier.
14 Dépouiller des données de types nominale et ordinale.
15 Tracer les diagrammes appropriés pour des données nominales et ordinales.
16 Interpréter les résultats dans un tableau croisé.
17 Distinguer entre données primaires et données secondaires.
18 Préciser en quoi consiste les principaux éléments d’un rapport d’étude.
1.1 Introduction
On peut définir la statistique descriptive comme l’instrument statistique qui permet de donner un
sens, une expression à l’information recueillie. Elle rend plus intelligible une série de données en
permettant de dégager les caractéristiques essentielles qui se dissimulent dans une masse de données.
Nous obtenons donc par la statistique descriptive une image concise et simplifiée de la réalité : un
résumé statistique qui caractérise l’essentiel.
exactitude, mais plutôt être analysé dans un contexte d’incertitude. Le but ultime de l’utilisation de
ces méthodes et modèles est d’arriver à des conclusions pratiques pour éventuellement proposer
des recommandations et des mesures correctives s’il y a lieu ou encore pour mieux comprendre
ces phénomènes et éventuellement en prévoir le comportement.
On désigne aussi sous le vocable statistique une quantité particulière calculée à partir des données
Statistique d’un échantillon comme la moyenne arithmétique, l’écart-type, la proportion de PME possédant un
Pour une utilisation exclusive par le prof. Mohamed Dia U d’Ottawa ADM 2703 automne 2021
site Web...
L’application des outils statistiques est courante. Elle fait fréquemment partie d’un travail
d’investigation expérimentale où l’on doit recueillir, analyser et interpréter des données avec des
outils objectifs pour être en mesure de tirer des conclusions valables et d’en dégager les
recommandations pratiques qui s’imposent.
L’objectif de cet ouvrage est de présenter un certain nombre d’outils statistiques et probabilistes en
insistant sur l’utilisation que l’on peut en faire dans différents secteurs des sciences de la gestion à
l’aide d’applications diverses.
Voici trois exemples comportant divers types de données et dont l’analyse nécessite les techniques
appropriées.
Exemple
1.1 b)
Extrait du
fichier de
données
Logiciels de
traitement
de données
Exemple 1 79 15 105 29 99 43 96 57 79
1.1 c) 2 148 16 135 30 134 44 109 58 73
3 109 17 92 31 76 45 63 59 102
4 82 18 105 32 76 46 82 60 79
5 109 19 122 33 92 47 73 61 102
6 118 20 115 34 79 48 89 62 86
7 109 21 99 35 122 49 109
*
8 86 22 96 36 112 50 82 Source : Nous remer-
9 96 23 112 37 80 51 86 cions le professeur
10 102 24 102 38 109 52 102
Normand Pettersen du
département des scien-
11 128 25 82 39 102 53 89
ces de la gestion de
12 118 36 125 40 79 54 86
l’UQTR d’avoir fourni
13 125 27 86 41 102 55 112
les données.
14 107 28 80 42 132 56 66
Le test de spatialisation permet de mesurer l’aptitude à concevoir visuellement des formes géométriques
(1)
et à comprendre la représentation d’objets en deux dimensions, à distinguer les rapports qui résultent du
mouvement d’objets dans l’espace.
b) En général, vous êtes parmi les premières personnes à utiliser les nouveautés
technologiques.
Totalement Assez Assez en Totalement
d’accord d’accord désaccord en désaccord
CHAPITRE 1 : MÉTHODOLOGIE ET ANALYSE DESCRIPTIVE DES DONNÉES 7
Quel est votre degré d’intérêt pour une carte à puce offrant de multiples fonctions?
Très Assez Peu Pas du tout
intéressé intéressé intéressé intéressé
Incluant vous-même, combien de personnes vivent actuellement chez vous?
1 2 3 4 5 6 7 8
À quel groupe d’âge appartenez-vous?
Pour une utilisation exclusive par le prof. Mohamed Dia U d’Ottawa ADM 2703 automne 2021
Moins de 18 ans De 45 à 54 ans
De 18 à 24 ans De 55 à 64 ans
De 25 à 34 ans 65 ans ou plus
De 35 à 44 ans
Adapté d’un Sondage de la compagnie Bell.
Quelle échelle de mesure correspond à chacune de ces questions? Quel traitement statistique est
approprié pour chacune des questions? Quels sont les diagrammes appropriés pour visualiser les
résultats?
Ces aspects sont traités à l’aide de méthodes utilisées en analyse descriptive de données. L’analyse
descriptive des données permet de donner un sens, une expression à l’information recueillie.
Recherche Tester des Surtout de na- Enquêtes à l’aide d’un Échantillon repré-
causale ou hypothèses ture quantita- questionnaire sentatif de la popu-
explicative statistiques tive Expérimentation (soit en lation
Déterminer laboratoire, soit sur le ter- Collecte de don-
les variables rain) nées à l’aide d’un
explicatives plan d’expérience
significatives (méthode avancée)
Déterminer la
force du lien
entre deux va-
riables
Pour une utilisation exclusive par le prof. Mohamed Dia U d’Ottawa ADM 2703 automne 2021
La tâche est facilitée grandement si les réponses sont de nature numérique ou que les modalités
Nous présentons à la sec-
de réponses sont fixées au préalable (avec codification).
tion 1.20, les principaux Rédaction du rapport d’étude. Une fois l’analyse des données complétée, on doit effectuer
éléments requis dans un
rapport basé sur une étude
une synthèse des résultats et les mettre en relation avec les objectifs de l’étude. Il ne faut pas
statistique. oublier que ce rapport d’étude s’adresse habituellement à des gestionnaires; le rapport doit
être écrit dans une perspective managériale. Il doit servir comme outil de référence d’aide à
la décision.
a) Une association professionnelle regroupe 3 000 membres. On veut effectuer une étude auprès des
membres sur l’impact humain des nouvelles technologies. Les 3 000 membres constituent la
population statistique; chaque membre est une unité statistique de cette population.
b) Une étude porte sur les profits des usines établies au Québec et employant plus de 100 personnes.
Statistique Canada définit une
L’ensemble des usines établies au Québec et employant plus de 100 personnes constitue la
Pour une utilisation exclusive par le prof. Mohamed Dia U d’Ottawa ADM 2703 automne 2021
Schématisation
des principaux élé-
ments de la statisti- Analyse de données
que descriptive et de
la statistique
inférentielle
Pour une utilisation exclusive par le prof. Mohamed Dia U d’Ottawa ADM 2703 automne 2021
Statistique Statistique
descriptive inférentielle
Population
Schématisation
Population
et
unités statistiques
Unités statistiques
12 MÉTHODES STATISTIQUES EN GESTION
a) Dans le cas d’un caractère qualitatif, les modalités ne sont pas mesurables. Par exemple, dans
une étude sur la dextérité manuelle, on pourrait classer les individus selon trois modalités :
plus habile de la main gauche, ambidextre, plus habile de la main droite.
b) Dans une enquête sur la perception des nouvelles technologies, on demande d’indiquer « À
quel groupe d’âge appartenez-vous? ».
Les classes suivantes sont indiquées :
Moins de 18 ans(1) De 35 à 44 ans (4)
Pour une utilisation exclusive par le prof. Mohamed Dia U d’Ottawa ADM 2703 automne 2021
a) Dans une étude sur la psychologie du consommateur, on veut connaître l’effet sur les ventes de
l’utilisation d’une musique douce comparativement à une musique forte comme musique
d’ambiance dans une boutique spécialisée. Le type de musique est une variable de nature
qualitative. On ne peut qu’identifier le type utilisé.
b) Dans une entreprise de service, on veut évaluer le temps (en minutes) requis pour répondre à un
type de requêtes qui exige une recherche spéciale. La variable « temps requis » est une variable
quantitative de nature continue.
c) On veut analyser le nombre de plaintes reçues par le service à la clientèle d’une grande entreprise.
La caractéristique « nombre de plaintes » est une variable quantitative de nature discrète.
d) Dans une étude sur le stress chez les gestionnaires en ressources humaines, on veut connaître,
parmi une liste de tâches, le nombre de tâches qu’effectue le gestionnaire en ressources humaines.
Ce caractère est une variable quantitative de nature discrète.
CHAPITRE 1 : MÉTHODOLOGIE ET ANALYSE DESCRIPTIVE DES DONNÉES 13
e) Dans un sondage* portant sur l’apprentissage des dirigeants et des cadres supérieurs des
organisations membres du Centre francophone d’informatisation des organisations (CEFRIO)
et dont l’objectif était d’évaluer l’importance qu’ils accordent à l’amélioration de leurs
compétences professionnelles, et de connaître le moyen qu’ils utilisent pour se former et
s’informer, on veut connaître le temps consacré au développement des compétences
professionnelles. La variable « temps consacré au développement des compétences
professionnelles » est une variable quantitative de nature continue.
Pour une utilisation exclusive par le prof. Mohamed Dia U d’Ottawa ADM 2703 automne 2021
*Source : Audet, M.et S. Lépinay. L’acte d’apprendre: passion ou obligation. CEFRIO, volume 1, n°2.
Variable indépendante. La variable indépendante est une caractéristique qui est censée avoir
un effet ou une influence systématique sur une autre variable. La variable indépendante est
Les notions de variable observée directement ou manipulée expressément par l’expérimentateur . Les valeurs que peut
indépendante et de variable
dépendante sont importantes
prendre la variable indépendante sont appelées modalités (ou niveaux) de cette variable et une
lorsqu’on s’intéresse à établir variable indépendante comporte au moins deux modalités. On parlera par exemple, d’une variable
s’il existe un lien entre deux indépendante à 2 modalités si elle peut prendre 2 valeurs différentes comme la variable « Sexe
caractères (tableau croisé, de l’employé » (dont les valeurs sont masculin et féminin) ou à 3 modalités (ou niveaux) si elle
chapitre 9) ou qu’on désire
développer un modèle de
peut prendre 3 valeurs différentes comme la variable « Aménagement de l’espace de travail »
prédiction pour prévoir les (dont les valeurs pourraient être Aménagement A, Aménagement B, Aménagement C) et ainsi de
valeurs d’une variable dépen- suite.
dante en fonction d’une ou
plusieurs variables indépen- Variable dépendante (ou réponse). La variable dépendante est une caractéristique dont on
dantes (régression, chapitres observe les variations et dont on tente d’expliquer le comportement à partir d’une ou de plusieurs
11 et 12). variables indépendantes. C’est la variable dont on veut comprendre les différents états et dont
l’expérimentateur enregistre les résultats (par exemple « Le temps d’assemblage d’un sous-
produit selon l’aménagement de l’espace de travail »).
Une recherche* est effectuée auprès des PME manufacturières qu’elles soient ou non utilisatrices
d’une innovation technologique (le contrôle numérique) et auprès des ateliers d’usinage.
Cette recherche vise à identifier, à étudier et à hiérarchiser certaines caractéristiques
organisationnelles et managériales qui différencient ces trois secteurs au niveau de l’utilisation
(ou de la non-utilisation) d’au moins une innovation technologique.
*Source : Julien, P.A., Carrière, J.B., Hébert, L. La diffusion des nouvelles technologies dans trois secteurs industriels. Conseil
de la science et de la technologie, Document no 88-03.
•Variable dépendante
Niveau de satisfaction au travail
•Variables indépendantes (ou explicatives)
La rémunération (en milliers de dollars)
L’âge (en années)
Les années de service avec l’entreprise
Le nombre d’années d’expérience associé à la fonction
avant l’engagement chez JPX.
L’objectif de cette étude est d’établir une relation statistique entre le niveau de satisfaction au
travail (variable dépendante) et les quatre variables explicatives mentionnées ci-haut.
Pour une utilisation exclusive par le prof. Mohamed Dia U d’Ottawa ADM 2703 automne 2021
Identification de Étude Unité Variable Type de variable Variable quantitative
différents types de
statistique statistique Quantitative Qualitative Continue Discrète
variables
L’échelle nominale. Une variable est mesurée Les enquêtes comportent fréquemment des variables
Types d’échelle de sur une échelle nominale si les codes utilisés ne servent mesurées sur une échelle nominale.
mesure qu’à identifier la modalité à laquelle appartient l’unité Sexe de l’individu : féminin, masculin
statistique. Sur cette échelle, il n’y a pas de relation Statut : Célibataire, marié(e), veuf...
d’ordre entre les codes. Les données correspondantes Région : urbaine, semi-urbaine, rurale, éloignée
sont dites données nominales. Rôle organisationnel : cadre supérieur, intermédiaire...
Classification d’un produit: conforme, non conforme.
On ne peut effectuer aucune opération arithmétique avec des données nominales; on ne peut qu’identifier sa modalité.
L’échelle ordinale. Une variable est mesurée Les exemples suivants illustrent des variables mesurées sur
sur une échelle ordinale si les codes utilisés permettent une échelle ordinale.
non seulement d’identifier la modalité à laquelle Potentiel entrepreneurial : faible, moyen, élevé
appartient l’unité statistique, mais également d’établir Groupe d’âge : moins de 18, de 18 à 24, de 25 à 29, de
une relation d’ordre entre les modalités observables et 30 à 34, de 35 à 44, de 45 à 54...
par le fait même, entre les unités statistiques. Les Niveau de scolarité : primaire, secondaire, collégial,
données recueillies dans l’échantillon sont dites universitaire
données ordinales. Niveau d’appréciation d’un produit : Très bonne
On ne peut que mettre en ordre les différentes modalités. qualité, bonne qualité, qualité moyenne...
L’échelle d’intervalles. Une variable est L’exemple suivant permet de mieux saisir l’échelle
Types d’échelle mesurée sur une échelle d’intervalles si les codes utilisés d’intervalles.
permettent non seulement d’identifier la modalité à Dans une étude sur la consommation d’énergie
de mesure
laquelle appartient l’unité statistique et d’établir un ordre électrique, on a posé la question suivante:
(suite) entre les modalités observables, mais aussi s’ils nous À quelle valeur réglez-vous normalement
informent de l’écart (la distance) séparant deux votre thermostat durant le jour? ____0 C.
modalités (ou deux unités statistiques). Elle suppose Le caractère quantitatif « réglage du thermostat » est
le choix d’une unité de mesure qui est répartie mesuré sur une échelle d’intervalles.
uniformément sur l’échelle. Un écart d’une unité ou La valeur 0o C ne veut pas dire absence totale
Pour une utilisation exclusive par le prof. Mohamed Dia U d’Ottawa ADM 2703 automne 2021
de dix unités (en terme de distance) fournit la même de chaleur. Ici le zéro est un point de référence arbitraire.
information, peu importe où l’on se situe sur l’échelle Notons qu’un écart de 10o C entre 15o C et 25o C
de mesure. Sur cette échelle, la position du zéro est a la même signification qu’un écart de 10o C entre
arbitraire. Les données recueillies dans l’échantillon 20o C et 30o C.
sont dites données d’intervalles.
On peut additionner et soustraire les données d’intervalles.
L’échelle de rapport. Une variable est mesurée Les exemples suivants illustrent des variables mesurées sur
sur une échelle de rapport si les codes correspondants une échelle de rapport.
possèdent les propriétés des codes d’une échelle Chiffre d’affaires d’une entreprise
d’intervalles et si le zéro constitue un zéro absolu. La Nombre de mois d’ancienneté
valeur 0 indique l’absence complète du caractère que Nombre d’employés d’une entreprise
l’on mesure. C’est l’échelle de mesure avec laquelle Nombre d’heures de travail
nous sommes le plus familier dans la vie courante. Les Nombre d’années passées à la direction d’une entreprise
données correspondantes sont dites données de rapport. Coût d’un système de gestion de la qualité ISO.
Échelle nominale,
échelle ordinale, Échelles de mesure et type de données
échelle d’intervalles
et échelle de rapport
Données nominales : Forme légale d’une entreprise dont les modalités sont codées 1, 2, 3.
Dans le but de mieux servir ses lecteurs et lectrices et de cerner une partie de son marché, voici
quelques questions qui ont été posées dans un magazine d’une compagnie aérienne.
Pour une utilisation exclusive par le prof. Mohamed Dia U d’Ottawa ADM 2703 automne 2021
Q4) Est-ce que votre destination est : 1 à l’intérieur du Canada? 2 à l’extérieur du Canada?
Q5) Nombre de voyages aériens effectués au cours de la dernière année
Une variable qui est mesu- 1 1-2 2 3-6 3 7-10 4 11-14 5 15+
rée sur une échelle nominale
est de nature qualitative. Q6) Revenu familial annuel :
Une variable qui est mesu- 1 moins de 75 000 $ 2 75 000 $ - 99 999 $
rée sur une échelle d’inter- 3 100 000 $ -149 999 $ 4 150 000 $+
valles ou de rapport est de
nature quantitative. Les échelles de mesure utilisées pour chacune des questions sont les suivantes :
Une variable qui est mesu- Questions Échelle de mesure
rée sur une échelle ordinale
Q1 Nominale
peut être de nature qualita-
tive (degré d’appréciation Q2 Ordinale
d’un produit) ou de nature Q3 Nominale
quantitative (catégories Q4 Nominale
salariales). Q5 Ordinale
Q6 Ordinale
Appliquer vos Dans une recherche effectuée auprès de deux entreprises du secteur des pâtes et papier de la région de
connaissances
l’Estrie, on a mesuré à l’aide d’un questionnaire divers aspects concernant la satisfaction au travail de
Série 1.2 contremaîtres.
Dans une section du questionnaire concernant l’emploi, on a posé les questions suivantes :
Échelles de mesure Q1 : Quel emploi ou profession exercez-vous présentement?
pour diverses variables
Veuillez préciser :
Appliquer vos Q5 : Dans l’organisation ou l’entreprise où vous travaillez présentement, votre salaire est de :
connaissances 39 999 $ et moins 1
Série 1.2 (suite) 40 000 à 49 999 $ 2
50 000 à 59 999 $ 3
60 000 à 69 999 $ 4
Échelles de mesure
70 000 $ et plus 5
pour diverses variables
Pour une utilisation exclusive par le prof. Mohamed Dia U d’Ottawa ADM 2703 automne 2021
selon un diagramme en feuilles.
Il existe divers logiciels qui permettent le dépouillement rapide d’une série de données selon une
distribution de fréquences absolues; on peut effectuer divers traitements, dont un tri des données
Tri de données
(en ordre croissant ou décroissant). Ce tri peut être une première étape dans le dépouillement
d’une série statistique.
Donnons un premier exemple.
*Source : Adapté de Therrien, C. L’effet de l’utilisation de pratiques de gestion financière à court terme sur la vulnérabilité
financière en fonction de l’âge des PME. Mémoire de recherche, Université du Québec à Trois-Rivières.
Si nous ordonnons les valeurs obtenues en ordre croissant, on obtient la série de la page suivante.
20 MÉTHODES STATISTIQUES EN GESTION
Tableau 1.3 Dirigeant Direction Dirigeant Direction Dirigeant Direction Dirigeant Direction
Valeurs ordonnées 15 5 14 7 65 7 35 8
du nombre d’an- 43 5 16 7 66 7 49 8
nées passées à la
direction de la
56 5 18 7 71 7 57 8
présente entre- 3 6 22 7 72 7 59 8
prise 7 6 23 7 73 7 61 8
10 6 25 7 77 7 67 8
12 6 27 7 78 7 69 8
17 6 30 7 79 7 70 8
Pour une utilisation exclusive par le prof. Mohamed Dia U d’Ottawa ADM 2703 automne 2021
28 6 31 7 81 7 74 8
42 6 33 7 82 7 84 8
47 6 34 7 83 7 1 9
48 6 36 7 4 8 41 9
51 6 37 7 5 8 45 9
53 6 38 7 6 8 46 9
54 6 39 7 8 8 62 9
75 6 40 7 13 8 63 9
76 6 44 7 19 8 64 9
80 6 50 7 21 8 68 9
85 6 52 7 24 8 20 10
2 7 55 7 26 8
9 7 58 7 29 8
11 7 60 7 32 8
Nous constatons que le nombre d’années minimal qui a été observé est 5 ans, alors que le nombre
maximal est 10.
Dépouillement des données par valeurs
On peut, à partir du tri que nous venons d’effectuer, dépouiller les données par valeurs; il s’agit
simplement de noter le nombre de fois qu’apparaît chaque donnée dans la série.
À partir du tableau 1.3, on obtient la répartition suivante :
Valeurs Fréquences Visualisation (pictogramme)
absolues
5 3
6 16
7 36
8 21
9 8
10 1
On constate que la valeur qui revient le plus fréquemment est 7 ans. On a visualisé l’allure de la
répartition des fréquences absolues en utilisant un point () pour chaque valeur notée (on pourrait
également utiliser un x). Un logiciel statistique pourrait donner le dépouillement suivant :
Compilation
Variable : direction de l'entreprise (années)
Valeurs (années) Fréquence absolue Pour cent Pour cent cum.
5 3 3,5% 3,5% De cette compilation, on
6 16 18,8% 22,4% peut lire que 36 dirigeants
(soit 42,4 %) ont 7 années
7 36 42,4% 64,7% passées à la direction de la
8 21 24,7% 89,4% présente entreprise, alors
9 8 9,4% 98,8% que 8 ont 9 années passées
10 1 1,2% 100,0% à la direction de l’entreprise.
Total : 85
CHAPITRE 1 : MÉTHODOLOGIE ET ANALYSE DESCRIPTIVE DES DONNÉES 21
Pour une utilisation exclusive par le prof. Mohamed Dia U d’Ottawa ADM 2703 automne 2021
Dépouiller les données
d’une variable quanti-
pour en faciliter le dépouillement.
tative selon une distri-
bution de fréquences Dépouillement des données et distribution de fréquences absolues. Le groupement des
absolues données en classes dans lequel on indique par un trait vertical chaque donnée appartenant à sa
classe respective s’appelle dépouillement des données. Il est également de pratique courante
de dépouiller les données par bloc de 5 (s’il y a lieu) en marquant d’un trait oblique (ou horizontal)
un ensemble de 4 traits verticaux déjà notés. La somme du nombre de traits appartenant à chaque
classe donne la fréquence absolue de cette classe (ce qui correspond au nombre de données
appartenant à cette classe). La répartition des données dans les classes accompagnées des
Distribution de fréquences absolues respectives s’appelle la distribution de fréquences absolues ou distribution
fréquences absolues des effectifs.
Les nombres entre lesquels sont classées les données s’appellent limites des classes. De plus les
classes sont définies en ordre croissant. En regroupant ainsi les valeurs de la série numérique,
nous obtenons une série classée.
La valeur centrale d’une classe ou centre de classe (ou point milieu) est simplement la somme
des limites de chaque classe divisée par 2.
Considérations pratiques dans l’élaboration d’une distribution de fréquences absolues
Lorsqu’on veut grouper une série numérique suivant une distribution de fréquences absolues, on
doit fixer au préalable le nombre de classes dans lesquelles les valeurs sont réparties. Un peu
d’expérience et les quelques conseils qui suivent peuvent faciliter la tâche.
a) Détermination du nombre de classes
Mentionnons d’abord que le nombre de classes ne devrait, en général, être ni inférieur à 5 ni supérieur
à 20. De préférence, il variera entre 6 et 12 classes.
Ce choix est fonction évidemment du nombre de données à dépouiller et de l’éparpillement de ces
données.
En pratique, on peut utiliser une formule pour déterminer le nombre souhaitable de classes, c’est la
formule de Sturges.