Académique Documents
Professionnel Documents
Culture Documents
Chapitre 1
Présenter pour informer
Objectifs
• Découvrir les enjeux de la statistique et la démarche du statisticien
• Se familiariser avec les concepts de base
• Mesurer l’importance du travail de présentation des données
© 2013 Pearson France – Statistique pour économistes et gestionnaires, 3e éd. – Brigitte Tribout
arrêt au stand
Défi
6,80 7,99 6,09 6,69 3,70 7,59 4,63 6,15 7,89 8,07 5,92 7,98 7,65 5,76 8,63
6,68 5,78 9,27 6,27 9,36 6,25 6,21 9,16 6,12 6,80 8,75 6,94 5,44 5,93 6,14
7,53 6,62 7,87 5,00 5,69 5,60 4,93 4,90 7,72 8,28 8,78 7,61 8,11 9,23 5,98
8,13 5,97 7,34 6,15 6,97 7,81 8,28 4,72 6,09 6,17 6,28 7,22 4,37 6,06 6,59
7,60 5,39 8,42 6,44 5,94 8,42 5,39 5,77 7,91 6,18 6,58 7,14 7,94 9,22 6,68
6,71 6,03 7,11 4,93 4,96 6,35 7,30 6,81 9,92 9,67 8,50 5,59 7,22 6,99 7,77
6,26 7,31 6,92 7,96 7,88 9,67 6,13 8,83 5,49 5,45
© 2013 Pearson France – Statistique pour économistes et gestionnaires, 3e éd. – Brigitte Tribout
Défi
7,83 7,51 6,32 7,42 7,02 7,78 6,97 7,24 7,29 7,19 7,10 6,80 6,92 7,79 7,21
8,12 7,63 6,72 7,95 7,37 8,05 7,35 8,36 7,85 7,05 7,69 7,86 6,67 7,97 7,71
8,36 7,04 7,02 6,83 8,22 8,06 8,19 7,96 7,31 7,10 7,18 7,90 8,03 7,48 7,45
7,61 6,81 7,69 6,93 7,96 7,95 8,36 7,56 6,89 7,91 6,74 6,42 7,44 7,38 8,17
7,57 6,93 7,51 7,79 7,87 6,93 8,07 8,22 7,92 7,70 6,80 7,14 6,72 7,25 7,79
8,01 7,14 6,79 7,47 7,14 7,76 7,85 8,03 7,74 7,21 6,67 7,64 7,27 6,97 7,40
7,24 7,72 7,57 7,49 7,98 8,26 7,64 7,95 7,38 7,67
Le processus de décision de choix d’une équipe doit ainsi être éclairé par la présenta-
tion des données figurant dans ces deux tableaux.
© 2013 Pearson France – Statistique pour économistes et gestionnaires, 3e éd. – Brigitte Tribout
Choix de
Quel type Choix des
la méthode
Campagne Traitement Prise
(présentation,
de données de recueil de de
résumé, etc.)
problématique ? à observer des données mesures des données décision
© 2013 Pearson France – Statistique pour économistes et gestionnaires, 3e éd. – Brigitte Tribout
Réunion
de groupe
Expérimentation Observation
Données Obtention
de seconde des Enquête
main données
expérimentation
Comme son nom l’indique, l’expérimentation suppose de pouvoir réaliser des expériences,
c’est-à-dire de faire varier un paramètre (la variable de contrôle) et d’observer l’impact de
cette variation sur une autre grandeur (la variable de réponse).
© 2013 Pearson France – Statistique pour économistes et gestionnaires, 3e éd. – Brigitte Tribout
Ainsi, afin de mettre en évidence l’efficacité d’un nouvel engrais, un laboratoire d’agro-
nomie a la possibilité de faire varier la quantité d’engrais sur une vingtaine de parcelles
et de mesurer le rendement obtenu. Dans cet exemple, la population est composée de 20
parcelles. Pour chacune d’elles, deux variables sont relevées : la quantité d’engrais, qui est
la variable de contrôle, et le rendement, qui est la variable de réponse. De telles situations
sont traitées aux chapitres 4 et 11.
Observation1
Au sens propre du terme, l’observation est la méthode qui consiste par exemple à filmer
les clients d’une librairie. L’objectif est d’identifier d’éventuelles différences de compor-
tements entre ceux qui terminent leur visite par un achat et ceux qui quittent la boutique
les mains vides. Cette technique d’étude est riche d’enseignements, mais ne relève pas à
proprement parler de la statistique. Les observations qui relèvent de la statistique sont des
observations structurées (via des grilles d’observation) ou automatisées (via des compteurs).
réunion de groupe
Elle consiste à réunir les individus pour les interroger. Par nature, cette méthode est
plutôt destinée à recueillir des données qualitatives : des impressions, des sentiments,
des envies, etc. Cette technique est également utilisée pour déterminer les questions qui
doivent apparaître dans un questionnaire, ou bien pour tester la compréhension d’un
questionnaire avant son lancement grandeur nature.
enquête
L’enquête est certainement la méthode de collecte de données la plus connue et la plus
courante. Elle demande :
• d’élaborer un questionnaire,
• de choisir son mode d’administration (support utilisé pour transmettre le question-
naire et le faire remplir).
1. Le terme d’observation est aussi utilisé par certains auteurs pour désigner la réalisation d’une variable aléatoire
réelle.
2. A contrario, les données recueillies par le chargé d’études s’appellent des données primaires.
© 2013 Pearson France – Statistique pour économistes et gestionnaires, 3e éd. – Brigitte Tribout
1. Consulter par exemple Naresh Malhotra adapté par Jean Marc Décaudin, Afifa Bouquerra, Denis Bories,
Études Marketing, Pearson Education, 6e éd. 2011.
© 2013 Pearson France – Statistique pour économistes et gestionnaires, 3e éd. – Brigitte Tribout
Les traitements, non exclusifs les uns des autres, correspondent à six2 grandes probléma-
tiques présentées ci-après en même temps qu’une partie du plan de l’ouvrage :
1. Ce n’est pas toujours l’idéal pour des populations de très grande taille.
2. Les deux derniers titres comportent deux problématiques.
© 2013 Pearson France – Statistique pour économistes et gestionnaires, 3e éd. – Brigitte Tribout
Par définition, le résumé des données entraîne une perte de données brutes. Cette perte doit se
faire au profit d’un gain d’information.
© 2013 Pearson France – Statistique pour économistes et gestionnaires, 3e éd. – Brigitte Tribout
Conclusions
de l’étude
Décision
politique
Contraintes
(budgétaires)
Définition 1.1
1. L’ensemble étudié s’appelle une population (c’est un ensemble au sens mathématique
du terme).
2. Les éléments de la population s’appellent des individus ou unités statistiques.
3. Le nombre d’individus ou d’unités statistiques appartenant à la population est appelé
taille de la population ou effectif total.
4. Une variable statistique (ou un caractère) est une application qui, à chaque individu
de la population, associe une valeur (numérique ou non).
© 2013 Pearson France – Statistique pour économistes et gestionnaires, 3e éd. – Brigitte Tribout
5. Les valeurs que peut prendre une variable statistique s’appellent des modalités.
6. Le nombre d’individus qui présentent une modalité de la variable statistique est ap-
pelé effectif de cette modalité.
remarques
1. Une variable statistique (ou un caractère) est une application d’un ensemble dans un
autre. Le vocable de variable n’est pas pertinent, puisqu’il ne s’agit pas d’une variable
(c’est-à-dire l’argument d’une fonction) mais d’une application parfaitement définie.
L’utilisation du terme variable statistique est cependant, a priori, plus répandue que
celui de caractère.
2. Si, en mathématique, l’usage est plutôt d’appeler f, g ou h les applications, en statistique
celles-ci sont notées X, Y ou Z.
3. Traditionnellement, la population est notée Ω (oméga majuscule) et ses éléments sont
notés ω i (oméga minuscule).
4. L’ensemble des modalités est l’image de l’ensemble Ω par l’application X. Cet ensemble
se note X (Ω), comme f(I) désigne l’image d’un intervalle I par une application f.
5. La figure 1.4 représente une variable statistique X. Une telle figure s’appelle un dia-
gramme sagittal – du latin sagitta, qui signifie « flèche ». Par définition, une et une seule
flèche part de chaque ω i .
Ensemble
Population des modalités
Variable X( )
1 statistique X
x1
2
x2
3
4
x3
5
6. Les termes individu et population sont issus des premiers travaux statistiques qui furent
des travaux de recensement (comptage des hommes d’une armée, d’une contrée, etc.).
Cependant un individu peut être également une entreprise, un logement, un jour ou-
vrable, etc.
Dans tout l’ouvrage, les variables statistiques sont notées en majuscules (X) et leurs modalités,
en minuscules (xi).
© 2013 Pearson France – Statistique pour économistes et gestionnaires, 3e éd. – Brigitte Tribout
© 2013 Pearson France – Statistique pour économistes et gestionnaires, 3e éd. – Brigitte Tribout
Ensemble
Population Variable
des modalités
Délit 1
statistique X :
Vols
X( )
« Catégorie »
Infractions
économiques
et financières
Délit k Crimes et délits
contre des personnes
Ça va mieux en le disant
Qu’est-ce qu’une application ?
Les applications sont omniprésentes en statistique. Il est important de savoir ce qu'est
une application et de connaître ses modes de représentations.
Une application est un mécanisme d’association entre deux ensembles d’objets. Pour définir
une application, trois éléments doivent être décrits : l’ensemble de départ, l’ensemble d’arrivée
et le mécanisme d’association.
© 2013 Pearson France – Statistique pour économistes et gestionnaires, 3e éd. – Brigitte Tribout
Ensemble d’arrivée
y1 Sens du mécanisme
d’association
x1 Ensemble de départ
Variable
statistique
Qualitative Quantitative
Les modalités ne sont Les modalités
pas des nombres sont des nombres
© 2013 Pearson France – Statistique pour économistes et gestionnaires, 3e éd. – Brigitte Tribout
2. Variable qualitative ordinale. C’est le cas, par exemple, d’une variable dont les
modalités sont : très bonne, bonne, plutôt bonne, etc. En effet, cela a du sens de
définir l’ordre1 selon lequel la modalité « très bonne » est supérieure à « bonne ».
3. Variable quantitative discrète. D’un point de vue théorique, une variable quan-
titative est discrète si l’ensemble de ses modalités est dénombrable2. D’un point de
vue opérationnel, une variable quantitative est discrète si la valeur de ses modalités
relève d’un comptage. Ainsi, on compte un « nombre d’enfants », un « nombre de
pièces d’un logement », etc.
4. Variable quantitative continue. Théoriquement, une variable quantitative est
continue si l’ensemble de ses modalités est non dénombrable, c’est-à-dire si la variable
peut prendre n’importe quelle valeur numérique dans un intervalle. Très souvent,
les modalités d’une variable continue sont obtenues en utilisant un instrument de
mesure (taille d’une personne, diamètre d’un cylindre, longueur d’un câble).3
L’identification du type d’une variable statistique n’est pas toujours fondamentale en revanche,
s’assurer, à chaque étape du traitement des données (graphiques, calculs de nombres-résumé3,
etc.), que le travail effectué a du sens est primordial.
Série brute
Définition 1.2
La série brute d’une variable statistique est la liste des données telles qu’elles ont été collec-
tées, c’est-à-dire vierges de tout traitement.
1. Une relation d’ordre sur un ensemble est une relation réflexive, transitive et antisymétrique.
2. Un ensemble est dénombrable s’il est possible de construire une bijection entre cet ensemble et une partie de
l’ensemble des entiers naturels.
3. Terme défini au chapitre 2.
© 2013 Pearson France – Statistique pour économistes et gestionnaires, 3e éd. – Brigitte Tribout
2 2 5 2 3 1 1 1 1 2 1 1 0 2 2
5 1 4 2 2 1 0 2 2 1 2 1 1 2 1
3 1 2 1 0 0 1 3 13 1 0 2 1 1 1
1 6 1 3 1 0 1 5 7 2 1 2 2 3 0
3 2 2 7 14 9 5 4 1 0 1 2 1 3 2
1 2 2 0 4 1 0 1 0 1 1 1
Les manipulations involontaires sont courantes lors de la saisie informatique des données.
Cette réalité impose :
• de consacrer du temps à vérifier qu’il n’y a pas d’erreur,
• puis de conserver une sauvegarde de la série brute vérifiée.
© 2013 Pearson France – Statistique pour économistes et gestionnaires, 3e éd. – Brigitte Tribout
de frères et sœurs , il convient de vérifier s’il ne s’agit pas de la donnée 14 mal saisie. Le
cas échéant, la valeur doit être supprimée.
Tableau 1.6 Série classée de la variable statistique « langue maternelle »
0 1 1 1 2 2 2 5
0 1 1 1 2 2 3 5
0 1 1 1 2 2 3 5
0 1 1 1 2 2 3 5
0 1 1 1 2 2 3 6
0 1 1 1 2 2 3 7
0 1 1 1 2 2 3 7
0 1 1 1 2 2 3 9
0 1 1 1 2 2 4 13
0 1 1 1 2 2 4 14
0 1 1 1 2 2 4
© 2013 Pearson France – Statistique pour économistes et gestionnaires, 3e éd. – Brigitte Tribout
Définition 1.3
1. La série classée d’une variable statistique qualitative est la liste des observations clas-
sées par ordre alphabétique.
2. La série ordonnée d’une variable statistique quantitative est la liste des observations
classées par ordre croissant.
Définition 1.4
Une distribution observée des effectifs est l’application qui associe à chaque modalité d’une
variable statistique l’effectif observé correspondant. Cette distribution est présentée sous
la forme soit d’un tableau, soit d’un graphique.
Le tableau 1.9 et la figure 1.8 sont deux présentations des mêmes données. La figure a
l’avantage de mettre clairement en évidence la dissymétrie de la distribution ainsi que
les modalités non observées.
© 2013 Pearson France – Statistique pour économistes et gestionnaires, 3e éd. – Brigitte Tribout
Figure 1.8 Distribution observée des 87 étudiants suivant leur nombre de frères et sœurs.
33
23
11
7
4
3
2
1 1 1 1
0 1 2 3 4 5 6 7 8 9 10 11 12 13 14
Nombre de frères et sœurs
La distribution observée des effectifs est la manière la plus courte de présenter les données
sans que celles-ci aient subi (sauf erreur involontaire) la moindre modification. Son usage
est donc extrêmement courant.
© 2013 Pearson France – Statistique pour économistes et gestionnaires, 3e éd. – Brigitte Tribout
données sont potentiellement porteuses d’information, mais doivent être traitées pour
en faire émerger une signification.
Le rôle de la statistique est de donner une signification à un ensemble de données numériques.
L’objectif est de donner une forme, autrement dit d’« in-former » des données pour en extraire
de l’information utile à la prise de décision. La présentation des données à l’aide de graphiques
occupe ainsi un rôle primordial puisqu’il s’agit, au sens propre, de donner une forme aux données.
© 2013 Pearson France – Statistique pour économistes et gestionnaires, 3e éd. – Brigitte Tribout
Relever le défi
La description du défi conduit à modéliser l’étude entreprise par la figure 1.9.
Quel type
de Définir une stratégie de choix d’équipe (A ou B)
problématique ? en course
Choix des
Quoi : durée du pitstop pour changer
données les pneumatiques
à observer Qui : équipes A et B
Choix de la Comment : expérimentation
méthode
de recueil
des données
Représentations Prise
graphiques de Stratégie
décision
© 2013 Pearson France – Statistique pour économistes et gestionnaires, 3e éd. – Brigitte Tribout