Académique Documents
Professionnel Documents
Culture Documents
REMERCIEMENTS
La DRIF / Le CDC Gestion Commerce remercie toutes les personnes qui ont participé à l’élaboration de ce guide
de soutien.
Pour la supervision
Pour la conception :
Pour la validation :
N.B :
Les utilisateurs de ce document sont invités à communiquer à la DRIF / CDC GESTION
COMMERCE toutes les remarques et suggestions afin de les prendre en considération pour
l’enrichissement et l’amélioration de ce manuel.
OBJECTIF OPERATIONNEL
COMPORTEMENT ATTENDU
CONDITIONS D’EVALUATION
A partir des études de cas, mise en situation, consignes du formateur, toute documentation nécessaire
A l’aide de : calculatrice, tableur et logiciel de statistiques,
CRITERES GENERAUX
La statistique peut être définie comme une méthode scientifique qui vise à analyser des données
quantitatives.
Exemple : Après analyse des données précédentes, on peut conclure que les stagiaires qui ont une note
supérieure à 10 représentent 80 % des éléments du groupe.
I : DEFINITION DE LA STATISTIQUE :
C’est une méthode qui étudie des phénomènes observés, à travers la collecte, le traitement et
l’interprétation de données, afin de les rendre compréhensibles.
X X X X X X X X X X X X X X
X X X X X X X X X X X X X Population
X X X X X X X X X X X X X
Echantillon
X X X X X X X X X X X X X
X X X X X X X X X X X X X X
Unité statistique
Ainsi, les modalités d’un caractère sont élaborées à partir de nombres. Ceux-ci varient et constituent ce
que l’on appelle « variable statistique ».
Une variable statistique peut prendre deux catégories de valeurs :
- Soit des valeurs isolées (souvent entières) d’un intervalle donné. Cette variable est appelée « Variable
Statistique Discrète ou Discontinue ». Exemple 1 : Nombre de chambres par appartement.
- Soit toutes les valeurs d’un intervalle (des valeurs infinies dans un intervalle donné). Cette variable est
appelée « Variable Statistique continue ». Exemple 2 : L’âge des individus est une variable statistique
continue.
OFPPT-DRIF-CDCGC STATISTIQUE PAGE7
C) Série Statistique ou Distribution Statistique.
C’est une suite de valeurs qui mesurent un caractère. La série statistique peut être une série simple ou une
série classée.
Dans cet objectif, plusieurs outils numériques (moyenne, mode, variance….) et graphiques (histogramme,
tuyaux d’orgue…) existent et permettent de résumer un ensemble de données et d’étudier ses caractéristiques
comme la tendance centrale et la dispersion. Ces outils peuvent être également utilisés pour décrire
l’association parmi plusieurs variables.
Le choix d’un outil de statistique descriptive peut être lié aux caractéristiques des variables, comme leur type
et leur nombre, ainsi qu’à l’objectif de l’étude.
Remarque :
Lorsque le nombre de modalités est réduit,
on peut utiliser les diagrammes semi-
circulaires. A ce moment, l’angle au centre
relatif à une modalité i est égal à :
𝛼 i = 180 * fi
Représentation graphique :
Représentation graphique :
1 -
0,94 -
0,82 -
0,35 -
0,15 -
0 -
b) Exemples :
Exemple 1 : Cas où les classes ont la même amplitude
La série suivante nous donne la répartition de 12 personnes selon le salaire horaire.
Salaire horaire ni
[10-20[ 4
[20-30[ 5
[30-40[ 2
[40-50[ 1
Total 12
Représentation graphique :
ni
5 -
4 -
3 -
2 -
1 -
OFPPT-DRIF-CDCGC STATISTIQUE PAGE17
0 -
10 20 30 40 50 xi
Représentation graphique :
ni
5 -
4 -
3 -
2 -
1 -
0 -
10 20 30 40 50 xi
Exemples :
Exemple 1 : Cas où les classes ont la même amplitude
On reprend l’exemple 1 précédent pour tracer le polygone des fréquences.
Salaire horaire ni
[10-20[ 4
[20-30[ 5
[30-40[ 2
[40-50[ 1
OFPPT-DRIF-CDCGC STATISTIQUE PAGE18
Total 12
Représentation graphique :
ni
5 -
4 -
3 -
2 -
1 -
0 -
10 20 30 40 50 xi
Représentation graphique :
ni
5 -
4 -
3 -
2 -
1 -
0 -
10 20 30 40 50 xi
c) Tracé du polygone des effectifs ou des fréquences :
Représentation graphique :
ni
12 -
10 -
Courbe cumulée croissante
8 - Courbe « des moins de »
6 -
4 -
Courbe cumulée décroissante
2 - Courbe « des plus de »
0
10 20 30 40 50 xi
INTRODUCTION :
Les représentations graphiques constituent une manière géométrique qui permet de visualiser les
caractéristiques générales d’une population. Cependant, elles présentent l’inconvénient d’avoir un certain
aspect « subjectif ».
Le présent chapitre va permettre de définir des indicateurs dont l’objet est de résumer quantitativement les
caractéristiques d’ensemble des séries statistiques.
Notes xi Effectifs ni ni xi
Totaux 8 68
Application 2 :
Soit la série suivante qui donne la répartition de 88 personnes selon leur âge.
Age Effectifs ni xi ni xi
20-25 8 22,5 180
25-30 10 27,5 275
30-35 20 32,5 650
35-40 25 37,5 937,5
40-45 15 42,5 637,5
45-50 10 47,5 475
Total 88 3 155
x = ∑nixi / ∑ni
= ∑ni(x0 + x’i) / ∑ni
= (x0 ∑ni + ∑nix’i) / ∑ni
= x0 + (∑nix’i / ∑ni)
Exemple 2:
Reprenons l’exemple précédent. On prendra comme x0, la valeur la plus fréquente : x0 = 37,5
Age Effectifs ni xi x’i = xi-x0 nix’i
20-25 8 22,5 -15 -120
OFPPT-DRIF-CDCGC STATISTIQUE PAGE22
25-30 10 27,5 -10 -100
30-35 20 32,5 -05 -100
35-40 25 37,5 0 0
40-45 15 42,5 5 75
45-50 10 47,5 10 100
Total 88 -145
x = x0 + a x’
Exemple 2:
Reprenons l’exemple précédent. On prendra :
x0 : la valeur la plus fréquente : x0 = 37,5 et a ; Intervalle de classe = 5
Age Effectifs ni xi x’i = (xi-x0) / a nix’i
20-25 8 22,5 -3 -24
25-30 10 27,5 -2 -20
30-35 20 32,5 -1 -20
35-40 25 37,5 0 0
40-45 15 42,5 1 15
45-50 10 47,5 2 20
total 88 -29
x = x0 + a x’ Donc, x = 37,5 + 5 (-29 / 88) = 35,8 ans
4) Calcul de la moyenne à l’aide des fréquences relatives :
x = ∑ni xi / ∑ni = (n1x1 + n2x2 +…+ nnxn ) / ∑ni
= (n1x1/∑ni) + (n2x2/∑ni) + … + (nnxn/∑ni)
=f1x1 + f2x2 +…………+ fnxn
Donc, x = ∑fixi avec fi = ni / ∑ni
B) la moyenne géométrique :
1) Définition :
Etant donné n observations : x1, x2, ….xi, … xn connues individuellement (une par une), on appelle
moyenne géométrique la quantité G tel que :
𝑛
G = √x1 ∗ x2 ∗ … … … . xi ∗ … … .∗ xn
G = (∏𝑛
𝑖=1 𝑥𝑖 )
1/n
Moyenne géométrique simple
Si les xi sont groupés (répétitifs) , la moyenne géométrique s écrit
2) Calcul de G :
Pour calculer la moyenne G, il vaut mieux passer par le calcul de log G.
Rappels :
log an = n log a et log (a * b) = log a + log b
Nous avons :
G = √x1 ∗ x2 ∗ … … … . xi ∗ … … .∗ xn = (x1 * x2 * … * xi *… * xn) 1/n
𝑛
3) Application :
xi ni log xi ni log xi
2 1 0,30103 0,30103
6 2 0,77815 1,55430
10 3 1,00000 3,00000
12 2 1,07918 2,15836
totaux 8 7,01569
Log G = ∑ (ni log xi)/ ∑ ni
Log G = 7,015/8 = 0,876
G = 7.53
C) La moyenne harmonique :
1) Définition :
Etant donné n observations : x1, x2, ….xi, … xn connues individuellement (une par une), on appelle
moyenne harmonique la quantité H tel que :
1/H =1/n (1/x1 + 1/x2 +………. + 1/xi + ……..+1/xn)
1/H = (∑ 1/xi) / n avec H = moyenne harmonique simple
Si les xi sont groupés, la moyenne harmonique pondérée s écrit :
1/H = [(n1/ x1) + (n2/x2) + …….+ (ni/xi) + …..+ (nn/xn)] / (n1 + n2 +……….+ ni +…….+ nn)
1/H = (∑ (ni/xi)) / ∑ni
2) Application :
OFPPT-DRIF-CDCGC STATISTIQUE PAGE24
xi ni 1 / xi ni(1/xi)
2 1 0,5 0,5
6 2 0,166 0,332
10 3 0,10 0,3
12 2 0,083 0,166
total 8 1,298
1/H = (∑ (ni/xi)) / ∑ni donc 1/H = 1,298 / 8 === > H = 8 / 1,298 = 6,16
D) La moyenne quadratique :
1) Définition :
Etant donné n observations : x1, x2, ….xi, … xn connues individuellement (une par une), on appelle
moyenne quadratique la quantité Q tel que :
Q2= (1/n) * [(x12 + x22 +……….xi2 +……..+ xn2)]
Q2 = (∑ni2) / n moyenne quadratique simple
Si les xi sont groupés, la moyenne quadratique pondérée s’écrit :
Q2 = (n1 x12+ n2x22 +……….+ ni xi2 +……..+ nnxn2) /( n1 + n2+……….+ni,+…….+nn)
Q2 = [∑ (ni xI2)] / ∑ni
2) Application :
xi ni xi2 ni xi2
2 1 4 4
6 2 36 72
10 3 100 300
12 2 144 288
total 8 664
Q2 = [∑ (ni xI2)] / ∑ni = 664/ 8 = 83 == Q= √83 = 9,11
E) Conclusion :
1) Rappel de moyennes :
Moyenne arithmétique : x = ∑nixi / ∑ni
Moyenne géométrique : Log G = ∑ (ni log xi)/ ∑ ni
Le logarithme de la moyenne géométrique est égal à la moyenne arithmétique des log
Moyenne harmonique : 1/H = (∑ (ni/xi)) / ∑ni
L’inverse de la moyenne est égal à la moyenne des inverses.
20 Me Me = (5 * 7/20) + 20
20 Me 25
Représentation graphique :
ni
80 -
70 -
60 -
50 -
40 -
20 -
10 -
0
10 15 20 Me 25 30 xi
Salaire Effectif
10-15 9 Classe modale : 20-25
15-20 25 MO = 22,5
20-25 32
25-30 16
Total 82
On peut chercher à approcher davantage la valeur du mode, plusieurs procédés peuvent être utilisés :
B-1) Détermination graphique du mode :
On trace l histogramme pour repérer le mode.
Représentation graphique :
ni
40 -
i
10 -
0 -
10 15 20 Mo 25 30 xi
Mo = 21,5
Remarque : Ne pas oublier de corriger les effectifs lorsque les classes ne sont pas égales.
B-1) Détermination algébrique du mode :
Cette méthode consiste a utiliser la formule suivante : Mo= L1 +[ [d1 / (d1+d2)] * i]
La connaissance des valeurs centrales ne nous renseigne pas sur la structure interne d’une série.
Exemple :
Série 1 : 38 39 40 41 42
Série 2 : 30 35 40 45 50
Série 3 : 1 1 1 1 196
Nous avons la même moyenne x‾ = 40 alors que les séries sont très différentes.
Il nous faut un indicateur de la dispersion des valeurs de la série. Cet indicateur est appelé « Caractéristique
de dispersion ».
I : L’INTERVALLE DE VARIATION :
L’intervalle de variation est la différence entre la plus grande valeur et la petite valeur de la série.
Exemple : 50 58 67 80 Intervalle de variation = 80 – 50 = 30
L’intervalle de variation est insuffisant pour nous informer sur la dispersion, surtout lorsque les valeurs
extrêmes sont Aberrantes (extravagantes).
Exemple : 18 20 20 21 …………………..22 Intervalle de variation = 22 – 18 = 4
18 20 20 21 …………… 22…70 Intervalle de variation = 70 – 18 = 52
II : L’ECART INTERQUARTILES :
A) Définition :
On appelle 1er quartile, que l’on note Q1, la valeur du caractère tel que 25 % des observations lui sont
inférieures, 75% des observations lui sont supérieures.
Q2 = Me
On appelle 3ème quartile que l’on note Q3, la valeur du caractère tel que 75% des observations lui sont
inferieures et 25% lui sont supérieures.
OFPPT-DRIF-CDCGC STATISTIQUE PAGE30
L’écart interquartile = Q3 – Q1
Application :
Salaires ni ni cumulés croissants
10-15 9 9
15-20 25 34
20-25 32 66
25-30 16 82
Total 82
Rang de Q1 = 82 /4 = 20,5
Classe de Q1 : 15-20
Interpolation : 25 5
1 5/25
(20,5 - 9) = 11,5 Q1 = 15+ [(5/25) * 11,5] = 17,3 DH
Ou bien :
(20,5 – 9) / (34 – 9) = (Q1 – 15) / (20-15) Q1 = 17,3 DH
Rang de Q3 = 82 * 3 / 4 = 61,5
Classe de Q3 : 20 – 25
Interpolation : 32 5
1 5/32
(61,5 - 34) = 27,5 Q3 = 20 + [(5/25) * 27,5] = 24,3 DH
Ou bien :
(61,5 – 34) / (66 – 34) = (Q3 – 20) / (25-20) Q3 = 24,3 DH
Q3 - Q1 = 24,3 - 17,3 = 7
Signification : Q3 - Q1 = 7 signifie que pour 50% des observations (salariés), l’écart maximum de salaires
entre les salaries est égal a 7.
Remarque : L’écart interquartile a l’inconvénient de ne tenir compte que de 50% des observations d’où l’idée
de calculer des intervalles (des écarts) inter-déciles ou inter- percentiles :
1) Ecart inter-déciles :
On appelle 1er décile « d1 », la valeur du caractère tel que 10 % des observations lui sont inférieures et 90 %
lui sont supérieures.
On appelle 9ème décile « d9 », la valeur du caractère tel que 90 % des observations lui sont inférieures et 10
% lui sont supérieures.
Remarque : d9 - d1 contient 80% des observations.
2) Ecart inter-percentiles :
On appelle 1er percentile « P1 », la valeur du caractère tel que 1 % des observations lui sont inférieures et 99
% lui sont supérieures.
Pour supprimer les valeurs aberrantes, il suffit de considérer l’intervalle inter-percentile :
OFPPT-DRIF-CDCGC STATISTIQUE PAGE31
P93 – P07
δ = √33,17 = 5,7 kg
Surface yi Effectif ni
10-30 4 Cette distribution est appelée distribution marginale de y,
30-50 16 dont on peut calculer la moyenne (la surface moyenne des
50-70 20 logements) appelée moyenne marginale de y et notée y̿.
70-90 17
total 57
Qté
100 - Nuage de points
90 -
x
80 -
x
70 -
x
60 - x
x
50 -
x
40 -
30 -
20 -
10 -
0 -
70 75 80 85 90 95 Prix
Graduation
non respectée
Parmi les méthodes de régression les plus simples, on trouve la méthode des moindres carrés.
Remarques :
On estime qu’une corrélation est satisfaisante lorsque r ≥ 0,87
On estime qu’une corrélation est parfaite lorsque r ≥ 0,96
Quand on écrit que r 2 = a * a’ et donc que r =√𝑎 ∗ 𝑎′ qui est toujours positif, on ne peut rien dire du
sens de la corrélation. Pour savoir si une corrélation est positive ou négative on regarde le signe de a *
a’ :
Si a et a’ sont > 0 a * a’ > 0 Corrélation positive
Si a et a, sont < 0 a * a’ < 0 Corrélation négative
Application :
Prix xi Quantité yi xi - x‾ yi - y‾ (xi - x‾) * (yi - y‾) (xi - x‾) 2 (yi - y‾) 2
70 42 -10 -20 200 100 400
75 51 -5 -11 55 25 121
77 60 -3 -2 6 9 4
80 62 0 0 0 0 0
86 74 6 12 72 36 144
93 83 13 21 273 109 441
481 372 606 339 1 110
x‾ = 481 / 6 = 80 y‾ = 372 / 6 = 62
OFPPT-DRIF-CDCGC STATISTIQUE PAGE40
a = 606 / 339 = 1,79 a’ = 606 / 1 110 = 0,55
r2 = (606 / 339) * (606 / 1 110) d’où r = 0,98 Corrélation parfaite.
xi yi xi yi xi2 xi2
x‾ = ∑ 𝑥𝑖 / n y‾ = ∑ 𝑦𝑖 / n
Remarque :
On peut également écrire :
a = ∑ [(xi - x‾) * (yi - y‾)] / ∑ (xi - x‾) 2 ce qui correspond à
Covariance de (X, Y) / Variance de (X) Cov (X, Y) / Var (X)
En effet, Cov (X, Y) = 1/n * ∑ [(xi - x‾) * (yi - y‾)]
Et Var (X) = 1/n * ∑ (xi - x‾) 2
a = Cov (X, Y) / Var (X)
Séquence 5 : - 2 heures
Elaboration du Présenter la méthode d’élaboration des rapports
rapport
20 heures
Sphinx est un logiciel de traitement d’enquête qui propose un ensemble d’outils de conception de
questionnaires, de collecte, de partage et d’analyse de données.
Il assiste ses utilisateurs dans chacune des quatre grandes étapes de réalisation d'une enquête :
La réalisation du questionnaire (création, rédaction, impression)
La saisie des réponses
Les traitements quantitatifs des données et l'analyse des données qualitatives
La rédaction du rapport d'étude
Choisissez « Plus² »,
Puis, cliquez sur « Ok ».
Il est possible
d'enrichir la
bibliothèque à partir
de ses propres
questions.
Si vous voulez associer une question texte "Autre, préciser", cochez la case « Associer une question
ouverte texte ‘Autre, préciser’ ».
N. B. : Attention, il faut ajouter la modalité Autre avant d’activer l’option.
Si on valide par «Ok », l’écran suivant est obtenu :
Cliquez sur Menu « Rédiger », puis cliquez sur « Nouveau groupe de questions »
Après validation par « OK », les questions apparaissent groupées. Le groupe est matérialisé par le trait bleu
reliant l’ensemble des questions du groupe ;
Lors de l’établissement du formulaire, les questions apparaîtront dans un seul tableau.
Présentation du
questionnaire sur
plusieurs colonnes ;
Contenu de l’en-tête du
questionnaire ;
Numérotation des
questions et des
modalités de réponses ;
Choix des polices pour
chaque partie du
questionnaire, etc.
Etape n° 2 :
Etape n° 3 :
Etape n° 4 :
Etape n° 5 :
Etape n° 6 :
Cliquez sur Menu « Fichier », puis cliquez sur « Publier l’enquête sur Internet »
Cliquez sur :
« Suivant »
Etape n° 9 :
N. B. :
Serveur : Sphinx Online
Cliquez sur :
« Terminer »
Depuis l’écran central, se placer au stade «Collecte des réponses » ; ou «Saisie rapide». En effet, le mode de
saisie par défaut est le « mode rapide ».
Dans notre exemple, on ne veut pas ajouter une sixième observation avec des non-réponses, donc on clique
sur « Non ».
2. Saisie Directe :
Tableaux à plats :
Strates :
Définition :
Un questionnaire est soumis à un ensemble d’individus.
La strate est une partie de cet ensemble qui présente un certain profil.
Si l’on revient sur l’écran central et on clique sur « Tableaux croisés », la fenêtre suivante est ouverte :
Tableau croisé
Corrélation :
OFPPT-DRIF-CDCGC STATISTIQUE PAGE78
La Corrélation du menu « Analyser » permet d’étudier les relations entre deux variables numériques et
de rechercher s’il existe une relation mathématique entre celles-ci.
On valide par
« Ok ».
2. Méthode :
Choisissez le bouton
« Tableau Word »,
Validez par le bouton
Ok.