Académique Documents
Professionnel Documents
Culture Documents
UNIVARIEE
M. TALNAN Hongwopena Evrard
LICENCE 1 SEA ET SEG
UIST
Année académique : 2022-2023
OBJECTIFS
Une variable quantitative continue est une variable dont les valeurs
appartiennent à un intervalle numérique.
• Exemple: Les variables « longueur », « volume » et « masse ».
Une variable quantitative continue est habituellement associée à l’idée de
mesure et à un système abstrait d’unités fractionnables.
il est possible d’augmenter à l’infini la précision de la mesure.
EXERCICE D’APPLICATION
• indiquez si les variables suivantes sont qualitatives ou quantitatives
(discrètes ou continues).
a) Le nombre de spectateurs au dernier match de hockey du Canadien de
Montréal.
b) Le métier d’une personne.
c) L’origine ethnique d’une personne.
d) L’année de naissance d’un ivoirien.
e) Le poids d’un nouveau-né.
f) La satisfaction à l’égard du gouvernement exprimée sur une échelle
variant de 1 à 5.
g) La température maximale de la journée.
h) La langue parlée à la maison.
Les échelles de mesure
Afin de décrire le phénomène à l’étude, il importe de bien le mesurer.
• Échelle de mesure : est l’ensemble des modalités ou des valeurs que peut
prendre une variable.
• Échelle de mesure nominale : est échelle de mesure formée par les
modalités d’une variable qualitative dans le cas où elles sont déterminées
par une propriété.
• Les différentes modalités qui composent l’échelle de mesure doivent respecter deux
critères de base. Il faut qu’elles soient exhaustives, c’est-à-dire qu’elles représentent
toutes les catégories que peut prendre la variable. Elles doivent aussi être
mutuellement exclusives, ce qui signifie qu’aucune des données ne peut être placée
dans plus d’une modalité.
Les échelles de mesure
• Exemple : Les modalités de la variable qualitative « sexe » {masculin,
féminin} ou de la variable « situation familiale » {marié(e), conjoint(e)
de fait, divorcé(e), séparé(e) de fait, célibataire, veuf(ve), religieux(se)}
sont associées à des échelles de mesure nominale.
• Échelle de mesure ordinale est une échelle de mesure formée par les
modalités d’une variable dans le cas où elles sont ordon- nées selon un
critère.
• Exemple : Quel est le plus haut niveau de scolarité complété par ta mère ?
• Aucun
• Primaire
• Secondaire
• Universitaire
• Je ne sais pas
Les échelles de mesure
• Une échelle de mesure d’intervalles indique, sur une échelle abstraite
(comme l’échelle Celsius), la distance (ou l’intervalle) entre la position
d’une unité statistique et la position attribuée arbitrairement à la valeur
zéro. Cette dernière est appelée zéro arbitraire (ou relatif).
• Exemple : Température, l’année de naissance, le quotient intellectuel
(QI), le niveau de la mer en altitude et la longitude d’une ville sont
d’autres exemples de variables quantitatives auxquelles on associe une
échelle de mesure d’intervalles.
Les échelles de mesure
• Une échelle de mesure de rapports (ou proportionnelle) : représente des
mesures en unités de base et la valeur zéro indique l’absence de la
caractéristique étudiée. la valeur zéro est considérée comme le zéro
absolu.
• Zéro absolu est la Valeur correspondant à l’absence de la
caractéristique étudiée
• Exemple: revenu annuel; le nombre d’échecs d’un étudiant
Exercice d’application
Tableau 1 : Répartition des 300 étudiants de UIST, selon leur revenu, 2022
Variables (avec
les unités) Tranche de revenu (en FCFA) Nombre d’étudiants
Moins de 20000 100
Modalités, 20000 à 29999 50
valeurs ou
classes 30000 et plus 150
Total 300
4%
22%
Chabriolet, deux places
41%
Petites quatre places
Cinq places
Modèle de Luxe
33%
LIRE ET DÉCRIRE UN TABLEAU ET UN GRAPHIQUE
• Les étapes qui suivent ont pour but de faciliter la lecture et
l’interprétation d’un tableau statistique ou d’un graphique.
• Étape 1 Identifiez la population à l’étude. L’information est présentée
directement dans le titre du tableau ou du graphique.
• Étape 2 Identifiez la variable présentée dans le tableau ou dans le
graphique (avec l’unité de mesure). L’identification de la variable et de
ses modalités, valeurs ou classes se fait en lisant les lignes de la
première colonne du tableau ou, généralement, l’axe horizontal du
graphique.
LIRE ET DÉCRIRE UN TABLEAU ET UN GRAPHIQUE
• Étape 3 Identifiez les fréquences des données (avec l’unité de
mesure). Les fréquences sont présentées dans la deuxième et la
troisième colonne (%) du tableau ou, généralement, sur l’axe vertical
du graphique.
• Étape 4 Décrivez les résultats en débutant toujours par le général (le
total), pour ensuite vous concentrer sur le particulier, c’est-à-dire sur
les données les plus significatives (celles qui font ressortir l’essentiel
de l’étude). Le but est de mettre en lumière les informations les plus
pertinentes pour bien faire saisir le phénomène à l’étude.
LE TRAITEMENT D’UNE VARIABLE QUALITATIVE
Faible 3 30
Moyen 3 30
Elevé 4 40
Total 10 100
𝑛
𝐷𝑒𝑔𝑟é = 𝑖 × 360𝑜
𝑛
4
𝑀= × 360𝑂 = 144𝑜
10
6
𝐹= × 360𝑂 = 216𝑜
10
4
𝑓𝑀 = × 100 = 40%
10
6
𝑓𝐹 = × 100 = 60%
10
Exemple de diagramme circulaire
Fig : Repartition des étudiants selon le sexe
40%
M
F
60%
M
4
0 1 2 3 4 5 6 7
Effectif
40
35
30
25
20
15
10
0
0 1 2 3 4
Effectif
Polygone de fréquence
Diagramme intégral
EXERCICE D’APPLICATION
Au cours d’une enquête sociologique sur l’itinérance, on a demandé à des
itinérants hébergés dans une ressource d’aide d’indiquer le nombre de fois
où ils ont fait appel à ce type de ressource d’hébergement dans la
dernière année. Le tableau suivant résume les réponses des 50 itinérants
interrogés.
2 4 3 1 3 7 2 4 1 3
3 7 4 5 4 4 5 5 4 4
1 5 3 4 2 5 4 6 3 2
2 2 4 3 4 6 3 2 5 4
4 4 5 5 3 4 6 4 6 3
EXERCICE D’APPLICATION
• a) Construisez un tableau de distribution des fréquences de la
variable « nombre d’hébergements dans une ressource d’aide par
année ».
• b) À partir du tableau construit en a), tracez un diagramme à bâtons
et interprétez-le.
Les données groupées en classes
• Si le nombre de valeurs différentes de la variable est proche de N ou n (et
que N ou n ≥ 20), alors on groupe les données en classes.
• Dans le cas d’une variable qui prend un nombre relativement élevé de
valeurs, un tableau de distribution des fréquences des valeurs isolées est
inutile, car il comportera un grand nombre de lignes et à peu près toutes
les fréquences seront égales à 1.
• Pour obtenir une synthèse valable de l’information fournie par les
données brutes et un portrait clair et significatif de la distribution des
fréquences, on groupe les données en classes.
• Classe : Intervalle compris entre deux valeurs de la variable étudiée.
Les données groupées en classes: construction
de classes
• La construction de classes peut se faire suivant les étapes ci-après:
• Etape 1: Calculez l’étendue des données.
• L’étendue, symbolisée par E, est la différence entre la plus grande et
la plus petite valeur d’une série statistique: 𝑬 = 𝒙𝒎𝒂𝒙 − 𝒙𝒎𝒊𝒏
• Étape 2 Choisissez le nombre théorique de classes
• On choisit un nombre théorique de classes situé entre 5 et 12 à l’aide
de la table de Sturges. Le nombre de classes, noté k, dépend du
nombre d’unités statistiques à distribuer (c’est-à-dire de N ou n).
Les données groupées en classes: Table de sturges
Nombre d’unités statistiques (N ou n) Nombre approximatif
(k) de classes
Moins de 23 5
De 23 à 45 6
De 46 à 90 7
De 91 à 180 8
De 181 à 361 9
De 362 à 723 10
De 724 à 1 447 11
De 1 448 à 2 895 12
LES DONNÉES GROUPÉES EN CLASSES
• On peut utiliser la formule de Sturges : 𝒌 = 𝟏 + 𝟑, 𝟑𝟐𝒍𝒐𝒈(𝒏)
• Étape 3 Déterminez l’amplitude de chaque classe.
• L’amplitude des classes est approximativement égale à l’étendue
divisée par le nombre de classes (déterminé à l’étape 2 au moyen de
la table de Sturges):
𝑬
𝒂=
𝒌
• Il est habituellement nécessaire de procéder à des ajustements,
puisque le nombre de classes trouvé à l’étape 2, qui est théorique,
peut être modifié en fonction du contexte de l’étude.
Les données groupées en classes
• Il est préférable que l’amplitude soit un multiple de 2, 5, 10, 25, 50,
100 ou 1 000, car cela améliore la lisibilité du tableau de distribution.
• Étape 4 Définissez les classes.
• Il faut d’abord définir la borne inférieure de la première classe (de
manière que celle-ci inclue la plus petite donnée, en tenant compte
de l’amplitude des classes déterminées à l’étape 3), puis toutes les
autres classes (en s’assurant naturellement que la dernière donnée
appartient à la dernière classe)
La notation des classes
• Il existe diverses notations pour désigner un intervalle semi-ouvert,
c’est-à-dire un intervalle fermé à gauche (la borne de gauche est
incluse) et ouvert à droite (la borne de droite est exclue).
[60, 65[
60 ≤ x < 65
60 – 65
60 à moins de 65
• Étape 2 Sur l’axe vertical, notez les fréquences relatives cumulées à l’aide d’une échelle appropriée. En fait, il est
généralement avantageux d’utiliser les pourcentages, car ainsi, l’échelle est toujours graduée de 0 % à 100 % ; dans le cas des
• Étape 3 Sur l’axe horizontal, placez un premier point dont l’abscisse est la borne inférieure de la première classe du tableau de
distribution et dont l’ordon- née est le pourcentage 0 % ou la fréquence zéro. Le premier point du graphique se situe toujours
• Étape 4 Pour chacune des classes, placez un point dont l’abscisse est la borne supérieure de la classe et l’ordonnée, la
• Étape 5 Joignez tous les points par une ligne brisée qui va de la borne inférieure de la première classe, sur l’axe horizontal, au
point dont l’abscisse est la borne supérieure de la dernière classe et l’ordonnée, le pourcentage 100 % ou la fréquence N ou n.
VARIABLE CONTINUE : DIAGRAMME INTÉGRAL
La série chronologique
900
800
700
600
500
400
300
200
100
0
2017 2018 2019 2020 2021 2022 2023
Nombre d'étudiant
Le diagramme à rectangles
900
800
700
600
500
400
300
200
100
0
2017 2018 2019 2020 2021 2022 2023
Nombre d'étudiants
CHAPITRE III : MESURES RELATIVES
On utilise les notations suivantes :
• X ou Y (lettre majuscule) pour désigner une variable quelconque ;
• Δ (delta) pour désigner une variation.
Le rapport sous toutes ses formes
• La moyenne
• Le mode
• La médiane
Faible 10 25
Moyen 10 25
Élevé Mode 20 50
Total 40 100
LE MODE D’UNE VARIABLE QUANTITATIVE
• Considérons les données sur l’âge des huit étudiants d’une classe de
statistique:
• 16, 17, 17, 17, 18, 18, 18, 31
• Dans cette série, il y a deux modes : « 17 » et « 18 », car ces deux
valeurs reviennent trois fois, alors que chacune des autres valeurs
n’apparaît qu’une seule fois.
• Interprétation des résultats:
• Les âges les plus courants parmi les huit étudiants de la classe de
statistique sont 17 ans et 18 ans.
LE CAS DE DONNÉES GROUPÉES PAR VALEURS
• Dans le cas de données groupées par valeurs, la définition est tout aussi
simple :
• le mode est la valeur ayant la fréquence (ou le pourcentage) la plus
élevée dans le tableau de distribution.
Exemple
Nombre d’enfants à charge Effectifs employés
0 4
1 15
2 29
3 18
4 10
5 3
6 1
ICI, L’effectif le plus élevé est 29. il correspond à la modalité 2 enfants à charges. Donc le mode de
cette série est 2 enfant à charge.
DONNEES GROUPEES EN CLASSE : VARIABLE
CONTINUE
• Le cas de données groupées en classes est particulier, car on perd de
vue les données isolées.
• Il est donc impossible de déterminer la valeur unique la plus
fréquente.
• Par contre, on reconnaît facilement la classe (ou l’ensemble de
valeurs) la plus fréquente, qu’on appelle classe modale.
DONNEES GROUPEES EN CLASSE : VARIABLE
CONTINUE
• Cas ou les amplitude sont égale :
Salaire (en dizaines de milliers de FCFA) Effectif (𝒏𝒊 )
[8;12[ 18
[12;16[ 24
[16;20[ 28
[20;24[ 14
[24;28[ 6
Total 90
Ici, l’effectif le plus élevé est 28. il correspond à la classe modale [16;20[. Donc le mode de cette
16+20
série est 𝑀𝑜 = = 18
2
DONNEES GROUPEES EN CLASSE : VARIABLE
CONTINUE
• Cas ou les amplitudes ne sont pas égale: il faut corriger les effectifs
avant de déterminer le mode.
Durée Effectif Amplitude Effectif corrigé
[0; 4[ 40
[4; 8[ 80
[8;12[ 160
[12;20[ 200
[20;28[ 140
Calcul du mode
• Pour avoir une valeur du mode on utilise la formule suivante :
𝑑1
• 𝑀𝑂 = 𝑥𝑚 + 𝑑 +𝑑 × 𝑎𝑚
1 2
• Avec
𝑥𝑚 = 𝑙𝑖𝑚𝑖𝑡𝑒 𝑖𝑛𝑓é𝑟𝑖𝑒𝑢𝑟 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑠𝑒 𝑚𝑜𝑑𝑎𝑙𝑒
𝑎𝑚 : 𝑎𝑚𝑝𝑙𝑖𝑡𝑢𝑑𝑒 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑠𝑒 𝑚𝑜𝑑𝑎𝑙𝑒
𝑑1 : 𝑙𝑎 𝑑𝑖𝑓𝑓é𝑟𝑒𝑛𝑐𝑒 𝑒𝑛𝑡𝑟𝑒 𝑙𝑒𝑠 𝑒𝑓𝑓𝑒𝑐𝑡𝑖𝑓 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑠𝑒 𝑚𝑜𝑑𝑎𝑙𝑒 𝑒𝑡 𝑙′ 𝑒𝑓𝑓𝑒𝑐𝑡𝑖𝑓 𝑑𝑒 𝑙𝑎 𝑐𝑙𝑎𝑠𝑠𝑒 𝑝𝑟é𝑐é𝑑𝑒𝑛𝑡𝑒
• Le premier quartile, noté Q1, est une valeur de la série; telle que 25 % au
moins des valeurs de la série sont inférieures ou égales à Q1; et telle que
75% au moins des valeurs de la série sont supérieures ou égales à Q1.
• Le troisième quartile, noté Q3, est : une valeur de la série; telle que 75%
au moins des valeurs de la série sont inférieures ou égales à Q3; et telle
que 25% au moins des valeurs de la série sont supérieures ou égales à Q3.
LES QUARTILES
LES QUARTILES (cas de regroupement en
classes)
𝑁
𝑄1 −𝑁𝑖−1 𝑄1
• 𝑄1 = 𝑒𝑖−1 + 4
𝑄 × 𝑎𝑖
𝑛𝑖 1
3𝑁
𝑄3 −𝑁𝑖−1 𝑄3
• 𝑄3 = 𝑒𝑖−1 + 4
𝑄 × 𝑎𝑖
𝑛𝑖 3
CHAPITRE V MESURE DE DISPERSION
• Pourquoi les mesures de dispersion ?
• L’étendue
• La variance et l’écart type
• Le coefficient de variation
• La comparaison des mesures de dispersion
Pourquoi les mesures de dispersion ?
17 3 50
18 3 50
Total 6 100
• Elle est due à JW. Tukey et est appelée « box plot » en anglais
DIAGRAMME À MOUSTACHE
• Une boîte avec des "pattes" courtes indique que la série est assez
concentrée autour de sa médiane. Au contraire des "pattes" longues
indique que la série est assez dispersée.
• Le graphique est parfois fait en dessinant des pattes correspondant
au 1er et au 99ème centile, ou même aux valeurs extrêmes
VALEURS ABERRANTES
DIAGRAMME À MOUSTACHE
• Il est utilisé principalement pour comparer un même caractère dans
deux populations de tailles différentes.
Exercice d’application
• 95 ; 97 ; 100 ; 103 ; 105
• 50; 75; 100 ; 125 ; 150
1. Calculer la variance
2. Calculer l’écart-type
3. Calculer le coefficient de variation et interpréter le résultat
CHAPITRE VI MESURES DE FORME
• Mesure de l’asymétrie Les courbes suivantes donnent une idée sur la
forme d’une distribution de données:
MESURE DE L’ASYMÉTRIE
• Certains coefficients (indices) permettent de situer la distribution
dans un des trois cas précédents:
MESURE DE L’ASYMÉTRIE
2. Coefficient de Pearson:
CHAPITRE VII: LES MESURES DE POSITION
• Les quantiles
• Le rang
• La cote Z
Les mesures de position
• Mesure de position sert à trouver la position exacte d’une donnée
dans une série statistique provenant d’un échantillon ou d’une
population.
• Les mesures de position n’ont pas de sens pour les variables
qualitatives. C’est pourquoi elles ne sont généralement définies que
pour les variables quantitatives.
Les quantiles
• Les quantiles sont des mesures de position servant à partager une
distribution ordonnée en un nombre quelconque de parties
sensiblement égales.
• Il existe plusieurs quantiles, chacun étant défini en fonction du nombre
de sous-groupes à diviser.
• Chaque quantile correspond à une valeur à laquelle une proportion de
données lui est inférieure.
• Ces valeurs déterminent le partage de la distribution des fréquences
en cent, dix, cinq ou quatre parties égales et s’appellent
respectivement centiles, déciles, quintiles et quartiles.
Les centiles
• Les centiles (Cα) sont des valeurs qui divisent une distribution de
fréquences en 100 tranches égales notées de C1 à C99.
• Par exemple, le 32e centile, noté C32, est la valeur à laquelle 32 % des
données sont inférieures ou égales et, par conséquent, 68 % des
données sont supérieures. Dans un polygone de fréquences, l’aire
sous la courbe à gauche de C32 représente 32 % de l’aire totale, alors
que l’aire sous la courbe à droite de C32 représente 68 % de l’aire
totale.
• En général, le centile d’ordre α, noté Cα, est la valeur à laquelle α %
des données sont inférieures.
Les étapes suivantes résument comment évaluer un centile à partir
d’un tableau de fréquences groupées par classes
• Il existe une autre définition du rang d’une donnée dans une série
statistique : c’est le rang cinquième (R5(x)).
• Pour calculer cette mesure, on divise l’ensemble des données en cinq
parties égales, chacune étant constituée de 20 % des données.
• On attribue aux données, placées en ordre croissant comme pour le
calcul du rang centile, un rang de 5 à 1, selon la partie à laquelle elles
appartiennent.
• Un rang cinquième de 1 signifie que la donnée appartient au peloton de
tête, qui correspond aux premiers 20 % des données. Un rang cinquième
de 2 signifie que la donnée concernée se trouve dans le deuxième
groupe de données, c’est-à-dire dans les meilleurs 40 % des données,
mais pas dans les premiers 20 %. Il en est de même pour les rangs 3, 4 et
5, ce dernier étant considéré comme le peloton de queue.
L’interprétation des notions de rang
• Le rang brut : Dans le cas du rang brut, on regarde en avant. Un rang brut
de 3 signifie que la valeur examinée est la troisième à partir du début de la
série statistique. Par exemple, le troisième coureur d’un ensemble de
concurrents est celui qui a le troisième meilleur temps.
• Le rang cinquième : Dans le cas du rang cinquième, on regarde aussi en
avant. Lors d’un marathon, les coureurs de rang cinquième 1 font partie
des 20 % qui sont les premiers à atteindre la ligne d’arrivée. Ainsi, plus le
rang brut ou le rang cinquième d’un coureur est élevé, plus celui-ci s’est
mal classé lors de la compétition.
• Le rang centile : Dans le cas du rang centile, on regarde en arrière, c’est-à-
dire vers la fin de la série statistique. Si un étudiant a un rang centile de 68
lors d’un examen, cela signifie que 68 % de l’ensemble des étudiants ont
moins bien réussi que lui. Plus les étudiants soumis à cet examen ont un
rang centile élevé, meilleure est leur performance par rapport au groupe.
La cote Z
• Si on veut établir une comparaison valable, il faut employer une
échelle de mesure commune, c’est-à-dire déterminer une moyenne et
un écart type qui soient les mêmes pour tous.
• On peut effectuer un changement d’échelle de mesure en centrant et
en réduisant la distribution de fréquences.
• Centrer une distribution consiste à en ramener la moyenne à 0 ;
réduire une distribution consiste à en ramener l’écart type à 1.
• Ainsi, on transforme chaque donnée d’une série statistique en cote Z
(z), c’est-à-dire une valeur à échelle commune qui exprime sa distance
avec la moyenne en nombre d’écarts types.
La côte Z
• En ne comportant pas d’unité de mesure, la cote Z permet de situer
précisément une donnée par rapport aux autres données de séries
statistiques différentes.
• Si l’on désigne par 𝑥 la valeur d’une donnée, μ 𝑙𝑎 moyenne de la
population et 𝜎 l’écart type, la formule de la cote Z, notée z, s’écrit comme
suit :
𝑥−𝜇
•𝑧= 𝜎
• Soulignons que dans le cas d’un échantillon, la cote Z est définie par la
formule suivante :
𝑥−𝑥
•𝑧= 𝑠
• 𝑥 et 𝑠 désignent respectivement la moyenne et l’écart type de l’échantillon.
FIN