Académique Documents
Professionnel Documents
Culture Documents
K. DJAGOURI
1
Objectif général
Ce cours vise à fournir aux auditeurs des outils et méthodes de base pour construire,
exploiter, interpréter, critiquer des données statistiques en communication
Objectifs spécifiques
A la fin de cette unité d’enseignement l’étudiant devra être capable de:
– Donner la définition de concepts fondamentaux du vocabulaire de la
statistique
– Faire la saisie des données
– Faire le tri à plat des données brutes collectées lors d’une enquête
– Construire le tableau de distribution d’une série statistique
– Construire la représentation graphique appropriée à une série
statistique
– Analyser des données représentées dans un tableau ou sur un
graphique
– Donner la définition de chacun des paramètres de positions d’une
série statistique
– Calculer les paramètres d’une série statistique
– Interpréter les valeurs des paramètres d’une distribution statistique
en éducation
– Utiliser ces paramètres pour analyser les données
Plan du cours :
Le plan du cours découle des objectifs précédents
• GÉNÉRALITÉS ET DÉFINITIONS
• DENOMBREMENT ET REPRESENTATION GRAPHIQUE D'UN CARACTERE
• CARACTÉRISTIQUES D’UNE SÉRIE STATISTIQUE
- LES PARAMETRES DE TENDANCE CENTRALE
– LES PARAMÈTRES DE POSITION
– LES PARAMÈTRES DE FORME
– LES PARAMÈTRES DE DISPERSION
2
CHAPITRE 1 : DEFINITIONS ET TERMINOLOGIE.
b) L’inférence statistique est la méthode statistique par laquelle il est possible de déduire
les caractéristiques quantitatives de toute une population à partir de leur étude dans un
échantillon issu de celle-ci. Elle nécessite des méthodes d’échantillonnage et suppose
un modèle probabiliste sur la population.
Elle a pour objectifs entre autres de :
3
2) Définition de quelques termes usuels en statistique
Remarque: La statistique traite des propriétés des populations plus que des individus
particuliers de ces populations.
Recensement
C’est l’étude de tous les individus d’une population. Difficile en pratique lorsque les
populations sont grandes pour des questions de coût et de temps.
Sondage.
C’est le recueil d’une partie de la population c’est-à-dire l’échantillon. Le recueil d’un
échantillon à partir de la population initiale se fait par des techniques statistiques,
appelées méthodes d’échantillonnage.
4
Les principales composantes de l’approche statistique
L’estimation
L’inférence
statistique
A une variable
Pour déduire (ou plus précisément inférer) Ils permettent, par une prédiction, si
les caractéristiques d’une population, ou Les tests d’hypothèses une supposition faite au sujet d’un
confirmer des suppositions à son sujet, à paramètre est contredite par les
partir de l’étude d’un échantillon statistiques mesurées sur un
échantillon choisi au hasard
5
Exemple :
En période électorale, on interroge 1 000 personnes sur leur intention de vote. A partir des résultats
obtenus sur cet échantillon, on prévoit, avec une certaine précision, le comportement de l’ensemble
des électeurs (population mère) et par la même, le résultat des élections. C’est ce qu’on appelle
l’inférence statistique et c’est le principe même du sondage d’opinion par exemple.
6
Le lien de complémentarité entre statistique d’inférence et statistique descriptive est évident.
Référence : document tiré du cours de statistique du prof. Marie – Hélène de Marceau.
Une variable est la caractéristique que l’on veut étudier et pour laquelle on cherche des
données. Ainsi, l’âge, le niveau de scolarité, la note obtenue à un examen, le revenu
annuel d’un ménage sont autant de variables.
les données seraient les valeurs particulières que prennent ces variables pour chaque
individu.
Les différents états possibles dans lesquels peuvent se trouver une variable sont
appelés ses modalités. Par exemple la variable niveau d’étude a pour modalités niveau
primaire, niveau secondaire, niveau supérieur.
Une variable est dite qualitative lorsque les données qui s’y rapportent sont des
qualités ou des attributs non mesurées par des nombres. Elle est dite non numérique.
Une variable qualitative est dite nominale si aucun lien de hiérarchie ne peut être établi
entre ses modalités ; dans le cas contraire elle est dite ordinale.
7
Une variable est dite quantitative lorsque les données qui s’y rapportent sont le résultat
d’un décompte ou d’une mesure numérique, faisant appel aux propriétés arithmétiques
des nombres.
Une variable quantitative est dite discrète (ou discontinue) si elle ne peut
prendre aucune autre valeur entre deux valeurs consécutives. Généralement, ses
valeurs sont le résultat d’un décompte, elles sont donc connues avec exactitude
et sont souvent des entiers.
Une variable quantitative est dite continue si elle peut prendre une infinité de
valeurs entre deux valeurs proches. Ses valeurs sont souvent le résultat d’une
mesure relative à un étalon, sa valeur n’est donc pas connue avec exactitude,
c’est un nombre réel (entier ou décimal)
Remarque : données en coupe transversale et données temporelles.
Les données sont dites en coupes transversales si elles sont collectées au même
moment ou presque.
Si elles sont collectées sur des périodes différentes, elles sont dites temporelles.
8
La notion d’échelle de mesure
Pour noter une caractéristique quelconque, c’est-à-dire une donnée concernant une variable telle
que le revenu d’un individu, son âge, son lieu de résidence dans le cadre d’une enquête, on
utilise un système de notation déterminé au préalable avant de commencer la collecte
systématique des données. Ce système de notation est appelé échelle de mesure. Il existe
quatre types d’échelle de mesure : l’échelle nominale, l’échelle ordinale, l’échelle d’intervalle et
l’échelle de rapport.
10
11
Exercices 1
Parmi les exemples suivants, identifier les variables et dire si elles constituent dans le
contexte une variable dépendante ou indépendante :
a- Dans une étude, on recherche des données sur la nature des articles volés selon
l’emplacement du magasin.
b- Un chercheur en marketing veut vérifier si le groupe culturel a une influence sur le
moment où des enfants atteignent les différents stades de développement selon la
théorie de Piaget. Il fait passer quatre épreuves de Piaget à trois groupes d’enfants de
10 ans, d’ethnies différentes.
c- On veut mesurer l’effet de nouvelles méthodes de publicité sur les habitudes
vestimentaires des enfants.
12
Chapitre 2 : Organisation des données
Introduction.
Introduction
Supposons, par exemple, que pour évaluer l'opportunité d’ouvrir un centre d’exposition
d’articles de sport « aux perles grises », on procède à une enquête auprès d’un échantillon
aléatoire de 170 ménages du quartier. Un enquêteur se présente à chacun des ménages avec
un questionnaire contenant des questions comme :
Age……………………………… n
Sexe M………………………….F………………………….
Niveau d’étude : primaire……secondaire…………supérieur…………
Statut matrimonial : marié…célibataire…veuf…..divorcé….vivant maritalement.
Nombre d’enfant par ménage :…..
13
Chacune de ces questions correspond à une variable. Le résultat immédiat de cette enquête
est une pile de 170 fiches, chaque fiche renfermant par exemple 20 questions. On aura donc au
total 20*170 = 3400 données recueillies.
Comment traiter ces données pour les rendre plus intelligibles en vue d’une analyse ?
a- La saisie des données :
Elle consiste à transcrire les données dans un tableau. On construit ainsi un immense
tableau où chaque ligne représente un individu et chaque colonne une variable. Ce tableau est
dit tableau complet.
La présentation complète peut ainsi être la forme première de saisie et de stockage des
données (issues par exemple d'une enquête ou d'un travail de terrain ou les résultats d'une
étude statistique), soit sous forme papier soit sous forme informatique. Elle constitue la matrice
des données brutes.
b- Analyse uni-variée
Dans ce cas, le traitement statistique porte sur l’étude systématique des données relatives à
chaque variable, indépendamment de toutes les autres. C’est l’analyse unidimensionnelle ou
analyse uni-variée. Pour chaque variable du tableau complet, on réalise un tri à plat simple.
Cette opération consiste à associer à chaque modalité X i de la variable X choisie le nombre n i
d’individus ayant cette valeur ; ni est l’effectif ou la fréquence absolue de cette modalité.
L’ensemble des couples (Xi ; ni) forme une série statistique. Cette série peut être présentée
sous forme de tableau appelée tableau de répartition ou tableau de fréquences de la variable
X.
c- Analyse bivariée
C’est l’étude des données relatives à deux variables à la fois. Il s’agit par exemple de
rechercher une éventuelle association entre les variables prises deux à deux : c’est une
analyse bi-dimensionnelle ou bi-variée. Pour chaque couple de variable (X ; Y) on
réalise un tri-croisé. Les résultats de cette opération se présentent sous forme de tableau
appelé tableau croisé ou tableau de contingence.
d- Analyse multivariée
C’est l’étude des données relatives à plus de deux variables à la fois. Sur la recherche de
relations entre un grand nombre de variables prises simultanément : c’est l’analyse
multidimensionnelle ou multivariée. Ces traitements sont longs et complexes et supposent le
recours aux outils informatiques.
14
Exemple de matrice de données brute.
Matrice de données brutes issues d’une enquête auprès d’un échantillon aléatoire de 60 téléspectateurs d’une
télévision privée de la place.
IND VAR1 VAR2 VAR3 IND VAR1 VAR2 VAR3 IND VAR1 VAR2 VAR3
01 1 1 3 21 3 4 5 41 2 2 4
02 2 2 4 22 3 3 4 42 3 2 4
03 3 1 5 23 2 1 5 43 1 2 5
04 2 2 4 24 3 2 4 44 2 3 4
05 2 3 4 25 3 1 3 45 3 1 5
06 2 1 5 26 3 2 5 46 1 2 2
07 3 3 5 27 2 1 2 47 3 1 4
08 2 2 3 28 1 3 3 48 2 2 3
09 1 4 4 29 1 3 4 49 1 1 3
10 2 2 5 30 2 2 4 50 2 2 4
11 2 3 3 31 1 2 4 51 1 4 5
12 3 1 5 32 2 2 5 52 2 1 5
13 3 2 5 33 1 3 5 53 1 2 4
14 3 1 4 34 3 1 2 54 3 2 4
15 2 4 4 35 2 2 3 55 1 3 5
16 3 1 4 36 1 1 3 56 2 3 3
17 3 1 1 37 2 2 5 57 2 2 4
18 2 3 1 38 1 1 2 58 1 4 4
19 3 2 5 39 2 3 4 59 3 1 4
20 2 2 5 40 1 1 4 60 3 1 3
Var2 : profession : 1- cadre du privé ; 2- cadre de la fonction publique ; 3- emploi libéral ; 4- autres.
Var3 : appréciation de la qualité générale du service comparativement aux autres chaines privées :
1-mauvais ; 2- équivalent ; 3- bon ; 4- très bon ; 5- excellent
15
I- ANALYSE UNIVARIEE
N = Σ ni
16
B- Définition de quelques indicateurs
Les fréquences simples : elles peuvent être déterminées quel que soit la nature des données.
C’est l’effectif des données (ou le nombre d’individus) ayant pour valeur de la variable la valeur
xi. C’est une valeur observée.
Fréquences relatives
Proportion notée fi: elle indique le poids relatif, en terme numérique, de la modalité x i. Elle
indique aussi la probabilité d’observer la valeur xi du caractère X.
fi = n i / n
Les taux
17
Les taux sont une variété particulière de proportion. Il s’agit de proportion exprimée par
rapport à un nombre constant (1, 100, 1000,10000 etc.) et généralement construite pour
permettre des comparaisons dans le temps ou dans l’espace. Le dénominateur 1, 100,
1000,10000 etc. est choisi et convenu par des spécialistes pour permettre au
phénomène étudié d’être observable.
Les ratios
Le ratio exprime un poids relatif des effectifs d’une catégorie par rapport aux effectifs d’une
autre catégorie.
Exercice : Que signifie l’expression suivante : le ratio femmes / hommes à la RTVB est de
45% ?
Exemple 1 :
3 12 0.2 20 30 90 18
4 24 0.4 40 70 70 42
5 18 0.3 30 100 30 60
Exercice 1: Compléter le tableau suivant et donner un titre. On fera une analyse du document
obtenu.
18
1 16 26.66 26.66 99.99
2 24 40 66.66 73.33
Total 60 100
Légende :
Exercice 2
0 4 5 5 100
1 15 18.75 23.75 95
2 29 36.25 60 76.25
3 18 22.5 82.5 40
4 10 12.5 95 17.5
5 3 3.75 98.75 5
Total 80 100
i- Compléter le tableau
ii- Déterminer les pourcentages suivants :
19
Lorsque les différentes valeurs prises par le caractère (quantitatif) étudié sont en grand
nombre, on répartit les données en classes soit de mêmes amplitudes soit d’amplitudes
différentes.
Définition :
Classe [x1 ; x2 [
Amplitude de classe a = x2 – x1
NOMBRE DE NOMBRE DE
DONNEES (N) CLASSES (k)
10 4
]10; 22] 5
]22 ; 44] 6
]44 ;90] 7
]90 ;180] 8
]180 ;360] 9
]360 ;720] 10
]720 ;1000] 11
Une entreprise possède 200 points de vente de journaux répartis sur le territoire ivoirien.
Chaque point de vente a fait connaître son chiffre d’affaires, exprimé en million de francs,
pour le mois de Septembre 2023. Un traitement préliminaire des données fournit les
résultats suivants.
53 68 84 75 82 68 90 62 88
76 65 73 69 88 73 60 93 61
54 85 72 61 65 75 87 74 62
95 78 63 60 66 82 78 65 54
77 69 74 68 71 96 68 89 61
75 55 60 79 83 65 79 62 67
68 78 85 76 61 71 74 65 80
73 57 88 78 62 53 67 86 67
73 81 62 63 76 65 85 56
Digramme circulaire
23
appréciation de la qualité du service
Effectifs Pourcenta Pourcentag Pourcentag
ge e valide e cumulé
1 2 3,3 3,3 3,3
2 4 6,7 6,7 10,0
3 12 20,0 20,0 30,0
Valide
4 24 40,0 40,0 70,0
5 18 30,0 30,0 100,0
Total 60 100,0 100,0
24
25
Exercice :
Dans une entreprise, on a observé un échantillon d’employés. Le caractère étudié est
l’état matrimonial; les données recueillies sont:
Marie(e)','Marie(e)','Divorce(e)','Celibataire','Celibataire','Marie(e)',‘
Celibataire’,'Celibataire','Celibataire','Marie(e)','Celibataire','Marie(e)',
'Veuf(ve)', 'Marié(e) 'Veuf(ve)','Divorce(e)','Célibataire’, ‘Célibataire',
'Célibataire’, ‘Marie(e)‘
a) Faire le tri à plat
b) Construire le tableau des fréquences
c) Construire le graphique approprié
Nous examinons dans cette partie les principales mesures utilisées pour décrire un ensemble
de données. Il s’agit de caractériser la distribution des valeurs observées d’une variable
statistique par certains nombres représentatifs qui pourraient résumer de façon suffisamment
complète l’ensemble de ces valeurs. On exposera les mesures de tendance centrale (le mode,
la médiane et la moyenne), les mesures de position (les quantiles) ainsi que les mesures de
dispersion (l’écart type) les mesures de forme.
26
CHAPITRE III : LES MESURES DE TENDANCE CENTRALE
ET LES MESURES DE POSITION.
Détermination :
Dans une distribution (xi,ni) le mode correspond à la valeur de x i qui a la plus grande valeur
de ni.
Donner des exemples à partir des distributions vues dans les chapitres précédents.
Dans ce cas on détermine d’abord la classe modale ou la classe dominante notée [x 1, x2[. C’est
la classe qui a l’effectif le plus élevé (données reparties en classes de même amplitude) ou la
densité d’effectif la plus élevée.
Δ1
Mo = x1+ ∗ai
Δ 1+ Δ 2
Δ1
Pour les données groupé Δ 1 = 24 – 20 = 4 et Δ 2 = 24 – 10 = 14 /Mo = x1+ ∗ai
Δ 1+ Δ 2
4
D’où Mo = 6050+ ∗300 = 6117 frs/heure
4+ 14
28
Les données étant rangées par ordre croissant ou décroissant, la médiane est la valeur
observée ou estimée de la variable qui partage l’ensemble des données en deux parties de
même effectif :
Détermination de la médiane
On dispose d’abord les données en ordre croissant et on attribue à chaque donnée un rang.
On calcule ensuite le rang de la médiane. Pour cela on calcule n/2, n étant le nombre total
des données.
- Si n/2 n’est pas un entier, on l’arrondit à l’entier supérieur qui correspond au rang de la
médiane.
- Si n/2 est un entier, la médiane est la moyenne des données de rang n/2 et n/2 +1.
Note 8 10 12 13 14 16 17 17
Rang 1 2 3 4 5 6 7 8
n/2 = 8/2 = 4. C’est un entier, donc la médiane est la moyenne des notes de rang 4 soit 13 et de
rang 5 soit 14. La médiane vaut donc (13 + 14)/2 = 13,5.
Note 8 10 12 13 14 16 17 17 18
29
Rang 1 2 3 4 5 6 7 8 9
n/2 = 9/2=4,5 on arrondit à l’entier supérieur soit 5. Donc la médiane est égale à 14.
On détermine d’abord la classe médiane ; elle correspond à la classe qui a pour pourcentage
cumulé croissant 50% ou immédiatement supérieur à 50%.
50−F cum%
Mé = x1+( )∗ai
f % mé
50−40
Mé= 6050+ ( )∗300
28 , 8
30
Soit une série numérique x1,x2…xn. La moyenne de cette série est
donnée par :
x 1+ x 2+ … .+ xn
X= n
[∑ ]
k
x=
¿∗xi
i=1
n
avec k le nombre de différentes valeurs du caractère
ii- La moyenne arithmétique (pour les données quantitatives groupées par classe)
( x )=¿
- Par contre Mo < Mé < X alors on a une distribution asymétrique avec étalement à droite
- Si le Mo > Mé > X alors on a une distribution asymétrique avec étalement à gauche
31
A l’analyse, nous remarquons que :
B- Les quartiles
Ils peuvent être utilisés pour les données ordinales et quantitatives. Les données étant
rangées par ordre croissant, les quartiles notés (Q1, Q2, Q3) divisent l’ensemble des
données en quatre parties de même effectif.
- Le 1er quartile Q1 est tel que 25% des données lui sont inférieures ou égales et 75%
lui sont supérieures ou égales.
- Le 2ème quartile Q2 est la médiane
- Le 3ème quartile Q3 est tel que 75% des données lui sont inférieures ou égales et
25% lui sont supérieures ou égales
Médiane
X min X max
Q1 Q2 Q3
32
Pour les données non groupées, il faut les ranger par ordre croissant et calculer le rang de Q1
7 8 10 12 14 15 16 16 17
Note
Rang 1er 2e 3e 4e 5e 6e 7e 8e 9e
Rang de Q1= n/4 = 9/4=2,25 arrondir à 3 est la position de Q1 don la note équivaut à 10
Rang de Q2= n/2= 9/2=4,5 arrondir à 5e position dont la note équivaut à 14
Rang de Q3= 3n/4 = 3*9/4=6,7 arrondir à 7e position dont la note équivaut à 16
33
Note 7 8 10 12 14 15 16 16 17 18
Rang 1er 2e 3e 4e 5e 6e 7e 8e 9e 10
Calculons Q1 :
Rang de Q1 : 10/4 = 2,5 soit 3 donc Q1 = 10
Calculons Q2
Rang de Q2 : 10/2 =5 donc Q2 = (14 +15) /2 = 14.5
Calculons Q3
Rang de Q3 : 3*10/4 =7.5 donc Q3 =16
Calcul du Q1
On détermine d’abord la classe de Q1 ; elle correspond à la classe qui a pour pourcentage
cumulé croissant 25% ou immédiatement supérieur à 25%.
25−F cum%
Q1 = x1+( )∗ai
f %Q 1
Calcul du Q3
On détermine d’abord la classe de Q3 ; elle correspond à la classe qui a pour pourcentage
cumulé croissant 75% ou immédiatement supérieur à 75%.
75−F cum%
Q3 = x1+( )∗ai
f % Q3
Exemple : calculez Q1 et Q3 du tableau sur les chiffres d’affaire.
34
Recherche de données aberrantes :
Définition : c’est une donnée qui s’écarte anormalement de l’ensemble des données
observées.
Détermination :
Iq = Q3 – Q1 exple Iq = 93 – 47.14= 45.86
W = 1.5*Iq exple W = 1.5*45.86 = 68.79
W1 = Q1 – W exple W1 = 47.14-68.79 = - 21.65
W2 = Q3 + W exple W2 = 93+68.79 = 161.79
Règle : [ W1 ; W2] exple [ -21.65 ; 161.79] soit [ 2 ; 161.79]
35
CHAPITRE IV : LES MESURES DE DISPERSION
R = Xmax – Xmin
L’étendue étant une grandeur absolue (non relative) elle ne permet pas d’apprécier des
dispersions autour des valeurs centrales.
- Etendue interquartile Iq :
Iq = Q3 – Q1
2- Ecart type :
n (x x)
N
2
i
s = i1 i
N F
36
1
s= n x x
k
2 2
i i
N i1
Pour les données groupées en classe Xi est remplacé par le centre de classe Ci.
Exemple Σnici2 = 1168495 et s2 = 931.96 (million de francs)2 et S= 30.52 millions de francs.
3- Le coefficient de variation
Cv% = (S / m) *100
37
Chapitre V : INTRODUCTION A L’ANALYSE BIVARIEE
38
Exemple de matrice de données brutes.
Matrice de données brutes issues d’une enquête auprès d’un échantillon aléatoire de 60
partenaires d’un groupe scolaire privé de la place.
IND VAR1 VAR2 VAR3 IND VAR1 VAR2 VAR3 IND VAR1 VAR2 VAR3
01 1 1 3 21 3 4 5 41 2 2 4
02 2 2 4 22 3 3 4 42 3 2 4
03 3 1 5 23 2 1 5 43 1 2 5
04 2 2 4 24 3 2 4 44 2 3 4
05 2 3 4 25 3 1 3 45 3 1 5
06 2 1 5 26 3 2 5 46 1 2 2
07 3 3 5 27 2 1 2 47 3 1 4
08 2 2 3 28 1 3 3 48 2 2 3
09 1 4 4 29 1 3 4 49 1 1 3
10 2 2 5 30 2 2 4 50 2 2 4
11 2 3 3 31 1 2 4 51 1 4 5
12 3 1 5 32 2 2 5 52 2 1 5
13 3 2 5 33 1 3 5 53 1 2 4
14 3 1 4 34 3 1 2 54 3 2 4
15 2 4 4 35 2 2 3 55 1 3 5
16 3 1 4 36 1 1 3 56 2 3 3
17 3 1 1 37 2 2 5 57 2 2 4
18 2 3 1 38 1 1 2 58 1 4 4
19 3 2 5 39 2 3 4 59 3 1 4
20 2 2 5 40 1 1 4 60 3 1 3
Var2 : profession : 1- cadre du privé ; 2- cadre de la fonction publique ; 3- emploi libéral ; 4- autres.
Var3 : appréciation de la qualité générale du service comparativement aux autres établissements privés :
1-mauvais ; 2- équivalent ; 3- bon ; 4- très bon ; 5- excellent
39
Tab2 : tableau de répartition, en effectif, d’un échantillon aléatoire de 60 partenaires d’un groupe
scolaire privé de la place interrogée lors d’une enquête selon la profession et l’appréciation de la qualité
du service.
Apréciation ; 3
Nievau d’étude
Titre :
Consigne : écrire les réponses dans les espaces indiqués sur la feuille du sujet.
Exercice 1
Dans une enquête d’opinion auprès des jeunes sur l’utilisation des portables pendant le cours,
Djèdjè a construit un questionnaire dans lequel les questions se présentent sous la forme d’affirmations
suivies d’une échelle sur laquelle les sujets doivent entourer un nombre pour indiquer leur opinion ; par
exemple : « même si le professeur fait le cours, l’étudiant a le droit de répondre aux appels ».
-2 -1 0 1 2
Pas du tout En désaccord sans opinion D’accord Tout à fait
d’accord d’accord
1 27 35,06 80 ;5 54 ;54
2 15 19,48 99,98 19 ;48
Total 77
Compléter le tableau.
Avec quels graphiques peut-on représenter la variation des pourcentages selon le type d’opinion ?
Avec un diagramme enpilé utilisé quand on veit comparer deux variables ²
Le chapeau
42
La valeur modale
Voir si il y’a des irrégularités
………………………………………………………………………………………………………………………………………………………….
………………………………………………………………………………………………………………………………………………………..
c) indiquer le pourcentage de :
ceux qui sont en désaccord… .
ceux qui sont au moins d’accord…………………………………………………………………………………………..
ceux qui sont au plus « sans opinion » ………………………………………………………………
Exercice 2
Vous êtes le responsable d’un cyber, vous voulez réaliser une étude sur la durée de visite en minutes sur
un site internet qui vient d’être installé. Voici les données obtenues
24 24 24 25 25 26 26 26
28 28 28 28 28 29 30 31
33 34 34 35 35 36 37 39
43 43 46 48 52 53 57 60
a / identifier la variable statistique sur laquelle porte l’étude ; quelle est sa nature ?
C’est une variable quantitative continue
C’est une échelle de rapport car on compare les valeurs
b/ quelle est l’unité statistique ?
c’est chaque visiteur du site iè(
c c/ les données du tableau ci-dessus sont rangées par ordre croissant suivant les lignes. Déterminer la
durée modale et les trois quartiles Q1, Q2, Q3.
……………………………………………………………………………………………………………………………………………………
………………………………………………………………………………………………………………………………………………......
……………………………………………………………………………………………………………………………………………………….....
………………………………………………………………………………………………………………………………………………………
……………………………………………………………………………………………………………………………………………………………
…………………………………………………………………………………………………………………………………………………………
……………………………………………………………………………………………………………………………………………………..
d/ Déterminer la durée de visite moyenne X. on donne ∑nixi= 1115 minutes.
43
………………………………………………………………………………………………………………………………………………………......
e/ ce site sera jugé intéressant si les conditions suivantes sont vérifiés :
- Les visiteurs passent en moyenne plus d’une demi-heure sur le site ;
- La distribution est asymétrique avec étalement à gauche
Exercice 3 :
Complétez le tableau ci-dessous indiquant la répartition en pourcentage des revenus annuels en 2000
des familles dans un pays donné.
44
………………………………………………………………………………………………………………………………………….
3) Donnez les pourcentages des familles :
Qui gagnent moins de 10 millions l’an……………………………………………………………………………………
Qui gagnent au moins 25 millions l’an…………………………………………………………………………………..
Qui gagnent entre 30 millions et moins de 45 millions l’an………………………………………………….
…………………………………………………………………………………………………………………………………………..
4) Estimez par interpolation linéaire :
Le revenu modal ……………………………………………………………………………………………………………
……………………………………………………………………………………………………………………………………………
……………………………………………………………………………………………………………………………………….
Le revenu médian……………………………………………………………………………………………………………
……………………………………………………………………………………………………………………………………….
………………………………………………………………………………………………………………………………………………..
Le revenu correspondant au premier quartile Q1…………………………………………………………………
………………………………………………………………………………………………………………………………………………………
………………………………………………………………………………………………………………………………………………………
……………………………………………………………………………………………………………………………
Le revenu correspondant au troisième quartile Q3………………………………………………………
………………………………………………………………………………………………………………………………………………………
………………………………………………………………………………………………………………………………………………………
……………………………………………………………………………………………………………………….
………………………………………………………………………………………………………………………………………………
Faites un résumé en cinq chiffres de la distribution.
………………………………………………………………………………………………………………………………………………………
………………………………………………………………………………………………………………………………………
5) La distribution admet-elle des valeurs aberrantes ? si oui, lesquelles ?
………………………………………………………………………………………………………………………………………………………
………………………………………………………………………………………………………………………………………………………
………………………………………………………………………………………………………………………………………………………
………………………………………………………………………………………………………………………………………………………
………………………………………………………………………………………………………………………………………………………
……………………………………………………………………………………………………..
…………………………………………………………………………………………………………………………………………………………………
…………………………………………………………………………………………………………………………………………………………………
…………………………………………………………………………………………………………………………………………………………………
…………………………………………………………………………………………………………………………………………………………………
45
…………………………………………………………………………………………………………………………………………………………………
………………………………………………………………………………………………………………………………….
Exercices 1
Parmi les exemples suivants, identifier les variables et dire si elles constituent dans le
contexte une variable dépendante ou indépendante :
d- L’inspecteur de l’enseignement primaire de Yop. 4 veut analyser l’évolution du nombre
des grossesses des élèves dans sa circonscription depuis 1990 selon l’origine ethnique
et le niveau d’étude des parents.
e- Dans une étude, on recherche des données sur la nature des infractions commises par
des élèves selon le sexe des accusés
f- Un chercheur veut vérifier si le groupe culturel a une influence sur le moment où des
enfants atteignent les différents stades de développement selon Piaget. Il fait passer
quatre épreuves de Piaget à trois groupes d’enfants de 10 ans, d’ethnies différentes.
g- On veut mesurer l’effet d’une nouvelle méthode d’enseignement des mathématiques sur
les aptitudes logiques des élèves.
Exercice 2 :
Au cours d’une recherche ayant pour but d’étudier les effets dus à l’introduction de
l’informatique dans l’enseignement des mathématiques, plusieurs investigations ont été
réalisées auprès d’un groupe d’élèves et d’un groupe d’enseignants.
Les élèves ont d’abord été soumis à une épreuve de connaissance destinée à évaluer
leur maîtrise dans deux domaines : l’interprétation de graphiques et la connaissance des
formes géométriques. Ensuite, ils ont répondu à un questionnaire devant permettre de
déterminer, d’une part, leurs caractéristiques sociodémographiques (sexe, profession
des parents, zone géographique d’habitation etc.) et, d’autre part, leur niveau de
motivation quant à l’utilisation scolaire de l’informatique.
Les enseignants ont, en revanche, participé à un entretien individualisé au cours duquel
des informations ont été recueillies concernant leurs opinions sur l’utilité pédagogique de
46
l’innovation, sur la nature des difficultés rencontrées, sur les types de formation
souhaités et sur l’ampleur de l’investissement exigé par la réforme.
Dans cette étude, relevez les variables étudiées.
47