Académique Documents
Professionnel Documents
Culture Documents
1
Traitement de l’information, GACO S2
1) Population :
Sens statistique : ensemble des éléments sur lesquels on procédera à des mesures pour
réaliser l’étude de certaines statistiques
2) Individu : Série statistique =
Élément de la population étudiée ensemble des données
3) Échantillon : recueillies
Sous-ensemble de la population
4) Caractère (ou variable) :
Propriété que l’on étudie sur la population pour chaque individu
5) Les modalités :
Ensemble des valeurs que peut prendre une variable (effectif = nombre de fois où la valeur
apparait)
➔ Les modalités finies
➔ Les modalités infinies
Variable où les modalités s’expriment de façon littérale, c’est-à-dire qu’il n’y a pas de sens
numérique.
➔ Mots
➔ Signes, couleurs ou symboles
➔ Bruits
➔ Nombres (s’ils n’ont pas de sens lors d’une opération. Ex : loto, code barre…)
Classement possible
Classement impossible
Variable exprimée par des nombres indiquant une quantité sur laquelle des opérations sont
possibles.
Les modalités de la variable sont des valeurs isolées (= chiffre limité, pas de virgule)
ex : le nombre d’enfants dans une famille
Les modalités de la variable peuvent être des valeurs infinies dans un intervalle donné
(ex : taille, poids, temps…)
2
Traitement de l’information, GACO S2
II – La récolte de données
1) Mesure
Individu → Pour chaque individu, on mesure le caractère étudié
➔ Il faut un appareil de mesure calibré (étalonné)
➔ Processus de mesure (ex : opération, manière de formuler un questionnaire)
➔ Report des informations (saisie)
2) Le recueil de données
Bleuenn 1,70
Vivien 1,75
Flavie 1,54
Jeanne 1,58
Cloé 1,63
Eloïse 1,70
Théo 1,75
Nolwenn 1,63
Variable Effectif
Xi (écrire « Xi » permet Yi (écrire « Yi »
de préciser que l’on permet de préciser
désigne tous les X de la que l’on désigne tous
colonne (X1, X2, …)) les X de la colonne
(N1, N2, …))
1,54 (X1) 1 (n1)
1,58 (X2) 1 (n2)
1,63 (X3) 2 (n3)
1,70 (X4) 2 (n4)
1,75 (X5) 2 (n5)
On place ici des intervalles pour encore plus simplifier les données
Xi Ni
]1,50 ; 1,55] 1
]1,55 ; 1,60] 1
]1,60 ; 1,65] 2
]1,65 ; 1,70] 2
]1,70 ; 1,75] 2
3
Traitement de l’information, GACO S2
L’INCOMPATIBILITÉ
L’EXHAUSTIVITÉ
SANS AMBIGUITÉ
4
Traitement de l’information, GACO S2
On appelle effectif une valeur donnée Xi le nombre de fois où cette valeur apparait dans la population
étudiée.
Individu Poids
A 57
B 63
C 57
D 62
E 65
F 68
G 65
H 63
I 57
J 62
5
Traitement de l’information, GACO S2
Lorsque l’on a beaucoup de données, on va les regrouper pour les représenter. Dans le recueil des
données, il y a une nécessité d’identifier les individus pour éviter les doublons.
Dès qu’on parle de simplification de données faisant partie d’un recueil très dense, on parle de
statistiques.
Dès qu’on représente des informations sur un tableau, un graphique ou des chiffres clés comme
une moyenne, une médiane, des indices etc., ON FAIT DES STATISTIQUES.
1) Tableau statistique
Individu Salaire On voit bien que personne n’a pas le même salaire. Or, il faut
A 1200 qu’on arrive à simplifier ces données. On va alors créer des
B 1350 « classes » (intervalles de valeurs de la variable). On va devoir en
C 1820 effet faire des choix. La taille de la classe s’appelle « amplitude »
D 2500 notée Ai. On pourra faire différentes classes :
E 2130 a) Classes à petite amplitude
F 2050
]1000 ; 1050]
G 1780 Avantages : Moins de perte d’information
]1050 ; 1100] Inconvénients : Très faible lisibilité
H 1600
]1100 ; …
I 1250
J 1920 b) Classes à grande amplitude
K 2000 ]1000 ; 1500]
Avantages : Meilleure lisibilité
L 1100 ]1500 ; 2000] Inconvénients : Très grande perte d’informations
]2000 ; 2500]
c) Amplitudes de classe plus petites pour se focaliser sur le phénomène étudié
On met des grandes classes là où il n’y a pas beaucoup de monde, et des classes plus affinées
là où il y a beaucoup de monde.
]1100 ; 1500] 4
]1500 ; 1780] 2
]1780 ; 2000] 3
…
NB : les variables quantitatives continues seront représentées (pratiquement tout le temps) en tableau
avec des classes. Pour les autres types de variables, c’est surtout lorsque les modalités sont trop
nombreuses, que l’on procédera à la même chose.
6
Traitement de l’information, GACO S2
2) Graphiques
Règles de base :
a) Variable qualitative
Titre du graphique
Catégorie 4
Catégorie 3
Catégorie 2
Catégorie 1
0 1 2 3 4 5 6
7
Traitement de l’information, GACO S2
b.1 Histogramme
ai 0-20 8
xi ni (amplitude) 20-40 8
0-80 32 80 40-60 8
80-120 24 40 60-80 8
120-140 18 20 80-100 12
140-160 11 20 100-120 12
160-200 16 40 120-140 18
140-160 11
160-180 8
180-120 8
COEFFICIENT (pour obtenir les effectifs pour faire le graphique) = classe de référence / ai
SINON, on calcule la densité. Il s’agit de ramener la quantité par unité de variable (ex : nombre
d’étudiants par m2). C’est comme si on choisissait comme classe de référence une unité de variable.
8
Traitement de l’information, GACO S2
b.2 Le polygone
ATTENTION : on ne met JAMAIS de barre épaisse car cela voudrait dire qu’il y a un volume au sein de
l’amplitude de la classe. Pour spécifier qu’il ne s’agit que d’une seule valeur précise, on met un trait.
De la même manière que pour les histogrammes et les polygones, s’il y a des amplitudes de classe
différentes, on ramène chaque classe à une amplitude de référence. Cependant, au lieu de regrouper
ensuite ces amplitudes dans une barre avec du volume (largeur), on représente chaque amplitude
selon le nouvel effectif calculé grâce au coefficient.
NB : quand un graphique est trop long (ex : une variable qui va jusqu’à 300 alors qu’elle est quasi
nulle), on peut mettre le signe « // » pour indiquer que le graphique a été comme « coupé » et ne
pas avoir à faire un axe très long
9
Traitement de l’information, GACO S2
Dans ce type d’analyse, on n’a pas de graphique, mais on doit représenter tout de même la position
centrale et la dispersion de la variable.
1) Le mode
Le mode, c’est la valeur de la variable portée par le plus grand nombre d’individus.
Exemple :
Xi Ni
Bleu 15 Classe modale : entre
Rouge 25 Xi Ni
20 et 30
Vert 22 0-10 15
Jaune 13 10-20 13 → Mode = 25
20-30 18
Mode = Rouge 30-40 12
40-50 5
Xi Ni
0 15 Xi Ni On corrige les
1 13 0-30 12 effectifs :
2 18 30-40 27
0-10 : 4
3 12 40-70 19
10-20 : 4
4 5 70-80 21
20-30 : 4
5 6 80-100 9
30-40 : 27 / Mode = 35
Mode = 2
40-50 : 6,33
Remarque : 50-60 : 6,33
60-70 : 6,33
• Le mode est faible à déterminer
70-80 : 21
• Le mode n’est pas adapté :
80-90 : 4,5
- Aux séries plates
90-100 : 4,5
- Aux séries avec plusieurs sommets
10
Traitement de l’information, GACO S2
2) L’étendue
L’étendue, c’est l’amplitude entre les valeurs extrêmes de la variable (ou entre la plus petite classe et
la plus grande)
Exemple :
Xi Ni
Bleu 15
Rouge 25 Xi Ni
Vert 22 0-10 15
Jaune 13 10-20 13
20-30 18
Étendue = non calculable, il s’agit
30-40 12
d’une variable qualitative nominale !
40-50 5
Étendue = 40 – 10 = 30
Xi Ni
0 15 Xi Ni
1 13 0-30 12
2 18 30-40 27
3 12 40-70 19
4 5 70-80 21
5 6 80-100 9
Inutile de corriger les
Étendue = 5 – 0 = 5 effectifs ici : l’étendue
est de 80 – 30 = 50
11