Académique Documents
Professionnel Documents
Culture Documents
Et leurs caractéristiques
I. Introduction :
II. Vocabulaire :
1. On appelle population un ensemble d’éléments homogènes auxquels on s’intéresse.
Par exemple, les étudiants d’une classe, les contribuables français, les ménages lillois.
2. Les éléments de la population sont appelés les individus ou unités statistiques.
3 .On appelleéchantillon la partie de la population qui est choisie pour réaliser le test
statistique.
4. Des observations concernantun thème particulier ont été effectuées sur ces
individus. La série de ces observations forme ce que l’on appelle une variable
statistique. Par exemple, les Notes des Etudiants à l’Examen de Statistique, les
Mentions qu’ils ont obtenues à leur Bac, leur Sexe, les Couleurs de leurs Yeux, le
Chiffre d’Affaire par PME, le Nombre d’Enfants par Ménage, . . .
(i) quantitative : lorsqu’elle est mesurée par un nombre (les Notes des Etudiants à l’examen de
statistique, le Chiffre d’Affaire par PME, le Nombre d’Enfants par Ménage,...).On
distingue2typesdevariablesquantitatives:
(ii) qualitative : lorsque les modalités (ou les valeurs) qu’elle prend sont désignées par des
noms.Par exemples,lesmodalitésdelavariableSexesont: Masculinet Féminin; les modalités de
la variable Couleur des Yeux sont : Bleu, Marron, Noir et Vert; les
modalitésdelavariableMentionauBac sont:TB,B,ABetP.On distingue deux types de variables
qualitatives : les variables qualitatives ordinales et les variables qualitatives nominales. Plus
précisément une variable qualitative est dite ordinale, lorsque ses modalités peuvent être
classées dans un certain ordre naturel (c’est par exemple le cas de la variable Mention au
Bac); une variable qualitative est dite nominale, lorsque ses modalités nepeuvent être classées
de façon naturelle (c’est par Exemplele casdelavariable Couleur ou encore delavariable
Sexe).
Une étude statistique consiste en un recueil de données (obtenue par une enquête).
Ces données sont ensuite organisées et présentées sous forme de tableaux (afin de faciliter à
l’interprétation de ces données), on dit « pour donner une vision globale d’une situation
décrite»
a) Tableau à simple entrée :
Exemple : Statistique du personnel d’une entreprise en fonction des salaires.
Tranche de salaire (€): x i Effectif : ni
] 900 ; 1050 ] 25
] 1050 ; 1200] 35
] 120 0 ; 1350] 9
] 1350 ; 1500] 4
] + de 1500 2
Tableau1
Tranche Total
[20 - [30 - [40 - [50 - [60 -
d’âge « y1 » 70 x i
30[ 40[ 50[ 60[ 70[
900 ; 1050 ] 14 5 3 2 1 0 25
Distribution
] 1050 ; 1200] 10 15 6 3 1 0 35
marginale de
] 120 0 ; 1350] 0 0 7 (1) 2 0 0 9 xi
] 1350 ; 1500] 0 1 3 0 0 0 4
] + de 1500 0 1 0 0 1 0 2
Total : des « y1 » 24 22 19 7 3 0 75
Distribution marginale des y1
Tableau2
Remarque :
- La lecture du tableau (1) indique que 7 salariés, dont l’âge est compris entre 40 et
50 ans touche un salaire compris entre 1200 et 1350 €.
-La série « Total xi » est appelée « distribution marginale de xi » et la série « Total
yi » est appelée « distribution marginale de yi ».
- Pour finir, il est aisé de vérifier que les sommes des deux distributions marginales
sont égales.
c) Présentation d’un tableau :
D’une façon générale, un tableau se compose :
- d’une colonne indiquant les diverses modalités de la variable ; (notée : xi)
- d’une ou plusieurs autres colonnes indiquant l’effectif (noté : ni) correspondant à ces
diverses modalités.
Tableau concernant une variable continue : tableau1
Tableau concernant une variable discrète :tableau3
x 1 + x 2 + ...x i ....x n
N
Moyenne pondérée (arithmétique)
Cas des variables discrètes
Une moyenne pondérée est une moyenne dont certaines des valeurs sont affectées d’un
poids. Elle notée m ou x elle est utilisée pour calculer dans une étape avancée la
variance et l’écart type.
Pour calculer une moyenne pondérée, on effectue le calcul suivant :
n
x n i i
n1x1 + n 2 x 2 + ...n i x i ....n n x n
m=x= i
n
=
N
n i
i
Exemple :
Voici les notes d’une classe de troisièmes à un contrôle de maths :
Tout d’abord on range les différentes valeurs par ordre croissant. Si trois élèves ont eu
6/20, on marquera le 6 trois fois, si 7 élèves ont eu 9/20, on marquera le 9 sept fois,
etc.
Voici ce que ca donne :
2, 6, 6, 6, 8, 8, 8, 9, 9, 9, 9, 9, 9, 9, 10, 10, 10, 10, 10, 10, 11, 11, 11, 11, 11, 12, 12, 12,
14, 14, 16,16,16
En tout, il y a 33 notes (N = 33). La médiane sera égale à la valeur correspondant à la
N -1 N + 1 ième
note n° +1 c’est ( ) variable
2 2
Les points A, M, B sont alignés ce qui se traduit par les droites (AM) et (AB) ont même
coefficient directeur (ou on utilise le théorème de Thalès dans le triangle bleu) :
Me - 8 12 - 8
=
25 -18 30 - 18
Me - 8 4
=
7 12
4
Me = * 7 + 8 » 10.33
12
3. L’étendue
L’étendue d’une série statistique est la différence entre sa valeur la plus élevée et sa valeur la
plus basse.
Exemples :
Tableau5 : La note la plus élevée est 20 et la note la plus basse est 3. L’étendue e = 20 – 3 =
17.
Tableau6 :La note la plus élevée est 16 et la note la plus basse est 2. L’étendue e = 16 – 2 =
14.
4. Le mode
Dans le cas d'une série statistique continue, la classe modale est la classe la
plus dense c'est à dire la classe qui contient le plus d'effectifs par amplitude.
La densité d'effectif de la classe se calcule en divisant chaque effectif par
l'amplitude correspondante de la classe.
Exemple : tableau7 pour la première classe l'amplitude est de 5 - 0 = 5,
l'effectif de 10 donc la densité sera de 10/5 soit 2.
Le mode de la série continue de tableau7 est 3.666 = (11/(15-12))
Dans le cas d’une série statistique discrète, le mode est la valeur de plus grand
effectif.
Exemple : tableau5 :note 12, tableau6 : note 9
Dans certains cas on peut trouver plus qu’une seule valeur de mode.
5. La variance et l’écart type
-La variance : Pour calculer la variance d'une série statistique, on utilise la formule :
n 2
(x i - x) * n i n
2
V= i n = (x i - x) * fi
ni i
i
Remarque : Dans le cas des variables continus xi de la formule est le centre de la classe
modale comme est mentionné précédemment
σ tel que σ= V .
5. L’écart moyen :
x x *n
i i
e i
n
n i
i
Variable discréte :
Le premier quartile et le troisième quartile d'une série statistique rangée dans l'ordre croissant
(x1 , x2 ,x3 , x4 , ....., xn) sont les nombres Q1 et Q3 définis de la façon suivante :
- si n/4 est un entier , le premier quartile Q1 est le terme de rang n/4 et le troisième
Exemple : Tableau6
Les notes sont écrites dans un ordre croissant sinon il faut trier les modalités en ordre croissant
N=33
N/4=8.25 le premier quartile est la note qui correspond au 9ième élève c’est 9 ; Q1=9
3*N/4=24.75 le troisième quartile est la note qui correspond au 25ième élève c’est 11 ; Q3=11
2*N/4=N/2=16.5 le deuxième quartile (médiane) Q2= 10.
Variable continue
Si la variable est continue (regroupement par intervalle des résultats) le calcul des quartiles se fait
autrement : Les quartiles se calculent alors par interpolation linéaire. :
Exemple : Tableau7
25%N=12.5 Q1=5.94
75%N=37.5 Q3=14.05
Les quartiles sont les valeurs des variables telles que 25% et respectivement 75% des valeurs
leur soient inférieurs. Tandis que le premier, le second et le troisième décile sont
respectivement les valeurs de modalité telle que 10% respectivement 20% et 90% des
effectifs observés correspondent à des valeurs qui lui sont inférieurs.
Exemples :
10%N=3.3 D1=6
20%N=6.6 D2=8
90%N=29.7 D9=14
2) Tableau8 : variables continues : distribution des salaires des 250 salariés d’une entreprise.
25 10
D1 8.4 (8.8 8.4) * 8.6euros
40 10
25ième salarié appartient à l’effectif dont la classe modale est [8.4, 8.8 [
D9 est le salaire du 225ième salarié (225 =N*90/100)
225ièmesalarié appartient à l’effectif dont la classe modale est [9.6, 10.2 [
225 212
D9 9.6 (10.2 9.6)* 9.925euros
236 212
L’intervalle inter décile D9-D1= 9.925-8.6=1.325