Académique Documents
Professionnel Documents
Culture Documents
Polycopie Statistiques PDF
Polycopie Statistiques PDF
Master 2012 MAGE
Statistique descriptive à une variable
LES SAVOIRS
La statistique est une méthode scientifique qui recueille, ordonne, analyse et interprète des
données numériques. Pour une meilleure lisibilité, ces données sont représentées
graphiquement.
m
La statistique est utilisée dans des domaines aussi variés que la biologie, l’économie,
l’agronomie,...
co
A Vocabulaire
L’ensemble sur lequel porte l’étude statistique est appelé : population. Les éléments la
composant sont appelés individu ou unité statistique.
.
Lorsque la population est trop importante, on peut pour des raisons économiques y
prélever un échantillon représentatif, d’une plus petite taille.
hs
Exemple : l’ensemble des candidats au CRPE est une population.
Chaque candidat est une unité statistique. A chacune de ces unités statistiques peut être
associé, un caractère ou une variable statistique, mesurable ou pas.
Exemple : la note obtenue en mathématiques, l’âge, la série au bac…
at
Les valeurs prises par la variable statistique sont appelées : modalités.
Une variable statistique est soit qualitative soit quantitative.
om
1) Caractère ou variable statistique
1.1) Caractère qualitatif
Une variable qualitative, est une variable qui n’est pas mesurable.
Exemple : sexe, département de naissance, mention obtenue au bac …
f
Une variable est qualitative ordinale lorsque les modalités qui lui sont associées peuvent
in
être hiérarchisées.
Exemple : appréciation d’une prestation par les modalités : « mauvaise, moyenne, bonne ».
Une variable est qualitative nominale lorsque les modalités qui lui sont associées ne
peuvent pas être hiérarchisées.
Exemple : couleur des yeux : « bleus, marrons, verts, noirs…. »
1.2) Caractère quantitatif
Une variable quantitative est une variable qui est mesurable.
Exemple : nombre de frères et sœurs, note obtenue au bac, âge, taille…
Saïd Chermak 2012
1
Saïd Chermak. Master 2012 MAGE
Une variable est quantitative discrète, si elle peut prendre des valeurs isolées .
Exemple : nombre d’enfants par foyer,0, 1, 2, 3…..
Une variable est quantitative continue, si elle peut prendre toutes les valeurs d’un intervalle
appelé classe .
Exemple : âge, taille, salaire….
2) Effectifs et fréquences
La modalité i est notée xi
Pour p modalités on a : x1 , x2 , x3 ...........x p
L’effectif d’une modalité i noté ni est le nombre d’individus associé à xi
m
Pour p modalités on a : n1 , n2 , n3 ...........n p
L’effectif total : N = n1 + n2 + n3 + ........... + n p
co
i= p
On peut aussi écrire : N = ∑n i =1
i
Après avoir rangé les xi dans l’ordre croissant(ou décroissant) et en additionnant les
effectifs successifs des xi , on obtient les effectifs cumulés croissants ( ou décroissants).
i =k .
hs
On peut écrire : N k = ∑n
i =1
i
i= p
ni
On a alors fi = avec ∑ f i = f1 + f 2 + ....... + f p = 1
N i =1
om
On peut aussi calculer les fréquences cumulées croissantes ou décroissantes, selon l’ordre
de rangement des xi .
i =k
On a Fk = ∑f
i =1
i
f
Les données peuvent être consignées dans un tableau au format suivant :
in
xi x1 x2 x3 ‐ ‐ xp Total
n1 n2 n3 ‐ ‐ np N
ni
fi f1 f2 f3 ‐ ‐ fp 1
Saïd Chermak 2012
2
Saïd Chermak. Master 2012 MAGE
i =k
n1 n1 + n2 n1 + n2 + n3 ‐ ‐ N
N k = ∑ ni
i =1
i =k
f1 f1 + f 2 f1 + f 2 + f3 ‐ ‐ 1
Fk = ∑ fi
i =1
Une variable continue est représentée dans un tableau au format suivant :
Classes [ a0 ; a1 ] [ a1 ; a2 ] [ a2 ; a3 ] ‐ ‐ ⎡⎣ a p −1 ; a p ⎤⎦ Total
Effectifs n1 n2 n3 ‐ ‐ np N
m
ni
Ce tableau est ensuite complété, en calculant le centre de chaque classe :
co
a0 + a1 a1 + a2 a p −1 + a p
x1 = ; x2 = ;...............; x p =
2 2 2
On obtient alors :
Centre x1 x2 . x3 ‐ ‐ xp Total
hs
de classe
xi
Effectifs n1 n2 n3 np N
at
ni
om
B) Série statistique et ses paramètres.
Une série statistique est l’ensemble des couples {( xi , ni )} où xi est la modalité i , d’effectif
ni .
f
in
1) Paramètres de position
1.1 Le mode
Le mode d’une série statistique, est la valeur de la variable associée au plus grand effectif ou
à la plus grande fréquence.
Dans le cas d’une variable continue dont les classes sont de même amplitude, la classe
associée au plus grand effectif rectifié est appelée classe modale. Le mode est le centre de
cette classe.
Les notes obtenues dans une classe de 20 élèves sont :
Saïd Chermak 2012
3
Saïd Chermak. Master 2012 MAGE
1.2 Les moyennes
1.2.1 La moyenne arithmétique.
La moyenne arithmétique de n observations est le quotient de leur somme par l’effectif
total p .
x1 + x2 + ....... + xn 1 i=n
m
Soit x =
n
ou x = ∑ xi « lire somme des x i , i variant de 1 à n »
n i =1
Exemple.
co
Les âges des sept joueurs d’une équipe de handball sont : 18, 19, 20, 21, 22, 25 et 29 ans.
18 + 19 + 20 + 21 + 22 + 25 + 29
L’âge moyen de l’équipe est égal à : soit x = 22 ans
7
.
hs
1.2.2 La moyenne arithmétique pondérée.
par les effectifs ni .
n1 x1 + n2 x2 + .....n p x p 1 i= p i= p
Soit x = ou x = ∑ ni xi avec N = n1 + n2 + .....n p = ∑ ni
om
N N i =1 i =1
i= p
On a donc x = x1 f1 + x2 f 2 + .....xn f p ou x = ∑x f
f
i i
i =1
in
Exemple.
Les notes obtenues dans une classe de 20 élèves sont :
Notes xi 4 7 10 12 15 Total
Effectifs ni 6 4 7 1 2 20
La moyenne est:
Saïd Chermak 2012
4
Saïd Chermak. Master 2012 MAGE
6 × 4 + 4 × 7 + 7 × 10 + 1 × 12 + 2 × 15
x= soit x = 8, 2
20
1.2.3 La moyenne géométrique
La moyenne géométrique de n valeurs positives xi , est la racine nième de leur produit.
1
G = x1 × x2 × ...... × xn = ( x1 × x2 × ...... × xn )
n n
Exemple
Le prix d’un article a subi trois hausses de 5 %, 6 % et 8 % et deux baisses de 3 % et 4 %.
Pour déterminer l’augmentation moyenne, il faut d’abord calculer la moyenne géométrique G, des
coefficients multiplicatifs associés aux augmentations et diminutions successives :
m
1
G = 5 1,05 × 1,06 × 1,08 × 0,97 × 0,96 = (1,05 × 1,06 × 1, 08 × 0,97 × 0,96) 5 = 1,0228
L’augmentation moyenne est donc égale à 2,28 %.
L’ordre dans lequel interviennent les augmentations et les diminutions n’a aucune incidence sur le
co
calcul de la moyenne géométrique des coefficients multiplicatifs car la multiplication est une
opération commutative.
1.2.4 La moyenne harmonique
.
La moyenne harmonique den valeurs positives xi , est le nombre H dont l’inverse est la moyenne
hs
arithmétique des inverses de ces n valeurs.
1 1 1 1 1 n
Soit = ( + + ......... + ) ou H =
H n x1 x1 xn 1 1 1
+ + ......... +
x1 x1 xn
at
Exemple
Un cycliste a parcouru 4 étapes de 80 km chacune à la vitesse respective de 10 km/h, 20 km/h, 16
km/h et 32 km/h. Quelle est sa vitesse moyenne ?
om
Ce n’est certainement pas la moyenne arithmétique des vitesses, mais la moyenne harmonique des
vitesses.
En effet, sa vitesse moyenne est égale à la distance totale parcourue 4 × 80 , soit 320 km divisée par
la somme des durées mises à parcourir chacune de ces étapes.
4 × 80
f
On en déduit la vitesse moyenne :
80 80 80 80
+ + +
in
10 20 16 32
4
Après simplification par 80 on obtient : qui n’est autre que la moyenne
1 1 1 1
+ + +
10 20 16 32
harmonique. La vitesse moyenne du cycliste est donc H = 16, 41 km/h
Saïd Chermak 2012
5
Saïd Chermak. Master 2012 MAGE
1.3 Les quantiles.
Ce sont les valeurs du caractère xi qui partagent la série statistique en n séries de même
effectif.
Selon la valeur de n, les quantiles sont appelés :
• Médiane, M e si n = 2
• Quartiles, Q1 , Q2 et Q3 si n = 4
• Déciles, D1 , D2 ......, D9 si n = 10
• Centiles, C1 , C2 ,........., C99 si n = 100
Pour calculer un quantile, il suffit de suivre la même méthode que celle développée plus bas
m
pour le calcul de la médiane.
1.3.1 La médiane.
Les modalités x1 , x2 , x3 ...........x p doivent‐être rangées dans un ordre croissant.
co
La médiane M e , est la valeur de xi qui partage la série statistique en deux séries de même
effectif.
.
Il y a donc autant de valeurs inférieures à la médiane que de valeurs supérieures à la
hs
médiane.
Si le caractère est discret, on peut déterminer la médiane de la manière suivante :
9 Si l’effectif total N est impair, la médiane est la valeur du caractère xi située au rang
N +1
at
2
Exemple
Un élève a obtenu les notes suivantes : 6 ; 7 ; 8 ; 10 ; 15.
om
La médiane est la valeur située au rang 3, soit M e = 8
9 Si l’effectif total N est pair, la médiane est la moyenne arithmétique des 2 valeurs
de xi de
N N
rang et de rang + 1
f
2 2
in
Un élève a obtenu les notes suivantes : 5 ; 8 ; 8 ; 10 ; 12 ; 12 ; 13 ; 16
La médiane est la moyenne des valeurs situées au rang 4 et au rang 5, soit
10 + 12
Me = = 11
2
Remarque
Si le caractère est continu, on retiendra la classe associée à l’effectif cumulé croissant,
représentant au moins 50% de l’effectif total. La médiane appartient alors, à cette classe et
peut‐être calculée à l’aide d’une interpolation affine.
Saïd Chermak 2012
6
Saïd Chermak. Master 2012 MAGE
1.3.2 Les quartiles
Les quartiles d'une série statistique sont les trois valeurs Q1, Q2 et Q3 du caractère qui
partagent la série statistique en quatre parties de même effectif :
‐ 25 % au moins de l’effectif total a une valeur inférieure à Q1 ;
‐ 75 % au moins de l’effectif total a une valeur inférieure à Q3.
Le deuxième quartile Q2 est égal à la médiane M e .
m
4 4
Exemple
Un élève a obtenu les 10 notes suivantes : 5 ; 6 ; 8 ; 10 ; 11 ; 13 ; 14 ; 15 ; 17 ; 18
10
co
Comme = 2,5 alors Q1 = 8 (note de rang 3 )
4
3 × 10
comme = 7, 5 alors Q3 = 15 (note de rang 8).
4
Si l’effectif total N est un multiple de 4 alors les quartiles Q1 et Q3 sont les termes de rang
N 3N .
hs
et respectivement.
4 4
Exemple
Un élève a obtenu les 8 notes suivantes : 3 ; 5 ; 7 ; 10 ; 12 ; 13 ; 15 ; 18
8
at
Comme = 2 alors Q1 = 5 (note de rang 2)
4
3× 8
Comme = 6 alors Q3 = 13 (note de rang 6).
4
om
1.3.3 Les déciles
Les déciles d'une série statistique sont les neuf valeurs D1, D2, ………. , D9 du caractère qui partagent la
série statistique en dix parties de même effectif :
f
9 10% au moins de l’effectif total a une valeur inférieure premier décile D1 ;
in
9 90 % au moins de l’effectif total a une valeur inférieure au neuvième décile D9.
2) Paramètres de dispersion
2.1 Etendue
L’étendue d’une série statistique, notée e est la différence entre la plus grande valeur xmax
et la plus petite valeur xmin du caractère.
e = xmax − xmin
Saïd Chermak 2012
7
Saïd Chermak. Master 2012 MAGE
Exemple.
On a relevé dans une classe les dix notes suivantes : 4 ; 12 ; 7 ; 12 ; 10 15 ; 12 ; 8 ;12 ;8
L’étendue e = 15 − 4 , soit e = 11
2.2 Intervalle interquartile
[Q1 ; Q3 ] est appelé, intervalle interquartile d’une série statistique. Il contient 50 % de
l’effectif total.
m
Q3 − Q1 est appelé, écart interquartile. Il mesure la dispersion des valeurs xi autour de la
médiane.
Plus cet écart est petit, plus les valeurs appartenant à l’intervalle interquartile sont proches
co
de la médiane.
L’écart interquartile est un paramètre de dispersion (au même titre que l'étendue).
Il a l’avantage de n’intégrer que 50% de l’effectif total, ce qui a pour effet d’éliminer
l’influence des valeurs extrêmes, souvent marginales.
.
hs
2.3 Ecart absolu moyen
at
Définition : l’écart absolu moyen est la moyenne arithmétique des écarts à la moyenne,
comptée positivement c'est‐à‐dire en valeur absolue.
om
1
Ex =
n
∑ ni xi − x
Aussi, si on fait la moyenne algébrique des écarts ( x i − x ) , alors cette moyenne sera nulle
car les écarts négatifs vont compenser les écarts positifs.
f
1 1
( ∑ n x − nx ) = 1n ⎜⎝⎛ ∑ n x −n∑ nnx ⎟⎠⎞ = 1n ( ∑ n x −∑ n x ) = 0
in
Preuve :
n
∑ ni ( xi − x) =
n
i i i
i i
i i
Pour cette raison, on effectue la moyenne des valeurs absolues des écarts à la moyenne.
Il faut noter que le calcul de l’écart absolu moyen se prête mal à la programmation
informatique à cause justement de la présence des valeurs absolues.
On lui préférera un autre paramètre de dispersion appelé l’écart‐type.
Saïd Chermak 2012
8
Saïd Chermak. Master 2012 MAGE
2.4 Variance et écart‐type
La variance est la moyenne des carrés des écarts à la moyenne.
1
V ( x) = ∑ ni ( xi − x) 2
n i
L’écart‐type est la racine carrée de la variance ou encore.
⎛1 ⎞
σ 2 ( x) = ⎜ ∑
⎝n i
ni ( xi − x) 2 ⎟
⎠
σ ( x) == V ( x)
m
L’écart‐type mesure la dispersion des xi autour de la moyenne x .
co
Il s’exprime dans la même unité que xi , contrairement à la variance qui s’exprime dans l’unité au
carré.
Formule de König
.
Pour les calculs on utilisera la forme développée de la variance.
hs
1 1
∑ ni ( xi − x) 2 = ∑ ni xi2 − x
2
V ( x) =
n i n i
Preuve :
at
1
V ( x) = ∑ ni ( xi − x) 2
n i
om
1 2
V ( x) = ∑ ni ( x i2 − 2 xi x + x )
n i
1 2
V ( x) = (∑ ni x i2 − 2 x ∑ ni xi + x ∑ ni )
f
n i i i
in
Saïd Chermak 2012
9
Saïd Chermak. Master 2012 MAGE
1 1 2 1
V ( x) = ∑
n i
ni xi2 − 2 x ∑ ni xi + x ∑ ni
n i n i
1 2 1
V ( x) = ∑
n i
ni xi2 − 2 xx + x n
n
1
∑ii
2
V ( x) = n x 2
− 2 xx + x
n i
1
∑
2 2
V ( x) = ni xi2 − 2 x + x
n i
1
∑ii
m
2
V ( x) = n x 2
− x
n i
Le coefficient de variation CV est un paramètre de dispersion relative.
co
Il est égal au rapport de l’écart‐type à la moyenne. Il est donc sans unité et s’exprime le plus
souvent en pourcentage.
Il permet de comparer des séries statistiques exprimées dans des unités différentes.
.
Plus la valeur du coefficient de variation est élevée, plus la dispersion autour de la moyenne
hs
est grande.
σ
CV =
x
at
C) Représentation graphique
Il existe plusieurs types de graphique dont la nature est liée à la qualité de la variable
om
statistique.
1) Variables qualitatives
Une entreprise vend des produits catalogués A, B, C, D et E. Les ventes du mois ont été
regroupées dans le tableau suivant :
f
in
Produit A B C D E
Saïd Chermak 2012
10
Saïd Chermak. Master 2012 MAGE
1.1 Diagramme à secteurs
Le secteur A a une mesure de 360°x0,24 soit 86,4°. Les mesures des secteurs B, C, D et E sont
respectivement de 129,6°, 50,4°, 36° et 57,6°.
m
. co
hs
at
om
f
in
1.2 Diagramme à bandes
Saïd Chermak 2012
11
Saïd Chermak. Master 2012 MAGE
m
. co
hs
at
om
2) Variable quantitative discrète
On a relevé les notes d’un élève sur un trimestre.
f
in
Notes 4 6 8 10 14 16
Effectifs 2 7 10 15 8 4
Saïd Chermak 2012
12
Saïd Chermak. Master 2012 MAGE
Diagramme en bâtons
m
. co
hs
at
om
3) Variable quantitative continue
f
L’histogramme est un diagramme composé de rectangles contigus dont l’aire est
in
proportionnelle à l’effectif de chaque classe.
Il faut envisager le cas où les amplitudes des classes sont égales et le cas où ces amplitudes
sont inégales.
En général, pour construire l’histogramme d’une série statistique ([ai , ai +1[, ni ) à variable
continue, il faut associer à chaque classe [ai , ai +1[ ,un rectangle dont la largeur est ai + 1 −
ai et dont l'aire est proportionnelle à l'effectif ni associé à cette classe.
3.1) Classes d’amplitudes égales.
La répartition des employés d’une entreprise selon l’âge est la suivante.
Saïd Chermak 2012
13
Saïd Chermak. Master 2012 MAGE
Ages [ 20 ; 25 [ [ 25 ; 30 [ [ 30 ; 35 [ [ 35 ; 40 [ [ 40 ; 45[ [45 ; 50[
Les classes sont toutes d’amplitudes égales à 5.
m
. co
hs
at
om
f
in
Saïd Chermak 2012
14
Saïd Chermak. Master 2012 MAGE
3.2) Classes d’amplitudes inégales.
La répartition annuelle des salaires versés par une entreprise en milliers d’euros est la
suivante :
Effectifs 6 9 26 20 11 10
Amplitude 4 2 4 8 2 10
Effectifs 3 9 13 5 11 2
rectifiés
m
Comme les amplitudes sont inégales, il faut que l’aire de chaque rectangle soit
proportionnelle à l’effectif de chaque classe. Si l’amplitude 2 est prise comme unité, alors il
co
faut diviser par 2 , par 4 et par 5 les effectifs des classes d’amplitudes respectives 4 , 8 et 10
pour obtenir les effectifs rectifiés, hauteurs des rectangles .
.
hs
at
f om
in
Saïd Chermak 2012
15
Saïd Chermak. Master 2012 MAGE
Méthodes
Pour calculer les quantiles il faut calculer les effectifs cumulés croissants ou les fréquences
cumulées croissantes.
Notes Effectifs Fréquence ECC FCC
2 10 2,50% 10 2,50%
m
4 27 6,75% 37 9,25%
5 48 12,00% 85 21,25%
8 60 15,00% 145 36,25%
co
10 74 18,50% 219 54,75%
11 88 22,00% 307 76,75%
12 46 11,50% 353 88,25%
14 29 7,25% 382 95,50%
15 10 2,50%
.392 98,00%
hs
17 8 2,00% 400 100,00%
Total 400 1
ECC : Effectifs cumulés croissants
FCC : Fréquences cumulées croissantes
at
Méthode 1
Calculer les fréquences.
om
Pour calculer la fréquence d’une modalité :
9 diviser l’effectif de cette modalité par l’effectif total.
9 multiplier le résultat par 100 pour exprimer la fréquence en %.
La somme des fréquences est égale à 1.
Exemple :
50 automobiles ont été réparties en fonction de leur consommation énergétique en quatre classes
f
A, B, C,D.
Il y a 17, 8, 11 et 14 véhicules de classe A, B, C et D respectivement.
in
17
La fréquence des automobiles de classe A est : fA == 0,34 ou 34%
50
8
La fréquence des automobiles de classe B est : f B = = 0,16 ou 16%
50
11
La fréquence des automobiles de classe C est : f C = = 0,22 ou 22%
50
14
La fréquence des automobiles de classe D est : f D = = 0, 28 ou 28%
50
Saïd Chermak 2012
16
Saïd Chermak. Master 2012 MAGE
et f A + f B + fC + f D = 1 ou 100%.
Méthode 2
Calculer les effectifs cumulés croissant s ECC et les effectifs cumulés décroissants ECD:
Pour calculer l’effectif cumulé croissant d’une modalité (ou classe) :
Ajouter à l’effectif de cette modalité (ou de cette classe) la somme des effectifs des modalités (ou
des classes) précédentes.
Pour calculer l’effectif cumulé décroissant d’une modalité (ou classe) :
Ajouter à l’effectif de cette modalité (ou de cette classe) la somme des effectifs des modalités (ou
des classes) suivantes.
m
Exemple.
Températures relevées pendant 300 jours.
co
Températures Effectifs ECC ECD
[ 0 ; 5 ] 63 63 63+237 = 300
[ 5 ; 10 ] 97 97 + 63 = 160 97 + 140 = 237
[ 10 ; 15 ] 88 88 + 160 = 248 88 +52 = 140
[ 15 ; 20 ]
[ 20 ; 25 ]
28
24 . 28 + 248 = 276
24 + 276 = 300
28 +24 = 52
24
hs
Méthode 3
Calculer les fréquences cumulées croissantes FCC et les fréquences cumulées décroissantes FCD:
at
Pour calculer la fréquence cumulée croissante ou la fréquence cumulée décroissante d’une modalité
(ou classe) :
9 Calculer la fréquence de chaque modalité.
om
9 Puis reprendre les étapes de la méthode 2 en remplaçant effectif par fréquence.
Méthode 4
Pour calculer la moyenne arithmétique simple d’une série statistique :
9 additionner toutes les valeurs du caractère de la série.
9 diviser la somme obtenue par l’effectif total de la série
f
Exemple :
in
25, 22, 17, 19,20 est le relevé des températures en degré cinq jours de suite.
25 + 22 + 17 + 19 + 20
La température moyenne est égale à , soit 20,6°
5
Pour calculer la moyenne arithmétique pondérée d’une série statistique :
9 additionner les produits des effectifs par les valeurs correspondantes du caractère.
9 diviser la somme obtenue par l’effectif total
Exemple :
Saïd Chermak 2012
17
Saïd Chermak. Master 2012 MAGE
Le tableau ci‐dessous contient les notes de mathématiques obtenues par les 250 élèves de
troisième lors d’un examen :
.
Notes 4 5 8 10 12 17
27 × 4 + 48 × 5 + 60 × 8 + 64 × 10 + 43 × 12 + 8 × 17
La note moyenne à cet examen est : soit
250
8,48
m
Méthode 5.
Calculer la médiane.
co
Pour calculer la médiane d’une série,:
9 Ordonner les données dans l’ordre croissant ou décroissant.
9 Calculer l’effectif total N .
. N +1
hs
9 Si l’effectif total N est impair, la médiane est la valeur située au rang
2
9 Si l’effectif total N est pair, la médiane est la moyenne arithmétique des 2 valeurs
N N
de rang et de rang + 1
at
2 2
Exemple1.
Un élève a obtenu les notes suivantes : 6 ; 7 ; 8 ; 10 ; 15.
om
N +1 5 +1
Comme N = 5 effectif total impair, alors la médiane est le terme de rang =
2 2
La médiane est donc la valeur située au rang 3, soit M e = 8
Exemple 2
Un élève a obtenu les notes suivantes : 5 ; 8 ; 8 ; 10 ; 12 ; 12 ; 13 ; 16
f
Comme N = 8 effectif total pair, alors la médiane est est la moyenne arithmétique des 2
in
N N 8 8
valeurs de rang et de rang + 1 , soit de rang et de rang + 1
2 2 2 2
La médiane est donc la moyenne des valeurs situées au rang 4 et au rang 5, soit
10 +12
Me = = 11
2
Saïd Chermak 2012
18
Saïd Chermak. Master 2012 MAGE
Méthode 6.
Calculer les quartiles, l’intervalle interquartile et l’écart interquartile.
Pour calculer le premier quartile Q1 :
9 Ordonner les données dans l’ordre croissant.
9 Calculer l’effectif total N .
N
9 Calculer
4
N
9 N est un multiple de 4, alors le premier quartile Q1 est le terme de rang
Si 4
m
9 Si N n’est pas un multiple de 4, alors le premier quartile Q1 est le terme de rang égal
à la partie entière du quotient de N par 4 majorée de 1.
co
Pour calculer le troisième quartile Q3 :
3N
9 Reprendre toutes les étapes ayant permis le calcul de Q1, en calculant .
4
.
L’intervalle interquartile est l’intervalle : [Q1 ; Q3 ]
hs
Pour calculer l’écart interquartile :
9 Calculer Q3‐ Q1
at
Exemple 1 :
Soit la série de valeurs rangées dans l’ordre croissant : 6, 8, 15, 15, 15, 19, 23, 27.
N
Comme l’effectif total, N = 8 et = 2 , alors le premier quartile Q1 est la valeur de rang 2
om
4
, soit Q1=8 et le troisième quartile Q3 est la valeur de rang 6, soit Q3 = 19.
Exemple2:
Soit la série de valeurs : 7, 10, 13, 15, 15, 21, 23, 27, 29, 32, 40.
L'effectif total N = 11 .
f
N 11
= = 2,75 , alors le premier quartile Q1 est le terme de rang (2+1) = 3. Soit
in
Comme
4 4
Q1 = 13
3 N 3 × 11
Comme = = 8, 25 , alors le troisième quartile Q3 est le terme de rang 9.
4 4
Soit Q3 = 29
Le deuxième quartile Q2 est égal à la médiane. Q2=Me = 21, terme de rang 6
L’intervalle interquartile est l’intervalle : [13 ; 29 ]
L’ écart‐interquartile égal à Q3 – Q1= 29 – 13 , soit 16.
Saïd Chermak 2012
19
Saïd Chermak. Master 2012 MAGE
Méthode 7.
Calculer les déciles.
Pour calculer le premier quartile D1 :
9 Ordonner les données dans l’ordre croissant.
9 Calculer l’effectif total N .
9 Calculer
N
9 Calculer
10
N
9 Si N est un multiple de 10, alors le premier décile D1 est le terme de rang
m
10
9 Si N n’est pas un multiple de 10, alors le premier décile D1 est le terme de rang égal
à la partie entière du quotient de N par 10 majorée de 1.
co
Exemple2:
Soit la série de valeurs : 2,5,7,7,10,10,10,11,12, 12, 13,14,14,15,15,15,16,18
L’effectif total N = 18 .
N 18 .
= = 1,8 , alors le premier décile D1 est la valeur de rang 2. Soit D1 = 5
hs
Comme
10 10
9 N 9 × 18
Comme = = 16, 2 , alors le neuvième décile D9 est le valeur de rang 17. Soit
10 10
at
D9 = 16.
Méthode 8.
om
Pour tracer le polygone ou courbe des effectifs cumulés croissants ECC :
9 Tracer un repère avec en abscisse les classes et en ordonnée les ECC.
9 Placer chaque point dont l’abscisse est la borne supérieure de la classe et l’ordonnée
l’effectif cumulé croissant associé à cette classe.
9 Joindre tous les points par une ligne brisée en ajoutant le point d’abscisse égale à la borne
f
inférieure de la plus petite classe et d’ordonnée 0.
in
Pour tracer le polygone ou courbe des effectifs cumulés décroissants ECD :
9 Placer chaque point dont l’abscisse est la borne inférieure de la classe et l’ordonnée l’effectif
cumulé décroissant associé à cette classe.
9 Joindre tous les points par une ligne brisée en ajoutant le point d’abscisse égale à la borne
supérieure de la plus grande classe et d’ordonnée 0.
Exemple :
Reprenons l’énoncé développé dans la méthode 2.
Températures relevées pendant 300 jours.
Saïd Chermak 2012
20
Saïd Chermak. Master 2012 MAGE
m
co
.
hs
Méthode 9.
Pour déterminer la médiane et les quartiles graphiquement :
at
9 Tracer le polygone des effectifs cumulés croissants ECC.
N
9 L’abscisse du point de la courbe d’ordonnée est la médiane, Me.
2
om
N
9 L’abscisse du point de la courbe d’ordonnée est le premier quartile Q1.
4
3N
9 L’abscisse du point de la courbe d’ordonnée est le troisième quartile Q3.
4
f
in
Méthode 10.
Pour tracer un diagramme en boîte :
9 Calculer le premier quartile Q1, la médiane Me et le troisième quartile Q3.
9 Tracer au‐dessus d’une droite graduée un rectangle délimité par le premier quartile
Q1 ,le troisième quartile Q3 et coupé par la médiane Me. Ce rectangle constitue le
diagramme en boîte.
9 Tracer ensuite deux segments délimités par les valeurs extrêmes.
Les extrémités des deux segments peuvent aussi être le premier et le neuvième décile.
Saïd Chermak 2012
21
Saïd Chermak. Master 2012 MAGE
Exemple
Note minimale 2 , note maximale 17, Q1 = 8, Me = 10 et Q3 = 11.
m
. co
hs
ENTRAINEMENT A L’EPREUVE
at
Autoévaluation
om
1) Patrick a relevé les températures moyennes journalières du mois d’avril :
Température 10 12 17 19
f
moyenne en °C
in
Nombre de jours 6 8 12 5
La température moyenne du mois d’avril est égale à :
a) 14,85 b) 14,94 c) 14,5 d) 15,25
Corrigé 1
6 × 10 + 8 × 13 + 12 × 17 + 5 × 19
Moyenne = Soit 14,94
6 + 8 + 12 + 5
Saïd Chermak 2012
22
Saïd Chermak. Master 2012 MAGE
La bonne réponse est la b)
2) En utilisant le relevé des températures donné en 1), la température médiane est
égale à :
a) 12 b) 14,5 c) 14,2 d) 17
Corrigé 2
31 + 1
L’effectif total est égal à 31. La médiane est donc la valeur de rang = 16 .
2
La valeur de rang 16 , est 17. D’où Me = 17
m
La bonne réponse est la d)
3) En utilisant le relevé des températures donné en 1), l’écart interquartile est égal à :
a) 3 b) 4 c) 5 d) 6
co
Corrigé 3
L’écart interquartile = Q3 – Q1
31
= 7,75 , soit la valeur de rang 8. On a donc Q1 = 12
Q1 est la valeur de rang
4 .
hs
3
Q3 est la valeur de rang × 31 = 23,25 , soit le rang 24. On a donc Q3 = 17
4
On en déduit que l’écart interquartile est égal à 17 – 12 , soit 5
at
La bonne réponse est la c)
om
4) Lors d’un examen, 4 candidats ont passé la même épreuve. les trois premiers ont
obtenu 10, 11 et 13 sur 20 respectivement. La moyenne des quatre candidats est de
12,75/20.
La note obtenue par le quatrième candidat est égale à :
a) 17/20 b) 15/20 c) 13/20 d) on ne peut pas la calculer
f
Corrigé 4
in
10 + 11 + 13 + x
Si x est la note du quatrième candidat , on a alors = 12,75
4
Soit x = 4 × 12,75 − (10 + 11 + 13) . D’où x = 17
La bonne réponse est la a)
5) La moyenne arithmétique de 8 nombres est 13. En retirant l’un de ces nombres la
moyenne est alors égale à 12 . Le nombre retiré est égal à :
Saïd Chermak 2012
23
Saïd Chermak. Master 2012 MAGE
a) 8 b) 16 c) 20 d) 21
Corrigé 5
Le total des nombres est égal à 8 × 13 = 104 .
104 − x
Si x est le nombre retiré alors = 12 , car il ne reste plus que 7 nombres.
7
On en déduit que x = 20
La bonne réponse est la c)
6) La moyenne à un devoir, d’une classe de 15 élèves présents était de 12/20. Un élève
m
absent ayant composé le lendemain a relevé la moyenne de la classe à 12,25/20.
La note obtenu par le 16ième élève est égale à :
a) 9 b) 12 c) 15 d) 16
co
Corrigé 6
Le total des points obtenu par les 15 élèves présents est égal à : 15 × 12 = 180 .
180 + x
Si x est la note obtenue par le 16ième élève, alors = 12, 25
On en déduit que x = 16
. 16
hs
La bonne réponse est la d)
7) L’étendue de la série de nombres suivante : 6 ; 7 ; 15 ; 3 ; 10 ; 12 ; 11 ; 9 est égale à :
at
a) 15 b) 12 c) 11 d) 3
Corrigé 7
om
L’étendue e d’une série statistique est la différence entre la valeur maximale et la valeur minimale.
On a donc e = 15 − 3 = 12
La bonne réponse est la b)
8) La médiane de la série de 15 nombres suivante : 2,2 ; 1,8 ; 1,9 ; 2,2 ; 2 ; 1,9 ;2,2 ;
f
1,8 ;1,9 ; 1,7 ; 2 ; 2,4 ; 2 ; 1,7 ; 2 est égale à :
in
a) 1,8 b) 1,9 c) 2 d) 2,1
Corrigé 8
On ordonne la série dans un ordre croissant.
1,7 ;1,7 ;1,8 ; 1,8 ; 1,9 ; 1,9 ; 1,9 ; 2 ; 2 ; 2 ; 2 ; 2,2 ; 2,2 ; 2,2 ; 2,4.
15 + 1
La médiane est la valeur de rang = 8 . Soit Me = 2
2
La bonne réponse est la c)
Saïd Chermak 2012
24
Saïd Chermak. Master 2012 MAGE
9) Le mode d’une variable statistique est :
a) La modalité ayant le plus petit effectif
b) La modalité ayant le plus grand effectif
c) Le plus grand des effectifs
Corrigé 9
La bonne réponse est la b)
10) En augmentant toutes les notes des élèves d’une classe de 1 point, la note moyenne
de la classe augmentera de 1 point.
m
a) vrai b) faux c) On ne pas conclure
Corrigé 10
co
La bonne réponse est la a)
.
hs
at
11) En augmentant toutes les notes des élèves d’une classe de 1 point, la note médiane
de la classe augmentera de 1 point.
a) vrai b) faux c) On ne peut pas conclure
om
Corrigé 11
En augmentant toutes les notes de 1 point le nombre de valeurs reste inchangé.
La médiane est donc la valeur de même rang majorée de 1 point.
f
La bonne réponse est la a)
in
12) Soit les valeurs rangées dans l’ordre croissant :
2; 4 ; 4 ; 6 ; 7 ; 7 ; 8 ; 9 ; 9 ; 10 ; 10 ; 10 ; 10 ; 11 ; 11 ; 12 ; 13 ; 13 ; 13 ; 14 ; 15
Le troisième quartile Q3 est égal à :
a) 10 b) 11 c) 12 d) 13
Corrigé 12
3
L’effectif total est égal à 21. Q3 est la valeur de rang × 21 = 15,75 , soit la valeur de rang 16.
4
Saïd Chermak 2012
25
Saïd Chermak. Master 2012 MAGE
On a Q3 = 12.
La bonne réponse est la c)
13) Un test effectué sur un échantillon de composants électroniques a donné les
résultats suivants :
Durée de vie en heures Nombre de composants
[800 ; 1000 [ 420
[1000 ; 1200 [ 1234
m
[1200 ; 1400 [ 1850
[1400 ; 1600 [ 1216
[1600 ; 2000 [ 280
co
La durée de vie moyenne d’un composant est égale à :
a) 1283,50 b) 1175,72 c) 1285,65 d) 1293,68
Corrigé 13
.
Après avoir calculé le centre de chaque classe, on en déduit la vie moyenne :
420 × 900 + 1234 × 1100 + 1850 × 1300 + 1216 × 1500 + 280 × 1800
hs
, soit 1293,68
420 + 1234 + 1850 + 1216 + 280
La bonne réponse est la d)
at
14) En reprenant le test précédent, est‐il exact d’affirmer que 25% au plus des
composants ont une durée de vie inférieure à 1400 h.
• vrai b) faux
om
Corrigé 14
Le nombre de composants dont la durée de vie est inférieure à 1400 h est égal à 420+1234+1850,
soit 3504.
f
3504
Le pourcentage correspondant est égal à : × 100
420 + 1234 + 1850 + 1216 + 280
in
Soit 70,1%.
L’affirmation est fausse.
La bonne réponse est la b)
Saïd Chermak 2012
26
Saïd Chermak. Master 2012 MAGE
Entraînement aux exercices et aux problèmes de mathématiques.
Exercice 1
m
. co
hs
at
Corrigé 1
1. Les notes rangées par ordre croissant sont les suivantes :
om
Notes 2 4 5 6 7 8 9 10 11 12 13 15 17 18 19 Total
Effectifs 1 3 1 2 2 2 2 1 2 2 4 2 1 2 1 28
Effectifsxnotes 2 12 5 12 14 16 18 10 22 24 52 30 17 36 19 289
f
in
2. L’effectif total de ce groupe est : N = 28
289
3. La moyenne des notes de cette classe est : x = . Soit x = 10,3 à 0,1 près.
28
4. Comme l’effectif total 28 est pair alors la médiane est la moyenne des 14ième et 15ième valeurs,
4+5
soit 4 et 5 respectivement. D’où Me = = 4,5
2
Saïd Chermak 2012
27
Saïd Chermak. Master 2012 MAGE
5. Comme il y a 15 notes supérieures ou égales à 10 et 28 notes au total alors la probabilité que
15
la note de cette copie soit supérieure ou égale à 10 est égale à : .
28
Exercice 2
m
. co
hs
at
Corrigé 2
om
1) Le temps moyen d’attente aux caisses est :
14 × 1 + 13 × 2 + 23 × 3 + 9 × 4 + 14 × 5 + 8 × 6 + 12 × 7 + 4 × 8 + 1 × 9 + 2 × 10
x=
100
Soit un temps moyen d’attente de 4,08 min.
2) La médiane est la moyenne des valeurs de rang 50 et 51, soit 3 et 4 respectivement.
f
La médiane est donc égale à 3,5.
in
100
Le premier quartile est la valeur dont le rang est supérieure ou égal , Q1 est la 25ième
4
valeurs, soit Q1= 2.
3
Le trosième quartile est la valeur dont le rang est supérieure ou égal × 100 , Q3 est la 75ième
4
valeurs, soit Q3= 6.
3) Diagramme en boîte
Saïd Chermak 2012
28
Saïd Chermak. Master 2012 MAGE
Exercice 3
m
. co
hs
at
om
f
ANNEXE Figure 1
in
Saïd Chermak 2012
29
Saïd Chermak. Master 2012 MAGE
m
Corrigé 3.
co
1. Les résultats rangés par ordre croisant sont les suivants :
.
hs
a) Le niveau moyen de bruit sur la période étudiée est :
2 × 50 + 52 + 55 + 56 + 2 × 64 + 65 + 73 + 2 × 74 + 79
x= = 63
12
at
b) Les valeurs extrêmes sont 50 pour la valeur minimale et 79 pour la valeur maximale.
L’étendue est alors e = 79 − 50 = 29 .
om
c) La médiane est la valeur de la variable séparant la série en deux séries de même effectif.
Comme l’effectif total est 12, entier pair alors la médiane est la moyenne des valeurs de rang 6 et
64 + 64
7 respectivement égale à 64 et 64. D’où Me = = 64 .
2
Le premier quartile Q1 est la valeur dont le rang est le plus petit entier supérieure ou égal à:
f
N 12
= = 3 , valeur de rang 3. Soit Q1 = 52
in
4 4
Le troisième quartile est la valeur dont le rang est le plus petit entier supérieure ou égal à :
3 3
N = × 12 = 9 , valeur de rang 9. Soit Q3 = 73
4 4
L’écart interquartile est : e = 73 − 52 = 21
2. a) Voir ANNEXE Figure1
Saïd Chermak 2012
30
Saïd Chermak. Master 2012 MAGE
b) Le niveau sonore est moins dispersé donc, plus constant dans la rue Beausoleil que dans la rue
Bellepomme car l’étendue y est plus réduite. Le niveau sonore dans la rue Beausoleil est plus
faible que celui de la rue Bellepomme car la médiane et la valeur maximale y sont plus petites.
A l’aide des différentes données, on peut affirmer que les habitants de la rue Beausoleil
jouissent d’un meilleur cadre de vie.
ANNEXE Figure 1
m
co
Exercice 4
.
hs
Le tableau ci‐dessous donne le relevé des précipitations atmosphériques sur 60 jours dans une région
donnée.
Hauteur de
pluie [0 ; 5[ [5 ; 10[ [10 ; 15[ [15 ; 20[ [20 ; 25[ [25 ; 30[
at
(en mm)
Nombre de
17 12 3 12 14 2
om
jours
1) Calculer le mode, la moyenne.
2) Déterminer graphiquement, la médiane et les quartiles.
3) Représenter le diagramme en boîte.
f
in
Corrigé 4
Effectifs
Hauteur des cumulés
précipitations Centre de croissants
(en mm) classe xi Effectifs ni EEC ni*xi
[ 0 ; 4 [ 2 17 17 34
Saïd Chermak 2012
31
Saïd Chermak. Master 2012 MAGE
1. Comme les classes sont amplitudes égales alors la classe modale est la classe
associée au plus grand effectif, soit la classe [ 0 ; 4 [ . le mode est égal au centre de
classe, soit 2
m
La moyenne x =
∑n x i i
=
600
soit 10 mm
N 60
co
2. On trace la courbe des effectifs cumulés croissants.
La médiane est l’abscisse du point de la courbe d’ordonnée 60/2, soit la moitié de l’effectif
total.
Par lecture graphique on a: Me ≈ 9,3 .
.
hs
Le premier quartile Q1 et le troisième quartile Q3 sont les abscisses des points de la courbe
60 3
d’ordonnées respectives : = 15 et × 60 = 45 .
4 4
at
Par lecture graphique on a : Q1 = 3,5 et Q3 = 16,3.
f om
in
Saïd Chermak 2012
32
Saïd Chermak. Master 2012 MAGE
m
. co
hs
at
f om
in
Diagramme en boîte
Saïd Chermak 2012
33
Saïd Chermak. Master 2012 MAGE
m
co
.
hs
P
at
om
Ecart absolu moyen
Définition : l’écart absolu moyen est la moyenne arithmétique des écarts par rapport à la
f
in
tendance centrale, exprimée en valeur absolue.
1
E x = ∑ ni xi − x
n
Eclaircissement :
Saïd Chermak 2012
34
Saïd Chermak. Master 2012 MAGE
Pourquoi écart absolu xi − x ? C’est une mesure de distance en mathématique
(valeur observée –valeur moyenne en absolue). Ce qui compte c’est l’écart et non
pas le signe de cet écart.
Exemple : Imaginons qu’une moyenne est de –1. L’écart d’une observation ‐3, par rapport à
la moyenne est : |‐3‐(‐1)|=|‐2|=2. Un écart c’est, par essence, une valeur absolue.
Aussi, si on fait la moyenne des écarts ( x i − x ) sans prendre les valeurs absolues alors
m
cette moyenne sera de 0. Car il va y avoir des valeurs négatives (inférieurs à la moyenne) et
des valeurs positives (supérieurs à la moyenne) qui vont s’équilibrer.
co
⎛ ⎞
1⎜ ni xi ⎟
Démonstration : 1 1
∑ni (xi − x) = n ( )
∑ni xi − nx = n ⎜∑ni xi − n∑ n ⎟ = 0
n ⎜
⎟
. ⎝ 0 ⎠
hs
D’où l’utilité de faire une moyenne de valeurs absolues des différences à la moyenne
(écarts)
at
f om
in
Saïd Chermak 2012
35