Vous êtes sur la page 1sur 7

STATISTIQUES ET ECHANTILLONNAGE

I. Caractristique de position dune srie statistique


1) Sries statistiques

Voici les sries de notes obtenues par 3 lves :

Jrme : 4 ; 6 ; 18 ; 7 ; 17 ; 12 ; 12 ; 18
Bertrand : 13 ; 13 ; 12 ; 10 ; 12 ; 3 ; 14 ; 12 ; 14 ; 15
Julie : 15 ; 9 ; 14 ; 13 ; 10 ; 12 ; 12 ; 11 ; 10

2) Moyennes

M(Jrme) = (4 + 6 + 18 + 7 + 17 + 12 + 12 + 18) : 8 11,8


M(Bertrand) = (13 + 13 + 12 + 10 + 12 + 3 + 14 + 12 + 14 + 15) : 10 = 11,8
M(Julie) = (15 + 9 +14 + 13 + 10 + 12 + 12 + 11 + 10) : 9 11,8

La moyenne est une caractristique de position.

3) Mdianes

Dfinition :
La mdiane m est une valeur de la srie telle que la moiti de leffectif ait des valeurs infrieures m,
lautre moiti des valeurs suprieures m.

Pour dterminer les notes mdianes, il faut ordonner les sries. La mdiane partage leffectif en deux.

Jrme : 4 6 7 12 12 17 18 18

4 donnes 4 donnes

m(Jrme) = 12

Bertrand : 3 10 12 12 12 13 13 14 14 15

5 donnes 5 donnes

m(Bertrand) = (12 + 13) : 2 = 12,5

Julie : 9 10 10 11 12 12 13 14 15

4 donnes 4 donnes

m(Julie) = 12

La mdiane est une caractristique de position.

Page 1 sur 7
II. Caractristiques de dispersion dune srie statistique
1) Etendue

Dfinition :
Ltendue dune srie statistique est la diffrence entre la plus grande valeur et la plus petite valeur de la
srie.

En reprenant les donnes de lexemple tudi au paragraphe I. :

E(Jrme) = 18 4 =14 E(Bertrand) = 15 10 = 5 E(Julie) = 15 9 = 6

car 3 est ngligeable dans la srie de Bertrand.


On dit quon a lagu la srie.

Ltendue est une caractristique de dispersion.

2) Quartiles

Dfinitions :
Le premier quartile est la plus petite valeur de la srie telle qu'au moins 25 % des autres valeurs de la
srie sont infrieures ou gales cette valeur.
Le troisime quartile est la plus petite valeur de la srie telle qu'au moins 75 % des autres valeurs de la
srie sont infrieures ou gales cette valeur.

Pour dterminer les quartiles, il faut ordonner les sries.


Le premier quartile est la donne de la srie se trouvant au quart de leffectif.
Le troisime quartile est la donne de la srie se trouvant au trois-quarts de leffectif.

Jrme : 4 6 7 12 12 17 18 18

1
x 8 = 2, le premier quartile est la 2e donne de la srie ordonne.
4
3
x 8 = 6, le troisime quartile est la 6e donne de la srie ordonne.
4
Q1(Jrme) = 6 Q3(Jrme) = 17

Bertrand : 3 10 12 12 12 12 13 14 15 15

1
x 10 = 2.5, le premier quartile est la 3e donne de la srie ordonne.
4
3
x 10 = 7.5, le troisime quartile est la 8e donne de la srie ordonne.
4
Q1(Bertrand) = 12 Q3(Bertrand) = 14

Julie : 9 10 10 11 12 12 13 14 15

1
x 9 = 2.25, le premier quartile est la 3e donne de la srie ordonne.
4
3
x 9 = 6.75, le troisime quartile est la 7e donne de la srie ordonne.
4

Page 2 sur 7
Q1(Julie) = 10 Q3(Julie) = 13

Les quartiles sont des caractristiques de dispersion.

3) Interprtations

M(Jrme) = 11,8 m(Jrme) = 12 E(Jrme) = 14 Q1(Jrme) = 6


Q3(Jrme) = 17
M(Bertrand) = 11,8 m(Bertrand) = 12,5 E(Bertrand) = 5 Q1(Bertrand) = 12
Q3(Bertrand) = 14
M(Julie) 11,8 m(Julie) = 12 E(Julie) = 6 Q1(Julie) = 10
Q3(Julie) = 13

Les moyennes sont environ gales et pourtant les notes ne se rpartissent pas de la mme manire
autour de cette caractristique de position. Les tendues sont trs diffrentes.

Dire que Jrme une mdiane gale 12 signifie que Jrme a obtenu autant de notes au dessus de 12
que de notes en dessous de 12.

Dire que le premier quartile de Bertrand est gal 12 signifie quau moins un quart des notes de Bertrand
sont infrieures 12.

Dire que le troisime quartile de Julie est gal 13 signifie quau moins trois quarts des notes de Julie
sont infrieures 13.

III. Effectifs cumuls et frquences cumules


1) Srie statistique

Tailles des lves de 2nde5 en cm :


174 160 161 166 177 172 157 175 162 169 160 165 170 152 168 156 163 167 169
158 164 151 162 166 156 165 179

2) Regroupement par classe

Regrouper cette srie de tailles par classes de longueur 5 cm et calculer les frquences en % arrondies
lunit :

Tailles 150 t <155 155 t <160 160 t <165 165 t <170 170 t <175 175 t<180
Effectifs 2 4 7 8 3 3
2
Frquences x100 = 7 15 26 30 11 11
27
Leffectif total est 27.

Page 3 sur 7
HISTOGRAMME DES EFFECTIFS DES TAILLES

Remarque :
Dans un histogramme, laire des rectangles est proportionnelle leffectif (ou la frquence).
Ainsi, dans lexemple, en regroupant les deux premires classes, on obtiendrait la reprsentation
suivante :

3) Moyenne :
a) Calcul de la moyenne en centrant les classes :

Classes
152 157 162 167 172 177
centres
Effectifs 2 4 7 8 3 3
Il sagit dun calcul de moyenne pondr.

Dfinition :
La moyenne dune srie statistique dont les valeurs sont x1, x2 , , xk et les effectifs correspondants n1, n2,
n1 x1 ... nk xk
, nk est note x et est gale x .
n1 ... nk

Page 4 sur 7
Ainsi dans lexemple :
(152 x 2 + 157 x 4 + 162 x 7 + 167 x 8 + 172 x 3 + 177 x 3) : 27
= 4449 : 27
164,8 cm
b) Calcul de la moyenne exacte :

(174 + 160 + 161 + 166 + 177 + 172 + 157+ 175 + 162 + 169 + 160 + 165 + 170 + 152 + 168 + 156 + 163
+ 167+ 169 + 158 + 164 + 151 + 162 + 166+ 156 + 165 + 179) : 27
= 4444 : 27
164,6 cm
La mthode de calcul de moyenne en centrant les classes est trs fiable (ici : 2 mm derreur)

4) Cumuls:

Tailles t <155 t <160 t <165 t <170 t <175 t <180

Effectifs
cumuls 2 6 13 21 24 27
croissants
Frquences
cumules
7 22 48 78 89 100
croissantes
en %

Quel est le pourcentage dlves dont la taille est infrieure 170 cm ? 78%
Quel est le pourcentage dlves dont la taille est comprise entre 160 cm et 170 cm?
78 22 = 56%
Combien y a-t-il dlves dont la taille est suprieure 165 cm ? 27 - 13 = 14

Polygone des effectifs cumuls croissants :

Page 5 sur 7
IV. Echantillonnage
1) Notion dchantillon

Exemple :
Si, sur lensemble des cartes puce produites par une entreprise en une semaine, on en prlve
200, on dit que cet ensemble de 200 cartes puce constitue un chantillon de taille 200 de la
population de toutes les cartes puce produites en une semaine.

Dfinition :
Un chantillon de taille n est constitu des rsultats de n rptitions indpendantes de la mme
exprience sur lensemble des personnes ou objets sur lesquels porte ltude statistique (la
population).
Un chantillon issu dune population est donc lensemble de quelques lments de cette population.

2) Intervalle de fluctuation

On suppose que 22% des cartes puce produites par lentreprise sont dfectueuses.
La proportion effective p est donc gale 22%.
On prlve un chantillon de taille 200 parmi cette production et on compte le nombre de cartes puce
dfectueuses parmi cette chantillon. Ce nombre est gal 41.
41
Dans ce cas, la frquence observe f est gale 0,205 .
200
Pour un chantillon de taille 200, lintervalle de uctuation de la frquence p des cartes puce dfectueuses
au seuil de 95 %, est un intervalle de centre 0,22 tel que les frquences observes se trouvent dans cet
intervalle pour 95 % des chantillons de taille 200.

Dfinition :
Lintervalle de fluctuation au seuil de 95% dune frquence dun chantillon de taille n est lintervalle
centr autour de la proportion effective p tel que la frquence observe f se trouve dans lintervalle
avec une probabilit gale 0,95.

Proprit :

Pour 0,2 < p < 0,8 et n > 25, lintervalle de fluctuation au seuil de 95% de f est lintervalle
1 1
p ; p .
n n

Cela signifie quon a une probabilit de 0,95 pour que la frquence observe se trouve dans
1 1
lintervalle p ;p
n
.
n
Page 6 sur 7
Remarque :
2
Lamplitude de cet intervalle est gale .
n

Dans lexemple prcdent, lintervalle de fluctuation au seuil de 95% de p=0,22 est


1 1
0,22 200 ;0,22 200 soit de faon approche [0,15 ; 0,29].

3) Intervalle de confiance

Dfinition :
Soit p la proportion effective tel que 0,2 < p < 0,8.
On considre la frquence observe f pour un chantillon donn de taille
n > 25.
1 1
Lintervalle f ;f est appel un intervalle de conance (ou fourchette de sondage) de
n n
p au niveau 0,95.

Proprit :
95 % des intervalles de confiance associs aux chantillons de taille n possibles ayant comme
frquence observe f contiennent la proportion effective p.

Exemple :
Un jeu consiste tirer 100 billes dun sac contenant 300 billes noires et 300 billes blanches.
Lexprience peut tre simule avec un tableur afin deffectuer rapidement un grand nombre de tirage.
Pour cet chantillon de taille 100, on compte le nombre de billes noires et on calcule la frquence observe f.
On pourrait ainsi vrier que, dans 95 % des cas, la frquence des billes noires dans lchantillon appartient
lintervalle :
1 1
0,5 100 ;0,5 100 soit : [0,4 ; 0,6].

o p = 0,5 et n = 100.

NUAGE DE POINTS DES FREQUENCES OBSERVEES


DES BILLES NOIRES POUR 50 TIRAGES EFFECTUES

Page 7 sur 7