Vous êtes sur la page 1sur 64

TABLE DES MATIERES

CHAPITRE 1: Elments de statistiques descriptives .................................................................................................... 2


1. Introduction ....................................................................................................................................................... 2
2. Les diffrents types de variables non chronologiques ...................................................................................... 3
3. La collecte des donnes ..................................................................................................................................... 4
4. Premier exemple : Variable discrte quantitative .............................................................................................. 6
5. Deuxime exemple : Variable continue quantitative ....................................................................................... 10
6. Petit test recapitulatif sur le vocabulaire ......................................................................................................... 13
7. Les paramtres de position: la moyenne, le mode , la mdiane, les quantiles ................................................. 14
8. Les paramtres de dispersion: l'cart moyen, l'cart-type et la variance ......................................................... 19
9. Population et chantillon ................................................................................................................................. 22
10.
Le coefficient de variation........................................................................................................................... 23
11.
Exercices divers .......................................................................................................................................... 24
12.
Piges statistiques sous forme de graphiques .............................................................................................. 27
CHAPITRE 2 : les probabilits,les variables alatoires et les lois de probabilit ....................................................... 30
1. Probabilits : dfinitions ................................................................................................................................. 30
2. Les variables alatoires (V.A.) ........................................................................................................................ 32
3. Les variables alatoires discrtes .................................................................................................................... 32
4. Les variables alatoires continues ................................................................................................................... 36
5. Loi de probabilit observe et loi de probabilit thorique ............................................................................. 37
6. La loi normale (loi de Laplace-Gauss) ............................................................................................................ 38
7. Le test du Khi Carr ( 2): Vrification de la normalit d'une distribution...................................................... 42
CHAPITRE 3 : Infrence statistique ........................................................................................................................... 47
1. Principes de l'infrence statistique .................................................................................................................. 47
2. L'estimation ..................................................................................................................................................... 48
3. Estimation ponctuelle ...................................................................................................................................... 49
4. Le thorme central limite .............................................................................................................................. 50
5. Estimation par intervalle de confiance ............................................................................................................ 50
6. Intervalle de confiance de la moyenne ......................................................................................................... 51
7. Intervalle de confiance d'une frquence (n 30) ............................................................................................ 53
8. Exercices ......................................................................................................................................................... 54

CHAPITRE 1: ELMENTS DE STATISTIQUES


DESCRIPTIVES
1.

INTRODUCTION

Sur base des documents observs (extraits de journaux, revues, livres, ), on se rend compte sans difficult que les
tudes statistiques envahissent notre vie. Mais comment peut-on dfinir la statistique ?
La statistique est une branche des mathmatiques qui a pour but, dans un premier temps, de rassembler une srie de
donnes et de les prsenter (statistique descriptive). Dans un deuxime temps, ces donnes sont interprtes afin
den tirer des conclusions et d'effectuer des prvisions ventuelles (statistique infrentielle).
Linterprtation et lutilisation de donnes statistiques se retrouve dans de trs nombreux domaines dont notamment,
les sciences humaines, les sciences conomiques, les mdias, la gestion des entreprises, la recherche mdicale, ... Ce
n'est pas pour rien qu'un cours de statistique est prsent en premire anne de la plupart des graduats et des
universits.

Exemple dapplication : laccidentologie (tudes scientifiques des accidents)


Grce aux statistiques, nous avons aujourdhui une meilleure connaissance de laccidentologie. Les premires
statistiques des accidents de la circulation remontent pratiquement la naissance de lindustrie automobile.
Mais, au fil des annes, elles nont cess de saffiner, gagnant en fiabilit, en prcision et en rapidit, afin de
disposer dune connaissance dtaille de notre accidentologie.
Il y a trois bonnes raisons cela.
*

Il sagit pour les pouvoirs publics davoir la vision la plus claire, la plus prcise possible sur les causes et
les conditions des accidents qui surviennent sur les diffrents rseaux. (les lieux, les conditions
atmosphriques, lclairement, les individus et les vhicules impliqus, ...). Le choix des "armes" dpend
troitement de lennemi que lon a combattre et seules les statistiques permettent de bien le dfinir.

Une fois les actions dcides et mises en uvre, il sagit dvaluer leur efficacit sur le terrain. L encore,
les statistiques permettent de mesurer objectivement les effets des actions entreprises, de faon pouvoir les
gnraliser si celles-ci sont positives, ou bien les amender si elles ne donnent pas entire satisfaction.

La diffusion des statistiques permet de faire partager lensemble des usagers notre connaissance sur
laccidentologie. Cest indispensable si lon veut obtenir leur adhsion une lutte qui passe forcment par
un consensus social. Savoir, par exemple, quune baisse sensible des accidents qui concide avec la mise en
place de nouvelles mesures peut convaincre des usagers, jusque-l incrdules, de lintrt de ces mesures ...

Des mesures de vitesses sont ralises sur les diffrents rseaux routiers. Les appareils utiliss permettent
galement de reprer les interdistances entre les vhicules. Lvolution des comportements sur certains points
importants (lalcool, le port de la ceinture et du casque, etc.) vient complter les donnes strictement
accidentologiques. Et dautres enqutes doivent sy ajouter : sur le respect des feux rouges, lutilisation des
tlphones portables au volant, etc ...

Au dpart, on se base gnralement sur les rsultats dune enqute. La variable (ou le caractre) tudie dans
lenqute peut tre de diffrents types :

donnes ou variables non chronologiques : Dans ce cas, la variable (ou le caractre tudi lors de
lenqute) peut tre discrte ou continue ainsi que qualitative ou quantitative. Ce sont des donnes non
chronologiques, cest--dire des donnes dont on n'tudie pas l'volution en fonction du temps. (Exemples :
taille, poids, vote, d'un ensemble de personnes un moment donn)

donnes ou variables chronologiques : On analyse l'volution des valeurs de la variable en fonction du


temps. (Exemples: chiffre d'affaire d'une socit au cours des annes, population de Schaerbeek de 1831
1970)
2

2.

LES DIFFERENTS TYPES DE VARIABLES NON CHRONOLOGIQUES

Les diffrents types de variables non chronologiques sont les suivantes :


2.1. Variable qualitative
Une variable qualitative exprime une qualit et est une variable dont les valeurs ne sont ni mesurables ni reprables
(ce ne sont pas des nombres).
Les valeurs prises par une variable qualitative sont appeles des modalits qui portent des noms. Cest la raison
pour laquelle on parle aussi de variable nominale .
Exemples: couleur, profession, marque de voitures, ...
Variable ordinale
Les modalits dune variable qualitative sont parfois ordonnes. On parle dans ce cas de variable ordinale.
Exemples :
-

Les grades aux examens : Aj, S, D, GD, PGD.


Les degrs dune brulure : 1er, 2me, 3me.
La pratique dun sport : jamais, rarement, souvent, trs souvent.

2.2. Variable quantitative


Une variable quantitative est une variable dont les valeurs sont mesurables ou reprables par des nombres rels. Les
valeurs de la variable sont des nombres. Exemples: salaire, temprature, taille, poids, ...
2.2.1.

Variable discrte quantitative

Une variable quantitative discrte est une variable dont les valeurs sont en nombre fini (un petit nombre de valeurs
possibles).
Exemples: ges des lves de 6me secondaire, nombre de filles dans une famille de cinq enfants, ...
2.2.2.

Variable continue quantitative

Une variable quantitative continue est une variable qui peut prendre toutes les valeurs possibles dans un intervalle
(un grand nombre de valeurs possibles).
Exemples: taille d'une population, poids, la pression artrielle, ...
Exercices
Parmi les exemples suivants, indique quelles sont les caractristiques de la variable tudie.

Le nombre d'enfants de 0 24 ans par famille en France en 2003.

Les marques de voitures neuves immatricules en Belgique pendant le 1 er semestre de l'anne 2002.

La marque de GSM prfre des adolescents.

Le temps quotidien pass devant la tlvision

Le nombre de lancs sur 5 russis au basket-ball pour 25 lves.

La taille de cent personnes adultes de sexe masculin.

Les marques de chocolat les plus apprcies par les lves de l'cole.
3

Voici un tableau brut donnant les puissances (en watts) des ampoules disponibles lors d'un inventaire :
60
100
75
60

100
100
150
100

40
60
40
150

100
60
40
75

150
60
100
60

60
40
75
100

100
75
75
100

40
60
150
100

Quelle variable est tudie ? Est-elle quantitative ou qualitative ? Est-elle continue ou discrte ?
Rponse : .....................................................................................................................................................
Voici un tableau brut reprenant la taille des lves dune classe. On obtient les rsultats suivants :
165
192
162
159
168

172
168
161
160
165

181
175
185
182
178

158
180
195
186
175

172
184
178
192
175

156
159
189
187
182

190
178
175
152
180

Quelle variable est tudie ? Est-elle quantitative ou qualitative ? Est-elle continue ou discrte ?
3.

LA COLLECTE DES DONNES

3.1. L'chantillonnage
Si on veut rsoudre le problme : "quel est l'ge moyen des belges ?", on peut envisager deux dmarches :

Relever l'ge et le nombre de belges (population)

Relever l'ge de quelques milliers de belges (chantillon) pris au hasard et considrer que les valeurs
constates dans cet chantillon sont identiques celles que l'on cherche pour la population.

La premire solution est la plus prcise condition, ce qui n'est pas certain, d'tre ralisable dans un dlai tel
qu'aucune naissance ou qu'aucune mort ne viennent modifier le rsultat.
La seconde solution prsente l'avantage de la rapidit pour autant que les valeurs constates dans l'chantillon
puissent tre reportes la population entire, c'est--dire que l'chantillon soit reprsentatif de l'ensemble de la
population.
Cette technique qui consiste mesurer sur un chantillon des valeurs qu'il est impossible ou difficile de mesurer sur
la population entire constitue une des bases de la statistique.
3.2.

Reprsentativit d'un chantillon

Un chantillon reprsentatif d'une population pour une variable est un chantillon pour lequel on n'a pas de raison
de penser que la valeur observe de la variable diffre dans l'chantillon et la population. En pratique, toute
l'valuation statistique est base sur l'obtention d'chantillons reprsentatifs, la manire de les obtenir, le contrle de
leur reprsentativit, leur traitement mathmatique.
Un bel exemple d'erreur d'chantillonnage conduisant une valuation errone peut tre cit : dans un
laboratoire d'exprimentation en toxicologie, les animaux d'exprience sont prlevs dans des parcs sans
mthode apparente de slection. A premire vue, les animaux sont prlevs au hasard. Il est fort possible que
la capture des animaux les plus vifs soit moins probable que celle des animaux en mauvaise sant et que
l'chantillonnage conduise des conclusions fausses.
3.3. Conditions d'obtention d'un chantillon reprsentatif

Les individus de la population doivent tous avoir la mme chance d'tre slectionns,

L'effectif de l'chantillon doit tre grand (plusieurs milliers pour les sondages d'opinion),

L'chantillon doit viter les "mortalits", c'est--dire la perte d'un certain nombre d'individus choisis pour
constituer l'chantillon (lves malades lors d'un test par exemple)
4

3.4. Echantillon alatoire


La premire des conditions cites ci-dessus correspond la notion d'obtention d'un chantillon alatoire, c'est
dire que:
l'extraction des individus de la population pour constituer l'chantillon s'est rellement faite au
hasard
la population n'a pas t significativement modifie par l'extraction de l'chantillon. Si la
population est trs nombreuse, cette condition ne pose pas de problme; si elle est trs rduite , il
vaut mieux tudier la population dans son ensemble plutt que d'en extraire un chantillon.
la population est bien dfinie
Comme on l'a vu plus haut, constituer l'chantillon de manire alatoire n'est pas aussi simple que l'on peut le
croire premire vue; il faut viter une srie de piges d'une slection involontaire ou d'un rejet systmatique
de certains des individus. Une tude pralable srieuse la fois de la population et du paramtre considr doit
tre conduite terme; cette tude visera entre autres prciser si le paramtre fluctue de manire continue dans
la population.

3.5. Quelques types d'erreurs viter


A titre d'exemple, nous pouvons citer les erreurs les plus courantes lors de la constitution d'un chantillon :

des raisons de commodit inclinent parfois le chercheur considrer comme valables des chantillons
pris proximit ou limits un grand ensemble gographique, ville ou rgion. Or la localisation
humaine joue souvent un grand rle sur les paramtres des individus.

l'limination systmatique d'une partie de la population lors de la constitution d'un chantillon est
classique: on peut citer en exemple l'utilisation du bottin, qui limine les non possesseurs de tlphone,
l'appel aux tlspectateurs, la lettre laquelle il faut rpondre.

la mortalit d'un chantillon rsulte moins d'une erreur de mthode que de circonstances particulires
ou temporaires: pidmie de grippe dans une cole teste, enqutes effectues durant les vacances... .
Lorsque l'on s'aperoit qu'une partie non ngligeable de l'chantillon envisag est temporairement hors
d'tat de livrer ses paramtres, il vaut mieux remettre les tests une date ultrieure.

dans le monde de la mdecine et de la pdagogie, les individus tests ont parfois un comportement
particulier du au fait qu'ils se savent observs: l'inspecteur qui visite une classe sait que sa prsence
provoque, chez les lves, des ractions diverses; le mdecin qui examine un patient, surtout si celui-ci sait
que l'examen participe un plan d'ensemble, est susceptible de donner, sur ses paramtres personnels, des
indications fausses.

Cependant, dans une tude, mme s'il faut viter au maximum les biais (carts entre les "vraies" valeurs et les
valeurs observes), ce n'est pas toujours possible.
Par exemple, dans une tude rcente sur les effets nocifs des ondes GSM sur la sant, on a interrog des patients
porteurs d'une tumeur dans le lobe frontal ou temporal (l o passent les circuits de la mmoire). La question
tait : "Combien de fois par jour tlphoniez-vous avec votre portable, il y a dix ou quinze ans et quelle tait la
dure de vos appels ?".
La maladie pourrait trs bien dans ce cas altrer les souvenirs ! Il faut donc le vrifier et ventuellement
effectuer des corrections.

4.

PREMIER EXEMPLE : VARIABLE DISCRETE QUANTITATIVE

4.1. Vocabulaire statistique et mise en forme des donnes


En statistique, comme dans tous les domaines, il y a lieu d'utiliser un vocabulaire particulier. On partira d'un
exemple pratique pour dfinir petit petit le "langage statistique".
On dsire raliser l'enqute suivante : Quel est l'ge moyen d'un tudiant de 1re BSI en Belgique ?
1re
partie : Pour tudier ce problme, il faut raliser une enqute et poser la question chaque tudiant de chaque classe
de 1re kin de chaque cole de Belgique.
Population = ensemble de tous les tudiants de 1re BSI de chaque cole de Belgique.
La population comporte un certain nombre d'individus. Il est videmment difficile d'interroger tous les tudiants de
1re BSI de Belgique. Pour l'exemple, on se limitera donc un chantillon de 27 tudiants (l'chantillon n'tant ici
pas reprsentatif de la population).
2me partie : L'enqute ci-dessus est propose un chantillon cest--dire une partie de la population.
Il compte 27 individus (27 tudiants).
3me partie : Rsultats de l'enqute.
18 20 19 20 21 18 20 18 18
21 19 19 19 18 18 18 21 20
19 19 20 19 18 20 22 19 18
Il s'agit d'un tableau brut cest--dire un tableau o sont nots les rsultats au fur et mesure qu'ils se prsentent.
Le nombre de donnes contenues dans ce tableau est appel l'effectif total n. Ici, l'effectif total vaut : n = 27.

Remarque : dans cette enqute, l'effectif total correspond au nombre d'individus que contient l'chantillon
puisque chaque individu a donn un rsultat.
Ce n'est pas toujours le cas. Exemple: enqute du type: Quel est l'ge des enfants de votre famille?
Chaque individu peut donner plusieurs rponses. Par consquent, le nombre d'individus n'est pas gal
l'effectif total.

4me partie : Classement des rsultats de l'enqute.


Le tableau brut est difficilement utilisable tel quel surtout quand le nombre de donnes est trs lev.
On va donc classer les donnes pour rendre le tableau plus facile exploiter.
i

Xi

ni : effectifs

fi : frquences

18

9/ 27 = 0,333 = 33,3 %

19

8 / 27 = 0,296 = 29,6 %

20

6 / 27 = 0,222 = 22,2 %

21

3 / 27 = 0,111 = 11,1 %

22

1 / 27 = 0,037 =3,7 %
6

n=

ni = 27
i 1

fi

0,99

i 1

1re colonne: on y place la variable note X qui est la caractristique tudie lors de l'enqute (ge d'un tudiant de
1re BSI). Dans le cas prsent, la variable X est discrte car elle peut prendre un nombre fini de valeurs (5 valeurs:
18, 19, 20, 21 ou 22).
2me colonne: chaque valeur de la variable apparat plusieurs fois. L'effectif (appel aussi rptition pour une
variable discrte) est le nombre de fois qu'apparat chaque valeur de la variable dans le tableau brut. On le note n i.
La somme des effectifs ni est appele leffectif total n.
3me colonne: c'est la frquence fi cest--dire le rapport entre chaque effectif et l'effectif total.
frquence fi =

effectif n i
effectif totaln

On constate que le total des frquences nest pas gal 100 %. Ceci est du bien sr aux erreurs darrondi. Pour
viter ces erreurs, on utilisera un tableur (comme EXCEL, par exemple).
Le tableau rsultant du classement des donnes est appel tableau recens ou ordonn.
4.2. Reprsentations graphiques.
4.2.1.

Le diagramme en btonnets

On porte en abscisse la variable (ici l'ge) et en ordonne la frquence ou l'effectif.

Effectifs

diagramme en btonnets des effectifs


10

18

19

20

21

22
ge en annes

Frquences

diagramme en btonnets des frquences


0,4

0,3

0,2

0,1

18

19

20

21

22
ge en annes

En joignant les extrmits des btonnets, on obtient un polygone appel polygone des frquences.

Frquences

polygone des frquences


0,4

0,3

0,2

0,1

0
18

4.2.2.

19

20

21

22

ge en annes

Diagramme circulaire (frquences)

Xi

ni

frquences fi en %

frquences fi en

18

33,3 %

33,3.3,6 = 120

19

29,6 %

106,7

20

10

22,2 %

80

21

11,1 %

40

22

3,7 %

13,3

Effectif
total: n = 27

Somme = 360

Diagramme circulaire des ges (en annes)

22
21
4%
11%

18
33%

20
22%
19
30%

4.2.3.

Le diagramme des frquences cumules ou diagramme en escalier

Reprenons le tableau de donnes.


i

Xi

ni

fi en %

fi cumules
croissantes

fi cumules
dcroissantes

18

33,3 %

33,3 %

99,9 %

19

29,6 %

62,9 %

66,6 %

20

22,2 %

85,1 %

37,0 %

21

11,1 %

96,2 %

14,8 %

22

3,7 %

99,9 %

3,7 %

On peut tracer un "diagramme des frquences cumules" avec en abscisse l'ge et en ordonne les frquences
cumules (croissantes ou dcroissantes).
On voit directement sur ce graphique qu'il y a 62,9 % des lves qui ont 19 ans ou moins.

frquences cumules

diagramme des frquences cumules croissantes


(en escalier)

0,962

0,999

0,851

0,9
0,8
0,7

0,629

0,6
0,5
0,4

0,333

0,3
0,2
0,1
0
18

19

20

21

22

ge (en annes)
9

5.

DEUXIEME EXEMPLE : VARIABLE CONTINUE QUANTITATIVE

5.1. Mise en forme des donnes


Soit un tableau reprenant les salaires mensuels bruts en euros dans le secteur de la kinsithrapie (valeurs fictives,
nen dduisez rien !).
270 275 300 455 323 642 254 532 541 335 .................. (67 valeurs diffrentes)
C'est le tableau brut. L'chantillon est de 67 kins. L'effectif total est aussi de 67 (un salaire par personne).
Si on classait ces donnes comme dans le premier exemple, on obtiendrait un trs grand tableau avec une colonne
effectif presque toujours gale 1 (peu de valeurs sont identiques). On ne saurait que faire de ce tableau.
Pour classer ces donnes, on va procder autrement, on va les regrouper en classes.
i : numro de
Classes (salaires en )
la classe

Centres de
classe

ni: effectifs

fi cumules
croissantes

fi: frquences

12

4
= 0,060 (6,0 %)
67
17,9 %

23,9 %

375

20

29,9 %

53,8 %

[400; 450[

425

15

22,4 %

76,2 %

[450; 500[

475

10

14,9 %

91,1 %

500

525

9,0 %

100,1 %

effectif total = 67

somme = 100,1 % = 1

< 300

275

[300; 350[

325

[350; 400[

6%

L'effectif total est gal : n =

ni = 67.
i 1

Dans la deuxime classe par exemple, les nombres 300 et 350 sont appels respectivement borne infrieure et
borne suprieure de la classe.
Le centre de la deuxime classe est 325.
5.2. Reprsentations graphiques
5.2.1.

L'histogramme des effectifs ou des frquences

On porte en abscisse les centres des classes (ou les intervalles de classe) et en ordonne les effectifs ou les
frquences (uniquement dans le cas ou les classes ont mme amplitude).

histogramme des frquences


frquences

effectifs

histogramme des effectifs


25
20

0,35
0,3
0,25

15

0,2
0,15

10

0,1
5
0,05
0

0
275

325

375

425

475

525
salaire ()

275

325

375

425

475

525

salaire ()

10

5.2.2.

Diagramme des frquences cumules

Diagramme des frquences cumules croissantes

frquences cumules

1
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
250

300

350

400

450

500

550

600

salaire () bornes suprieures

Dans ce cas, on porte en abscisse les extrmits des classes (les bornes suprieures) et on suppose que les valeurs
des individus se rpartissent de manire linaire entre ces points.
Cest sur ce type de graphique que lon se basera pour la dtermination de la mdiane, des quartiles, dciles,
Question: Quel est le pourcentage de kins qui ont un salaire infrieur ou gal 400 ?

Remarque importante :

5.2.3.

dans le cas dun diagramme des frquences cumules croissantes, on porte en abscisse
les extrmits des classes (les bornes suprieures).
dans le cas dun diagramme des frquences cumules dcroissantes, on porte en abscisse
les origines des classes (les bornes infrieures).

Diagramme circulaire
Diagramme circulaire des salaires (en )
[450; 500[
14,9%

>=500
8,9%
<300
6,0%

[400; 450[
22,3%
[300; 350[
18,0%

[350; 400[
29,9%

11

5.2.4.

Autres types de graphiques

Les graphiques tracs jusqu'ici sont les plus courants que l'on rencontre. Il est vident qu'il existe de nombreux
autres types de graphiques qui permettent de caractriser des sries statistiques.
5.3. Remarque : classes damplitudes diffrentes
Dans l'exemple prcdent, les classes avaient la mme amplitude. Ce n'est cependant pas toujours le cas.
Prenons lexemple suivant.
Les rsultats dun groupe de 120 lves dans une branche donne sont reprsents dans le tableau : (rsultats
exprims sur 20)
Cotes sur 20

effectifs ni

[0, 8[

12

[8, 10[

30

[10, 12[

36

[12, 16[

28

[16, 20]

14
n = 120

Si on essaie de tracer un histogramme laide dEXCEL, on obtient le diagramme suivant :

effectifs ni

40

35

30

25

20

15

10

[0, 8[

[8, 10[

[10, 12[

[12, 16[

[16, 20]

cotes sur 20

Cette prsentation nest pas satisfaisante puisque les classes sont reprsentes comme si elles avaient la mme
amplitude.
En ralit le tableur Excel, lorsquon lui demande de tracer un histogramme, trace un diagramme en btonnets.
Dans un histogramme, chaque classe et son effectif sont reprsents par un rectangle. La largeur du rectangle est
lamplitude de la classe ; la hauteur du rectangle est ajuste de manire que laire du rectangle soit proportionnelle
leffectif de la classe.
Par consquent, la premire classe, qui a un effectif de 12 est donc reprsente par un rectangle de largeur 8
(lamplitude de la classe) et de hauteur 1,5, puisque 8 x 1,5 = 12.
Exercice : Suite cette explication, tracer l'histogramme correct.

12

6.

PETIT TEST RECAPITULATIF SUR LE VOCABULAIRE

Au cours dune enqute dans une classe 20 lves, on pose les questions suivantes :
Combien avez-vous de frres et surs ?
Quelle est leur taille ?
Quel moyen de transport utilisez-vous pour venir lcole ?
Complter les phrases suivantes :

La .. sur laquelle porte lenqute est constitue dun . de 20


personnes ; chaque personne reprsente un . de la srie statistique.
La . nombre de frres et surs , sexprime par des nombres : elle est
, comme celle de la taille .
La moyen de transport ne sexprime pas avec un nombre ; elle
sexprime avec un mot : elle est .
La . nombre de frres et surs a galement un autre caractre, elle est
. ; de mme la taille est ..
Les donnes sont tout dabord recueillies dans un ..
Dans le cas dune variable discrte, ce dernier est mis en forme pour donner alors un
.
Dans le cas dune variable continue, ce dernier est mis en forme pour donner alors un

Ces tableaux retravaills permettent alors de calculer la . de chaque valeur, en


divisant leffectif de cette valeur par leffectif total. La . peut tre
calcule en ordre croissant et/ou en ordre dcroissant.
Le traitement des donnes permet alors de faire des reprsentations graphiques statistiques.
Dans le cas dune variable discrte, les principales reprsentations sont :
- .,
- .,
- ..
Dans le cas dune variable continue, lune de ces reprsentations fait place un

Rponses :
- continue

- diagramme en btonnets - diagramme circulaire

- chantillon

- frquence

- frquence cumule

- polygone des frquences - population


- tableau recens et ordonn
- variable

- variable

- qualitative

- discrte

- histogramme
- quantitative

- tableau recens, ordonn et group

- individu
- tableau brut

- variable

- variable
13

7.

LES PARAMETRES DE POSITION: LA MOYENNE, LE MODE , LA MEDIANE, LES QUANTILES

Quand les statisticiens se trouvent en face des rsultats d'une enqute, ils trouvent intressant d'en dterminer les
"tendances moyennes". Pour cela, ils disposent de plusieurs outils: la moyenne arithmtique, le mode, la mdiane et
les quantiles. La moyenne arithmtique est le paramtre de position le plus utilis. Il existe galement d'autres types
de moyenne, comme la moyenne harmonique ou la moyenne gomtrique dont on ne parlera pas.
7.1. La moyenne arithmtique
7.1.1.

Soit deux hommes affams auxquels on donne un poulet


rti. Le premier s'en empare et le dvore entirement.
En moyenne, chacun a eu un demi-poulet.
(La Cit de chiffres, Jena-Louis Besson, d. Autrement)

Cas d'une variable discrte

Reprenons l'exemple de l'ge des lves de la classe de 6me gnrale.


On avait obtenu:
18 20 17 17 17 16 20 18 18
18 19 19 19 18 18 18 19 18
18 18 17 16 16 17 20 17 17
On obtient la moyenne arithmtique en additionnant toutes ces valeurs et en divisant le nombre obtenu par le
nombre de valeurs. Elle est dsigne par le symbole X ("x barre").
Moyenne = X = (18+20+17+17+17+16+20+18+18+18+19+19+19+18+18+18+19+18+18+18+17+16+16+17
+20+17+17) / 27 = 483 / 27 = 17,89
Si on avait pris comme chantillon la totalit des classes de 6 me de lAthne, le calcul aurait t trs long et on
aurait fait des fautes.
C'est pour cette raison qu'on calcule gnralement la moyenne partir du tableau recens ou ordonn.
i

Xi

ni

fi en %

16

0,111 = 11,1 %

17

0,259 = 25,9 %

18

10

0,370 = 37,0 %

19

0,148 = 14,8 %

20

0,111 = 11,1 %

n = 27
On obtient la moyenne en multipliant chaque valeur de la variable par l'effectif correspondant. Le nombre obtenu est
divis par l'effectif total.
16.3 17.7 18.10 19.4 20.3 483
X=
17,9
27
27
k

Dans ce cas, la formule gnrale de la moyenne s'crit:


o

i 1

n .X
i i
n

k est le nombre de valeurs de la variable X


Xi sont les valeurs de la variable
ni est l'effectif correspondant la variable i
n est l'effectif total

14

On peut aussi utiliser les frquences pour calculer la moyenne. On sait que la frquence f i correspondant la valeur
ni
effectif i
Xi vaut : fi
.
n effectif total
On obtient la formule:
k
X
f .X
i i

i 1

X = 16 .0,11 17 .0,26 18 .0,37 19 .0,15

7.1.2.

20 .0,11 17 ,89

Cas d'une variable continue, rpartition en classes

En 1954, une enqute sur la rpartition selon l'ge de la population agricole masculine a donn les rsultats suivants:
Age en annes Xi

Centres de classe

Effectifs ni

Frquences fi

[15; 25[
[25; 35[
[35; 45[
[45; 55[
[55; 65[
[65; 75[
75 et plus

20
30
40
50
60
70
80

197
207
151
189
127
108
21

0,197
0,207
0,151
0,189
0,127
0,108
0,021

n = 1000
Dans ce cas, les Xi qui reprsentaient les valeurs de la variable reprsentent les centres des classes. Les formules de
calcul de la moyenne sont donc identiques.

k
X

i 1

n .X
i i

i 1

f .X
i i

o Xi reprsente le centre de la classe i et k le nombre de classes.


X=

20.197 30.207 40.151 50.189 60.127 70.108 80.21


1000

42,5

7.2. Le mode
Dans une enqute relative au moyen de transport, on a obtenu le tableau suivant:
Moyens de transport
vlo
bus
tram
vlomoteur
pied

Effectifs
7
10
2
5
6

Dans ce cas, il n'est pas possible de calculer une moyenne. On pourrait cependant se demander quel est le moyen de
transport le plus utilis (" la mode"). C'est videmment le bus qui correspond au plus grand nombre d'effectifs.

Dans le cas de variable valeurs numriques, si on reprend l'exemple des ges de la classe de 6 me
gnrale, on s'aperoit que l'ge que l'on retrouve le plus souvent est 17 (10 effectifs).
Dans l'exemple de l'ge de la population agricole masculine, le mode est la classe de 25 34 ans qui
compte l'effectif le plus lev. (on parle de classe modale )

Le mode est la valeur de la variable (ou la classe) dont l'effectif est le plus important (la valeur
de la variable la plus frquente)
15

7.3. La mdiane

La mdiane d'une variable statistique est la valeur de la variable (ou la classe) qui partage
l'effectif en deux parties gales.

Dans le cas dune srie ordonne simple, on peut trouver aisment la mdiane :
-

n 1
.
2
Par exemple, la srie ordonne {1, 3, 7, 8, 9, 15, 17} comporte 7 observations ; sa mdiane est la quatrime
7 1
observation (
) et est gale 8.
2
n n 1
si n est pair, la mdiane est la moyenne arithmtique des valeurs de la variable de rang et
.
2
2

si n est impair, la mdiane est la valeur de la variable de rang

Par exemple, la srie ordonne {1, 3, 7, 8, 9, 15} comporte 6 observations et a pour mdiane 7,5, obtenue en prenant
la moyenne arithmtique entre la troisime observation (7) et la quatrime (8).
Dans le cas dune distribution observe plus complexe, il existe diverses formules dans la littrature. On se limitera
dterminer la mdiane sur le diagramme des frquences cumules (la mdiane est labscisse correspondant
une frquence de 50 %).

7.4. Les quantiles


La mdiane peut tre considre comme un cas particulier dune valeur caractristique plus gnrale, appele
quantile.
Les quantiles que lon rencontre le plus souvent sont (dfinis partir dun diagramme des frquences cumules) :
a)

la mdiane X 1 : qui est la valeur de la variable correspondant une frquence (cumule) de 50 %.


2

b) les quartiles X 1 , X 1 , X 3 : qui correspondent aux frquences cumules 25, 50, et 75%. Ils partagent lensemble
4

des observations en 3 parties de mme effectif.


c)

les dciles X 1 , X 2 ,..., X 9 : qui correspondent aux frquences cumules 10, 20, , 90%.
10

d) les percentiles X

10

10

1 , X 2 ,..., X 99
100
100
100

qui correspondent aux frquences cumules 1, 2, , 99%.

Les quantiles X 1 , X 3 , X 1 , X 9 sont notamment intressants pour tudier la dispersion et lasymtrie dune
4

10

10

distribution.

7.5. Exercices sur les paramtres de position


1) Un tudiant dsirant aller faire une partie de ses tudes aux USA doit prsenter un examen d'anglais pour
pouvoir tre inscrit. Son rsultat lui est communiqu sous la forme suivante: 8540 personnes ont prsent
l'examen; vous tes dans le septime intervalle interdcile.
Pouvez-vous traduire ce renseignement en termes d'valuation scolaire qui nous est plus familier ?

16

2) Si on vous dit que sur un ensemble de pommes qu'on a peses, le premier dcile est 140 g et le 9 me dcile
160 g, quel est le pourcentage de pommes pesant entre 140 g et 160 g ?
3) Le rsultat d'une enqute sur la taille d'enfants de trois ans est reprise dans le tableau suivant:
Tailles (cm)

ficum (%)

[88,5; 90[

[90; 91,5[

10

[91,5; 93[

22

[93; 94,5[

36

[94,5; 96[

60

[96; 97,5[

77

[97,5; 99[

90

[99; 100,5[

97

[100,5; 102[

100

Trace un diagramme des frquences


cumules.
Dtermine sur le graphique la mdiane, les
troisime et sixime dciles ainsi que les
quartiles.

4) Le pre de Sbastien nest pas content du rsultat du dernier contrle de son rejeton. Mais, argumente ce
dernier, jai tout de mme une moyenne de 12. Sachant que Sbastien a pass 5 contrles et que les rsultats des
4 premiers ont t 13, 10, 16 et 14, quelle est la cote du dernier travail ?
5) Fabienne rentre chez elle avec une copie cote 11/20. Comme elle a lhabitude de meilleurs rsultats ses parents
demandent des explications. Fabienne argue de la difficult des questions et de la svrit de la correction du
professeur ; ses parents restent sceptiques. Pour les convaincre, elle ajoute : avec ce 11/20, je suis encore dans la
premire moiti de la classe. A quelle notion statistique fait appel cette argumentation ?
6) Dans une classe de 21 lves, 20 lves ont particip un contrle dont les rsultats ont t :{7, 8, 9, 10, 11, 12,
13, 14, 15, 16, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8}. La moyenne de ces cotes est de 12. Le lendemain, llve
absent, Alain est interrog son tour et il obtient 20. La moyenne de ce deuxime contrle est donc de 20. La
cote de 16, moyenne des deux jours ((12 +20)/2) reprsente-t-elle la moyenne de la classe ?
Combien dautres "Alain" faudra-t-il adjoindre cette classe pour que la moyenne soit effectivement de 16 ?
7) Analyser la courbe de croissance de la page suivante. (d'autres courbes sont disponibles sur le site
www.xrenard.sup.fr, page math, 4SCOM, "courbes de croissance")
7.6. Quelques remarques sur les paramtres de position

Dans le cas d'une variable qualitative, on se limite gnralement dterminer le mode (dans certains cas,
on peut aussi dterminer la mdiane). Il n'est pas possible de calculer la moyenne.

Pour des variables quantitatives, on peut dterminer soit la moyenne, soit le mode, soit la mdiane.

Dans ce cas, le problme est de savoir quel paramtre il convient d'utiliser. Par exemple, considrons le cas
d'une distribution de salaires moyens en Belgique. La moyenne est de 1398 et la mdiane de 1152 , soit un
cart de 246 entre les deux. Si on examine la courbe des salaires, on s'aperoit que si la moyenne est bien plus
leve que la mdiane, c'est tout simplement parce que certaines personnes ont des revenus trs levs mais sont
peu nombreuses. La moyenne est fortement influence par ce petit nombre de personnes revenu lev alors
que la mdiane ne l'est pas. La moyenne vient donc fausser l'estimation de ce que gagne la plupart des belges.
La mdiane est, dans ce cas, un meilleur indicateur de tendance centrale et c'est ce paramtre que l'on choisira.
Un des avantages de la mdiane est que sa valeur n'est pas influence par des termes extrmes, contrairement
la moyenne. Mais comme la mdiane ne rpond aucune formule rigoureuse, elle ne peut tre utilise dans des
calculs ultrieurs.
Remarquons que lorsque la moyenne et la mdiane sont proches, cela tmoigne d'une certaine symtrie de la
distribution (comme dans le cas de donnes suivant une loi normale, voir plus loin)
17

18

8.

LES PARAMETRES DE DISPERSION: L'ECART MOYEN, L'ECART-TYPE ET LA VARIANCE

8.1. Introduction
L'utilit des paramtres de position est d'indiquer d'une certaine manire autour de quelle valeur une srie s'tend.
Cependant, ce type de paramtre n'est pas suffisant pour caractriser une srie.
En effet, prenons les trois exemples suivants :
a) Alice et Batrice ont pris des vacances dans un endroit de rve : des conditions de vie trs proches de la nature
(logement sous tente), mille et une possibilits dactivits sportives, de loisir, de dtente, , le tout un prix
intressant. Le prospectus annonce pour la priode envisage, une temprature moyenne de 25C et une brise
lgre.
Alice est revenue enchante de ses vacances, Batrice est trs mcontente : un gros rhume, des mauvaises nuits
frquentes, des maux de tte, lui ont gch le sjour.
Cest que, alors que Batrice, ayant lu trs superficiellement le prospectus ne stait quipe que de vtements
dt, Alice au contraire avait lu que sur une journe, les carts de temprature pouvaient tre importants et
que notamment, les nuits taient plutt fraches. Elle avait donc encombr ses bagages de jeans et de petites
laines qui lui ont permis de bien dormir et de ne pas frissonner en soire et au petit matin.
b) Tout au long dune anne, on a fait des relevs statistiques dun restaurant scolaire et on a trouv quon servait
en moyenne 100 repas complets par jour de fonctionnement du restaurant (4 jours par semaine), et que chaque
repas comportait 100 g de pommes de terre. Ces donnes suffisent-elles lconome pour faire des achats
hebdomadaires raisonnables de pomme de terre ?
c)

Deux sries statistiques sont caractrises par les donnes suivantes:


1..........................100.............................199
99 100 101
Si on calcule la moyenne de ces deux sries, on obtient:
X = (1 + 100 + 199) / 3 = 100
X = (99 + 100 + 101) / 3 = 100

Les moyennes sont les mmes mais les sries sont trs diffrentes. Dans la premire srie, la dispersion autour
de la moyenne est trs grande contrairement la 2me srie !!!!
C'est pour cette raison que pour caractriser une srie statistique, on doit dfinir des paramtres de dispersion en
plus des paramtres de position. Ces paramtres de dispersion donnent des informations sur l tendue de la
srie par rapport la valeur centrale.
8.2. L'cart moyen, l'cart-type et la variance
Partons de lexemple suivant : dans un carr de haricots, on a rcolt 140 gousses (et non pas cosse qui est
lenveloppe du pois) et on a compt le nombre de grains dans chacune des gousses.
Voici le tableau de rsultats.
Nombre de grains
(variable discrte)
Xi

10

Nombre de gousses
effectifs ni

18

32

38

20

Frquences fi

0,014

0,043

0,064

0,129

0,229

0,271

0,143

0,05

0,043

0,014

L'effectif total vaut: n =

ni = 140
19

k
La moyenne vaut: X

fi .Xi = 5,51

( vrifier comme exercice)

i 1
Pour valuer la dispersion autour de cette moyenne, l'ide qui vient spontanment l'esprit est de dterminer les
carts entre cette moyenne et les diverses valeurs de la variable.
On appelle cart entre la valeur moyenne X et un nombre X, la valeur absolue de leur diffrence. On obtient pour la
srie tudie:
Nombre de grains
(variable discrte)
Xi

10

Frquences fi

0,014

0,043

0,064

0,129

0,229

0,271

0,143

0,05

0,043

0,014

Xi - X

4,51

3,51

2,51

1,51

0,51

0,49

1,49

2,49

3,49

4,49

fi . Xi - X
En calculant la moyenne de la srie des carts, on obtient:
k

Xi

X =

X = 1,371

fi . Xi

Cette valeur s'appelle l'cart moyen.

i 1

En quelque sorte, on peut dire qu'en moyenne, le nombre de grains d'une gousse s'carte, d'un ct comme de l'autre,
de 1,371 grains de la valeur moyenne qui est de 5,51 grains.
Le dfaut de l'cart-moyen est de donner la mme importance toutes les valeurs. Or, on a constat qu'on obtient
une meilleure mesure de la dispersion si on accorde plus de poids aux valeurs de la variable qui s'loignent plus de
la valeur moyenne. Au lieu de considrer les carts, on considre les carrs des carts. Plus l'cart est grand, plus son
carr augmente. (puisqu'on lve les carts au carr, la valeur absolue n'est plus ncessaire)
Nombre de grains
(variable discrte)
Xi

10

Frquences fi

0,014

0,043

0,064

0,129

0,229

0,271

0,143

0,05

0,043

0,014

Xi - X

4,51

3,51

2,51

1,51

0,51

0,49

1,49

2,49

3,49

4,49

(Xi - X )2

(-4,51)2

(-3,51)2

(-2,51)2

(-1,51)2

(-0,51)2

(0,49)2

(1,49)2

(2,49)2

(3,49)2

(4,49)2

fi . (Xi - X )2

La moyenne de la srie des carrs des carts vaut:

(Xi

X)2 = fi .(Xi - X ) = 3,078.

Elle est appele la variance et elle a la mme dimension que les carrs des valeurs de la variable.
On ne peut donc pas la comparer l'cart-moyen. Pour cela il faut prendre la racine carre de la variance que l'on
appellera l'cart-type.
k

Ecart-type =

fi .( Xi

X )2 =

3,078 = 1,75 ...

i 1

On peut dire que la plupart des gousses contient un nombre de grains compris entre 5,51 - 1,75 et 5,51 + 1,75.
(environ 108 des 140 gousses sont comprises dans cet intervalle).
20

Remarque
La distribution de nombreux paramtres biologiques et autres (taille, poids, mensurations diverses, pouls, quotient
intellectuel, mais aussi par exemple la dimension d'objets fabriqus en srie ...) suit une loi dite normale (que nous
tudierons dans la suite), reprsente par une courbe en cloche symtrique autour de la moyenne.
Si la distribution de frquence suit approximativement une loi normale :

68,27 % des lments ont une valeur comprise entre X -

95,45 % des lments ont une valeur comprise entre X - 2 et X + 2 ,

99,73 % des lments ont une valeur comprise entre X - 3 et X + 3 .

et X + ,

L'intervalle entre X - 2 et X + 2 est appel intervalle de rfrence (ou de tolrance) : seulement 5 % des sujets
tombent en dehors des limites.
Par exemple, pour dterminer les valeurs de rfrence de l'ure (mmol/l), un chantillon de 284 sujets ont subi une
prise de sang pour mesurer leur concentration d'ure. La moyenne obtenue est de 5,1 mmol/l et l'cart-type 1,1
mmol/l. Les limites de l'intervalle de rfrence sont donc 5,1 2.1,1, soit 2,9 et 7,3 mmol/l.
Un rsultat est considr comme normal s'il tombe dans l'intervalle de rfrence. Il est trs rare que l'on tombe en
dehors de l'intervalle lorsqu'on est en bonne sant.

RESUME
Dans le cas d'une variable quantitative, on appelle:

cart: la valeur absolue de la diffrence entre la moyenne et une valeur de la variable.

cart moyen: la moyenne de la srie des carts (voir plus haut) de tous les individus de la population.

variance: la moyenne de la srie des carrs des carts entre la moyenne et les valeurs de la variable de
tous les individus de la population.

l'cart-type: la racine carre positive de la variance. C'est l'cart-type qui est gnralement le plus
utilis.

Ecart-type =

fi .( Xi

X )2

i 1

On utilise souvent une formule plus pratique qui donne l'cart-type avec une bonne approximation:
k

Ecart-type =

fi .Xi2 X

i 1

21

9.

POPULATION ET ECHANTILLON

Ce n'est gnralement qu'en thorie qu'on travaille sur une bande de donnes complte (la population entire) et
donc X et

sont exacts.

En pratique, on extrait et on analyse un chantillon de la population.


Pour l'cart-type de l'chantillon, on utilise la formule :

n i .(Xi
chantillon

X )2

i 1

n -1

Il est vident que plus n est grand, plus l'cart-type de l'chantillon se rapproche de l'cart-type de la population
population.
Ces diffrences entre population et chantillon seront prcises dans le chapitre consacr l'estimation.
Signalons cependant que :

Pour la population entire, la moyenne est note , la variance et l'cart-type .

Pour un chantillon, la moyenne est note X et la variance s et l'cart-type s.

Pour simplifier, en statistiques descriptives, on dsignera la moyenne par X et l'cart-type par peu importe qu'il
k

s'agisse d'un chantillon ou de la population et on utilisera la formule :

fi .( Xi

X )2 .

i 1

Par contre, dans le chapitre consacr l'estimation, on fera la diffrence entre les cart-types et moyennes de la
population et de l'chantillon.

Remarque
Sur les claviers de beaucoup de calculatrices ayant les fonctions statistiques, on trouve les symboles
n et n -1 (parfois " s"). La fonction n correspond lcart-type dfini sur lensemble de la population. Dans les
analyses dchantillon, on utilise lcart-type de lchantillon n-1.
Si la calculatrice na que le symbole , il faut vrifier, en consultant le mode demploi ou par un exemple simple, de
quel cart-type il sagit.
Exemple : soit la population {10, 15, 20} dont la moyenne est 15 ;

= 4, 08, et

n-1=5.

Dans le logiciel Excel, n est donn par la fonction ECARTYPEP (P pour population) et
ECARTYPE. On a de mme les fonctions VARP et VAR pour la variance.

n-1

est donn par

22

10. LE COEFFICIENT DE VARIATION


Lorsque deux distributions sont analogues (par exemple, la taille en cm d'enfants de 8 ans et la taille en cm d'adultes
de 25 ans), il est facile de comparer leurs dispersions et donc leurs cart-type.
Il pourrait cependant tre utile de comparer des distributions issues d'chelles de grandeurs diffrentes ou d'units de
mesure diffrentes (par exemple un test dont les notes varient de 0 100 et un autre variant de 0 20). Dans ce cas,
on peut utiliser un coefficient de variation qui permet de ramener la valeur de n'importe quelle dispersion sur une
mme chelle, en l'occurrence un pourcentage. La valeur de ce coefficient est donne par la formule :

Coefficient de variation (en %) = CV =

cart - type
.100
moyenne

.100

Exemple :
La taille moyenne des jeunes de 18 ans est de 168 cm avec un cart-type de 14 cm; leur poids moyen est de 66 kg
avec un cart-type de 8 kg. La taille varie-t-elle plus que le poids ?
CV (taille) =

14
.100 8,33..%
168

CV (poids) =

8
.100 12,1..%
66

Les poids varient plus que les tailles.

23

11. EXERCICES DIVERS


EXERCICE 1
On a relev durant 30 jours la temprature extrieure, midi (temprature exprime en degrs Celsius):
12 10 11 13 15 16 16 17 19 18
19 17 16 15 14 17 19 18 19 21
22 21 21 23 22 24 25 27 26 24
Dtermine :

a) la variable
b) l'effectif total
c) la nature de la variable: quantitatif ou qualitatif ? Discret ou continu ?
d) Dresse les diagrammes suivants:
- histogramme des frquences
- diagramme des frquences cumules croissantes
- diagramme en camembert
e) Calcule la moyenne, le mode et la mdiane.
(Rp. : X =18,5)
f) Calcule l'cart-type et la variance.
(Rp. : 4,3 et 18,6)

EXERCICE 2
Une srie d'observations concernant les tailles d'un groupe d'adolescents de 11 14 ans a donn les rsultats
suivants:
Taille Xi

effectifs ni

Taille Xi

effectifs ni

140 < X

144 cm

160 < X

164 cm

31

144 < X

148 cm

17

164 < X

168 cm

20

148 < X

152 cm

63

168 < X

172 cm

152 < X

156 cm

82

172 < X

176 cm

156 < X

160 cm

69

176 < X

180 cm

a)
b)
c)
d)

Trace l'histogramme des effectifs


Trace le polygone des frquences cumules croissantes et en dduire la mdiane.
Dtermine le mode et la moyenne (Rp. : X = 155,5)
5,8 )
Calcule l'cart-moyen, l'cart-type et la variance (Rp. :

EXERCICE 3
Voici, releves au cours des jours ouvrables de l'anne 1982, les recettes d'un magasin de dtail:
Recettes en
milliers de
FB

Nombre de
jours

0 X<4
4 X<8
8 X < 12
12 X < 16
16 X < 20

8
24
210
42
16

a) Calcule :

- l'effectif total
- les frquences en degrs
b) Trace :
- un histogramme des frquences
- un polygone des frquences cumules croissantes
c) Calcule la moyenne, le mode, l'cart-type et la variance. (Rp.: X = 10,4 et

2,9 )
24

EXERCICE 4
Voici les tailles de 34 garons et 37 filles inscrits en 3me anne dans une cole.
Les garons mesurent (en cm) :
152
175
170

177
168
165

168
163
163

171
160
176

165
183
174

174
175
165

173
169
190

168
164
160

176
181

163
165

165
163

165
155

162
164

150
165
164

166
157
181

165
168
180

167
169
150

166
168
155

156
150

163
165

163 174 166


162 172 160

Les filles mesurent (en cm) :


160
176
165

165
160
171

165
165
163

168
161
166

Classe ces donnes dans deux tableaux.


1)
2)
3)
4)
5)
6)
7)
8)
9)

Ralise un histogramme des effectifs pour les garons.


Ralise un histogramme des effectifs pour les filles en conservant la mme chelle que pour les garons.
Compare les 2 histogrammes. Que constate-t-on ?
Calcule les moyennes des tailles des garons et des filles en indiquant la formule utilise.
Que constate-t-on ?
Ralise un polygone des frquences cumules (de haut en bas) pour les garons.
Indique sur le graphique le pourcentage de garons ayant une taille infrieure ou gale 170 cm.
Ralise un diagramme en camembert pour les filles.
Calcule lcart-type pour les garons en indiquant la formule utilise. Que signifie la valeur trouve ?

EXERCICE 5 : Lors dun rallye touristique, une des preuves du parcours consiste valuer la distance qui spare
lendroit o on se trouve dun autre endroit identifiable (ou dvaluer la hauteur dun arbre ou dun btiment, ou le
poids dun objet, ). Certaines quipes font la moyenne de lvaluation de chaque membre de lquipe. Cette
approche statistique est-elle judicieuse ?
EXERCICE 6 : Un instituteur remet ses lves une feuille sur laquelle est dessin un quadrilatre quelconque et
demande chacun de faire les mesures et les calculs ncessaires pour connatre laire de la figure. On devine qu la
collecte des rsultats, on observe des diffrences gnralement plus grandes que ce quon pourrait croire. Quel
nombre prendre pour la mesure de cette surface ?
EXERCICE 7 : Les statistiques montrent quon constate un plus grand nombre daccidents mettant en cause des
voitures roulant vitesse modre. Peut-on en conclure quil est recommand de rouler comme un fou ?
EXERCICE 8 : Les statistiques montrent quil est faux de dire que les mathmatiques constituent un trs grand
facteur de redoublements car cest dans les classes o le nombre dheures de math est le plus lev que lon constate
le moins de redoublements imputer cette matire. Quen pensez-vous ?
EXERCICE 9 : Les propositions suivantes sont-elles vraies ou fausses ?
La moyenne d'une srie de donnes statistiques divise les donnes en deux parts gales.
La moyenne arithmtique est influence par des valeurs extrmes d'une srie de donnes.
Entre le premier quartile et le troisime quartile se trouvent toujours 50 % des effectifs.
L'effectif compris entre le premier et le deuxime quartile est toujours le mme que celui compris entre le deuxime
et le troisime.
Quelle que soit la srie de donnes statistiques, la somme des carts par rapport la moyenne arithmtique est nulle.

25

EXERCICE 10
Voici un tableau reprenant les dures de vie de tubes lectriques :
Dure (heures)
[201; 300[
[300; 399[
[399; 498[
[498; 597[
[597; 696[
[696; 795[
[795; 894[
[894; 993[
[993; 1092[
[1092 ; 1191[
[1191; 1290[

ni
6
8
46
58
76
68
62
48
22
4
2

On donne :
X

710,4

192 ,7

Dterminer le pourcentage de tubes dont la dure de vie est :


a) "Normale"
b) Infrieure la "normale"
c) Suprieure la "normale"
Remarque :
Les lments sont "normaux" s'ils sont compris entre X - et X + , infrieurs la normale s'ils sont compris entre
X - et X - 2 et suprieurs la normale s'ils sont compris entre X + et X + 2 .
(Rp. : 64,22 %, 15,87 %, 16,44 %)

EXERCICE 11
Soit la taille de 210 tudiants :
Classes
[155; 160[
[160; 165[
[165; 170[
[170; 175[
[175; 180[
[180; 185[
[185; 190[

effectifs
5
23
42
68
47
21
4

Dterminer le pourcentage d'tudiants dont la taille est :


a) "Normale"
b) Infrieure la "normale"
c) Suprieure la "normale"

(Rp. : X

172,5 ,

6,4 ; 65,6 %, 15,3 %, 15,2 %)

26

12. PIEGES STATISTIQUES SOUS FORME DE GRAPHIQUES


Graphique issu de la publicit de la marque M

Voici un graphique
comparant les parts
de march de
diffrentes foreuses.
Commente...

27

28

29

CHAPITRE 2 : LES PROBABILITS,LES


VARIABLES ALATOIRES ET LES LOIS DE
PROBABILIT
1.

PROBABILITES : DEFINITIONS

Un phnomne fortuit est une exprience qui donne lieu plusieurs rsultats dont on ne peut prdire lavance
lequel se ralisera. Chacun de ces rsultats porte le nom dpreuve du phnomne.
Exemples de phnomnes fortuits : tous les jeux de hasard, la transmission des caractres hrditaires dans les
espces (animales ou vgtales) reproduction sexue, la physique des micro-particules, ...
Lensemble de toutes les preuves possibles dun phnomne fortuit se nomme catgorie dpreuves
phnomne. Par exemple, si on tire cinq fois pile ou face, on peut obtenir :
preuve 1 : pile
preuve 2 : face
preuve 3 : face

du

preuve 4 : pile
preuve 5 : pile

Dans ce cas, il ny a que deux rsultats possibles. La catgorie d'preuve est :

= {pile, face}.

On pourrait se demander quelle est la probabilit d'avoir cinq fois "face" ou bien d'avoir deux "face" suivi de trois
"pile", On parle dans ce cas d'vnement.
La probabilit P(E) quun vnement E se produise est donne par la formule :

P(E) =

nombre de cas favorables


nombre de cas possibles

qui est un nombre compris entre 0 et 1.


Deux ou plusieurs vnements sont quiprobables s'ils ont la mme probabilit d'apparition. (lanc d'un d, d'une
pice de monnaie, ...)
Exemple : On lance deux fois de suite une pice de monnaie. Quelle est la probabilit davoir l'vnement "face"
puis "face" ? (les vnements "pile" et "face" sont quiprobables)
Nombre de cas favorables : 1

Nombre de cas possibles : 4

P (face puis face) =

30

2.

LES VARIABLES ALEATOIRES (V.A.)

2.1. Dfinition
Voici quelques exemples de dfinitions dune variable alatoire. Si vous ne comprenez pas la premire, lisez la
suivante et ainsi de suite

Une variable alatoire, note X, est une variable susceptible de prendre des valeurs diverses (vnements) en
obissant une loi de probabilit dtermine (ou distribution de probabilit).
OU
Une variable alatoire est une variable dont la valeur est un nombre dtermin par lissue dune preuve.
OU (encore )
Une variable alatoire est une variable dont on ne peut prdire avec certitude, avant la mesure, le rsultat qui
surviendra.
OU (plus simple)
Une variable alatoire est quelque chose dont il est impossible de connatre le rsultat lavance.

En rsum, une variable alatoire est une variable dont les valeurs dpendent du hasard. Le poids ou la taille ne sont
pas des variables alatoires mais si on les mesure sur un sujet tir au hasard dune population, ils le deviennent
aussitt.
Il y a deux grands types de variables alatoires :
-

on parle de variable alatoire discrte si lensemble de ses valeurs est fini ou quand la catgorie dpreuve
comprend un nombre fini de valeurs.
on parle de variable alatoire continue si lensemble de ses valeurs est infini ou quand la catgorie
dpreuve est un ensemble continu. Dans ce cas, la variable peut prendre nimporte quelle valeur dans un
intervalle.

Exemples :
-

Le nombre de pannes journalires dune machine est une variable alatoire discrte.
Le nombre de pile obtenu lors de 5 lancers conscutifs est une variable alatoire discrte.
Le poids rel de paquets de lessive pesant en principe 5 kg est une variable alatoire continue.
La dure de vie d'un moteur soumis des conditions difficiles est une variable alatoire continue.

En sciences, on manipule toute sorte de variables alatoires, par exemple : le rendement dune culture, la densit
dun matriau, le temps ncessaire pour accomplir une tche, le nombre de ptales dune fleur, la rsistance la
flexion, le temps de raction aprs un stimulus, ...

3.

LES VARIABLES ALEATOIRES DISCRETES

Une variable alatoire discrte X est une variable dont toutes les valeurs Xi sont connues et chacune desquelles on
peut attacher une probabilit de ralisation P(Xi). La loi (ou distribution) de probabilit reprsente l'ensemble des
probabilits P(Xi) correspondant chaque valeur de la variable alatoire X.

32

Prenons l'exemple suivant.


Un vendeur de tlviseurs prsente la synthse du nombre darticles vendus chaque jour au cours des 100 derniers
jours de vente.
indice i
Nombre de TV vendues
chaque jour
Nombre de jours de
vente

20

25

30

12

Total = 100

Soit X la variable alatoire donnant le nombre de TV vendues au cours dune journe .


A partir de ces donnes, on peut calculer les frquences et considrer que chaque frquence fi correspond une
probabilit de ralisation P(Xi). On obtient la distribution de probabilits suivante :
Nombre de TV vendues
chaque jour X

P(Xi)

0,02

0,08

0,2

0,25

0,3

0,12

0,03

7
P( X i )

i 1

On peut videmment tracer un diagramme en btonnets, un diagramme en escaliers, (voir cours de statistique
descriptive)
La loi (ou distribution) de probabilit est reprsente sur le graphique suivant :
0,35
P(Xi)
0,3
0,25
0,2
0,15
0,1
0,05
0
0

nombre de TV vendues chaque jour

3.1. Calcul de lesprance mathmatique.


Lesprance mathmatique est une caractristique de position. Elle correspond la moyenne arithmtique en
statistique descriptive. Par analogie, on a :
k

E(X)

X i .P (Xi )
i 1

On obtient pour notre exemple : E(X) = 3,21.


Cela veut dire que sur une longue priode, la vente quotidienne est de 3,21 TV.

33

3.2. Calcul de lcart-type et de la variance.


Par analogie avec la variance et lcart-type dune variable normale (voir statistiques descriptives), on obtient :
k

Lcart-type : (X)

P(Xi ).(Xi

E(X))2 = 1,3 La variance : V(X) =

(X) = 1,7

i 1

3.3. Exercices supplmentaires


1) 1000 billets sont vendus par une association qui organise une loterie. Parmi ceux-ci, 250 billets sont gagnants,
10 donnent droit un lot de 75 , 30 un lot de 40 , 80 un lot de 18 et 130 un lot de 5 .
a) Dtermine la variable alatoire et la loi de probabilit qui en rsulte.
b) Un membre de lassociation achte un billet. Quelle est la probabilit quil gagne un lot dont le
montant peut aller jusque 18 , un lot infrieur 18 , un lot dun montant minimum de 5 , un lot de
40 ou de 75 , un lot suprieur 40 et infrieur 75 , un lot dun montant minimum de 40 et
infrieur 75 ?
c) Calcule E(X), V(X) et (X). (E(X) = 4,04; (X) = 10,8)
d) En supposant que lassociation veuille sautofinancer totalement pour cette action, quel prix de vente
minimum du billet faudra-t-il fixer ?
2) On lance 2 ds jouer et on fait chaque lancer la somme des points obtenus. Soit X la V.A. reprsentant cette
somme. On suppose que les ds sont non pips et ont 6 faces.
a) Dtermine la loi de probabilit de X.
b) Calculer E(X), V(X) et (X).
(E(X) = 7; (X) = 2,4)
3) On lance une pice de monnaie bien quilibre trois fois de suite. On note le "nombre de pile" observ.
a) Quelle est la variable alatoire ?
b) Dtermine la loi de probabilit (c'est--dire toutes les probabilits P(Xi)).
c) Calcule lesprance mathmatique E(X), la variance V(X) et lcart-type (X).
(E(X) = 1,5; (X) = 0,87)
d) Quelle est la signification de l'cart-type ?
Pour vous aider, on a reprsent ci-aprs la loi de probabilit de cette variable alatoire :

P(Xi)

0,400
0,350
0,300
0,250
0,200
0,150
0,100
0,050
0,000
1

nombre de piles observs

34

4) On lance 2 ds (1 rouge et un bleu) et on calcule le total des points.


Sur une mise de 50 , si le total 9, on gagne 200 .
si le total < 9, on perd la mise.
Calculer lesprance mathmatique des gains, la variance et lcart-type des gains (et donner sa signification).
(5,6; 8024,7; 89,6)

35

4.

LES VARIABLES ALEATOIRES CONTINUES

Une variable alatoire X est dite continue si lensemble des valeurs prises par cette variable est infini non
dnombrable, cest--dire que X peut prendre nimporte quelles valeurs relles comprises dans un intervalle [a, b].
Par consquent, la probabilit que X prenne une valeur particulire quelconque est gnralement nulle. On calculera
plutt la probabilit que X se trouve dans un intervalle donn.
f(X)

L'ensemble des valeurs possibles de la variable alatoire continue X et sa loi de probabilit (fonction de densit de
probabilit de X) est reprsente par une courbe qui peut avoir des allures diffrentes selon le type de distribution
tudie.
Laire comprise entre la courbe, les 2 verticales dabscisses a et b et laxe des abscisses est gale 1. Par consquent
dans l'intervalle [a, b], la somme des probabilits attaches aux valeurs de la variable est gale 1.
Dune faon gnrale, la mesure dune probabilit peut tre traduite graphiquement par une surface. En considrant
que la probabilit de se trouver dans lintervalle [a, b] vaut 1, si on choisit un intervalle [c, d] inclus dans [a, b], la
probabilit de se trouver dans lintervalle [c, d] est infrieure 1.
La diffrence fondamentale avec les variables alatoires discrtes est lutilisation de la notion dintervalle de valeurs
de X auxquelles sont lies les probabilits (plutt qu des valeurs particulires et isoles).
4.1. Fonction de rpartition
On appelle fonction de rpartition de la variable alatoire continue X, la fonction F(x) qui tout x de lintervalle de
dfinition fait correspondre la probabilit que X soit strictement infrieure x :
F(x) = P(X<x)
x

Pour un intervalle de dfinition de ]- , x[, on peut dire que F(x) =

f(X).dX reprsente laire sous la courbe f(x) de

- x.
Avec bien sr :

f(X).dX

f(X)

1.

-
X
x
b

On a de plus : P(a

b) = F(b) F(a) = f(X).dX


a

36

5.

LOI DE PROBABILITE OBSERVEE ET LOI DE PROBABILITE THEORIQUE

Pour bien comprendre la diffrence entre la loi de probabilit observe et la loi de probabilit thorique dune
variable alatoire, on utilisera lexemple suivant quon pourrait intituler : simuler le hasard .
Ecrivez sur un papier un nombre choisi au hasard entre 0 et 10 (inclus).
On demande ensuite un ordinateur de faire de mme, cest--dire de gnrer de manire alatoire une suite de
nombres compris entre 0 et 10 (on en gnrera 100).
Voici la loi (distribution) de probabilit observe :
15
10
5
0
0

10

La distribution thorique est videmment celle-ci (cest ce quon appelle une loi uniforme) :
12
10
8
6
4
2
0
0

10

On tracera titre dexercice la distribution de probabilit correspondant aux rponses donnes par les tudiants.
Que constate-t-on ?
La distribution observe sur ordinateur diffre de la distribution thorique. Cest un phnomne normal, nomm
fluctuations dchantillonnage . Si on recommenait un nouveau tirage de 100 nombres sur ordinateur, on
obtiendrait un autre graphique.
Quant la distribution obtenue par les tudiants, nous lanalyserons en direct .
Les distributions de probabilit des variables alatoires ne prennent donc pas nimporte quelle forme et peuvent tre
proches de distributions thoriques. En particulier, les variables alatoires utilises en biologie prsentent souvent
(mais pas toujours !) une forme de courbe en cloche , caractristique de loi normale.

37

6.

LA LOI NORMALE (LOI DE LAPLACE-GAUSS)

6.1. Introduction
Soit un ensemble de 200 tudiants dont on a not la taille.
Classes

effectifs

[150; 154[
[154; 158[
[158; 162[
[162; 166[
[166; 170[
[170; 174[
[174; 178[
[178; 182[
[182; 186[
[186; 190[

3
6
12
20
38
54
36
18
8
5

frquences
(%)
1,5
3
6
10
19
27
18
9
4
2,5

Traons le polygone des frquences relatif cette distribution.


polygone des frquences

frquences fi (%)

30

25

20

15

10

0
[150; 154[

[154; 158[

[158; 162[

[162; 166[

[166; 170[

[170; 174[

[174; 178[

[178; 182[

[182; 186[

[186; 190[

tailles (cm)

Si, au lieu de se limiter un chantillon de 200 tailles rparties en 10 classes, on considrait un chantillon de 10000
tailles rparties dans 50 classes s'chelonnant de 150 cm 190 cm, on conoit intuitivement que le polygone des
frquences s'apparenterait de plus en plus une courbe en cloche symtrique par rapport la verticale passant par la
moyenne X .
Cette courbe est appele courbe normale ou courbe de Laplace-Gauss.
6.2. Formulation de la loi normale
La loi normale ou loi de Laplace-Gauss pour les variables alatoires continues est une des lois les plus importantes
en statistiques. Elle constitue un modle mathmatique qui s'accommode de la plupart des distributions statistiques
variable continue.

La fonction qui la reprsente est la suivante :


avec

f(X)

1 ( X E(X)) 2
.
2
2

(fonction de densit de probabilit)

.
38

f(X)

X
Moyenne E(X)

La courbe obtenue est une courbe en cloche symtrique (courbe de Gauss). On constate que les trs grandes et les
trs petites valeurs sont peu probables et que les valeurs sont concentres autour de la moyenne.
De nombreux caractres peuvent tre reprsents par une loi normale. C'est le cas notamment de la taille, le poids,
les mensurations diverses, le pouls, le quotient intellectuel, mais aussi par exemple la dimension d'objets fabriqus
en srie.
Cette loi dpend donc des paramtres E(X) et (X). Pour lutiliser, il faudrait donc construire des tables pour chaque
couple de valeurs (E(X, (X)), ce qui serait impossible car il y aurait une infinit de tables.
Par exemple, on a trac ci-dessous deux courbes de Gauss ayant comme respectivement comme paramtres 10 et 15
pour l'esprance mathmatique et 1,5 et 4 pour l'cart-type.

39

Pour cette raison, on effectue un changement de variables en posant :


Z=

Et on obtient aprs manipulation, on obtient : f(Z)

X E(X)

1 2
.Z
2

(loi normale centre-rduite)

f(Z)

0
La courbe de la loi normale centre-rduite est aussi une courbe en cloche avec E(Z) = 0 et (Z) = 1.

La loi rduite ne dpend donc plus que de la variable Z et il est donc facile de construire des tables. Tous les
problmes ayant trait la loi normale demandent le passage la loi rduite.
6.3. Caractristiques d'une distribution normale
On dmontre mathmatiquement, que dans une population distribue normalement:

68,27 % des lments ont une valeur comprise entre E(X) -

95,45 % des lments ont une valeur comprise entre E(X) - 2 et E(X) + 2 ,

99,73 % des lments ont une valeur comprise entre E(X) - 3 et E(X) + 3 ,

le mode est gal la moyenne et la mdiane,

la courbe est symtrique par rapport la moyenne,

la courbe a deux points d'inflexion une distance + et - de la moyenne E(X).

et E(X) + ,

40

6.4. Exercices
1) Dans une population, la moyenne de la taille est de 169 cm avec un cart-type de 10 cm. Dterminer la
proportion d'individus dont la taille est suprieure 180 cm. (13,57 %)
2) On sait que le poids des flacons de pnicilline livrs par une firme pharmaceutique, est distribu normalement
avec une moyenne de 126 mg et un cart-type de 4 mg. Si on prlve un lot de 200 flacons, quelle devrait tre la
proportion d'entre eux dont le poids est:
a)
b)
c)
d)
e)

suprieur 130 mg (0,1587)


infrieur 130 mg (0,8413)
compris entre 120 et 130 mg (0,7745)
compris entre 120 et 125 mg (0,3345)
D'aprs les prescriptions lgales, pas plus de 10% des flacons ne peuvent s'carter de plus de 5%
du poids moyen. Peut-on conclure que la firme respecte ces prescriptions ? (non)

3) Une machine fabrique des pices cylindriques de diamtre nominal 50 mm. La tolrance admise est de 0,2 +
0,2 mm.
La production montre la longue que la dispersion correspond un cart-type de 0,05 mm. Au cours dune
journe, la production sest caractrise par une moyenne des diamtres de 50,1 mm. En supposant que la
distribution des diamtres est Gaussienne, quel est le pourcentage de rejet de pices au cours de cette journe.
(0,0228)
4) Une machine cadence rapide produit des rondelles dont le diamtre suit une loi normale de moyenne 15 mm et
dcart-type 1,3 mm.
On demande la proportion attendue de rondelles ayant :
a)
b)
c)
d)

moins de 14 mm (0,2206)
plus de 17 mm (0,0618)
entre 14,6 et 15,2 mm (0,1813)
quel est le diamtre de la rondelle la plus troite dans le groupe des 15 % de rondelles les plus larges ?
(16,352 mm)

5) Les pneus "Allseasons" peuvent parcourir en moyenne 56000 km, avec un cart-type de 8000 km et une
distribution normale.
a)

Quelle est la probabilit qu'un pneu soit us avant 50000 km ? (0,2266)

b) Quelle est la probabilit que les quatre pneus Allseasons qui quipent ma voiture soient uss avant 50000
km ? (0,0026)
c)

Quelles sont les hypothses poses en b) ? Comment des hypothses plus ralistes modifieraient-elles la
rponse ?

41

7.

LE TEST DU KHI CARRE ( 2): VERIFICATION DE LA NORMALITE D'UNE DISTRIBUTION

7.1. Introduction
Voici par exemple un relev du poids de 60 enfants dans une classe de maternelle :

Classes X :
poids (kg)
[9; 10[

nombre d'enfants
8

[10; 10,5[

12

[10,5; 11[

18

[11; 11,5[

13

[11,5; 12,5[

9
60

Il est trs probable que la variable (le caractre) tudie suit une loi normale. Si on calcule la moyenne et l'cart-type
de manire classique, on obtient respectivement 10,8 et 0,7.
Il pourrait tre utile de vrifier si cet chantillon peut tre considr comme extrait d'une population normale. Pour
cela, on peut raliser un test de Khi Carr ( 2). (il existe d'autres tests comme le test de la droite de Henry ou le test
de Kolmogorov-Smirnov).
7.2. Le test du 2

Le test du 2 permet de vrifier sil y a une diffrence significative entre une distribution
statistique observe et une distribution thorique donne (la loi normale en ce qui nous
concerne)
L'utilisation d'un test statistique (et notamment le test du 2) est soumise un pralable : la formulation d'une
hypothse de dpart, appele hypothse nulle H0, qui sera confirme ou rejete par le test.
Admettre l'hypothse nulle H0 en statistiques, c'est admettre que des diffrences observes entre la ralit des faits et
les hypothses mises ne sont pas dues des causes systmatiques mais au hasard de l'chantillonnage.
Deux erreurs d'interprtation sont videmment possibles :

Rejeter l'hypothse nulle alors qu'elle est vraie.


Adopter l'hypothse nulle alors qu'elle est fausse.

Dans le cas du test du 2, lhypothse de dpart (H0 : hypothse nulle), cest de dire que la rpartition exprimentale
confirme la rpartition thorique et donc que les diffrences observes sont uniquement dues au hasard.
Toutefois, l'acceptation ou le rejet de l'hypothse nulle est lie au risque d'erreur que le chercheur est prt prendre
pour affirmer que l'hypothse nulle est vraie ou fausse. Ce risque d'erreur est appel "seuil de signification" .
Quand l'hypothse nulle est formule, on calcule ensuite le
observe et la distribution thorique.

2
calc.

, qui est un indicateur dcart entre la distribution

Effectifs observs : O1, O2, , Ok


Effectifs thoriques : A1, A2, ,Ak (ce quon attend daprs la loi de probabilit choisie)

42

(Oi

2
calc
i 1

Ai )2

k : nombre de classes de la distribution

Ai

Comme les carts Oi Ai peuvent tre positifs ou ngatifs, et comme on veut faire la sommation, on considre le
carr des carts.
Plus

calcul est grand, plus il y a discordances entre les effectifs observs et les effectifs thoriques.

Il est vident que si


la table le 2thorique.
Recherche du

=0, la thorie est gale la ralit ( cas idal ). Si ce nest pas le cas, il faut rechercher dans

thorique.

On fixe la probabilit de voir


de signification .

2
calc.

dpasser une certaine limite (

thorique).

Cette probabilit est aussi appele seuil

On prend gnralement un seuil de signification de 0,05, et donc la probabilit davoir


gale 5 %. (Dans 5 cas sur 100, le 2calc dpassera le 2thorique par le fait du hasard)

calc>

2
thorique

est suppose

On dtermine le nombre de degrs de liberts (d.d.l.)


d.d.l. = k 1 nombre de paramtres calculer pour trouver les effectifs thoriques
Quand on connat le seuil de signification et le nombre de d.d.l., on va rechercher la valeur de
ci-dessous. Deux cas peuvent alors se prsenter :

2
thorique

dans la table

1) Si 2calc > 2thorique , alors la diffrence est trop forte pour tre due aux seuls faits du hasard et on est conduit
rejeter lhypothse de dpart. (les discordances sont significatives, elles sont trop grandes)
2) Si 2calc < 2thorique, on accepte lhypothse de dpart. (les discordances observes ne sont pas significatives,
elles ne sont pas trop fortes, elles sont dues au hasard)

Remarques :
-

le moins 1 dans le nombre de degrs de liberts vient du fait quune fois les effectifs rpartis dans k 1
classes, les observations restantes doivent normalement revenir la dernire classe. Cette dernire classe na par
consquent pas la libert (lindpendance) de prendre la valeur quelle veut.

plus le nombre de degrs de libert est lev, plus le


entre les effectifs observs et thoriques.

plus on a de paramtres calculer, plus le nombre de degrs de libert sera faible, et plus le
On acceptera donc moins de discordances entre les effectifs observs et thoriques.

plus le seuil de signification est faible, plus le


plus de discordances).

thorique est

2
thorique

lev. On acceptera donc plus de discordances


2
thorique

sera faible.

est lev et on est donc moins restrictif (on acceptera

Par consquent, un seuil de signification de 0,05 est moins svre quun seuil de signification de 0,25.
Avec 0,05, on accorde moins de signification aux discordances quavec 0,25.

43

Conditions de validit du test


-

la taille de lchantillon doit tre suffisamment grande : n

Les effectifs observs de chaque classe ne doivent pas tre trop faibles. En pratique, un effectif
observ de 5 est considr comme un minimum.

50.

Si certaines classes ne satisfont pas cette condition, on doit les regrouper avec les classes voisines
jusqu ce que la rgle soit respecte.
Dans ce cas, cest ce nouveau nombre de classes qui sera pris en compte pour le calcul du nombre
de degrs de libert.
Prenons l'exemple suivant :
Supposons qu'une pice de monnaie ait t lance en l'air 50 fois et soit retombe en ne montrant que le ct face
que 15 fois. Peut-on affirmer que la pice tait fausse ou que celui qui la lanait tait moins honnte qu'il le
paraissait ?
Hypothse nulle : la pice n'est pas fausse et les divergences observes sont dues au hasard.
Calcul du

2
calc

2
calc

(35 25)
25

(15 25)
=8
25

Nombres de ddl : 2 1 = 1

Avec = 0,05, (c'est--dire que si on ralise 100 fois l'exprience correctement, le


par le fait du hasard que 5 fois), on obtient 2thorique = 3,84.

2
calc

ne dpassera

2
thorique

Puisque 2calc > 2thorique (les diffrences sont trop importantes), on rejette donc l'hypothse nulle, le risque de
se tromper tant de 5 %.

Avec = 0,01, (c'est--dire que si on ralise 100 fois l'exprience correctement, le


par le fait du hasard que 1 fois), on obtient 2thorique = 6,64.

2
calc

ne dpassera

2
thorique

Puisque 2calc > 2thorique (les diffrences sont trop importantes), on rejette donc l'hypothse nulle, le risque de
se tromper tant de 1 %.

Si on veut un degr de certitude trs lev, on peut prendre = 0,001, (c'est--dire que si on ralise 1000 fois
l'exprience correctement, le 2calc ne dpassera 2thorique par le fait du hasard que 1 fois), on obtient 2thorique =
10,83.
Dans ce cas,

calc <

thorique,

on ne peut pas se prononcer sur le fait que la pice est fausse.

7.3. Applications
1) Reprendre l'exemple du relev du poids de 60 enfants dans une classe de maternelle et vrifier l'hypothse de
normalit de la distribution.
Classes X :
poids (kg)
[9; 10[

nombre d'enfants
8

[10; 10,5[

12

[10,5; 11[

18

[11; 11,5[

13

[11,5; 12,5[

9
60

44

2) Le tableau suivant donne le rsultat d'une enqute sur la taille des tudiants en informatique.
Xi : tailles en
cm

effectifs
observs

[150,160[

28

[160,170[

110

[170,180[

69

[180,190[

61

[190,200[

32
300

a)

Vrifier que les tailles de ces tudiants ne suivent pas du tout une loi normale.

b)

Critiquez le rsultat obtenu. Cela vous semble-t-il possible ? Observez attentivement le tableau de donnes.

3) Vous ralisez une enqute donnant sur le nombre de pulsations par minute (pouls) d'un chantillon de 250
adultes de 20 35 ans.
a)

Complter le tableau ci-dessous en indiquant des effectifs observs tels que la distribution se rapproche
d'une loi normale et le vrifier par le test du khi carr.

b)

Prendre des seuils

c)

Tracer un graphique permettant de confirmer "grossirement" que la variable suit une loi normale".

de 0,05 et de 0,01 et expliquer leur signification.

Nombre de pulsations
par minute
[40; 50[

Effectifs observs Oi

[50; 60[

25

[60; 70[
[70; 80[
[80; 90[

49

[90; 100[
[100; 110[

12

4) Un cadre d'une entreprise mtallurgique effectue une tude statistique sur l'paisseur de pices en acier.
L'enqute dure un mois et les rsultats sont repris dans le tableau suivant :

Xi : paisseur (en
1/10 mm)
[100; 105[

13

[105; 110[

101

[110; 115[

282

[115; 120[

430

[120; 125[

253

[125; 130[

92

[130; 135[

ni

45

a)

Vrifier par le test du Khi carr que ces donnes suivent une loi normale.

b)

En particulier, montrer sur papier la mthode utilise pour calculer les effectifs thoriques de la classe
[100; 105[.

c)

En supposant que le test est concluant, calculer sur papier avec la loi normale le pourcentage de rebuts si
l'on considre que l'on rejette les pices d'paisseur infrieure 108 et suprieure 128 (1/10 de mm).

d)

Expliquer la signification de l'cart-type.

46

CHAPITRE 3 : INFRENCE STATISTIQUE


1.

PRINCIPES DE L'INFERENCE STATISTIQUE

En statistique descriptive, nous nous sommes limits dcrire un ensemble de donnes, en extraire l'information
au moyen de graphiques, tableaux de frquences et calculs de paramtres, et ensuite dcrire quelques distributions
thoriques de variables, savoir binomiale, de Poisson et normale.
L'infrence statistique a pour but d'mettre un jugement sur une ou plusieurs caractristiques de la population
partir d'une ou plusieurs caractristiques observes sur un chantillon extrait de cette population.
Par population, on entend la totalit des observations individuelles existant dans une aire spcifie, limite dans
l'espace et dans le temps, et au sujet desquelles on dsire tirer des conclusions. Par exemple, la population des tailles
de tous les Belges, la population des concentrations hpatiques d'une enzyme chez tous les rats mles d'une mme
espce, la population des mesures d'erreurs si on pouvait prlever un millilitre de faon infinie, ...
L'chantillon constitue un sous-ensemble limit de la population.
Exemple : les tailles de quarante Belges, la concentration hpatique d'une enzyme mesure chez dix rats, ...
Pour que l'infrence statistique ait un sens, l'chantillon doit tre reprsentatif de la population. On admettra en
gnral son caractre reprsentatif si l'chantillon est prlev de faon alatoire, c'est--dire lorsque chaque individu
a une mme chance d'tre prlev et que les individus sont prlevs indpendamment les uns des autres. (voir
prcdemment)
Toute caractristique numrique calcule partir des observations de l'chantillon est appele une statistique et
toute caractristique numrique associe la population sera dornavant appele un paramtre.
Les principes de l'infrence statistique concourent deux objectifs :

Les problmes d'estimation : partir d'une statistique d'chantillon, obtenir une estimation prcise du
paramtre de la population.

Les tests d'hypothse : vrifier la vraisemblance d'une hypothse concernant le ou les paramtres d'une ou
de plusieurs populations partir des statistiques calcules dans le ou les chantillons.

47

2.

L'ESTIMATION

2.1 Introduction
L'estimation, c'est l'ensemble des mthodes utilises pour valuer un paramtre d'une population l'aide d'un
estimateurs pris dans un chantillon extrait de cette population.
Par exemple, dans le cas de l'tude de la taille d'une population, les paramtres que sont la moyenne et la variance
sont des constantes (qui sont gnralement inconnues).
Si on choisit plusieurs chantillons diffrents partir de cette population, les moyennes X et les variances s de ces
chantillons seront diffrentes pour chaque chantillon choisi. Ce sont par consquent des variables alatoires.
Un grand nombre de problmes statistiques consistent en la dtermination de la moyenne "vraie" sur base
d'observations ralises sur un chantillon, mais on peut aussi chercher connatre d'autres caractristiques, comme
la variance par exemple.
Exemples :

Quelle est la frquence d'apparition de tel type de cancer chez les souris ?
Quelle est la "vraie" valeur de la glycmie chez un patient ?
Quelle est la variance de la glycmie mesure chez ce mme patient ?

2.2 Estimateurs biaiss et non biaiss


Si la moyenne (l'esprance mathmatique) d'un estimateur d'chantillonnage est gale au paramtre correspondant
de la population, on dit que l'estimateur est un estimateur non biais de ce paramtre. Dans le cas contraire, on dit
que l'on a un estimateur biais.

Estimateur non biais (ou sans biais) : E( ) =

Sinon, le biais est dfini par : B( ) = E( ) -

Les valeurs correspondantes de ces estimateurs sont respectivement des estimations non biaises ou biaises.
Dans la figure ci-dessous, les estimateurs dont les distributions de probabilit sont A et C sont non biaiss (sa
moyenne est gale ) alors que celui dont la distribution est B est biais.

48

Si X et s sont respectivement la moyenne et la variance d'un chantillon, on peut dmontrer que X et s sont des
estimateurs sans biais de la moyenne et de la variance de la population correspondante.
E (X ) =

(s est la variance de lchantillon dfinie par : s

i 1

et E (s) = .

n i . Xi

X
)

n -1

Remarque : on peut montrer que si on avait pris comme estimateur de la variance de la population
k

s 2n

i 1

n i . Xi
n

X
, cet estimateur serait biais. On prfrera donc utiliser s.

2.3 Estimateurs efficaces


Si on compare les distributions de probabilit A et C des deux estimateurs du graphique ci-dessus, celui qui a la
variance la plus faible est considr comme le plus efficace. Cela correspond videmment une distribution la plus
concentre possible.
3.

ESTIMATION PONCTUELLE

Cette mthode consiste attribuer au paramtre inconnu une valeur approche de l'estimateur mesure dans un
chantillon pris au hasard.

Paramtres de la population

Estimateurs

= X

Moyenne de
Proportion d'individus
possdant la caractristique A
Ecart-type

nA
n
s

Cette mthode a comme inconvnient de ne pas donner d'indication sur l'erreur possible entre l'estim et le
paramtre.
Exemples
1) Si 150 tudiants de 6me ont un QI de 135 avec un cart type de 15 et si 38 de ces tudiants frquentent
l'enseignement technique, estimer le QI moyen, l'cart type et la proportion d'tudiants frquentant le technique
de tous les tudiants de 6me de la ville.
2) Pour tudier la consommation d'essence des voitures d'une certaine marque, on prlve un chantillon de 12
voitures pour lesquelles on note les consommations en litres par 100 km.
9,7

10,3

9,9

10,4

10,5

10,8

11,2

11

8,9

10

10,7

10,8

Estimer de faon ponctuelle la moyenne et l'cart type de la consommation d'essence des voitures de cette
marque.

49

4.

LE THEOREME CENTRAL LIMITE

Les informations relatives la distribution d'chantillonnage de la moyenne se rsument en un thorme : le


thorme central limite.
Etant donn une population ayant une moyenne

et dcart-type

Considrons lensemble des chantillons alatoires possibles de taille n. On a vu prcdemment que : E ( X ) = .


Il est vident que les moyennes dchantillon X 1 , X 2 , varient entre elles, puisque les chantillons varient de
lun lautre. On peut mesurer cette variabilit des moyennes dchantillon en calculant lcart-type ( X ) de
celles-ci.
Le thorme central limite nous dit que : ( X ) =

Et donc, la moyenne de lchantillon


n

X varie autour de la moyenne de la population avec un cart-type gal

Dans la ralit, ( X ) nest pas connu puisque est inconnu. En pratique, on a vu que lcart-type de lchantillon s
est une estimation de . On peut ds lors remplacer par s et obtenir une estimation de ( X ), note s( X ) :
s( X ) =

s
n

Remarquons que cette formule est trs intressante car elle permet destimer la variabilit des moyennes
dchantillon X alors quon ne dispose en pratique que dun seul chantillon !
Autre rsultat important
Lorsque la population mre est normale, ou lorsque la taille de lchantillon est suffisamment grande (n > 30), la
distribution dchantillonnage de a une forme approximativement normale.

5.

ESTIMATION PAR INTERVALLE DE CONFIANCE

Estimer un paramtre partir d'un chantillon alatoire simple fournit, comme on vient de le voir, une estimation
ponctuelle.
On peut par exemple estimer la taille moyenne des lves de toutes les lves de toutes les classes de 6me
secondaire de Belgique l'aide de la moyenne X d'un chantillon restreint d'lves.
Une telle opration ne nous permet pas de savoir si la valeur obtenue est proche ou non de la valeur inconnue. Pour
remdier ce problme, on utilise la notion d'intervalle de confiance.
Dfinir un intervalle de confiance, c'est rechercher un encadrement d'une valeur inconnue (moyenne,
pourcentage,...) qui soit la fois trs probable et le plus serr possible. La probabilit que l'intervalle contienne la
valeur inconnue est gale 1 - quelle que soit cette valeur.
Cette probabilit 1 - est appele niveau de confiance,
choisi en-dessous de 0,1.

tant un seuil ou niveau de probabilit habituellement

50

6.

INTERVALLE DE CONFIANCE DE LA MOYENNE

6.1 Introduction
Si X (moyenne d'un chantillon) est un bon estimateur de (moyenne de la population), la valeur observe de X
sur un chantillon est toujours un peu plus grande ou plus petite que . On ne peut plus affirmer que = X , on
construit alors un intervalle de confiance de la forme :
= X marge (ou erreur) d'chantillonnage
Quelle sera l'importance de cette marge d'erreur ?
On doit dcider du degr de confiance souhait 1 - . Si on choisit un niveau de confiance de 0,95 (et donc =
0,05), cela signifie que sur 100 chantillons prlevs, 95 donneront un intervalle qui contient la vraie valeur
estimer.
Prenons l'exemple suivant. Supposons que l'on veuille construire un intervalle de confiance pour la moyenne des
tailles de la population des tudiants de l'Universit de Lige en se basant sur un chantillons de 10 tudiants. On
suppose galement qu'on connat (ce qui est tonnant !) les valeurs de et de la population, soit respectivement
169 cm et 3,22 cm.
Si on prend 50 chantillons, on va obtenir des moyennes X 1 , X 2 , X 3 , , X 50 diffrentes (dont la moyenne est
gale et l'cart-type gal

, voir le thorme central limite).


n

Pour chacun des 50 chantillons, on peut calculer un intervalle de confiance (de niveau de confiance 95 %). On a
donc 50 intervalles de confiance diffrents et on regardera s'ils contiennent ou non la moyenne "vraie" (ici 169
cm).
Dans le cas d'un degr de confiance de 95 %, on devrait constater qu'environ 47 ou 48 intervalles de confiance sur
50 (soit environ 95 %) contiennent la moyenne "vraie" .
Remarquons que si on avait choisit un degr de confiance de 99 %, on devrait constater qu'environ 49 ou 50
intervalles de confiance sur 50 contiennent la moyenne "vraie" . Il est vident par consquent que les intervalles de
confiance " 99 %" seront plus tendus que ceux " 95 %".
En pratique, on ne prlve qu'un seul chantillon et on calcule un seul intervalle de confiance. La probabilit que cet
intervalle contienne la vraie valeur sera gale au niveau de confiance choisi (90 %, 95 %, 99 %, )

6.2 Echantillonnage avec ou sans remise


Lors du prlvement d'un chantillon, deux mthodes sont possibles. Prenons le cas d'une population de 1000 boules
numrotes dont on veut extraire un chantillon de 10 boules. On peut choisir une boule puis dcider de la mettre
sur le ct ou de la remettre dans l'urne (tirages sans ou avec remise). Dans le premier cas, cette boule ne pourra pas
tre tire une deuxime fois, il y aura une boule de moins dans l'urne et donc les tirages successifs seront
dpendants. Dans le deuxime cas, l'urne est chaque fois reconstitue et les tirages sont indpendants.
Si la population est trs grande, la diffrence entre ces deux cas sera faible et on la ngligera. Par contre, dans le cas
de petite population, il faut utiliser des facteurs de correction (facteur d'exhaustivit). Pour simplifier, nous
considrerons dans la suite que les diffrentes observations (ou tirages) sont indpendantes l'une de l'autre et il n'y
aura donc pas de facteur de correction appliquer.

6.3 Cas de grands chantillons (n

30)

On pourrait dmontrer que la marge d'erreur est de la forme :

/2

.
n

(si est connu)

ou

/2

s
n

(si est inconnu)


51

o Z /2 dpend du seuil de confiance considr et tel que P(Z < Z


dans les tables de la loi normale.

/2

) = 1 - /2. On recherche la valeur de Z

/2

Par exemple :

pour

= 10 %, on a : Z

pour

= 5 %, on a : Z

/2

= 1,96

pour

= 1 %, on a : Z

/2

= 2,575

= 1,645

/2

Donc en risquant de se tromper avec une probabilit gale , on peut affirmer que :
X -Z

L'intervalle [ X - Z

/2

, X + Z

/2

On peut aussi crire que : P ( X - Z

/2

/2

X + Z

n
.

s
n

/2

s
n

] est appel intervalle de confiance de

X + Z

/2

s
n

au niveau de confiance 1 - .

)=1-

Exemple
Dans un ensemble de 150 tudiants, on a constat dans un exercice d'expression orale que le temps de parole tait
distribu normalement avec un cart type de 2 min. On prlve sans remise un chantillon de 30 tudiants pour
lesquels le temps moyen de parole utilis pour cet exercice est de 14 min.
Construire un intervalle de confiance au niveau de confiance de 99% pour estimer le temps moyen de parole utilis
pour la population des 150 tudiants.
Dterminer la taille d'chantillon qu'il faudrait considrer pour rduire la marge d'erreur de moiti.

6.4 Cas des petits chantillons extraits d'une population normale ( n < 30)
Au paragraphe 4, on a vu que si la variable alatoire X suit une loi normale, la distribution des moyennes X suit une
loi normale N ( ,
Si

).
n
est connu, l'intervalle de confiance de la moyenne se construit comme dans le cas des grands chantillons.

Mais en gnral, est inconnu et estim par s. Dans le cas des petits chantillons, en remplaant
modifie la nature de la loi suivie par m.
La variable alatoire t =

X
s

par s et on

suit la loi de Student n-1 degrs de libert.

n
Le coefficient de risque tant choisi et le nombre de degr de libert tant connu, les tables permettent de lire t tel
que P(-t /2 < t < t /2 } = 1 - .
On en dduit la marge d'erreur sur la moyenne de la population :

t
2

,n 1

52

L'intervalle [ X - t
2

,n 1

, X + t
2

,n 1

] est appel intervalle de confiance de

au niveau de confiance 1 - .

Lorsque le nombre de degrs de libert tend vers l'infini, la fonction de rpartition de la loi de Student tend vers
celle de la loi normale centre rduite.

7.

INTERVALLE DE CONFIANCE D'UNE FREQUENCE (N

30)

Dans un chantillon de taille n tir d'une population binomiale pour laquelle p est la frquence de succs, les limites
de confiance de p sont donnes par p Z/2 p o p est la proportion de succs dans l'chantillon de taille n.
Les conditions suivantes tant ralises : np

5 et n.(1-p)

p Z

/2

5, les limites de confiance sont donnes par :

p.(1 p)
n

53

8.

EXERCICES

1) La dure de fonctionnement d'une pile suit une loi normale d'cart type 0,73 ans. On prlve un chantillon de
36 piles et on a observ une moyenne de 4,4 ans. Construire un intervalle de confiance au niveau de confiance
95% pour estimer la dure de fonctionnement moyenne des piles de ce type. On suppose que l'chantillonnage a
t fait avec remise.
Quelle devrait tre la taille d'chantillon de faon n'avoir une marge d'erreur que de 0,1 au mme niveau de
confiance ?
(4,16 - 4,64 ; 205)
2) Le personnel d'un bureau d'experts fiscaux sait que le temps ncessaire pour remplir une dclaration fiscale est
une variable alatoire d'cart type 15,3 min. Pour estimer le temps moyen, on prlve un chantillon de 60
dclarations et on note le temps moyen 77,8 min. On demande de construire un intervalle de confiance au
niveau de confiance de 90% pour estimer le temps moyen ncessaire pour remplir une dclaration fiscale.
(chantillon avec remise)
(74,55 - 81,05)
3) Sur un chantillon de 83 coquillages, on a relev une cote dtermine x. On a trouv une moyenne de 52,17 mm
et un cart type de 1,8 mm.
a)

estimer la moyenne de la population par un intervalle de confiance 95%

b)

quel devrait tre l'effectif de l'chantillon pour situer la moyenne dans un intervalle de 0,4 mm
avec une scurit de 95 % ?
(51,78 - 52,56 ; 311)

4) Un fabricant de stylos met un nouveau stylo sur le march. Pour estimer la dure moyenne d'criture de ces
stylos, il prlve un chantillon de 16 stylos et il note leur dure d'criture (en heures).
87

92

97

93

102

101

91

100

91

96

95

92

68

85

90

86

En supposant que la dure de vie suit une loi normale, on demande de construire un intervalle de confiance au
niveau de confiance de 95% pour estimer la dure moyenne d'criture.
(87,3 - 95,9)
5) Pour connatre les intentions de vote des belges, on prlve un chantillon de 900 personnes et on trouve que
426 d'entre elles ont l'intention de voter pour le parti "XYZ". On demande de construire un intervalle de
confiance au niveau de confiance de 95 % pour estimer la proportion des lecteurs qui ont l'intention de voter
pour le parti "XYZ" aux prochaines lections. Dterminer le nombre de personnes qu'il faudrait consulter de
faon ce que la marge d'erreur ne dpasse pas 0,02.
(0,44 - 0,51 ; 2395)
6) Marc Dupont, un tudiant, veut savoir s'il vaut la peine de se porter candidat la prsidence de l'Association des
Etudiants. Un chantillon de 50 tudiants a montr que 22% des tudiants voteraient pour lui. Estimer le
vritable pourcentage un niveau de confiance de 99%.
(0,07 - 0,37)
7) Dans un chantillon alatoire de 400 personnes, 320 approuvent la nouvelle politique gouvernementale en
matire d'immigration. Au niveau de confiance de 95%, estimer le pourcentage de la population en accord avec
la nouvelle politique. (0,76 - 0,84)
8) Madame X, dput, est inquite. La victoire aux prochaines lections est loin d'tre assure. Prise de panique,
elle s'empresse de commander un sondage pour savoir comment elle est perue par l'lectorat. Des 1200 votants
interrogs, 532 ont affirm qu'ils voteraient pour madame X, tous les autres semblent prfrer son adversaire ou
sont indcis. Au niveau de confiance de 95%, estimer le pourcentage de l'lectorat qui appuie la dpute.
(41,53 - 47,13)
9) Un chantillon de 100 votants choisis au hasard parmi tous les votants d'une circonscription donne a montr
que 55 % d'entre eux taient favorables un certain candidat.
54

Dterminer les limites de confiance (a) 95% (b) 99% (c) 99,73 % de la proportion de tous les votants
favorables ce candidat. (0,55 0,10 ; 0,55 0,13, 0,55 0,15)
10) Une entreprise de production de graines veut vrifier la facult germinative d'une espce, c'est--dire la
probabilit p pour qu'une graine, prise au hasard dans la production, germe.
Sur un chantillon de 400 graines, on observe que 330 graines germent. Quel est l'intervalle de confiance de p
au risque 5 % ? au risque 1 % ?
([0,788 - 0,862] ; [0,776 - 0,874])

11) On a mesur la densit minrale osseuse (DMO) chez 12 sujets hmiplgiques.


Ct
paralys
Ct
sain

0,772

0,630

0,757

0,541

0,607

0,474

0,489

0,570

0,721

0,824

0,525

0,824

0,750

0,628

0,824

0,599

0,667

0,649

0,499

0,570

0,691

0,883

0,599

0,827

Dterminer l'intervalle de confiance sur la DMO au niveau de confiance de 95 %.


([0,608 0,7564] ; [0,5622 0,7268])

55

ANNEXE 1 : TABLES
Table de Loi Normale
Fonction de rpartition de la loi normale centre
rduite.
Probabilit de trouver une valeur infrieure u.

0.00

0.01

0.02

0.03

0.04

0.05

0.06

0.07

0.08

0.09

0.0 0.50000 0.50399 0.50798 0.51197 0.51595

0.51994

0.52392 0.52790 0.53188

0.53586

0.1 0.53983 0.54380 0.54776 0.55172 0.55567

0.55962

0.56356 0.56749 0.57142

0.57535

0.2 0.57926 0.58317 0.58706 0.59095 0.59483

0.59871

0.60257 0.60642 0.61026

0.61409

0.3 0.61791 0.62172 0.62552 0.62930 0.63307

0.63683

0.64058 0.64431 0.64803

0.65173

0.4 0.65542 0.65910 0.66276 0.66640 0.67003

0.67364

0.67724 0.68082 0.68439

0.68793

0.5 0.69146 0.69497 0.69847 0.70194 0.70540

0.70884

0.71226 0.71566 0.71904

0.72240

0.6 0.72575 0.72907 0.73237 0.73565 0.73891

0.74215

0.74537 0.74857 0.75175

0.75490

0.7 0.75804 0.76115 0.76424 0.76730 0.77035

0.77337

0.77637 0.77935 0.78230

0.78524

0.8 0.78814 0.79103 0.79389 0.79673 0.79955

0.80234

0.80511 0.80785 0.81057

0.81327

0.9 0.81594 0.81859 0.82121 0.82381 0.82639

0.82894

0.83147 0.83398 0.83646

0.83891

1.0 0.84134 0.84375 0.84614 0.84849 0.85083

0.85314

0.85543 0.85769 0.85993

0.86214

1.1 0.86433 0.86650 0.86864 0.87076 0.87286

0.87493

0.87698 0.87900 0.88100

0.88298

1.2 0.88493 0.88686 0.88877 0.89065 0.89251

0.89435

0.89617 0.89796 0.89973

0.90147

1.3 0.90320 0.90490 0.90658 0.90824 0.90988

0.91149

0.91309 0.91466 0.91621

0.91774

1.4 0.91924 0.92073 0.92220 0.92364 0.92507

0.92647

0.92785 0.92922 0.93056

0.93189

1.5 0.93319 0.93448 0.93574 0.93699 0.93822

0.93943

0.94062 0.94179 0.94295

0.94408

1.6 0.94520 0.94630 0.94738 0.94845 0.94950

0.95053

0.95154 0.95254 0.95352

0.95449

1.7 0.95543 0.95637 0.95728 0.95818 0.95907

0.95994

0.96080 0.96164 0.96246

0.96327

1.8 0.96407 0.96485 0.96562 0.96638 0.96712

0.96784

0.96856 0.96926 0.96995

0.97062

1.9 0.97128 0.97193 0.97257 0.97320 0.97381

0.97441

0.97500 0.97558 0.97615

0.97670

2.0 0.97725 0.97778 0.97831 0.97882 0.97932

0.97982

0.98030 0.98077 0.98124

0.98169

2.1 0.98214 0.98257 0.98300 0.98341 0.98382

0.98422

0.98461 0.98500 0.98537

0.98574

2.2 0.98610 0.98645 0.98679 0.98713 0.98745

0.98778

0.98809 0.98840 0.98870

0.98899

2.3 0.98928 0.98956 0.98983 0.99010 0.99036

0.99061

0.99086 0.99111 0.99134

0.99158

2.4 0.99180 0.99202 0.99224 0.99245 0.99266

0.99286

0.99305 0.99324 0.99343

0.99361

2.5 0.99379 0.99396 0.99413 0.99430 0.99446

0.99461

0.99477 0.99492 0.99506

0.99520

2.6 0.99534 0.99547 0.99560 0.99573 0.99585

0.99598

0.99609 0.99621 0.99632

0.99643

2.7 0.99653 0.99664 0.99674 0.99683 0.99693

0.99702

0.99711 0.99720 0.99728

0.99736

2.8 0.99744 0.99752 0.99760 0.99767 0.99774

0.99781

0.99788 0.99795 0.99801

0.99807

2.9 0.99813 0.99819 0.99825 0.99831 0.99836

0.99841

0.99846 0.99851 0.99856

0.99861

3.0 0.99865 0.99869 0.99874 0.99878 0.99882

0.99886

0.99889 0.99893 0.99896

0.99900

3.1 0.99903 0.99906 0.99910 0.99913 0.99916

0.99918

0.99921 0.99924 0.99926

0.99929

3.2 0.99931 0.99934 0.99936 0.99938 0.99940

0.99942

0.99944 0.99946 0.99948

0.99950

3.3 0.99952 0.99953 0.99955 0.99957 0.99958

0.99960

0.99961 0.99962 0.99964

0.99965

3.4 0.99966 0.99968 0.99969 0.99970 0.99971

0.99972

0.99973 0.99974 0.99975

0.99976

3.5 0.99977 0.99978 0.99978 0.99979 0.99980

0.99981

0.99981 0.99982 0.99983

0.99983
56

57

58

Table du

ddl

0 ,9 9

0,95

0,05

0 ,0 2 5

0 ,0 1

3,84

5 ,0 2

6 ,6 3

0,02

0,10

5,99

7 ,3 8

9 ,2 1

0,11

0,35

7,81

9 ,3 5

1 1 ,3 4

0,30

0,71

9,49

1 1 ,1

1 3 ,2 8

0,55

1,15

11,07

1 2 ,8

1 5 ,0 9

0,87

1,64

12,59

1 4 ,4

1 6 ,8 1

1,24

2,17

14,07

1 6 ,0

1 8 ,4 8

1,65

2,73

15,51

1 7 ,5

2 0 ,0 9

2,09

3,33

16,92

1 9 ,0

2 1 ,6 7

10

2,56

3,94

18,31

2 0 ,5

2 3 ,2 1

11

3,05

4,57

19,68

2 1 ,9

2 4 ,7 2

12

3,57

5,23

21,03

2 3 ,3

2 6 ,2 2

13

4,11

5,89

22,36

2 4 ,7

2 7 ,6 9

14

4,66

6,57

23,68

2 6 ,1

2 9 ,1 4

15

5,23

7,26

25,00

2 7 ,5

3 0 ,5 8

16

5,81

7,96

26,30

2 8 ,8

3 2 ,0 0

17

6,41

8,67

27,59

3 0 ,2

3 3 ,4 1

18

7,01

9,39

28,87

3 1 ,5

3 4 ,8 1

19

7,63

10,12

30,14

3 2 ,9

3 6 ,1 9

20

8,26

10,85

31,41

3 4 ,2

3 7 ,5 7

21

8,90

11,59

32,67

3 5 ,5

3 8 ,9 3

22

9,54

12,34

33,92

3 6 ,8

4 0 ,2 9

23

10,20

13,09

35,17

3 8 ,1

4 1 ,6 4

24

10,86

13,85

36,42

3 9 ,4

4 2 ,9 8

25

11,52

14,61

37,65

4 0 ,6

4 4 ,3 1

26

12,20

15,38

38,89

4 1 ,9

4 5 ,6 4

27

12,88

16,15

40,11

4 3 ,2

4 6 ,9 6

28

13,56

16,93

41,34

4 4 ,5

4 8 ,2 8

29

14,26

17,71

42,56

4 5 ,7

4 9 ,5 9

30

14,95

18,49

43,77

4 7 ,0

5 0 ,8 9

55,8

5 9 ,3

6 3 ,7

40

59

ANNEXE 2 : EXEMPLE INTRODUCTIF


EXEMPLE INTRODUCTIF : VARIABLE QUANTITATIVE CONTINUE
On a mesur en millisecondes, quelle vitesse 50 enfants de quatre ans identifiaient des images simples (ours, lapin,
chat, ...).
Les rsultats sont prsents dans le tableau suivant :

Enfants
Temps (en ms)

1
24

2
27

3
38

4
21

5
27

6
19

7
23

8
23

9
24

10
19

Enfants
Temps (en ms)

11
27

12
30

13
15

14
27

15
24

16
35

17
18

18
20

19
21

20
15

Enfants
Temps (en ms)

21
33

22
27

23
20

24
32

25
28

26
27

27
22

28
17

29
30

30
18

Enfants
Temps (en ms)

31
21

32
25

33
25

34
29

35
25

36
24

37
32

38
31

39
28

40
20

Enfants
Temps (en ms)

41
29

42
24

43
23

44
34

45
17

46
15

47
21

48
28

49
24

50
23

Vu le nombre de valeurs diffrentes releves, il y a peu d'intrt les reprsenter sur un graphique. Il est prfrable
de constituer des classes.

Par exemple, on peut obtenir le tableau suivant :

i : numro de la classe
Intervalles de temps (en ms) Xi
Effectifs ni

[15, 18]

[19, 22]

[23, 26]

[27, 30]

[31, 34]

[35, 38]

11

14

11

La variable, note Xi, est le temps en millisecondes.

60

ANNEXE 3 : TOUTES SORTES DE


"DISTRACTIONS STATISTIQUES"
Lisez ce texte et dcouvrez la tromperie
Bigot quitte la RTBF pour Endemol France (Journal Le Soir)
JEAN-FRANCOIS LAUWENS
jeudi 10 avril 2008, 21:01

Le Franais Yves Bigot, directeur des antennes de la RTBF depuis avril 2006, quittera la tlvision
publique le 1er septembre prochain. Il a en effet trouv un accord avec Endemol France dont il
prendra la direction des programmes.
Deux ans aprs avoir pris ses fonctions de directeur des antennes de la RTBF (le 1er avril 2006), Yves Bigot a
dcid de faire le chemin inverse et de reprendre la direction de Paris. Bigot va en effet rallier Endemol France,
socit de production qui a la mainmise sur la tl franaise puisquelle arrose ses chanes avec des programmes
comme la Star Academy, A prendre ou laisser, Attention la marche, Miss France, Les enfants de la tl,
Tempches tout le monde de dormir, Secret Story et mme + Clair.
A 52 ans, le Tropzien nabandonne pas le paquebot RTBF en pleine mer mme si, videmment, il nira pas au bout
de son mandat de six ans. Dailleurs, il ne quittera la RTBF que le 31 aot prochain. Ce nest videmment pas une
nouvelle que lon accueille avec plaisir, mme si cela dmontre que nous ne nous tions pas tromps lorsque nous
lavons recrut voici deux ans, dit ladministrateur gnral de la RTBF, Jean-Paul Philippot. Ma premire
proccupation a t de savoir ce que nous allions faire pour les grilles de la rentre de septembre. Et Yves ma
rpondu spontanment quil allait les faire avec son quipe et les prsenter la presse fin aot. Ce nest quaprs
cette chance quil rejoindra Endemol France.
Dsigner son successeur
Par ailleurs, Bigot conservera, deux ans durant, une mission de conseil auprs de la RTBF. Dici septembre, il
participera la dsignation de son successeur, qui sera choisi via un appel candidatures lanc dici une semaine.
Bigot appartiendra effectivement au collge dexperts mis en place cet effet en compagnie du Suisse Gilles
Marchand (TSR) et du Flamand Aim Van Hecke (ex-VRT, Sanoma).
Pour Yves Bigot, il sagit dune nouvelle ligne sur un CV impressionnant qui la amen travailler dans la radio et
la presse crite, diriger des maisons de disques et faire de la tl (il a t directeur des varits et des programmes
de France 2, et directeur gnral adjoint charg des programmes de France 4).
Cest lamour de laventure et le got du risque qui mavaient amen en Belgique et jy ai pass deux annes
merveilleuses, explique-t-il. Mais le challenge que me propose Virginie Calmels, la prsidente dEndemol France,
est ambitieux et enthousiasmant. Je ne remplace pas Alexia Laroche-Joubert (ndlr : la directrice de la Star Ac vient
de quitter son poste de directrice des programmes dEndemol France pour rejoindre son ancien patron, Stphane
Courbit) puisque je prends un poste nouvellement cr, celui de directeur gnral adjoint charg des programmes.
Tous les programmes, donc y compris la tlralit mais pas seulement la tlralit, ce qui ne maurait pas
intress. Endemol ne serait pas venu me chercher moi pour a.
Quant au bilan de Bigot Reyers, il reste globalement trs positif malgr quelques checs. Cest en tout cas lavis de
Jean-Paul Philippot : La Une a stabilis ses audiences, la Deux les a augmentes de 43 %. On a investi dans la
production belge, comme Melting-pot caf, lanc Arte Belgique, des talk-shows, le 12 minutes et mis Matin
premire en tl. Surtout, la RTBF a renou avec des vnements (Stars of Europe, Tenue de soire) et avec une
politique remarquable en termes dacquisition de fictions et de droits sportifs. Nous aurions pu travailler ensemble
longtemps encore

COMMENTAIRE :
La Deux augmente son audience de 43 % !! En fait, elle passe de 3 4,5 % !!!!

Halte aux ides reues


Les jeux vido amliorent le niveau scolaire

Les parents qui se lamentent en voyant leur progniture


affale sur le canap du salon jouer des jeux vido et
qui nhsitent pas dire Et tes devoirs ? Travaille
plutt lcole seront sans doute forcs de rviser
leurs positions, car non, le jeu vido ne nuit pas aux
performances scolaires, bien au contraire, cest du moins
ce que tend prouver une tude consacre ce sujet et
dont
nous
nous
faisons
lcho
ici.
Le professeur Astreau, chercheur indpendant attach
lInstitut dtudes pdiatriques de Niort a effectu des
mesures trs prcises ce sujet, mesure dont il a tir des
conclusions
qui
en
tonneront
plus
dun.
Tout dabord, le rapport entre la frquence dutilisation
des consoles de jeux vido et les performances scolaires
chez les enfants comme chez les adolescents, loin dtre
dfavorable, savre au contraire tonnamment bon.
Quon en juge : un enfant qui ne dispose pas dune
console de jeux vidos chez lui a quatre fois plus de
chances de redoubler au cours de son parcours scolaire
quun enfant qui dispose dun tel quipement. Sans
entrer plus avant dans les dtails, on peut retenir les
grandes lignes de cette tude, selon laquelle la prcocit de lusage des consoles, le temps
quotidien qui y est consacr et la varit des jeux ont tous une influence positive directe
indubitable sur les performances scolaires des enfants et des adolescents, lexception des jeux
en rseau qui, au del dun certain nombre dheures de pratique hebdomadaires savrent
nfastes
au
dossier
scolaire.
Aprs avoir analys ses observations, Grard Astreau sest demand ce qui pouvait expliquer le
bon niveau scolaire des jeunes joueurs.
Il semble quil y ait un faisceau de raisons cela... explique-t-il, et non une raison
unique . La premire explication qui vient lesprit, cest la stimulation intellectuelle. Forc de
rflchir rapidement, de rsoudre des nigmes, de se montrer observateur, le joueur dveloppe
des capacits intellectuelles intressantes. Mais, tempre le chercheur, les aptitudes
dveloppes par la pratique du jeu vido ont un usage principal : jouer aux jeux vido. Cest le
serpent qui se mord la queue ! . Lexplication se trouve donc ailleurs.
Les joueurs apprennent trs tt limmobilit spatiale. Ils peuvent rester assis au mme endroit
sans prouver la moindre lassitude, plongs dans un tat de concentration quils parviennent
tenir pendant des heures. Une telle aptitude savre capitale en situation scolaire o, de la mme
manire, on exige des coliers dtre physiquement apathique et intellectuellement vifs et
concentrs.
Des lectrodes ont t disposes sur le cuir chevelu des sujets tudis afin denregistrer dans leur
dtail
leur
activit
crbrale
lorsquils
jouaient
aux
jeux
vido.

Il savre lanalyse de ces tests que le cerveau est fortement stimul par les jeux vido dans
lhippocampe et dans la rgion du para-hippocampe, des zones partiellement ddies
lapprhension cognitive de lenvironnement spatial et lorientation. Or, en agissant sur
ltendue et la qualit de la "carte mentale" des joueurs, les jeux vido ne stimulent pas
uniquement leur sens de lorientation, ils agissent aussi fortement sur la mmoire, au point quun
chercheur de lUniversit de Californie Los Angeles teste actuellement un traitement de la
maladie dAlzheimer base de jeu vido.
Tout ceci explique donc les rsultats obtenus. Cependant, G. Astreau se refuse dresser un
tableau idyllique du sujet : 12% des joueurs se plongent involontairement en apne lorsquils
jouent. Cette privation temporaire doxygne peut remettre en cause le bnfice scolaire obtenu
par la pratique des jeux vido. De plus les enfants pileptiques risquent des crises lorsquils sont
trop longtemps confronts des images frntiques et lumineuses, et ces crises peuvent imposer
une mdication importante qui son tour peut grever les performances scolaires de lenfant .
Enfin, rappelle-t-il, les notes des passionns de jeux vidos sont gnralement mdiocres en
cours dducation physique et sportive .
Jenny L. Voight
Spcialiste des souris

Commentaire : Qu'en-pensez-vous ?

BON COURAGE !!

BIBLIOGRAPHIE

Adam A., Lousberg F., Espace Math 54, De Boeck, 1999.

Albert A., Biostatistique, Universit de Lige, Facult de Mdecine, 2005.

dOdemont P., Statistique biomdicale, Haute Ecole de la Province de Lige.

Droesbeke J.-J., Elments de Statistiques, Editions Ellipse, 1997.

Jaffard P., Initiation aux mthodes de la statistique et du calcul des probabilits, Masson, 1986.

Lambermont M-F., cours de statistique, graduat en informatique, IPEPS Seraing, 2004.

Masiri, W., Notions essentielles de statistique et calcul des probabilits, travaux pratiques, Sirey, 1976.

Monfort F., Elments du calcul des probabilits et des mthodes statistiques. Ulg. 1970

Moroney M.J., Comprendre la statistique, Marabout Universit, 1970.

Poinsot D., Statistiques pour statophobes, cours en ligne, 2004.

Rateau P., Mthode et statistique exprimentales en sciences humaines, Edition Ellipses, 2001.

SBPMef, Explorations didactiques, Statistiques 1re approche, dossier n6, 1999.

Van Vyve-Genette A., Gohy J-M., Feytmans E., Statistique lmentaire pour les sciences bio-mdicales, De
Boeck Universit, 1988.

Tassi P., Mthodes Statistiques, Ed. Economica, 1989.

Wonnacott H. et J., Statistique : Economie, Gestion, Sciences, Mdecine, Ed. Economica, 4 me dition, 1995.