Académique Documents
Professionnel Documents
Culture Documents
INTRODUCTION
Sur base des documents observs (extraits de journaux, revues, livres, ), on se rend compte sans difficult que les
tudes statistiques envahissent notre vie. Mais comment peut-on dfinir la statistique ?
La statistique est une branche des mathmatiques qui a pour but, dans un premier temps, de rassembler une srie de
donnes et de les prsenter (statistique descriptive). Dans un deuxime temps, ces donnes sont interprtes afin
den tirer des conclusions et d'effectuer des prvisions ventuelles (statistique infrentielle).
Linterprtation et lutilisation de donnes statistiques se retrouve dans de trs nombreux domaines dont notamment,
les sciences humaines, les sciences conomiques, les mdias, la gestion des entreprises, la recherche mdicale, ... Ce
n'est pas pour rien qu'un cours de statistique est prsent en premire anne de la plupart des graduats et des
universits.
Il sagit pour les pouvoirs publics davoir la vision la plus claire, la plus prcise possible sur les causes et
les conditions des accidents qui surviennent sur les diffrents rseaux. (les lieux, les conditions
atmosphriques, lclairement, les individus et les vhicules impliqus, ...). Le choix des "armes" dpend
troitement de lennemi que lon a combattre et seules les statistiques permettent de bien le dfinir.
Une fois les actions dcides et mises en uvre, il sagit dvaluer leur efficacit sur le terrain. L encore,
les statistiques permettent de mesurer objectivement les effets des actions entreprises, de faon pouvoir les
gnraliser si celles-ci sont positives, ou bien les amender si elles ne donnent pas entire satisfaction.
La diffusion des statistiques permet de faire partager lensemble des usagers notre connaissance sur
laccidentologie. Cest indispensable si lon veut obtenir leur adhsion une lutte qui passe forcment par
un consensus social. Savoir, par exemple, quune baisse sensible des accidents qui concide avec la mise en
place de nouvelles mesures peut convaincre des usagers, jusque-l incrdules, de lintrt de ces mesures ...
Des mesures de vitesses sont ralises sur les diffrents rseaux routiers. Les appareils utiliss permettent
galement de reprer les interdistances entre les vhicules. Lvolution des comportements sur certains points
importants (lalcool, le port de la ceinture et du casque, etc.) vient complter les donnes strictement
accidentologiques. Et dautres enqutes doivent sy ajouter : sur le respect des feux rouges, lutilisation des
tlphones portables au volant, etc ...
Au dpart, on se base gnralement sur les rsultats dune enqute. La variable (ou le caractre) tudie dans
lenqute peut tre de diffrents types :
donnes ou variables non chronologiques : Dans ce cas, la variable (ou le caractre tudi lors de
lenqute) peut tre discrte ou continue ainsi que qualitative ou quantitative. Ce sont des donnes non
chronologiques, cest--dire des donnes dont on n'tudie pas l'volution en fonction du temps. (Exemples :
taille, poids, vote, d'un ensemble de personnes un moment donn)
2.
Une variable quantitative discrte est une variable dont les valeurs sont en nombre fini (un petit nombre de valeurs
possibles).
Exemples: ges des lves de 6me secondaire, nombre de filles dans une famille de cinq enfants, ...
2.2.2.
Une variable quantitative continue est une variable qui peut prendre toutes les valeurs possibles dans un intervalle
(un grand nombre de valeurs possibles).
Exemples: taille d'une population, poids, la pression artrielle, ...
Exercices
Parmi les exemples suivants, indique quelles sont les caractristiques de la variable tudie.
Les marques de voitures neuves immatricules en Belgique pendant le 1 er semestre de l'anne 2002.
Les marques de chocolat les plus apprcies par les lves de l'cole.
3
Voici un tableau brut donnant les puissances (en watts) des ampoules disponibles lors d'un inventaire :
60
100
75
60
100
100
150
100
40
60
40
150
100
60
40
75
150
60
100
60
60
40
75
100
100
75
75
100
40
60
150
100
Quelle variable est tudie ? Est-elle quantitative ou qualitative ? Est-elle continue ou discrte ?
Rponse : .....................................................................................................................................................
Voici un tableau brut reprenant la taille des lves dune classe. On obtient les rsultats suivants :
165
192
162
159
168
172
168
161
160
165
181
175
185
182
178
158
180
195
186
175
172
184
178
192
175
156
159
189
187
182
190
178
175
152
180
Quelle variable est tudie ? Est-elle quantitative ou qualitative ? Est-elle continue ou discrte ?
3.
3.1. L'chantillonnage
Si on veut rsoudre le problme : "quel est l'ge moyen des belges ?", on peut envisager deux dmarches :
Relever l'ge de quelques milliers de belges (chantillon) pris au hasard et considrer que les valeurs
constates dans cet chantillon sont identiques celles que l'on cherche pour la population.
La premire solution est la plus prcise condition, ce qui n'est pas certain, d'tre ralisable dans un dlai tel
qu'aucune naissance ou qu'aucune mort ne viennent modifier le rsultat.
La seconde solution prsente l'avantage de la rapidit pour autant que les valeurs constates dans l'chantillon
puissent tre reportes la population entire, c'est--dire que l'chantillon soit reprsentatif de l'ensemble de la
population.
Cette technique qui consiste mesurer sur un chantillon des valeurs qu'il est impossible ou difficile de mesurer sur
la population entire constitue une des bases de la statistique.
3.2.
Un chantillon reprsentatif d'une population pour une variable est un chantillon pour lequel on n'a pas de raison
de penser que la valeur observe de la variable diffre dans l'chantillon et la population. En pratique, toute
l'valuation statistique est base sur l'obtention d'chantillons reprsentatifs, la manire de les obtenir, le contrle de
leur reprsentativit, leur traitement mathmatique.
Un bel exemple d'erreur d'chantillonnage conduisant une valuation errone peut tre cit : dans un
laboratoire d'exprimentation en toxicologie, les animaux d'exprience sont prlevs dans des parcs sans
mthode apparente de slection. A premire vue, les animaux sont prlevs au hasard. Il est fort possible que
la capture des animaux les plus vifs soit moins probable que celle des animaux en mauvaise sant et que
l'chantillonnage conduise des conclusions fausses.
3.3. Conditions d'obtention d'un chantillon reprsentatif
Les individus de la population doivent tous avoir la mme chance d'tre slectionns,
L'effectif de l'chantillon doit tre grand (plusieurs milliers pour les sondages d'opinion),
L'chantillon doit viter les "mortalits", c'est--dire la perte d'un certain nombre d'individus choisis pour
constituer l'chantillon (lves malades lors d'un test par exemple)
4
des raisons de commodit inclinent parfois le chercheur considrer comme valables des chantillons
pris proximit ou limits un grand ensemble gographique, ville ou rgion. Or la localisation
humaine joue souvent un grand rle sur les paramtres des individus.
l'limination systmatique d'une partie de la population lors de la constitution d'un chantillon est
classique: on peut citer en exemple l'utilisation du bottin, qui limine les non possesseurs de tlphone,
l'appel aux tlspectateurs, la lettre laquelle il faut rpondre.
la mortalit d'un chantillon rsulte moins d'une erreur de mthode que de circonstances particulires
ou temporaires: pidmie de grippe dans une cole teste, enqutes effectues durant les vacances... .
Lorsque l'on s'aperoit qu'une partie non ngligeable de l'chantillon envisag est temporairement hors
d'tat de livrer ses paramtres, il vaut mieux remettre les tests une date ultrieure.
dans le monde de la mdecine et de la pdagogie, les individus tests ont parfois un comportement
particulier du au fait qu'ils se savent observs: l'inspecteur qui visite une classe sait que sa prsence
provoque, chez les lves, des ractions diverses; le mdecin qui examine un patient, surtout si celui-ci sait
que l'examen participe un plan d'ensemble, est susceptible de donner, sur ses paramtres personnels, des
indications fausses.
Cependant, dans une tude, mme s'il faut viter au maximum les biais (carts entre les "vraies" valeurs et les
valeurs observes), ce n'est pas toujours possible.
Par exemple, dans une tude rcente sur les effets nocifs des ondes GSM sur la sant, on a interrog des patients
porteurs d'une tumeur dans le lobe frontal ou temporal (l o passent les circuits de la mmoire). La question
tait : "Combien de fois par jour tlphoniez-vous avec votre portable, il y a dix ou quinze ans et quelle tait la
dure de vos appels ?".
La maladie pourrait trs bien dans ce cas altrer les souvenirs ! Il faut donc le vrifier et ventuellement
effectuer des corrections.
4.
Remarque : dans cette enqute, l'effectif total correspond au nombre d'individus que contient l'chantillon
puisque chaque individu a donn un rsultat.
Ce n'est pas toujours le cas. Exemple: enqute du type: Quel est l'ge des enfants de votre famille?
Chaque individu peut donner plusieurs rponses. Par consquent, le nombre d'individus n'est pas gal
l'effectif total.
Xi
ni : effectifs
fi : frquences
18
9/ 27 = 0,333 = 33,3 %
19
8 / 27 = 0,296 = 29,6 %
20
6 / 27 = 0,222 = 22,2 %
21
3 / 27 = 0,111 = 11,1 %
22
1 / 27 = 0,037 =3,7 %
6
n=
ni = 27
i 1
fi
0,99
i 1
1re colonne: on y place la variable note X qui est la caractristique tudie lors de l'enqute (ge d'un tudiant de
1re BSI). Dans le cas prsent, la variable X est discrte car elle peut prendre un nombre fini de valeurs (5 valeurs:
18, 19, 20, 21 ou 22).
2me colonne: chaque valeur de la variable apparat plusieurs fois. L'effectif (appel aussi rptition pour une
variable discrte) est le nombre de fois qu'apparat chaque valeur de la variable dans le tableau brut. On le note n i.
La somme des effectifs ni est appele leffectif total n.
3me colonne: c'est la frquence fi cest--dire le rapport entre chaque effectif et l'effectif total.
frquence fi =
effectif n i
effectif totaln
On constate que le total des frquences nest pas gal 100 %. Ceci est du bien sr aux erreurs darrondi. Pour
viter ces erreurs, on utilisera un tableur (comme EXCEL, par exemple).
Le tableau rsultant du classement des donnes est appel tableau recens ou ordonn.
4.2. Reprsentations graphiques.
4.2.1.
Le diagramme en btonnets
Effectifs
18
19
20
21
22
ge en annes
Frquences
0,3
0,2
0,1
18
19
20
21
22
ge en annes
En joignant les extrmits des btonnets, on obtient un polygone appel polygone des frquences.
Frquences
0,3
0,2
0,1
0
18
4.2.2.
19
20
21
22
ge en annes
Xi
ni
frquences fi en %
frquences fi en
18
33,3 %
33,3.3,6 = 120
19
29,6 %
106,7
20
10
22,2 %
80
21
11,1 %
40
22
3,7 %
13,3
Effectif
total: n = 27
Somme = 360
22
21
4%
11%
18
33%
20
22%
19
30%
4.2.3.
Xi
ni
fi en %
fi cumules
croissantes
fi cumules
dcroissantes
18
33,3 %
33,3 %
99,9 %
19
29,6 %
62,9 %
66,6 %
20
22,2 %
85,1 %
37,0 %
21
11,1 %
96,2 %
14,8 %
22
3,7 %
99,9 %
3,7 %
On peut tracer un "diagramme des frquences cumules" avec en abscisse l'ge et en ordonne les frquences
cumules (croissantes ou dcroissantes).
On voit directement sur ce graphique qu'il y a 62,9 % des lves qui ont 19 ans ou moins.
frquences cumules
0,962
0,999
0,851
0,9
0,8
0,7
0,629
0,6
0,5
0,4
0,333
0,3
0,2
0,1
0
18
19
20
21
22
ge (en annes)
9
5.
Centres de
classe
ni: effectifs
fi cumules
croissantes
fi: frquences
12
4
= 0,060 (6,0 %)
67
17,9 %
23,9 %
375
20
29,9 %
53,8 %
[400; 450[
425
15
22,4 %
76,2 %
[450; 500[
475
10
14,9 %
91,1 %
500
525
9,0 %
100,1 %
effectif total = 67
somme = 100,1 % = 1
< 300
275
[300; 350[
325
[350; 400[
6%
ni = 67.
i 1
Dans la deuxime classe par exemple, les nombres 300 et 350 sont appels respectivement borne infrieure et
borne suprieure de la classe.
Le centre de la deuxime classe est 325.
5.2. Reprsentations graphiques
5.2.1.
On porte en abscisse les centres des classes (ou les intervalles de classe) et en ordonne les effectifs ou les
frquences (uniquement dans le cas ou les classes ont mme amplitude).
effectifs
0,35
0,3
0,25
15
0,2
0,15
10
0,1
5
0,05
0
0
275
325
375
425
475
525
salaire ()
275
325
375
425
475
525
salaire ()
10
5.2.2.
frquences cumules
1
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
250
300
350
400
450
500
550
600
Dans ce cas, on porte en abscisse les extrmits des classes (les bornes suprieures) et on suppose que les valeurs
des individus se rpartissent de manire linaire entre ces points.
Cest sur ce type de graphique que lon se basera pour la dtermination de la mdiane, des quartiles, dciles,
Question: Quel est le pourcentage de kins qui ont un salaire infrieur ou gal 400 ?
Remarque importante :
5.2.3.
dans le cas dun diagramme des frquences cumules croissantes, on porte en abscisse
les extrmits des classes (les bornes suprieures).
dans le cas dun diagramme des frquences cumules dcroissantes, on porte en abscisse
les origines des classes (les bornes infrieures).
Diagramme circulaire
Diagramme circulaire des salaires (en )
[450; 500[
14,9%
>=500
8,9%
<300
6,0%
[400; 450[
22,3%
[300; 350[
18,0%
[350; 400[
29,9%
11
5.2.4.
Les graphiques tracs jusqu'ici sont les plus courants que l'on rencontre. Il est vident qu'il existe de nombreux
autres types de graphiques qui permettent de caractriser des sries statistiques.
5.3. Remarque : classes damplitudes diffrentes
Dans l'exemple prcdent, les classes avaient la mme amplitude. Ce n'est cependant pas toujours le cas.
Prenons lexemple suivant.
Les rsultats dun groupe de 120 lves dans une branche donne sont reprsents dans le tableau : (rsultats
exprims sur 20)
Cotes sur 20
effectifs ni
[0, 8[
12
[8, 10[
30
[10, 12[
36
[12, 16[
28
[16, 20]
14
n = 120
effectifs ni
40
35
30
25
20
15
10
[0, 8[
[8, 10[
[10, 12[
[12, 16[
[16, 20]
cotes sur 20
Cette prsentation nest pas satisfaisante puisque les classes sont reprsentes comme si elles avaient la mme
amplitude.
En ralit le tableur Excel, lorsquon lui demande de tracer un histogramme, trace un diagramme en btonnets.
Dans un histogramme, chaque classe et son effectif sont reprsents par un rectangle. La largeur du rectangle est
lamplitude de la classe ; la hauteur du rectangle est ajuste de manire que laire du rectangle soit proportionnelle
leffectif de la classe.
Par consquent, la premire classe, qui a un effectif de 12 est donc reprsente par un rectangle de largeur 8
(lamplitude de la classe) et de hauteur 1,5, puisque 8 x 1,5 = 12.
Exercice : Suite cette explication, tracer l'histogramme correct.
12
6.
Au cours dune enqute dans une classe 20 lves, on pose les questions suivantes :
Combien avez-vous de frres et surs ?
Quelle est leur taille ?
Quel moyen de transport utilisez-vous pour venir lcole ?
Complter les phrases suivantes :
Rponses :
- continue
- chantillon
- frquence
- frquence cumule
- variable
- qualitative
- discrte
- histogramme
- quantitative
- individu
- tableau brut
- variable
- variable
13
7.
Quand les statisticiens se trouvent en face des rsultats d'une enqute, ils trouvent intressant d'en dterminer les
"tendances moyennes". Pour cela, ils disposent de plusieurs outils: la moyenne arithmtique, le mode, la mdiane et
les quantiles. La moyenne arithmtique est le paramtre de position le plus utilis. Il existe galement d'autres types
de moyenne, comme la moyenne harmonique ou la moyenne gomtrique dont on ne parlera pas.
7.1. La moyenne arithmtique
7.1.1.
Xi
ni
fi en %
16
0,111 = 11,1 %
17
0,259 = 25,9 %
18
10
0,370 = 37,0 %
19
0,148 = 14,8 %
20
0,111 = 11,1 %
n = 27
On obtient la moyenne en multipliant chaque valeur de la variable par l'effectif correspondant. Le nombre obtenu est
divis par l'effectif total.
16.3 17.7 18.10 19.4 20.3 483
X=
17,9
27
27
k
i 1
n .X
i i
n
14
On peut aussi utiliser les frquences pour calculer la moyenne. On sait que la frquence f i correspondant la valeur
ni
effectif i
Xi vaut : fi
.
n effectif total
On obtient la formule:
k
X
f .X
i i
i 1
7.1.2.
20 .0,11 17 ,89
En 1954, une enqute sur la rpartition selon l'ge de la population agricole masculine a donn les rsultats suivants:
Age en annes Xi
Centres de classe
Effectifs ni
Frquences fi
[15; 25[
[25; 35[
[35; 45[
[45; 55[
[55; 65[
[65; 75[
75 et plus
20
30
40
50
60
70
80
197
207
151
189
127
108
21
0,197
0,207
0,151
0,189
0,127
0,108
0,021
n = 1000
Dans ce cas, les Xi qui reprsentaient les valeurs de la variable reprsentent les centres des classes. Les formules de
calcul de la moyenne sont donc identiques.
k
X
i 1
n .X
i i
i 1
f .X
i i
42,5
7.2. Le mode
Dans une enqute relative au moyen de transport, on a obtenu le tableau suivant:
Moyens de transport
vlo
bus
tram
vlomoteur
pied
Effectifs
7
10
2
5
6
Dans ce cas, il n'est pas possible de calculer une moyenne. On pourrait cependant se demander quel est le moyen de
transport le plus utilis (" la mode"). C'est videmment le bus qui correspond au plus grand nombre d'effectifs.
Dans le cas de variable valeurs numriques, si on reprend l'exemple des ges de la classe de 6 me
gnrale, on s'aperoit que l'ge que l'on retrouve le plus souvent est 17 (10 effectifs).
Dans l'exemple de l'ge de la population agricole masculine, le mode est la classe de 25 34 ans qui
compte l'effectif le plus lev. (on parle de classe modale )
Le mode est la valeur de la variable (ou la classe) dont l'effectif est le plus important (la valeur
de la variable la plus frquente)
15
7.3. La mdiane
La mdiane d'une variable statistique est la valeur de la variable (ou la classe) qui partage
l'effectif en deux parties gales.
Dans le cas dune srie ordonne simple, on peut trouver aisment la mdiane :
-
n 1
.
2
Par exemple, la srie ordonne {1, 3, 7, 8, 9, 15, 17} comporte 7 observations ; sa mdiane est la quatrime
7 1
observation (
) et est gale 8.
2
n n 1
si n est pair, la mdiane est la moyenne arithmtique des valeurs de la variable de rang et
.
2
2
Par exemple, la srie ordonne {1, 3, 7, 8, 9, 15} comporte 6 observations et a pour mdiane 7,5, obtenue en prenant
la moyenne arithmtique entre la troisime observation (7) et la quatrime (8).
Dans le cas dune distribution observe plus complexe, il existe diverses formules dans la littrature. On se limitera
dterminer la mdiane sur le diagramme des frquences cumules (la mdiane est labscisse correspondant
une frquence de 50 %).
b) les quartiles X 1 , X 1 , X 3 : qui correspondent aux frquences cumules 25, 50, et 75%. Ils partagent lensemble
4
les dciles X 1 , X 2 ,..., X 9 : qui correspondent aux frquences cumules 10, 20, , 90%.
10
d) les percentiles X
10
10
1 , X 2 ,..., X 99
100
100
100
Les quantiles X 1 , X 3 , X 1 , X 9 sont notamment intressants pour tudier la dispersion et lasymtrie dune
4
10
10
distribution.
16
2) Si on vous dit que sur un ensemble de pommes qu'on a peses, le premier dcile est 140 g et le 9 me dcile
160 g, quel est le pourcentage de pommes pesant entre 140 g et 160 g ?
3) Le rsultat d'une enqute sur la taille d'enfants de trois ans est reprise dans le tableau suivant:
Tailles (cm)
ficum (%)
[88,5; 90[
[90; 91,5[
10
[91,5; 93[
22
[93; 94,5[
36
[94,5; 96[
60
[96; 97,5[
77
[97,5; 99[
90
[99; 100,5[
97
[100,5; 102[
100
4) Le pre de Sbastien nest pas content du rsultat du dernier contrle de son rejeton. Mais, argumente ce
dernier, jai tout de mme une moyenne de 12. Sachant que Sbastien a pass 5 contrles et que les rsultats des
4 premiers ont t 13, 10, 16 et 14, quelle est la cote du dernier travail ?
5) Fabienne rentre chez elle avec une copie cote 11/20. Comme elle a lhabitude de meilleurs rsultats ses parents
demandent des explications. Fabienne argue de la difficult des questions et de la svrit de la correction du
professeur ; ses parents restent sceptiques. Pour les convaincre, elle ajoute : avec ce 11/20, je suis encore dans la
premire moiti de la classe. A quelle notion statistique fait appel cette argumentation ?
6) Dans une classe de 21 lves, 20 lves ont particip un contrle dont les rsultats ont t :{7, 8, 9, 10, 11, 12,
13, 14, 15, 16, 17, 16, 15, 14, 13, 12, 11, 10, 9, 8}. La moyenne de ces cotes est de 12. Le lendemain, llve
absent, Alain est interrog son tour et il obtient 20. La moyenne de ce deuxime contrle est donc de 20. La
cote de 16, moyenne des deux jours ((12 +20)/2) reprsente-t-elle la moyenne de la classe ?
Combien dautres "Alain" faudra-t-il adjoindre cette classe pour que la moyenne soit effectivement de 16 ?
7) Analyser la courbe de croissance de la page suivante. (d'autres courbes sont disponibles sur le site
www.xrenard.sup.fr, page math, 4SCOM, "courbes de croissance")
7.6. Quelques remarques sur les paramtres de position
Dans le cas d'une variable qualitative, on se limite gnralement dterminer le mode (dans certains cas,
on peut aussi dterminer la mdiane). Il n'est pas possible de calculer la moyenne.
Pour des variables quantitatives, on peut dterminer soit la moyenne, soit le mode, soit la mdiane.
Dans ce cas, le problme est de savoir quel paramtre il convient d'utiliser. Par exemple, considrons le cas
d'une distribution de salaires moyens en Belgique. La moyenne est de 1398 et la mdiane de 1152 , soit un
cart de 246 entre les deux. Si on examine la courbe des salaires, on s'aperoit que si la moyenne est bien plus
leve que la mdiane, c'est tout simplement parce que certaines personnes ont des revenus trs levs mais sont
peu nombreuses. La moyenne est fortement influence par ce petit nombre de personnes revenu lev alors
que la mdiane ne l'est pas. La moyenne vient donc fausser l'estimation de ce que gagne la plupart des belges.
La mdiane est, dans ce cas, un meilleur indicateur de tendance centrale et c'est ce paramtre que l'on choisira.
Un des avantages de la mdiane est que sa valeur n'est pas influence par des termes extrmes, contrairement
la moyenne. Mais comme la mdiane ne rpond aucune formule rigoureuse, elle ne peut tre utilise dans des
calculs ultrieurs.
Remarquons que lorsque la moyenne et la mdiane sont proches, cela tmoigne d'une certaine symtrie de la
distribution (comme dans le cas de donnes suivant une loi normale, voir plus loin)
17
18
8.
8.1. Introduction
L'utilit des paramtres de position est d'indiquer d'une certaine manire autour de quelle valeur une srie s'tend.
Cependant, ce type de paramtre n'est pas suffisant pour caractriser une srie.
En effet, prenons les trois exemples suivants :
a) Alice et Batrice ont pris des vacances dans un endroit de rve : des conditions de vie trs proches de la nature
(logement sous tente), mille et une possibilits dactivits sportives, de loisir, de dtente, , le tout un prix
intressant. Le prospectus annonce pour la priode envisage, une temprature moyenne de 25C et une brise
lgre.
Alice est revenue enchante de ses vacances, Batrice est trs mcontente : un gros rhume, des mauvaises nuits
frquentes, des maux de tte, lui ont gch le sjour.
Cest que, alors que Batrice, ayant lu trs superficiellement le prospectus ne stait quipe que de vtements
dt, Alice au contraire avait lu que sur une journe, les carts de temprature pouvaient tre importants et
que notamment, les nuits taient plutt fraches. Elle avait donc encombr ses bagages de jeans et de petites
laines qui lui ont permis de bien dormir et de ne pas frissonner en soire et au petit matin.
b) Tout au long dune anne, on a fait des relevs statistiques dun restaurant scolaire et on a trouv quon servait
en moyenne 100 repas complets par jour de fonctionnement du restaurant (4 jours par semaine), et que chaque
repas comportait 100 g de pommes de terre. Ces donnes suffisent-elles lconome pour faire des achats
hebdomadaires raisonnables de pomme de terre ?
c)
Les moyennes sont les mmes mais les sries sont trs diffrentes. Dans la premire srie, la dispersion autour
de la moyenne est trs grande contrairement la 2me srie !!!!
C'est pour cette raison que pour caractriser une srie statistique, on doit dfinir des paramtres de dispersion en
plus des paramtres de position. Ces paramtres de dispersion donnent des informations sur l tendue de la
srie par rapport la valeur centrale.
8.2. L'cart moyen, l'cart-type et la variance
Partons de lexemple suivant : dans un carr de haricots, on a rcolt 140 gousses (et non pas cosse qui est
lenveloppe du pois) et on a compt le nombre de grains dans chacune des gousses.
Voici le tableau de rsultats.
Nombre de grains
(variable discrte)
Xi
10
Nombre de gousses
effectifs ni
18
32
38
20
Frquences fi
0,014
0,043
0,064
0,129
0,229
0,271
0,143
0,05
0,043
0,014
ni = 140
19
k
La moyenne vaut: X
fi .Xi = 5,51
i 1
Pour valuer la dispersion autour de cette moyenne, l'ide qui vient spontanment l'esprit est de dterminer les
carts entre cette moyenne et les diverses valeurs de la variable.
On appelle cart entre la valeur moyenne X et un nombre X, la valeur absolue de leur diffrence. On obtient pour la
srie tudie:
Nombre de grains
(variable discrte)
Xi
10
Frquences fi
0,014
0,043
0,064
0,129
0,229
0,271
0,143
0,05
0,043
0,014
Xi - X
4,51
3,51
2,51
1,51
0,51
0,49
1,49
2,49
3,49
4,49
fi . Xi - X
En calculant la moyenne de la srie des carts, on obtient:
k
Xi
X =
X = 1,371
fi . Xi
i 1
En quelque sorte, on peut dire qu'en moyenne, le nombre de grains d'une gousse s'carte, d'un ct comme de l'autre,
de 1,371 grains de la valeur moyenne qui est de 5,51 grains.
Le dfaut de l'cart-moyen est de donner la mme importance toutes les valeurs. Or, on a constat qu'on obtient
une meilleure mesure de la dispersion si on accorde plus de poids aux valeurs de la variable qui s'loignent plus de
la valeur moyenne. Au lieu de considrer les carts, on considre les carrs des carts. Plus l'cart est grand, plus son
carr augmente. (puisqu'on lve les carts au carr, la valeur absolue n'est plus ncessaire)
Nombre de grains
(variable discrte)
Xi
10
Frquences fi
0,014
0,043
0,064
0,129
0,229
0,271
0,143
0,05
0,043
0,014
Xi - X
4,51
3,51
2,51
1,51
0,51
0,49
1,49
2,49
3,49
4,49
(Xi - X )2
(-4,51)2
(-3,51)2
(-2,51)2
(-1,51)2
(-0,51)2
(0,49)2
(1,49)2
(2,49)2
(3,49)2
(4,49)2
fi . (Xi - X )2
(Xi
Elle est appele la variance et elle a la mme dimension que les carrs des valeurs de la variable.
On ne peut donc pas la comparer l'cart-moyen. Pour cela il faut prendre la racine carre de la variance que l'on
appellera l'cart-type.
k
Ecart-type =
fi .( Xi
X )2 =
i 1
On peut dire que la plupart des gousses contient un nombre de grains compris entre 5,51 - 1,75 et 5,51 + 1,75.
(environ 108 des 140 gousses sont comprises dans cet intervalle).
20
Remarque
La distribution de nombreux paramtres biologiques et autres (taille, poids, mensurations diverses, pouls, quotient
intellectuel, mais aussi par exemple la dimension d'objets fabriqus en srie ...) suit une loi dite normale (que nous
tudierons dans la suite), reprsente par une courbe en cloche symtrique autour de la moyenne.
Si la distribution de frquence suit approximativement une loi normale :
et X + ,
L'intervalle entre X - 2 et X + 2 est appel intervalle de rfrence (ou de tolrance) : seulement 5 % des sujets
tombent en dehors des limites.
Par exemple, pour dterminer les valeurs de rfrence de l'ure (mmol/l), un chantillon de 284 sujets ont subi une
prise de sang pour mesurer leur concentration d'ure. La moyenne obtenue est de 5,1 mmol/l et l'cart-type 1,1
mmol/l. Les limites de l'intervalle de rfrence sont donc 5,1 2.1,1, soit 2,9 et 7,3 mmol/l.
Un rsultat est considr comme normal s'il tombe dans l'intervalle de rfrence. Il est trs rare que l'on tombe en
dehors de l'intervalle lorsqu'on est en bonne sant.
RESUME
Dans le cas d'une variable quantitative, on appelle:
cart moyen: la moyenne de la srie des carts (voir plus haut) de tous les individus de la population.
variance: la moyenne de la srie des carrs des carts entre la moyenne et les valeurs de la variable de
tous les individus de la population.
l'cart-type: la racine carre positive de la variance. C'est l'cart-type qui est gnralement le plus
utilis.
Ecart-type =
fi .( Xi
X )2
i 1
On utilise souvent une formule plus pratique qui donne l'cart-type avec une bonne approximation:
k
Ecart-type =
fi .Xi2 X
i 1
21
9.
POPULATION ET ECHANTILLON
Ce n'est gnralement qu'en thorie qu'on travaille sur une bande de donnes complte (la population entire) et
donc X et
sont exacts.
n i .(Xi
chantillon
X )2
i 1
n -1
Il est vident que plus n est grand, plus l'cart-type de l'chantillon se rapproche de l'cart-type de la population
population.
Ces diffrences entre population et chantillon seront prcises dans le chapitre consacr l'estimation.
Signalons cependant que :
Pour simplifier, en statistiques descriptives, on dsignera la moyenne par X et l'cart-type par peu importe qu'il
k
fi .( Xi
X )2 .
i 1
Par contre, dans le chapitre consacr l'estimation, on fera la diffrence entre les cart-types et moyennes de la
population et de l'chantillon.
Remarque
Sur les claviers de beaucoup de calculatrices ayant les fonctions statistiques, on trouve les symboles
n et n -1 (parfois " s"). La fonction n correspond lcart-type dfini sur lensemble de la population. Dans les
analyses dchantillon, on utilise lcart-type de lchantillon n-1.
Si la calculatrice na que le symbole , il faut vrifier, en consultant le mode demploi ou par un exemple simple, de
quel cart-type il sagit.
Exemple : soit la population {10, 15, 20} dont la moyenne est 15 ;
= 4, 08, et
n-1=5.
Dans le logiciel Excel, n est donn par la fonction ECARTYPEP (P pour population) et
ECARTYPE. On a de mme les fonctions VARP et VAR pour la variance.
n-1
22
cart - type
.100
moyenne
.100
Exemple :
La taille moyenne des jeunes de 18 ans est de 168 cm avec un cart-type de 14 cm; leur poids moyen est de 66 kg
avec un cart-type de 8 kg. La taille varie-t-elle plus que le poids ?
CV (taille) =
14
.100 8,33..%
168
CV (poids) =
8
.100 12,1..%
66
23
a) la variable
b) l'effectif total
c) la nature de la variable: quantitatif ou qualitatif ? Discret ou continu ?
d) Dresse les diagrammes suivants:
- histogramme des frquences
- diagramme des frquences cumules croissantes
- diagramme en camembert
e) Calcule la moyenne, le mode et la mdiane.
(Rp. : X =18,5)
f) Calcule l'cart-type et la variance.
(Rp. : 4,3 et 18,6)
EXERCICE 2
Une srie d'observations concernant les tailles d'un groupe d'adolescents de 11 14 ans a donn les rsultats
suivants:
Taille Xi
effectifs ni
Taille Xi
effectifs ni
140 < X
144 cm
160 < X
164 cm
31
144 < X
148 cm
17
164 < X
168 cm
20
148 < X
152 cm
63
168 < X
172 cm
152 < X
156 cm
82
172 < X
176 cm
156 < X
160 cm
69
176 < X
180 cm
a)
b)
c)
d)
EXERCICE 3
Voici, releves au cours des jours ouvrables de l'anne 1982, les recettes d'un magasin de dtail:
Recettes en
milliers de
FB
Nombre de
jours
0 X<4
4 X<8
8 X < 12
12 X < 16
16 X < 20
8
24
210
42
16
a) Calcule :
- l'effectif total
- les frquences en degrs
b) Trace :
- un histogramme des frquences
- un polygone des frquences cumules croissantes
c) Calcule la moyenne, le mode, l'cart-type et la variance. (Rp.: X = 10,4 et
2,9 )
24
EXERCICE 4
Voici les tailles de 34 garons et 37 filles inscrits en 3me anne dans une cole.
Les garons mesurent (en cm) :
152
175
170
177
168
165
168
163
163
171
160
176
165
183
174
174
175
165
173
169
190
168
164
160
176
181
163
165
165
163
165
155
162
164
150
165
164
166
157
181
165
168
180
167
169
150
166
168
155
156
150
163
165
165
160
171
165
165
163
168
161
166
EXERCICE 5 : Lors dun rallye touristique, une des preuves du parcours consiste valuer la distance qui spare
lendroit o on se trouve dun autre endroit identifiable (ou dvaluer la hauteur dun arbre ou dun btiment, ou le
poids dun objet, ). Certaines quipes font la moyenne de lvaluation de chaque membre de lquipe. Cette
approche statistique est-elle judicieuse ?
EXERCICE 6 : Un instituteur remet ses lves une feuille sur laquelle est dessin un quadrilatre quelconque et
demande chacun de faire les mesures et les calculs ncessaires pour connatre laire de la figure. On devine qu la
collecte des rsultats, on observe des diffrences gnralement plus grandes que ce quon pourrait croire. Quel
nombre prendre pour la mesure de cette surface ?
EXERCICE 7 : Les statistiques montrent quon constate un plus grand nombre daccidents mettant en cause des
voitures roulant vitesse modre. Peut-on en conclure quil est recommand de rouler comme un fou ?
EXERCICE 8 : Les statistiques montrent quil est faux de dire que les mathmatiques constituent un trs grand
facteur de redoublements car cest dans les classes o le nombre dheures de math est le plus lev que lon constate
le moins de redoublements imputer cette matire. Quen pensez-vous ?
EXERCICE 9 : Les propositions suivantes sont-elles vraies ou fausses ?
La moyenne d'une srie de donnes statistiques divise les donnes en deux parts gales.
La moyenne arithmtique est influence par des valeurs extrmes d'une srie de donnes.
Entre le premier quartile et le troisime quartile se trouvent toujours 50 % des effectifs.
L'effectif compris entre le premier et le deuxime quartile est toujours le mme que celui compris entre le deuxime
et le troisime.
Quelle que soit la srie de donnes statistiques, la somme des carts par rapport la moyenne arithmtique est nulle.
25
EXERCICE 10
Voici un tableau reprenant les dures de vie de tubes lectriques :
Dure (heures)
[201; 300[
[300; 399[
[399; 498[
[498; 597[
[597; 696[
[696; 795[
[795; 894[
[894; 993[
[993; 1092[
[1092 ; 1191[
[1191; 1290[
ni
6
8
46
58
76
68
62
48
22
4
2
On donne :
X
710,4
192 ,7
EXERCICE 11
Soit la taille de 210 tudiants :
Classes
[155; 160[
[160; 165[
[165; 170[
[170; 175[
[175; 180[
[180; 185[
[185; 190[
effectifs
5
23
42
68
47
21
4
(Rp. : X
172,5 ,
26
Voici un graphique
comparant les parts
de march de
diffrentes foreuses.
Commente...
27
28
29
PROBABILITES : DEFINITIONS
Un phnomne fortuit est une exprience qui donne lieu plusieurs rsultats dont on ne peut prdire lavance
lequel se ralisera. Chacun de ces rsultats porte le nom dpreuve du phnomne.
Exemples de phnomnes fortuits : tous les jeux de hasard, la transmission des caractres hrditaires dans les
espces (animales ou vgtales) reproduction sexue, la physique des micro-particules, ...
Lensemble de toutes les preuves possibles dun phnomne fortuit se nomme catgorie dpreuves
phnomne. Par exemple, si on tire cinq fois pile ou face, on peut obtenir :
preuve 1 : pile
preuve 2 : face
preuve 3 : face
du
preuve 4 : pile
preuve 5 : pile
= {pile, face}.
On pourrait se demander quelle est la probabilit d'avoir cinq fois "face" ou bien d'avoir deux "face" suivi de trois
"pile", On parle dans ce cas d'vnement.
La probabilit P(E) quun vnement E se produise est donne par la formule :
P(E) =
30
2.
2.1. Dfinition
Voici quelques exemples de dfinitions dune variable alatoire. Si vous ne comprenez pas la premire, lisez la
suivante et ainsi de suite
Une variable alatoire, note X, est une variable susceptible de prendre des valeurs diverses (vnements) en
obissant une loi de probabilit dtermine (ou distribution de probabilit).
OU
Une variable alatoire est une variable dont la valeur est un nombre dtermin par lissue dune preuve.
OU (encore )
Une variable alatoire est une variable dont on ne peut prdire avec certitude, avant la mesure, le rsultat qui
surviendra.
OU (plus simple)
Une variable alatoire est quelque chose dont il est impossible de connatre le rsultat lavance.
En rsum, une variable alatoire est une variable dont les valeurs dpendent du hasard. Le poids ou la taille ne sont
pas des variables alatoires mais si on les mesure sur un sujet tir au hasard dune population, ils le deviennent
aussitt.
Il y a deux grands types de variables alatoires :
-
on parle de variable alatoire discrte si lensemble de ses valeurs est fini ou quand la catgorie dpreuve
comprend un nombre fini de valeurs.
on parle de variable alatoire continue si lensemble de ses valeurs est infini ou quand la catgorie
dpreuve est un ensemble continu. Dans ce cas, la variable peut prendre nimporte quelle valeur dans un
intervalle.
Exemples :
-
Le nombre de pannes journalires dune machine est une variable alatoire discrte.
Le nombre de pile obtenu lors de 5 lancers conscutifs est une variable alatoire discrte.
Le poids rel de paquets de lessive pesant en principe 5 kg est une variable alatoire continue.
La dure de vie d'un moteur soumis des conditions difficiles est une variable alatoire continue.
En sciences, on manipule toute sorte de variables alatoires, par exemple : le rendement dune culture, la densit
dun matriau, le temps ncessaire pour accomplir une tche, le nombre de ptales dune fleur, la rsistance la
flexion, le temps de raction aprs un stimulus, ...
3.
Une variable alatoire discrte X est une variable dont toutes les valeurs Xi sont connues et chacune desquelles on
peut attacher une probabilit de ralisation P(Xi). La loi (ou distribution) de probabilit reprsente l'ensemble des
probabilits P(Xi) correspondant chaque valeur de la variable alatoire X.
32
20
25
30
12
Total = 100
P(Xi)
0,02
0,08
0,2
0,25
0,3
0,12
0,03
7
P( X i )
i 1
On peut videmment tracer un diagramme en btonnets, un diagramme en escaliers, (voir cours de statistique
descriptive)
La loi (ou distribution) de probabilit est reprsente sur le graphique suivant :
0,35
P(Xi)
0,3
0,25
0,2
0,15
0,1
0,05
0
0
E(X)
X i .P (Xi )
i 1
33
Lcart-type : (X)
P(Xi ).(Xi
(X) = 1,7
i 1
P(Xi)
0,400
0,350
0,300
0,250
0,200
0,150
0,100
0,050
0,000
1
34
35
4.
Une variable alatoire X est dite continue si lensemble des valeurs prises par cette variable est infini non
dnombrable, cest--dire que X peut prendre nimporte quelles valeurs relles comprises dans un intervalle [a, b].
Par consquent, la probabilit que X prenne une valeur particulire quelconque est gnralement nulle. On calculera
plutt la probabilit que X se trouve dans un intervalle donn.
f(X)
L'ensemble des valeurs possibles de la variable alatoire continue X et sa loi de probabilit (fonction de densit de
probabilit de X) est reprsente par une courbe qui peut avoir des allures diffrentes selon le type de distribution
tudie.
Laire comprise entre la courbe, les 2 verticales dabscisses a et b et laxe des abscisses est gale 1. Par consquent
dans l'intervalle [a, b], la somme des probabilits attaches aux valeurs de la variable est gale 1.
Dune faon gnrale, la mesure dune probabilit peut tre traduite graphiquement par une surface. En considrant
que la probabilit de se trouver dans lintervalle [a, b] vaut 1, si on choisit un intervalle [c, d] inclus dans [a, b], la
probabilit de se trouver dans lintervalle [c, d] est infrieure 1.
La diffrence fondamentale avec les variables alatoires discrtes est lutilisation de la notion dintervalle de valeurs
de X auxquelles sont lies les probabilits (plutt qu des valeurs particulires et isoles).
4.1. Fonction de rpartition
On appelle fonction de rpartition de la variable alatoire continue X, la fonction F(x) qui tout x de lintervalle de
dfinition fait correspondre la probabilit que X soit strictement infrieure x :
F(x) = P(X<x)
x
- x.
Avec bien sr :
f(X).dX
f(X)
1.
-
X
x
b
On a de plus : P(a
36
5.
Pour bien comprendre la diffrence entre la loi de probabilit observe et la loi de probabilit thorique dune
variable alatoire, on utilisera lexemple suivant quon pourrait intituler : simuler le hasard .
Ecrivez sur un papier un nombre choisi au hasard entre 0 et 10 (inclus).
On demande ensuite un ordinateur de faire de mme, cest--dire de gnrer de manire alatoire une suite de
nombres compris entre 0 et 10 (on en gnrera 100).
Voici la loi (distribution) de probabilit observe :
15
10
5
0
0
10
La distribution thorique est videmment celle-ci (cest ce quon appelle une loi uniforme) :
12
10
8
6
4
2
0
0
10
On tracera titre dexercice la distribution de probabilit correspondant aux rponses donnes par les tudiants.
Que constate-t-on ?
La distribution observe sur ordinateur diffre de la distribution thorique. Cest un phnomne normal, nomm
fluctuations dchantillonnage . Si on recommenait un nouveau tirage de 100 nombres sur ordinateur, on
obtiendrait un autre graphique.
Quant la distribution obtenue par les tudiants, nous lanalyserons en direct .
Les distributions de probabilit des variables alatoires ne prennent donc pas nimporte quelle forme et peuvent tre
proches de distributions thoriques. En particulier, les variables alatoires utilises en biologie prsentent souvent
(mais pas toujours !) une forme de courbe en cloche , caractristique de loi normale.
37
6.
6.1. Introduction
Soit un ensemble de 200 tudiants dont on a not la taille.
Classes
effectifs
[150; 154[
[154; 158[
[158; 162[
[162; 166[
[166; 170[
[170; 174[
[174; 178[
[178; 182[
[182; 186[
[186; 190[
3
6
12
20
38
54
36
18
8
5
frquences
(%)
1,5
3
6
10
19
27
18
9
4
2,5
frquences fi (%)
30
25
20
15
10
0
[150; 154[
[154; 158[
[158; 162[
[162; 166[
[166; 170[
[170; 174[
[174; 178[
[178; 182[
[182; 186[
[186; 190[
tailles (cm)
Si, au lieu de se limiter un chantillon de 200 tailles rparties en 10 classes, on considrait un chantillon de 10000
tailles rparties dans 50 classes s'chelonnant de 150 cm 190 cm, on conoit intuitivement que le polygone des
frquences s'apparenterait de plus en plus une courbe en cloche symtrique par rapport la verticale passant par la
moyenne X .
Cette courbe est appele courbe normale ou courbe de Laplace-Gauss.
6.2. Formulation de la loi normale
La loi normale ou loi de Laplace-Gauss pour les variables alatoires continues est une des lois les plus importantes
en statistiques. Elle constitue un modle mathmatique qui s'accommode de la plupart des distributions statistiques
variable continue.
f(X)
1 ( X E(X)) 2
.
2
2
.
38
f(X)
X
Moyenne E(X)
La courbe obtenue est une courbe en cloche symtrique (courbe de Gauss). On constate que les trs grandes et les
trs petites valeurs sont peu probables et que les valeurs sont concentres autour de la moyenne.
De nombreux caractres peuvent tre reprsents par une loi normale. C'est le cas notamment de la taille, le poids,
les mensurations diverses, le pouls, le quotient intellectuel, mais aussi par exemple la dimension d'objets fabriqus
en srie.
Cette loi dpend donc des paramtres E(X) et (X). Pour lutiliser, il faudrait donc construire des tables pour chaque
couple de valeurs (E(X, (X)), ce qui serait impossible car il y aurait une infinit de tables.
Par exemple, on a trac ci-dessous deux courbes de Gauss ayant comme respectivement comme paramtres 10 et 15
pour l'esprance mathmatique et 1,5 et 4 pour l'cart-type.
39
X E(X)
1 2
.Z
2
f(Z)
0
La courbe de la loi normale centre-rduite est aussi une courbe en cloche avec E(Z) = 0 et (Z) = 1.
La loi rduite ne dpend donc plus que de la variable Z et il est donc facile de construire des tables. Tous les
problmes ayant trait la loi normale demandent le passage la loi rduite.
6.3. Caractristiques d'une distribution normale
On dmontre mathmatiquement, que dans une population distribue normalement:
95,45 % des lments ont une valeur comprise entre E(X) - 2 et E(X) + 2 ,
99,73 % des lments ont une valeur comprise entre E(X) - 3 et E(X) + 3 ,
et E(X) + ,
40
6.4. Exercices
1) Dans une population, la moyenne de la taille est de 169 cm avec un cart-type de 10 cm. Dterminer la
proportion d'individus dont la taille est suprieure 180 cm. (13,57 %)
2) On sait que le poids des flacons de pnicilline livrs par une firme pharmaceutique, est distribu normalement
avec une moyenne de 126 mg et un cart-type de 4 mg. Si on prlve un lot de 200 flacons, quelle devrait tre la
proportion d'entre eux dont le poids est:
a)
b)
c)
d)
e)
3) Une machine fabrique des pices cylindriques de diamtre nominal 50 mm. La tolrance admise est de 0,2 +
0,2 mm.
La production montre la longue que la dispersion correspond un cart-type de 0,05 mm. Au cours dune
journe, la production sest caractrise par une moyenne des diamtres de 50,1 mm. En supposant que la
distribution des diamtres est Gaussienne, quel est le pourcentage de rejet de pices au cours de cette journe.
(0,0228)
4) Une machine cadence rapide produit des rondelles dont le diamtre suit une loi normale de moyenne 15 mm et
dcart-type 1,3 mm.
On demande la proportion attendue de rondelles ayant :
a)
b)
c)
d)
moins de 14 mm (0,2206)
plus de 17 mm (0,0618)
entre 14,6 et 15,2 mm (0,1813)
quel est le diamtre de la rondelle la plus troite dans le groupe des 15 % de rondelles les plus larges ?
(16,352 mm)
5) Les pneus "Allseasons" peuvent parcourir en moyenne 56000 km, avec un cart-type de 8000 km et une
distribution normale.
a)
b) Quelle est la probabilit que les quatre pneus Allseasons qui quipent ma voiture soient uss avant 50000
km ? (0,0026)
c)
Quelles sont les hypothses poses en b) ? Comment des hypothses plus ralistes modifieraient-elles la
rponse ?
41
7.
7.1. Introduction
Voici par exemple un relev du poids de 60 enfants dans une classe de maternelle :
Classes X :
poids (kg)
[9; 10[
nombre d'enfants
8
[10; 10,5[
12
[10,5; 11[
18
[11; 11,5[
13
[11,5; 12,5[
9
60
Il est trs probable que la variable (le caractre) tudie suit une loi normale. Si on calcule la moyenne et l'cart-type
de manire classique, on obtient respectivement 10,8 et 0,7.
Il pourrait tre utile de vrifier si cet chantillon peut tre considr comme extrait d'une population normale. Pour
cela, on peut raliser un test de Khi Carr ( 2). (il existe d'autres tests comme le test de la droite de Henry ou le test
de Kolmogorov-Smirnov).
7.2. Le test du 2
Le test du 2 permet de vrifier sil y a une diffrence significative entre une distribution
statistique observe et une distribution thorique donne (la loi normale en ce qui nous
concerne)
L'utilisation d'un test statistique (et notamment le test du 2) est soumise un pralable : la formulation d'une
hypothse de dpart, appele hypothse nulle H0, qui sera confirme ou rejete par le test.
Admettre l'hypothse nulle H0 en statistiques, c'est admettre que des diffrences observes entre la ralit des faits et
les hypothses mises ne sont pas dues des causes systmatiques mais au hasard de l'chantillonnage.
Deux erreurs d'interprtation sont videmment possibles :
Dans le cas du test du 2, lhypothse de dpart (H0 : hypothse nulle), cest de dire que la rpartition exprimentale
confirme la rpartition thorique et donc que les diffrences observes sont uniquement dues au hasard.
Toutefois, l'acceptation ou le rejet de l'hypothse nulle est lie au risque d'erreur que le chercheur est prt prendre
pour affirmer que l'hypothse nulle est vraie ou fausse. Ce risque d'erreur est appel "seuil de signification" .
Quand l'hypothse nulle est formule, on calcule ensuite le
observe et la distribution thorique.
2
calc.
42
(Oi
2
calc
i 1
Ai )2
Ai
Comme les carts Oi Ai peuvent tre positifs ou ngatifs, et comme on veut faire la sommation, on considre le
carr des carts.
Plus
calcul est grand, plus il y a discordances entre les effectifs observs et les effectifs thoriques.
=0, la thorie est gale la ralit ( cas idal ). Si ce nest pas le cas, il faut rechercher dans
thorique.
2
calc.
thorique).
calc>
2
thorique
est suppose
2
thorique
dans la table
1) Si 2calc > 2thorique , alors la diffrence est trop forte pour tre due aux seuls faits du hasard et on est conduit
rejeter lhypothse de dpart. (les discordances sont significatives, elles sont trop grandes)
2) Si 2calc < 2thorique, on accepte lhypothse de dpart. (les discordances observes ne sont pas significatives,
elles ne sont pas trop fortes, elles sont dues au hasard)
Remarques :
-
le moins 1 dans le nombre de degrs de liberts vient du fait quune fois les effectifs rpartis dans k 1
classes, les observations restantes doivent normalement revenir la dernire classe. Cette dernire classe na par
consquent pas la libert (lindpendance) de prendre la valeur quelle veut.
plus on a de paramtres calculer, plus le nombre de degrs de libert sera faible, et plus le
On acceptera donc moins de discordances entre les effectifs observs et thoriques.
thorique est
2
thorique
sera faible.
Par consquent, un seuil de signification de 0,05 est moins svre quun seuil de signification de 0,25.
Avec 0,05, on accorde moins de signification aux discordances quavec 0,25.
43
Les effectifs observs de chaque classe ne doivent pas tre trop faibles. En pratique, un effectif
observ de 5 est considr comme un minimum.
50.
Si certaines classes ne satisfont pas cette condition, on doit les regrouper avec les classes voisines
jusqu ce que la rgle soit respecte.
Dans ce cas, cest ce nouveau nombre de classes qui sera pris en compte pour le calcul du nombre
de degrs de libert.
Prenons l'exemple suivant :
Supposons qu'une pice de monnaie ait t lance en l'air 50 fois et soit retombe en ne montrant que le ct face
que 15 fois. Peut-on affirmer que la pice tait fausse ou que celui qui la lanait tait moins honnte qu'il le
paraissait ?
Hypothse nulle : la pice n'est pas fausse et les divergences observes sont dues au hasard.
Calcul du
2
calc
2
calc
(35 25)
25
(15 25)
=8
25
Nombres de ddl : 2 1 = 1
2
calc
ne dpassera
2
thorique
Puisque 2calc > 2thorique (les diffrences sont trop importantes), on rejette donc l'hypothse nulle, le risque de
se tromper tant de 5 %.
2
calc
ne dpassera
2
thorique
Puisque 2calc > 2thorique (les diffrences sont trop importantes), on rejette donc l'hypothse nulle, le risque de
se tromper tant de 1 %.
Si on veut un degr de certitude trs lev, on peut prendre = 0,001, (c'est--dire que si on ralise 1000 fois
l'exprience correctement, le 2calc ne dpassera 2thorique par le fait du hasard que 1 fois), on obtient 2thorique =
10,83.
Dans ce cas,
calc <
thorique,
7.3. Applications
1) Reprendre l'exemple du relev du poids de 60 enfants dans une classe de maternelle et vrifier l'hypothse de
normalit de la distribution.
Classes X :
poids (kg)
[9; 10[
nombre d'enfants
8
[10; 10,5[
12
[10,5; 11[
18
[11; 11,5[
13
[11,5; 12,5[
9
60
44
2) Le tableau suivant donne le rsultat d'une enqute sur la taille des tudiants en informatique.
Xi : tailles en
cm
effectifs
observs
[150,160[
28
[160,170[
110
[170,180[
69
[180,190[
61
[190,200[
32
300
a)
Vrifier que les tailles de ces tudiants ne suivent pas du tout une loi normale.
b)
Critiquez le rsultat obtenu. Cela vous semble-t-il possible ? Observez attentivement le tableau de donnes.
3) Vous ralisez une enqute donnant sur le nombre de pulsations par minute (pouls) d'un chantillon de 250
adultes de 20 35 ans.
a)
Complter le tableau ci-dessous en indiquant des effectifs observs tels que la distribution se rapproche
d'une loi normale et le vrifier par le test du khi carr.
b)
c)
Tracer un graphique permettant de confirmer "grossirement" que la variable suit une loi normale".
Nombre de pulsations
par minute
[40; 50[
Effectifs observs Oi
[50; 60[
25
[60; 70[
[70; 80[
[80; 90[
49
[90; 100[
[100; 110[
12
4) Un cadre d'une entreprise mtallurgique effectue une tude statistique sur l'paisseur de pices en acier.
L'enqute dure un mois et les rsultats sont repris dans le tableau suivant :
Xi : paisseur (en
1/10 mm)
[100; 105[
13
[105; 110[
101
[110; 115[
282
[115; 120[
430
[120; 125[
253
[125; 130[
92
[130; 135[
ni
45
a)
Vrifier par le test du Khi carr que ces donnes suivent une loi normale.
b)
En particulier, montrer sur papier la mthode utilise pour calculer les effectifs thoriques de la classe
[100; 105[.
c)
En supposant que le test est concluant, calculer sur papier avec la loi normale le pourcentage de rebuts si
l'on considre que l'on rejette les pices d'paisseur infrieure 108 et suprieure 128 (1/10 de mm).
d)
46
En statistique descriptive, nous nous sommes limits dcrire un ensemble de donnes, en extraire l'information
au moyen de graphiques, tableaux de frquences et calculs de paramtres, et ensuite dcrire quelques distributions
thoriques de variables, savoir binomiale, de Poisson et normale.
L'infrence statistique a pour but d'mettre un jugement sur une ou plusieurs caractristiques de la population
partir d'une ou plusieurs caractristiques observes sur un chantillon extrait de cette population.
Par population, on entend la totalit des observations individuelles existant dans une aire spcifie, limite dans
l'espace et dans le temps, et au sujet desquelles on dsire tirer des conclusions. Par exemple, la population des tailles
de tous les Belges, la population des concentrations hpatiques d'une enzyme chez tous les rats mles d'une mme
espce, la population des mesures d'erreurs si on pouvait prlever un millilitre de faon infinie, ...
L'chantillon constitue un sous-ensemble limit de la population.
Exemple : les tailles de quarante Belges, la concentration hpatique d'une enzyme mesure chez dix rats, ...
Pour que l'infrence statistique ait un sens, l'chantillon doit tre reprsentatif de la population. On admettra en
gnral son caractre reprsentatif si l'chantillon est prlev de faon alatoire, c'est--dire lorsque chaque individu
a une mme chance d'tre prlev et que les individus sont prlevs indpendamment les uns des autres. (voir
prcdemment)
Toute caractristique numrique calcule partir des observations de l'chantillon est appele une statistique et
toute caractristique numrique associe la population sera dornavant appele un paramtre.
Les principes de l'infrence statistique concourent deux objectifs :
Les problmes d'estimation : partir d'une statistique d'chantillon, obtenir une estimation prcise du
paramtre de la population.
Les tests d'hypothse : vrifier la vraisemblance d'une hypothse concernant le ou les paramtres d'une ou
de plusieurs populations partir des statistiques calcules dans le ou les chantillons.
47
2.
L'ESTIMATION
2.1 Introduction
L'estimation, c'est l'ensemble des mthodes utilises pour valuer un paramtre d'une population l'aide d'un
estimateurs pris dans un chantillon extrait de cette population.
Par exemple, dans le cas de l'tude de la taille d'une population, les paramtres que sont la moyenne et la variance
sont des constantes (qui sont gnralement inconnues).
Si on choisit plusieurs chantillons diffrents partir de cette population, les moyennes X et les variances s de ces
chantillons seront diffrentes pour chaque chantillon choisi. Ce sont par consquent des variables alatoires.
Un grand nombre de problmes statistiques consistent en la dtermination de la moyenne "vraie" sur base
d'observations ralises sur un chantillon, mais on peut aussi chercher connatre d'autres caractristiques, comme
la variance par exemple.
Exemples :
Quelle est la frquence d'apparition de tel type de cancer chez les souris ?
Quelle est la "vraie" valeur de la glycmie chez un patient ?
Quelle est la variance de la glycmie mesure chez ce mme patient ?
Les valeurs correspondantes de ces estimateurs sont respectivement des estimations non biaises ou biaises.
Dans la figure ci-dessous, les estimateurs dont les distributions de probabilit sont A et C sont non biaiss (sa
moyenne est gale ) alors que celui dont la distribution est B est biais.
48
Si X et s sont respectivement la moyenne et la variance d'un chantillon, on peut dmontrer que X et s sont des
estimateurs sans biais de la moyenne et de la variance de la population correspondante.
E (X ) =
i 1
et E (s) = .
n i . Xi
X
)
n -1
Remarque : on peut montrer que si on avait pris comme estimateur de la variance de la population
k
s 2n
i 1
n i . Xi
n
X
, cet estimateur serait biais. On prfrera donc utiliser s.
ESTIMATION PONCTUELLE
Cette mthode consiste attribuer au paramtre inconnu une valeur approche de l'estimateur mesure dans un
chantillon pris au hasard.
Paramtres de la population
Estimateurs
= X
Moyenne de
Proportion d'individus
possdant la caractristique A
Ecart-type
nA
n
s
Cette mthode a comme inconvnient de ne pas donner d'indication sur l'erreur possible entre l'estim et le
paramtre.
Exemples
1) Si 150 tudiants de 6me ont un QI de 135 avec un cart type de 15 et si 38 de ces tudiants frquentent
l'enseignement technique, estimer le QI moyen, l'cart type et la proportion d'tudiants frquentant le technique
de tous les tudiants de 6me de la ville.
2) Pour tudier la consommation d'essence des voitures d'une certaine marque, on prlve un chantillon de 12
voitures pour lesquelles on note les consommations en litres par 100 km.
9,7
10,3
9,9
10,4
10,5
10,8
11,2
11
8,9
10
10,7
10,8
Estimer de faon ponctuelle la moyenne et l'cart type de la consommation d'essence des voitures de cette
marque.
49
4.
et dcart-type
Dans la ralit, ( X ) nest pas connu puisque est inconnu. En pratique, on a vu que lcart-type de lchantillon s
est une estimation de . On peut ds lors remplacer par s et obtenir une estimation de ( X ), note s( X ) :
s( X ) =
s
n
Remarquons que cette formule est trs intressante car elle permet destimer la variabilit des moyennes
dchantillon X alors quon ne dispose en pratique que dun seul chantillon !
Autre rsultat important
Lorsque la population mre est normale, ou lorsque la taille de lchantillon est suffisamment grande (n > 30), la
distribution dchantillonnage de a une forme approximativement normale.
5.
Estimer un paramtre partir d'un chantillon alatoire simple fournit, comme on vient de le voir, une estimation
ponctuelle.
On peut par exemple estimer la taille moyenne des lves de toutes les lves de toutes les classes de 6me
secondaire de Belgique l'aide de la moyenne X d'un chantillon restreint d'lves.
Une telle opration ne nous permet pas de savoir si la valeur obtenue est proche ou non de la valeur inconnue. Pour
remdier ce problme, on utilise la notion d'intervalle de confiance.
Dfinir un intervalle de confiance, c'est rechercher un encadrement d'une valeur inconnue (moyenne,
pourcentage,...) qui soit la fois trs probable et le plus serr possible. La probabilit que l'intervalle contienne la
valeur inconnue est gale 1 - quelle que soit cette valeur.
Cette probabilit 1 - est appele niveau de confiance,
choisi en-dessous de 0,1.
50
6.
6.1 Introduction
Si X (moyenne d'un chantillon) est un bon estimateur de (moyenne de la population), la valeur observe de X
sur un chantillon est toujours un peu plus grande ou plus petite que . On ne peut plus affirmer que = X , on
construit alors un intervalle de confiance de la forme :
= X marge (ou erreur) d'chantillonnage
Quelle sera l'importance de cette marge d'erreur ?
On doit dcider du degr de confiance souhait 1 - . Si on choisit un niveau de confiance de 0,95 (et donc =
0,05), cela signifie que sur 100 chantillons prlevs, 95 donneront un intervalle qui contient la vraie valeur
estimer.
Prenons l'exemple suivant. Supposons que l'on veuille construire un intervalle de confiance pour la moyenne des
tailles de la population des tudiants de l'Universit de Lige en se basant sur un chantillons de 10 tudiants. On
suppose galement qu'on connat (ce qui est tonnant !) les valeurs de et de la population, soit respectivement
169 cm et 3,22 cm.
Si on prend 50 chantillons, on va obtenir des moyennes X 1 , X 2 , X 3 , , X 50 diffrentes (dont la moyenne est
gale et l'cart-type gal
Pour chacun des 50 chantillons, on peut calculer un intervalle de confiance (de niveau de confiance 95 %). On a
donc 50 intervalles de confiance diffrents et on regardera s'ils contiennent ou non la moyenne "vraie" (ici 169
cm).
Dans le cas d'un degr de confiance de 95 %, on devrait constater qu'environ 47 ou 48 intervalles de confiance sur
50 (soit environ 95 %) contiennent la moyenne "vraie" .
Remarquons que si on avait choisit un degr de confiance de 99 %, on devrait constater qu'environ 49 ou 50
intervalles de confiance sur 50 contiennent la moyenne "vraie" . Il est vident par consquent que les intervalles de
confiance " 99 %" seront plus tendus que ceux " 95 %".
En pratique, on ne prlve qu'un seul chantillon et on calcule un seul intervalle de confiance. La probabilit que cet
intervalle contienne la vraie valeur sera gale au niveau de confiance choisi (90 %, 95 %, 99 %, )
30)
/2
.
n
ou
/2
s
n
/2
/2
Par exemple :
pour
= 10 %, on a : Z
pour
= 5 %, on a : Z
/2
= 1,96
pour
= 1 %, on a : Z
/2
= 2,575
= 1,645
/2
Donc en risquant de se tromper avec une probabilit gale , on peut affirmer que :
X -Z
L'intervalle [ X - Z
/2
, X + Z
/2
/2
/2
X + Z
n
.
s
n
/2
s
n
X + Z
/2
s
n
au niveau de confiance 1 - .
)=1-
Exemple
Dans un ensemble de 150 tudiants, on a constat dans un exercice d'expression orale que le temps de parole tait
distribu normalement avec un cart type de 2 min. On prlve sans remise un chantillon de 30 tudiants pour
lesquels le temps moyen de parole utilis pour cet exercice est de 14 min.
Construire un intervalle de confiance au niveau de confiance de 99% pour estimer le temps moyen de parole utilis
pour la population des 150 tudiants.
Dterminer la taille d'chantillon qu'il faudrait considrer pour rduire la marge d'erreur de moiti.
6.4 Cas des petits chantillons extraits d'une population normale ( n < 30)
Au paragraphe 4, on a vu que si la variable alatoire X suit une loi normale, la distribution des moyennes X suit une
loi normale N ( ,
Si
).
n
est connu, l'intervalle de confiance de la moyenne se construit comme dans le cas des grands chantillons.
Mais en gnral, est inconnu et estim par s. Dans le cas des petits chantillons, en remplaant
modifie la nature de la loi suivie par m.
La variable alatoire t =
X
s
par s et on
n
Le coefficient de risque tant choisi et le nombre de degr de libert tant connu, les tables permettent de lire t tel
que P(-t /2 < t < t /2 } = 1 - .
On en dduit la marge d'erreur sur la moyenne de la population :
t
2
,n 1
52
L'intervalle [ X - t
2
,n 1
, X + t
2
,n 1
au niveau de confiance 1 - .
Lorsque le nombre de degrs de libert tend vers l'infini, la fonction de rpartition de la loi de Student tend vers
celle de la loi normale centre rduite.
7.
30)
Dans un chantillon de taille n tir d'une population binomiale pour laquelle p est la frquence de succs, les limites
de confiance de p sont donnes par p Z/2 p o p est la proportion de succs dans l'chantillon de taille n.
Les conditions suivantes tant ralises : np
5 et n.(1-p)
p Z
/2
p.(1 p)
n
53
8.
EXERCICES
1) La dure de fonctionnement d'une pile suit une loi normale d'cart type 0,73 ans. On prlve un chantillon de
36 piles et on a observ une moyenne de 4,4 ans. Construire un intervalle de confiance au niveau de confiance
95% pour estimer la dure de fonctionnement moyenne des piles de ce type. On suppose que l'chantillonnage a
t fait avec remise.
Quelle devrait tre la taille d'chantillon de faon n'avoir une marge d'erreur que de 0,1 au mme niveau de
confiance ?
(4,16 - 4,64 ; 205)
2) Le personnel d'un bureau d'experts fiscaux sait que le temps ncessaire pour remplir une dclaration fiscale est
une variable alatoire d'cart type 15,3 min. Pour estimer le temps moyen, on prlve un chantillon de 60
dclarations et on note le temps moyen 77,8 min. On demande de construire un intervalle de confiance au
niveau de confiance de 90% pour estimer le temps moyen ncessaire pour remplir une dclaration fiscale.
(chantillon avec remise)
(74,55 - 81,05)
3) Sur un chantillon de 83 coquillages, on a relev une cote dtermine x. On a trouv une moyenne de 52,17 mm
et un cart type de 1,8 mm.
a)
b)
quel devrait tre l'effectif de l'chantillon pour situer la moyenne dans un intervalle de 0,4 mm
avec une scurit de 95 % ?
(51,78 - 52,56 ; 311)
4) Un fabricant de stylos met un nouveau stylo sur le march. Pour estimer la dure moyenne d'criture de ces
stylos, il prlve un chantillon de 16 stylos et il note leur dure d'criture (en heures).
87
92
97
93
102
101
91
100
91
96
95
92
68
85
90
86
En supposant que la dure de vie suit une loi normale, on demande de construire un intervalle de confiance au
niveau de confiance de 95% pour estimer la dure moyenne d'criture.
(87,3 - 95,9)
5) Pour connatre les intentions de vote des belges, on prlve un chantillon de 900 personnes et on trouve que
426 d'entre elles ont l'intention de voter pour le parti "XYZ". On demande de construire un intervalle de
confiance au niveau de confiance de 95 % pour estimer la proportion des lecteurs qui ont l'intention de voter
pour le parti "XYZ" aux prochaines lections. Dterminer le nombre de personnes qu'il faudrait consulter de
faon ce que la marge d'erreur ne dpasse pas 0,02.
(0,44 - 0,51 ; 2395)
6) Marc Dupont, un tudiant, veut savoir s'il vaut la peine de se porter candidat la prsidence de l'Association des
Etudiants. Un chantillon de 50 tudiants a montr que 22% des tudiants voteraient pour lui. Estimer le
vritable pourcentage un niveau de confiance de 99%.
(0,07 - 0,37)
7) Dans un chantillon alatoire de 400 personnes, 320 approuvent la nouvelle politique gouvernementale en
matire d'immigration. Au niveau de confiance de 95%, estimer le pourcentage de la population en accord avec
la nouvelle politique. (0,76 - 0,84)
8) Madame X, dput, est inquite. La victoire aux prochaines lections est loin d'tre assure. Prise de panique,
elle s'empresse de commander un sondage pour savoir comment elle est perue par l'lectorat. Des 1200 votants
interrogs, 532 ont affirm qu'ils voteraient pour madame X, tous les autres semblent prfrer son adversaire ou
sont indcis. Au niveau de confiance de 95%, estimer le pourcentage de l'lectorat qui appuie la dpute.
(41,53 - 47,13)
9) Un chantillon de 100 votants choisis au hasard parmi tous les votants d'une circonscription donne a montr
que 55 % d'entre eux taient favorables un certain candidat.
54
Dterminer les limites de confiance (a) 95% (b) 99% (c) 99,73 % de la proportion de tous les votants
favorables ce candidat. (0,55 0,10 ; 0,55 0,13, 0,55 0,15)
10) Une entreprise de production de graines veut vrifier la facult germinative d'une espce, c'est--dire la
probabilit p pour qu'une graine, prise au hasard dans la production, germe.
Sur un chantillon de 400 graines, on observe que 330 graines germent. Quel est l'intervalle de confiance de p
au risque 5 % ? au risque 1 % ?
([0,788 - 0,862] ; [0,776 - 0,874])
0,772
0,630
0,757
0,541
0,607
0,474
0,489
0,570
0,721
0,824
0,525
0,824
0,750
0,628
0,824
0,599
0,667
0,649
0,499
0,570
0,691
0,883
0,599
0,827
55
ANNEXE 1 : TABLES
Table de Loi Normale
Fonction de rpartition de la loi normale centre
rduite.
Probabilit de trouver une valeur infrieure u.
0.00
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
0.09
0.51994
0.53586
0.55962
0.57535
0.59871
0.61409
0.63683
0.65173
0.67364
0.68793
0.70884
0.72240
0.74215
0.75490
0.77337
0.78524
0.80234
0.81327
0.82894
0.83891
0.85314
0.86214
0.87493
0.88298
0.89435
0.90147
0.91149
0.91774
0.92647
0.93189
0.93943
0.94408
0.95053
0.95449
0.95994
0.96327
0.96784
0.97062
0.97441
0.97670
0.97982
0.98169
0.98422
0.98574
0.98778
0.98899
0.99061
0.99158
0.99286
0.99361
0.99461
0.99520
0.99598
0.99643
0.99702
0.99736
0.99781
0.99807
0.99841
0.99861
0.99886
0.99900
0.99918
0.99929
0.99942
0.99950
0.99960
0.99965
0.99972
0.99976
0.99981
0.99983
56
57
58
Table du
ddl
0 ,9 9
0,95
0,05
0 ,0 2 5
0 ,0 1
3,84
5 ,0 2
6 ,6 3
0,02
0,10
5,99
7 ,3 8
9 ,2 1
0,11
0,35
7,81
9 ,3 5
1 1 ,3 4
0,30
0,71
9,49
1 1 ,1
1 3 ,2 8
0,55
1,15
11,07
1 2 ,8
1 5 ,0 9
0,87
1,64
12,59
1 4 ,4
1 6 ,8 1
1,24
2,17
14,07
1 6 ,0
1 8 ,4 8
1,65
2,73
15,51
1 7 ,5
2 0 ,0 9
2,09
3,33
16,92
1 9 ,0
2 1 ,6 7
10
2,56
3,94
18,31
2 0 ,5
2 3 ,2 1
11
3,05
4,57
19,68
2 1 ,9
2 4 ,7 2
12
3,57
5,23
21,03
2 3 ,3
2 6 ,2 2
13
4,11
5,89
22,36
2 4 ,7
2 7 ,6 9
14
4,66
6,57
23,68
2 6 ,1
2 9 ,1 4
15
5,23
7,26
25,00
2 7 ,5
3 0 ,5 8
16
5,81
7,96
26,30
2 8 ,8
3 2 ,0 0
17
6,41
8,67
27,59
3 0 ,2
3 3 ,4 1
18
7,01
9,39
28,87
3 1 ,5
3 4 ,8 1
19
7,63
10,12
30,14
3 2 ,9
3 6 ,1 9
20
8,26
10,85
31,41
3 4 ,2
3 7 ,5 7
21
8,90
11,59
32,67
3 5 ,5
3 8 ,9 3
22
9,54
12,34
33,92
3 6 ,8
4 0 ,2 9
23
10,20
13,09
35,17
3 8 ,1
4 1 ,6 4
24
10,86
13,85
36,42
3 9 ,4
4 2 ,9 8
25
11,52
14,61
37,65
4 0 ,6
4 4 ,3 1
26
12,20
15,38
38,89
4 1 ,9
4 5 ,6 4
27
12,88
16,15
40,11
4 3 ,2
4 6 ,9 6
28
13,56
16,93
41,34
4 4 ,5
4 8 ,2 8
29
14,26
17,71
42,56
4 5 ,7
4 9 ,5 9
30
14,95
18,49
43,77
4 7 ,0
5 0 ,8 9
55,8
5 9 ,3
6 3 ,7
40
59
Enfants
Temps (en ms)
1
24
2
27
3
38
4
21
5
27
6
19
7
23
8
23
9
24
10
19
Enfants
Temps (en ms)
11
27
12
30
13
15
14
27
15
24
16
35
17
18
18
20
19
21
20
15
Enfants
Temps (en ms)
21
33
22
27
23
20
24
32
25
28
26
27
27
22
28
17
29
30
30
18
Enfants
Temps (en ms)
31
21
32
25
33
25
34
29
35
25
36
24
37
32
38
31
39
28
40
20
Enfants
Temps (en ms)
41
29
42
24
43
23
44
34
45
17
46
15
47
21
48
28
49
24
50
23
Vu le nombre de valeurs diffrentes releves, il y a peu d'intrt les reprsenter sur un graphique. Il est prfrable
de constituer des classes.
i : numro de la classe
Intervalles de temps (en ms) Xi
Effectifs ni
[15, 18]
[19, 22]
[23, 26]
[27, 30]
[31, 34]
[35, 38]
11
14
11
60
Le Franais Yves Bigot, directeur des antennes de la RTBF depuis avril 2006, quittera la tlvision
publique le 1er septembre prochain. Il a en effet trouv un accord avec Endemol France dont il
prendra la direction des programmes.
Deux ans aprs avoir pris ses fonctions de directeur des antennes de la RTBF (le 1er avril 2006), Yves Bigot a
dcid de faire le chemin inverse et de reprendre la direction de Paris. Bigot va en effet rallier Endemol France,
socit de production qui a la mainmise sur la tl franaise puisquelle arrose ses chanes avec des programmes
comme la Star Academy, A prendre ou laisser, Attention la marche, Miss France, Les enfants de la tl,
Tempches tout le monde de dormir, Secret Story et mme + Clair.
A 52 ans, le Tropzien nabandonne pas le paquebot RTBF en pleine mer mme si, videmment, il nira pas au bout
de son mandat de six ans. Dailleurs, il ne quittera la RTBF que le 31 aot prochain. Ce nest videmment pas une
nouvelle que lon accueille avec plaisir, mme si cela dmontre que nous ne nous tions pas tromps lorsque nous
lavons recrut voici deux ans, dit ladministrateur gnral de la RTBF, Jean-Paul Philippot. Ma premire
proccupation a t de savoir ce que nous allions faire pour les grilles de la rentre de septembre. Et Yves ma
rpondu spontanment quil allait les faire avec son quipe et les prsenter la presse fin aot. Ce nest quaprs
cette chance quil rejoindra Endemol France.
Dsigner son successeur
Par ailleurs, Bigot conservera, deux ans durant, une mission de conseil auprs de la RTBF. Dici septembre, il
participera la dsignation de son successeur, qui sera choisi via un appel candidatures lanc dici une semaine.
Bigot appartiendra effectivement au collge dexperts mis en place cet effet en compagnie du Suisse Gilles
Marchand (TSR) et du Flamand Aim Van Hecke (ex-VRT, Sanoma).
Pour Yves Bigot, il sagit dune nouvelle ligne sur un CV impressionnant qui la amen travailler dans la radio et
la presse crite, diriger des maisons de disques et faire de la tl (il a t directeur des varits et des programmes
de France 2, et directeur gnral adjoint charg des programmes de France 4).
Cest lamour de laventure et le got du risque qui mavaient amen en Belgique et jy ai pass deux annes
merveilleuses, explique-t-il. Mais le challenge que me propose Virginie Calmels, la prsidente dEndemol France,
est ambitieux et enthousiasmant. Je ne remplace pas Alexia Laroche-Joubert (ndlr : la directrice de la Star Ac vient
de quitter son poste de directrice des programmes dEndemol France pour rejoindre son ancien patron, Stphane
Courbit) puisque je prends un poste nouvellement cr, celui de directeur gnral adjoint charg des programmes.
Tous les programmes, donc y compris la tlralit mais pas seulement la tlralit, ce qui ne maurait pas
intress. Endemol ne serait pas venu me chercher moi pour a.
Quant au bilan de Bigot Reyers, il reste globalement trs positif malgr quelques checs. Cest en tout cas lavis de
Jean-Paul Philippot : La Une a stabilis ses audiences, la Deux les a augmentes de 43 %. On a investi dans la
production belge, comme Melting-pot caf, lanc Arte Belgique, des talk-shows, le 12 minutes et mis Matin
premire en tl. Surtout, la RTBF a renou avec des vnements (Stars of Europe, Tenue de soire) et avec une
politique remarquable en termes dacquisition de fictions et de droits sportifs. Nous aurions pu travailler ensemble
longtemps encore
COMMENTAIRE :
La Deux augmente son audience de 43 % !! En fait, elle passe de 3 4,5 % !!!!
Il savre lanalyse de ces tests que le cerveau est fortement stimul par les jeux vido dans
lhippocampe et dans la rgion du para-hippocampe, des zones partiellement ddies
lapprhension cognitive de lenvironnement spatial et lorientation. Or, en agissant sur
ltendue et la qualit de la "carte mentale" des joueurs, les jeux vido ne stimulent pas
uniquement leur sens de lorientation, ils agissent aussi fortement sur la mmoire, au point quun
chercheur de lUniversit de Californie Los Angeles teste actuellement un traitement de la
maladie dAlzheimer base de jeu vido.
Tout ceci explique donc les rsultats obtenus. Cependant, G. Astreau se refuse dresser un
tableau idyllique du sujet : 12% des joueurs se plongent involontairement en apne lorsquils
jouent. Cette privation temporaire doxygne peut remettre en cause le bnfice scolaire obtenu
par la pratique des jeux vido. De plus les enfants pileptiques risquent des crises lorsquils sont
trop longtemps confronts des images frntiques et lumineuses, et ces crises peuvent imposer
une mdication importante qui son tour peut grever les performances scolaires de lenfant .
Enfin, rappelle-t-il, les notes des passionns de jeux vidos sont gnralement mdiocres en
cours dducation physique et sportive .
Jenny L. Voight
Spcialiste des souris
Commentaire : Qu'en-pensez-vous ?
BON COURAGE !!
BIBLIOGRAPHIE
Jaffard P., Initiation aux mthodes de la statistique et du calcul des probabilits, Masson, 1986.
Masiri, W., Notions essentielles de statistique et calcul des probabilits, travaux pratiques, Sirey, 1976.
Monfort F., Elments du calcul des probabilits et des mthodes statistiques. Ulg. 1970
Rateau P., Mthode et statistique exprimentales en sciences humaines, Edition Ellipses, 2001.
Van Vyve-Genette A., Gohy J-M., Feytmans E., Statistique lmentaire pour les sciences bio-mdicales, De
Boeck Universit, 1988.
Wonnacott H. et J., Statistique : Economie, Gestion, Sciences, Mdecine, Ed. Economica, 4 me dition, 1995.