Vous êtes sur la page 1sur 175

Par Paul CHEGE

African Virtual university


Universit Virtuelle Africaine
Universidade Virtual Africana
Probabilits
et statistiques

ur|vers|l v|rlue||e Alr|ca|re 1
Note
Ce document est publi sous une licence Creative Commons.
http://en.wikipedia.org/wiki/Creative_Commons
Attribution
http://creativecommons.org/licenses/by/2.5/
License (abrviation cc-by ), Version 2.5.
ur|vers|l v|rlue||e Alr|ca|re 2
I. Probabilitsetstatistiques ___________________________________ 3
II. Prrequis/connaissancespralablesncessaires _________________ 3
III. Volumehoraire/temps_______________________________________ 3
IV. Matrielsdidactiques _______________________________________ 3
V. Justification/Importancedumodule____________________________ 3
VI. Contenu__________________________________________________ 5
6.1Rsum_______________________________________________ 5
6.2Contour/grandeslignes___________________________________ 6
6.3Reprsentationgraphique_________________________________ 7
VII. Objectifgnral____________________________________________ 8
VIII. Objectifsspcifiquesauxactivitsdapprentissage_________________ 8
IX. Activitsdenseignementetdapprentissage______________________ 10
X. Concepts-cls(glossaire)____________________________________ 13
XI. Lecturesobligatoires________________________________________ 20
XII. Ressourcesobligatoires_____________________________________ 22
XIII. Liensutiles_______________________________________________ 23
XIV. Activitsdapprentissage ____________________________________ 25
XV. Synthsedumodule_______________________________________ 119
XVI. valuationsommative______________________________________ 120
XVII.Rfrencesbibliographiques_________________________________ 128
XVIII.Fichedvaluation_________________________________________ 129
XIX. Auteurdumodule_________________________________________ 129
XX. Structure _______________________________________________ 130

Table des maTires


ur|vers|l v|rlue||e Alr|ca|re 3
i. Probabilits et statistiques
Par Paul Chege
ii. Prrequis/ connaissances pralables
ncessaires
Cours de statistiques et probabilits au secondaire.
iii. Volume horaire/temps
La dure de ce module est de 120 heures.
iV. matriels didactiques
Les tudiants devraient avoir accs aux lectures mentionnes plus loin. De plus, ils
auront besoin dun ordinateur pour avoir accs ces lectures. Par ailleurs, les tu-
diants devraient pouvoir installer le logiciel wxMaxima et lutiliser pour pratiquer
des concepts algbriques. Ils doivent galement avoir accs au logiciel du microsoft
offce Excel qui traite les lois de probabilits usuelles, les tests statistiques, et analyses
statistiques descriptives et infrentielles classiques.
V. Justifcation/importance du module
Les probabilits et les statistiques, en plus dtre un lment cl dans lensei-
gnement au secondaire, fournissent un bagage important pour les mathma-
tiques avances au niveau tertiaire. Les statistiques font partie de la base des
mathmatiques appliques dans la plupart des sujets acadmiques et sont trs
utiles pour lanalyse dans des industries de production. Les spcialistes de
statistiques appels statisticiens analyseront des donnes brutes cueillies dans
le domaine pour fournir un aperu sur le comportement de la population. Les
statistiques fournissent aux gouvernements et aux organisations un rsum
concret dune situation qui aidera les dirigeants prendre une dcision. Par
exemple, le taux de propagation des maladies, des rumeurs, des incendies de
fort, la modlisation de la pluviomtrie et les volutions de population ou le
mouvement dmographique.
ur|vers|l v|rlue||e Alr|ca|re 1
Dautre part, ltude des probabilits aidera la prise de dcision des agents
gouvernementaux et des organisations bases sur la thorie de la chance. Par
exemple : prdire les sexes nouveau-ns sur une certaine priode et projeter le
niveau de la quantit des pluies sur des rgions, eu gard aux donnes histori-
ques sur le sujet. Les probabilits sont aussi utilises dans le choix du niveau
de qualit de certains produits dans la production industrielle, (comme) par
exemple, le nombre de pices dfectueuses prvues dans le processus manu-
facturier dune industrie.
Enfn, un niveau plus avanc, en cette re de la nouvelle technologie de
linformation, grce la puissance accrue des ordinateurs et la performance
des algorithmes pour traiter de gros volumes des donnes, ltude statistique
des tickets de caisse permet de mieux optimiser la liquidation des articles dans
une grande surface en tenant compte des associations des produits vendus.
Cela relve du domaine communment appel la fouille des donnes ou le
data mining qui traite diffrents types des donnes, donnes qualitatives et
/ ou quantitatives, et qui comprend plusieurs mthodes telles lanalyse des
rgles dassociation, les analyses factorielles de composantes principales, de
correspondances, etc.
Dans ce module de cours, on se limitera essentiellement ltude des donnes
quantitatives. Le logiciel Excel du microsoft offce fait partie doutils didac-
tiques travers son module Outils/UtilitairesdAnalyses.
ur|vers|l v|rlue||e Alr|ca|re 5
Vi. Contenu
6.1 Rsum
Ce module est divis en trois units :
Unit 1 : Les statistiques illustres (qualificatives**) et la distribution de proba-
bilits
Les statistiques illustres dans lunit 1 sont dveloppes, soit par extension aux
mathmatiques au niveau secondaire, soit comme une introduction pour ceux qui
apprennent les statistiques pour la premire fois. Cette unit introduit la mesure de
la dispersion dans les statistiques. Elle introduira aussi les concepts de probabilits
et le traitement thorique des probabilits.
Unit 2 : Les variables alatoires et la distribution
Cette unit requiert lunit 1 en prrequis. Elle parle du moment et des fonctions
produisant le moment, les ingalits de Markov et Chebychev, les distributions
spciales une variable, les distributions des probabilits deux variables et lana-
lyse des probabilits conditionnelles. Cette unit donne un aperu sur lanalyse des
coeffcients de corrlation linaires et la distribution des fonctions de variables ala-
toires, comme, par exemple, le khi carr, T et F. Utilisation de Excel sous Outils/
Utilitairesdanalyse.
Unit 3 : La thorie des probabilits
Cette unit a t conue partir de lunit 2. Elle analyse la probabilit en utilisant
un indicateur de fonctions. Elle introduit les vecteurs alatoires ingaux de Bonfe-
roni, les fonctions de production, les fonctions caractristiques et les chantillons
alatoires de statistiques indpendantes. Cette unit montre en dtail les concepts de
fonctions de plusieurs variables et lindpendance de X et de S2 dans des chantillons
gaussiens de statistiques dordre. Cette unit rsume le traitement de divers modes
de convergence et des thormes limites.
ur|vers|l v|rlue||e Alr|ca|re
6.2 Contour/grandes lignes
Unit 1 (40 heures) : Les statistiques illustres et la distribution de probabilits
Niveau 1. Priorit A. Sans prrequis.
La frquence des distributions relatives et cumulatives, les courbes frquence
variables, les moyennes, le mode et la mdiane. Les quartiles et les percentiles,
les carts-types, les distributions symtriques et asymtriques. La probabilit; les
chantillonnages et les vnements; la dfnition des probabilits; les proprits des
probabilits; les variables alatoires; la probabilit des distributions; Bernouli, lois
binmiales, lois de Poisson, lois gomtriques, lois hypergomtriques, lois uniformes,
lois exponentielles et lois normales. Des distributions deux variables. Les tables
des lois de probabilit jointes et les lois de probabilit marginales.
Unit 2 (40 heures) : Les variables alatoires et la distribution
Niveau 2. Priorit B. Prrequis : Statistiques 1.
Moments et fonction gnratrice de moments. Les ingalits de Markov et Cheby-
chev, des distributions univaries spciales. La probabilit de distributions deux
variables; les distributions marginales et conditionnelles communes; lindpendance;
lanticipation de la rgression et de la corrlation deux variables; lanalyse de la
rgression et du coeffcient de corrlation pour des donnes deux variables. La
distribution de variables alatoires, la distribution normale deux variables. Les
distributions drives comme le khi carr, T. et F.
Unit 3. (40 heures) : La thorie des probabilits
Niveau3.PrioritC.Prrequis:Statistiques2.
Probabilits : Utilisation des fonctions indicatrices. Les ingalits de Bonferoni
et les vecteurs alatoires. Les fonctions gnratrices. Les fonctions caractristi-
ques. Lindpendance des statistiques et chantillons alatoires. La distribution
multinomiale. Les fonctions de plusieurs variables alatoires.
Lindpendance de

X et de S
2
dans des chantillons normaux. Statistique dor-
dre. Lois normales multidimensionnelles. Convergence et thormes limites.
Exercices pratiques.

ur|vers|l v|rlue||e Alr|ca|re Z
6.3 Reprsentation graphique de lorganisation

Les ingalits
de Markov et
de
Chebychev
Les
distributions
drives, le khi
deux, t et F.
Les lois une
variable et
deux variables
DONNES
Les
tableaux de
probabilits
usuelles
La
moyenne, le
mode et la
mdiane
Les courbes
frquence
variable, les
quartiles et les
percentiles
Les fonctions
gnratrices et
caractristiques et
les chantillons
alatoires
Les
indicateur
s de
fonctions
La probabilit
des
distributions
Le moment
et fonction
gnratrice
des moments
Les ingalits
de Bonferoni,
les vecteurs
alatoires
Loi multinomiale,
les fonctions de
variables alatoires
Variance et
cart type
Les
probabilits
La rgression
et la
corrlation
Les lois marginales
et conditionnelles
usuelles
Les lois
multidimensionnelles
, la convergence et
thormes limites
ur|vers|l v|rlue||e Alr|ca|re 8
Vii. Objectif gnral
la fn de ce module, ltudiant devrait tre en mesure de calculer les diff-
rentes mesures de dispersions dans les statistiques et deffectuer des probabi-
lits bases sur les lois de la probabilit, de faire des tests sur des donnes en
utilisant les thories de la probabilit.
Viii. Objectifs spcifques aux activits
dapprentissage
Unit 1 : Les statistiques illustres et la distribution de probabilits (40 heures)
la fn de lunit 1, ltudiant devrait tre en mesure de :
Dessiner diverses courbes de frquences
Trouver la moyenne, le mode, la mdiane, les quartiles, les percentiles et les
carts-types de donnes regroupes
Dfnir et noncer les proprits des probabilits
Illustrer des variables alatoires, des probabilits de distributions, et les valeurs
attendues de variables alatoires
Illustrer les distributions de Bernoulli, les lois binomiales, lois de Poisson, lois
gomtriques, hypergomtriques, uniformes, exponentielles et normales
Faire des enqutes sur les frquences de distribution deux variables
Construire des tableaux de probabilits communes et marginales
Unit 2 : Les variables alatoires et la distribution (40 heures)
la fn de lunit 2, ltudiant devrait tre en mesure de :
Illustrer le moment et le moment gnrant des fonctions
Analyser les ingalits de Markov et de Chebychev
Examiner les distributions spciales une variable, les probabilits de dis-
tributions deux variables, les distributions marginales communes et condi-
tionnelles
Montrer lindpendance, lanticipation deux variables, la rgression et la
corrlation
Analyser la rgression et la corrlation du coeffcient pour des donnes deux
variables
Montrer les fonctions de distribution de variables alatoires
Examiner les distributions normales deux variables
Illustrer les distributions drives comme le khi carr, T et F.
ur|vers|l v|rlue||e Alr|ca|re 9
Unit 3 : La thorie des probabilits (40 heures)
la fn de lunit 3, ltudiant devrait tre en mesure de :
Utiliser des indicateurs de fonctions dans les probabilits
Montrer les ingalits de vecteurs alatoires de Bonferoni
Illustrer les fonctions gnratrices et caractristiques
Examiner lindpendance dchantillons alatoires de statistiques et les dis-
tributions multinomiales
valuer les fonctions de plusieurs variables alatoires
Illustrer lindpendance de X et de S2 dans des chantillons normaux de
statistiques
Montrer les distributions normales multidimensionnelles
Illustrer la convergence et les thormes limites
Faire des exercices pratiques
ur|vers|l v|rlue||e Alr|ca|re 10
iX. activits denseignement et dapprentissage
9.1 valuation prliminaire/initiale
Les mathmatiques de base constituent un prrequis pour les probabilits et les
statistiques.
Questions
1. Lorsquun d est lanc, la probabilit davoir un nombre suprieur 4 est de :
a. 1/6
b. 1/3
c. 1/2
d. 1
2. Une seule carte est tire au hasard dun paquet de cartes. Trouvez la probabilit
de tirer une reine.
a. 1/13
b. 1/52
c. 4/13
d. 1/2
3. Sur 100 nombres, il y avait vingt 4, quarante 5, trente 6 et le restant taient des
7. Trouvez la moyenne arithmtique des nombres.
a. 0.22
b. 0.53
c. 2.20
d. 5.30
4. Calculez la moyenne des donnes suivantes :
Grandeur (cm) Indice de classement (x)
60-62 61
63-65 64
66-68 67
69-71 70
72-74 73
a. 57.40
b. 62.00
c. 67.45
d. 72.25
ur|vers|l v|rlue||e Alr|ca|re 11
5. Trouvez le mode des donnes suivantes : 5, 3, 6, 5, 4, 5, 2, 8, 6, 5, 4, 8, 3, 4, 5,
4, 8, 2, 5 et 4
a. 4
b. 5
c. 6
d. 8
6. Ltendue des valeurs quune probabilit peut prsumer est :
a. De 0 1
b. De -1 +1
c. De 1 100
d. De 0
7. Trouvez la mdiane des donnes suivantes : 8, 7, 11, 5, 6, 4, 3, 12, 10, 8, 2, 5, 1,
6, 4.
a. 12
b. 5
c. 8
d. 6
8. Trouvez ltendue de ces chiffres : 7, 4, 10, 9, 15, 12, 7, 9.
a. 9
b. 11
c. 7
d. 8.88
9. Lorsque deux pices de monnaie sont lances, lespace dchantillon est :
a. P, F et PF
b. PP, PF, FP, FF
c. PP, PF, FF
d. P, F
10. Si une lettre est slectionne au hasard dans le mot Mississippi , trouvez la
probabilit que ce soit un i .
a. 1/8
b. 1/2
c. 3/11
d. 4/11
ur|vers|l v|rlue||e Alr|ca|re 12
Corrig
1. B
2. A
3. D
4. C
5. B
6. A
7. D
8. B
9. B
10. D
Commentaires pdagogiques pour les tudiants
Cette valuation prliminaire a t conue pour donner un aperu aux tudiants sur
ce quils peuvent se rappeler en probabilits et en statistiques. Une note infrieure
50 % dans cette valuation prliminaire indique que llve doit rviser les proba-
bilits et les statistiques vues en mathmatiques du niveau secondaire. Lvaluation
prliminaire couvre les concepts de base que les tudiants doivent connatre avant de
continuer dans ce module. Si vous avez eu des problmes avec cette valuation, vous
devriez rviser les probabilits et statistiques vues en mathmatiques du secondaire,
et vous devriez matriser les bases.

ur|vers|l v|rlue||e Alr|ca|re 13
X. Concepts-cls (glossaire)
Absolumentexclusifs/incompatibles : Deux vnements sont mutuellement
exclusifs sils ne peuvent pas intervenir en mme temps.
Lavariance dun ensemble de donnes est dfnie comme le carr de lcart
-type. Ex. : variance = s
2
.
Essai : Ce terme se rapporte une activit qui applique une exprience, comme,
par exemple, prendre une carte dans un paquet de 52 cartes ou lancer un ou
plusieurs ds.
Espace dchantillon ou univers des possibles: Ce terme dsigne toutes
les possibilits dune exprience de probabilits. On lappelle lvnement
certain ou lvnementsrattach lexprience considre. Ex. : En laant
une pice de monnaie, le rsultat sera soit pile (P) ou face (F).
Variablealatoire : Cest une fonction qui assigne un nombre rel tous les
rsultats possibles dune exprience alatoire.
chantillonalatoire : Il est choisi par une mthode qui fait intervenir un
lment imprvisible.
DistributiondeBernoulli : Cest une probabilit discrte qui prend la valeur 1
avec la probabilit du succs p, et la valeur 0 avec la probabilit dchec q =
1 p.
Distributionbinomiale : Cest une distribution de probabilits discrtes qui
exprime la probabilit dun nombre de succs dans une squence de n essais
indpendants dexpriences de Bernoulli, cest--dire deux issues exclusives
oui / non, selon laquelle chaque essai produit un succs avec la probabilit
p.
Distributionhypergomtrique : Cest une distribution de probabilits dis-
crtes qui dcrit le nombre de succs dans une squence n tire partir dune
population fnie sans remplacement.
DistributiondePoisson : Cest une distribution de probabilits discrtes qui
exprime la probabilit quun nombre dvnements qui se produisent dans une
priode de temps prdtermine, si ces vnements se produisent avec un taux
moyen connu, et ils sont indpendants du temps depuis le dernier vnement.
Cest une loi des vnements rares.
Corrlation : Cest une mesure dassociation entre deux variables.
Rgression: Cest la relation fonctionnelle explicite qui existe entre une
variable dpendante et une variable indpendante.
ur|vers|l v|rlue||e Alr|ca|re 11
Khicarr : Cest nimporte quel test dhypothse statistique dans lequel le test
de statistiques a une distribution khi carr lorsque lhypothse nulle est vrai,
ou lorsque la distribution de probabilits du test de statistique (en prenant pour
acquis que lhypothse soitvraie) peut tre faite pour estimer une distribution
khi carr au prs que voulu en faisant un espace dchantillon assez grand.
Distributionnormaleplusieursvariables : Cest une distribution de pro-
babilits spcifque qui peut faire penser la gnralisation de plus grandes
dimensions que la distribution normale unidimensionnelle.
TestT : Cest nimporte quelle hypothse de statistique pour deux groupes
dans lequel le test de statistiques a une distribution dun lve t lorsque lhy-
pothse nulle est vraie.
Termes de statistiques
1. Donnebrute : Cest une donne qui na pas t classe numriquement.
2. Sriestatistique : Cest un arrangement de donnes brutes et de donnes num-
riques dans un ordre ascendant de magnitude.
3. tendue : Cest la diffrence entre le plus gros et le plus petit nombre dans des
donnes.
4. Intervalle de classe : Dans une tendue de donnes regroupes. Ex. : 21-30,
31-40, etc.), alors 21-30 sera lintervalle de classe.
5. Limitesdeclasse : Dans lintervalle de classe de 21-30, 21 et 30 sont appels
les limites de classe.
6. Limitesinfrieuresdeclasse(l.i.c.) : Dans lintervalle de classe 21-30, la limite
infrieure de classe est 21.
7. Limitessuprieuresdeclasse(l.s.c.) : Dans lintervalle de classe 21-30, la limite
suprieure de classe est 30.
8. Limitesinfrieuresetsuprieuresdeclasse : Dans lintervalle de classe
infrieure 21-30, la limite de classe est 20.5 et la limite de classe suprieure
est 30.5. Ces limites prennent pour acquis que les mesures thoriques dun
intervalle de classe de 21-30 incluent tous les nombres de 20.5 30.5.
9. Intervalle de classe : Dans une classe de 21-30, lintervalle de classe
est la diffrence entre la limite suprieure de classe et la limite infrieure de
classe. Ex. : 30.5-20.5 = 10. Lintervalle de classe est aussi connu en tant que
lamplitude de classe.
10.Centredeclasseoupointmilieu : Dans un intervalle de classe de 21-30,
le point mdian est la moyenne de 21 et 30. Ex. : 5 . 25
2
30 21
=
+
ur|vers|l v|rlue||e Alr|ca|re 15
11.Distribution statistique : Cest plusieurs donnes brutes classes dans
des classes dans un tableau avec leurs frquences correspondantes. Ex. :
Masse (kg) 10-19 20-29 30-39 40-49
Nombre dlves (f ) 5 7 10 6
Ce tableau est appel une frquence de distributions ou un tableau de statistiques.
12. Frquencescumules : Pour les frquences de distributions suivantes, les fr-
quences cumules sont calcules comme des aditions de frquences individuelles.
Masse (X) 20-24 25-29 30-34 35-39 40-44
Frquence (f ) 4 10 16 8 2
Frquence cu-
mule
4 4+10=14 14=16=30 30+8=38 38+2=40
La frquence cumule dune valeur est sa frquence plus la frquence de toutes les
valeurs infrieures.
Le tableau ci-dessus est appel un tableau de frquencescumules.
13. Distribution de frquences relatives : Dans une frquence de distributions
Masse (X) 20-35 25-29 30-34 35-39 40-44
Frquence (f ) 4 10 16 8 2
f = 40
La frquence relative dune classe de 25-29 est la frquence de la classe divise par
la frquence totale de toutes les classes (frquence cumule) et est gnralement
exprime en pourcentage.
Exemple:
La frquence relative de la classe 25-29 = % 100

f
f
= 100
40
10
25%
Note:la somme des frquences relatives est 100 % ou 1.
ur|vers|l v|rlue||e Alr|ca|re 1
14. Courbe des frquences cumules (Ogive) :
Masse (X) 20-24 25-29 30-34 35-39 40-44
Frquence (f ) 4 10 16 8 2
Frquence cu-
mule (F.C)
4 4+10=14 14=16=30 30+8=38 38+2=40
partir du tableau de frquences cumules ci-dessus, nous pouvons dessiner un gra-
phique de frquences cumules par opposition aux limites de classes suprieures.
Limites de classes
suprieures
24.5 29.5 34.5 39.5 44.5
Frquences cu-
mules
3 14 30 38 40
Note : partir des donnes de frquences cumules, le premier point de res-
titution est (24.5, 3). Si nous avions commenc notre graphique ce point, il
serait suspendu sur laxe des y. Nous crons un autre point (19.5, 0) en tant
que point de dpart. 19.5 est la limite de classe suprieure prvue de la classe
prcdente.
ur|vers|l v|rlue||e Alr|ca|re 1Z
Formes des courbes de frquences
Symtrique ou en forme de cloche
3
Symmetrical or bell-shaped. Skewed to the right ( positive skewness)

Skewed to the left ( Negative skewness) J Shaped
Has equal frequency to the left and right
of the central maximum e.g. normal curve
Has the maximum towards the left and
the longer tail to the right
Has the maximum towards the right of
the and the longer tail to the left
Has the maximum occurring at the right
end
A une frquence gale gauche et droite du centre maximum. Ex. : courbe
normale.
Asymtrique droite (asymtrie positive)
3
Symmetrical or bell-shaped. Skewed to the right ( positive skewness)

Skewed to the left ( Negative skewness) J Shaped
Has equal frequency to the left and right
of the central maximum e.g. normal curve
Has the maximum towards the left and
the longer tail to the right
Has the maximum towards the right of
the and the longer tail to the left
Has the maximum occurring at the right
end
Elle a le maximum vers la gauche et une queue plus longue vers la droite.
Asymtrique gauche (asymtrie ngative)
3
Symmetrical or bell-shaped. Skewed to the right ( positive skewness)

Skewed to the left ( Negative skewness) J Shaped
Has equal frequency to the left and right
of the central maximum e.g. normal curve
Has the maximum towards the left and
the longer tail to the right
Has the maximum towards the right of
the and the longer tail to the left
Has the maximum occurring at the right
end
Elle a le maximum vers la droite et une queue plus longue vers la gauche.
ur|vers|l v|rlue||e Alr|ca|re 18
En forme de J
3
Symmetrical or bell-shaped. Skewed to the right ( positive skewness)

Skewed to the left ( Negative skewness) J Shaped
Has equal frequency to the left and right
of the central maximum e.g. normal curve
Has the maximum towards the left and
the longer tail to the right
Has the maximum towards the right of
the and the longer tail to the left
Has the maximum occurring at the right
end
Elle a le maximum qui se produit du ct droit.
En forme de J invers
4
Reverse J-Shaped U- shaped
Bimodal Multimodal
Has the maximum occurring at the left
end
Has maxima at both ends
Has two maxima Has more than two maxima.
Elle a le maximum qui se produit du ct gauche.
En forme de U
4
Reverse J-Shaped U- shaped
Bimodal Multimodal
Has the maximum occurring at the left
end
Has maxima at both ends
Has two maxima Has more than two maxima.
Elle a les maximums des deux cts.
ur|vers|l v|rlue||e Alr|ca|re 19
Bimodal
4
Reverse J-Shaped U- shaped
Bimodal Multimodal
Has the maximum occurring at the left
end
Has maxima at both ends
Has two maxima Has more than two maxima.
Elle a deux maximums.
Multimodal
4
Reverse J-Shaped U- shaped
Bimodal Multimodal
Has the maximum occurring at the left
end
Has maxima at both ends
Has two maxima Has more than two maxima.
Elle a plus de deux maximums.
ur|vers|l v|rlue||e Alr|ca|re 20
Xi. lectures obligatoires
Lecture #1 : Wolfram MathWorld (visit le 05/06/07)
Rfrencecomplte : http://mathworld.wolfram.com/Probability
Rsum : Cette rfrence donne du matriel essentiel en probabilits et statisti-
ques. Elle comporte plusieurs illustrations qui permettent llve dapprendre
par lui-mme partir de diffrentes approches mthodologiques. Wolfram
MathWorld est une encyclopdie en ligne spcialise en mathmatiques.
Motif: Il donne des rfrences dtailles sur tous les sujets de mathmatiques.
Les lves devraient commencer en utilisant la facult de recherche pour le
module titre. En tout temps, ltudiant devrait chercher pour des mots cls quils
doivent comprendre. Lentre devrait tre tudie consciencieusement.
Lecture #2 : Wikipdia (visit le 05/06/07)
Rfrencecomplte : http://en.wikipedia.org/wiki/statistics
Rsum : Wikipdia est un dictionnaire en ligne. Il est crit par ses propres
lecteurs. Il est mis jour trs souvent puisque les entres sont rvises constam-
ment. De plus, il a t prouv pour tre trs prcis. Les entres mathmatiques
sont trs dtailles.
Motif: Il donne des dfnitions, des explications et des exemples que les lves
ne peuvent pas avoir accs dans dautres ressources. Le fait que Wikipedia
est souvent mis jour donne ltudiant les approches les plus rcentes, les
arguments abstraits, des illustrations et se rfres dautres sources pour
permettre llve dacqurir dautres approches dans les probabilits et les
statistiques.
Lecture #3: MacTutor history of mathematics (visit le 05/03/07)
Rfrencecomplte:http://www-history.mcs.standrews.ac.uk/Indexes
Rsum: Le MacTutor Archive est lhistoire des mathmatiques la plus
comprhensive disponible sur internet. Les ressources sont organises par
personnages et par thmes historiques.
Motif: Les tudiants devraient pouvoir chercher sur MacTutor pour des mots
cls dans les sujets quils tudient (ou le module lui-mme). Il est important
davoir une vue densemble do les mathmatiques qui sont tudies vont dans
lhistoire des mathmatiques. Lorsque ltudiant termine un cours et enseigne
ur|vers|l v|rlue||e Alr|ca|re 21
les mathmatiques au secondaire, les personnages historiques des mathmati-
ques donneront un peu plus de vie la matire pour les tudiants. De plus, le
rle de la femme dans lhistoire des mathmatiques devrait tre tudi pour
aider les tudiants comprendre les diffcults auxquelles les femmes ont d
faire face tout en y apportant une importante contribution. galement, le rle
du continent africain devrait tre tudi pour partager avec les tudiants dans
les coles : notamment les premiers outils de calcul (comme los dIshango)
ainsi que le rle des mathmatiques gyptiennes.

ur|vers|l v|rlue||e Alr|ca|re 22
Xii. ressources obligatoires
Ressource #1 : Maxima.
Rfrencecomplte : Une copie de Maxima est disponible sur le disque qui
accompagne ce cours.
Rsum:La distance laquelle les lves sont occasionnellement confronts
des mathmatiques plus diffciles sans ressources pour les aider. Labsence
de leons avec un professeur en chair et en os rend parfois llve complte-
ment handicap sil nest pas bien quip avec des ressources pour rsoudre
leurs problmes mathmatiques. Ce handicap peut tre rsolu en utilisant une
ressource daccompagnement : Maxima.
Motif:Maxima est un logiciel gratuit qui peut aider les lves rsoudre des
quations linaires et quadratiques, des quations simultanes, des intgrations
et des diffrentiels et qui peut aider faire des manipulations algbriques :
des factorisations, des simplifcations, des expansions, etc. Ce logiciel est
obligatoire pour les tudiants suivant des cours distance puisquil les aide
apprendre plus vite en utilisant les aptitudes TIC dj apprises.
Ressource #2 : Graph
Rfrencecomplte:Une copie de Graph est disponible sur le disque qui
accompagne ce cours.
Rsum: Il est diffcile de dessiner des graphiques de fonctions, spcialement
avec des fonctions compliques et plus particulirement des fonctions en trois
dimensions. Les lves, qui apprennent distance, vont tomber un jour ou
lautre sur des situations o ils auront besoin de faire des graphiques math-
matiques. Ce cours est accompagn dun logiciel appel Graph qui aidera les
lves faire des graphiques. Cependant, ils auront besoin de se familiariser
avec le logiciel pour tre en mesure de lutiliser.
Motif:Graph est un logiciel gratuit pour crer des graphiques auquel les lves
pourront avoir accs sur le CD fournit. Il est facile utiliser lorsquun tudiant
investit du temps pour apprendre comment il fonctionne. Les lves devraient
tirer avantage du logiciel parce quil peut les assister pour faire des graphiques
dans dautres sujets pendant et aprs le cours. Ils le trouveront extrmement
utile pour enseigner les mathmatiques au niveau secondaire.
ur|vers|l v|rlue||e Alr|ca|re 23
Xiii. liens utiles
Lien #1
Titre:Wikipdia
URL:http://en.wikipedia.org/wiki/Statistics
Description:Wikipdia est le dictionnaire de nimporte quel mathmaticien.
Il est gratuit est mis jour rgulirement. La plupart des lves rencontreront
des problmes de matriel de rfrence de temps en temps. La plupart des
livres disponibles ne couvrent que les probabilits et les statistiques. Cette
pnurie de matriel de rfrence peut tre vaincue en utilisant Wikipdia. Il
est trs facile accder avec recherche Google .
Motif:La disponibilit de Wikipdia rsout les problmes de matriel dap-
prentissage dans toutes les branches des mathmatiques. Les lves devraient
avoir de lexprience avec Wikipdia pour les aider dans leur apprentissage.
Cest une ressource gratuite trs utile qui ne fait pas que rsoudre les problmes
des lves, mais qui les dirige aussi vers dautres sites internet connexes trs
utiles dun simple clic sur les icnes.
Lien #2
Titre:Mathsguru
URL:http://en.wikipedia.org/wiki/Probability
Description: Mathsguru est un site internet qui aide llve comprendre
plusieurs branches du module de thorie des nombres. Il est facile accder
travers la barre de recherche Google et fournit de linformation trs dtaills
sur plusieurs questions de probabilits. Il offre des explications et des exemples
pour que les lves apprennent plus facilement.
Motif: Mathsguru donne plusieurs faons daccder dautres sujets connexes,
des indices et des solutions qui peuvent tre trs pratiques pour les lves
qui souffrent des frustrations pour trouver des livres pertinents qui peuvent
aider rsoudre des problmes dans les probabilits. Il donne une approche
utile dans le calcul des probabilits eu gard aux diverses branches du module
de probabilits.
ur|vers|l v|rlue||e Alr|ca|re 21
Lien #3
Titre:Mathworld Wolfram
URL:http://mathworld.wolfram.com/Probability
Description: Mathworld Wolfram est un site web diffrent rempli de solutions
de probabilits. Les lves ont accs ce site trs facilement avec la barre de
recherche Google.Wolfram guide aussi llve vers dautres sites internet utiles
qui couvrent le mme sujet pour aider encore plus llve comprendre.
Motif: Wolfram est un site utile qui fournit des aperus dans plusieurs thories
des nombres tout en fournissant de nouveaux dfs ainsi quune mthodologie
dans la thorie des nombres. Le site devient trs pratique dans la modlisation
et tre trs recommande pour les tudiants qui souhaitent tudier la thorie
des nombres ainsi que dautres branches des mathmatiques. Il donne des liens
vers dautres sites web en fournissant aux lves beaucoup dinformations
dont ils ont besoin dans les probabilits et les statistiques.

ur|vers|l v|rlue||e Alr|ca|re 25
XiV. activits dapprentissage
Unit 1 40 heures
Les statistiques illustres et la distribution de probabilits
Un curieux fermier entreprend les activits suivantes sur sa ferme.
1. Elle plante 80 arbres le 1
er
mars. Elle mesure la hauteur des arbres le 1
er
d-
cembre.
2. Elle pse les 40 vaches sur sa ferme et enregistre les poids dans sa laiterie.
3. Elle enregistre la production journalire des ufs dans sa section de vo-
lailles.
4. Elle enregistre le temps utilis pour livrer le lait vers lusine de traitement
Voici les enregistrements.
1. Lahauteurdesarbresencm:
77 76 68 85 63 68 82 67 75 68
74 85 71 53 78 60 81 80 88 73
75 53 95 71 85 74 73 62 75 61
71 68 69 83 95 94 87 78 82 66
60 83 60 68 77 75 75 78 89 96
72 71 76 63 62 78 61 65 67 79
75 53 65 85 93 88 97 79 73 65
93 85 76 76 90 72 57 84 73 86
2. Lepoidsdesvachesenkg:
Poids (kg) 118-126 127-135 136-144 145-153 154-162 163-171 172-180
Nb de va-
ches
3 5 9 12 5 4 2
ur|vers|l v|rlue||e Alr|ca|re 2
3. Lenombredufspondus:
ufs 462 480 498 516 534 552 570 588 606 624
Nb de
jours
98 75 56 42 30 21 15 11 6 2
4. Letempspourlivrerlelaitdansverslusinedetraitement:
Temps en
minutes
90-100 80-89 70-79 60-69 50-59 40-49 30-39
Nb de jours 9 32 43 21 11 3 1
Problme #1 :
Une entreprise locale commerant avec des services dextensions dagriculture visite
le fermier. Il montre frement ses enregistrements. Loffcier dagriculture est trs
impressionn par ses enregistrements, mais il ralise que le fermier a besoin de plus
de capacits dans la gestion de donnes pour pouvoir laider prendre de meilleures
dcisions en se basant sur les rsultats de sa ferme.
Loffcier a cr un petit cours sur le traitement de donnes pour les fermiers ru-
raux.
Pendant la planifcation du cours, les termes suivants ont t dfnis pour la leon
un pour les fermiers.
a) Donne : le rsultat dobservation. Ex. : la hauteur des arbres.
b) Frquence : La frquence. Ex. : Le nombre de vaches peses.
c) Moyenne : La moyenne des donnes.
d) Mode : La donne la plus haute.
e) Mdiane : Dans des donnes ascendantes, la mdiane est le nombre au milieu
de la suite.
f) tendue : La diffrence entre la donne la plus haute et la plus basse.
Leon un : Les mesures de dispersion
Introduction aux statistiques
Les statistiques descriptives sont utilises pour indiquer nimporte laquelle des tech-
niques utilises pour rsumer un ensemble de donnes. Dans un sens, nous utilisons
les donnes sur des membres dun ensemble pour le dcrire. Les techniques sont
classes comme :
1. Une description graphique dans laquelle nous utilisons des graphiques pour
rsumer les donnes.
ur|vers|l v|rlue||e Alr|ca|re 2Z
2. Une description sous forme de tableau dans lequel celui-ci est utilis pour
rsumer les donnes.
3. Des descriptions paramtriques dans lesquelles nous estimons les valeurs de
certains paramtres dans lequel nous compltons la description de lensemble
de donnes.
En gnral, les donnes statistiques peuvent tre dcrites comme une liste de sujets
ou dunits et les donnes peuvent tre associes avec chacune delles. Nous avons
deux objectifs pour notre rsum :
1. Nous voulons choisir une statistique qui dmontre la diffrence des units dans
leur similarit. Les livres de statistique appellent la solution de cet objectif
une mesure de la tendance centrale.
2. Nous voulons choisir une autre statistique qui montre comment elles sont
diffrentes. Ce genre de statistique est souvent appel une mesure de la va-
riabilit statistique.
Lorsque nous rsumons une quantit comme la longueur, le poids ou lge, il est
commun de rpondre la premire question avec une moyenne arithmtique ou avec
le mode.Parfois, nous choisissons des valeurs spcifques de la fonction de distribution
cumulative appele quartiles.
Les mesures de variabilit les plus communes pour les donnes quantitatives et la
variance sont la racine carre, lcart type, ltendue statistique, ltendue interquartile
et lcart absolu.
Leons de fermiers
Les fermiers apprennent comment calculer les :
a) Moyennes des donnes suivantes :
La moyenne de donnes = Somme totale des donnes divises par le nombre dobjets
dans les donnes.
Exemple :
Calculer la moyenne des donnes suivante :
1) 1,3, 4,4, 5,6, 3,7
Rponse : Moyenne =
8
7 3 6 5 4 4 3 1 + + + + + + +
=
8
33
=4.125
2) 650,675, 700, 725, 800, 900, 1050, 1125, 1200, 575
ur|vers|l v|rlue||e Alr|ca|re 28
Rponse: Moyenne =
10
575 1200 1125 1050 900 800 725 700 675 650 + + + + + + + + +
=
10
8400
= 840
Leon deux: La moyenne dune donne discrte
Exemple :
1) Trouvez la moyenne des donnes suivantes :
X 22 24 25 33 36 37 41
f 5 7 8 4 6 9 11
Rponse: Moyenne =
11 9 6 4 8 7 5
) 11 ( 41 ) 9 ( 37 ) 6 ( 36 ) 4 ( 33 ) 8 ( 25 ) 7 ( 24 ) 5 ( 22
+ + + + + +
+ + + + + +

=
50
1628
= 32.56
2) Trouvez la moyenne du salaire des travailleurs :
Salaire en $ 220 250 300 350 375
Nb de travailleurs 12 15 18 20 5
Rponse:Moyenne =
5 20 18 15 12
) 5 ( 375 ) 20 ( 350 ) 18 ( 300 ) 15 ( 250 ) 12 ( 220
+ + + +
+ + + +
=
70
20665
= $ 295.214
ur|vers|l v|rlue||e Alr|ca|re 29
Tableaux de frquences et moyenne densemble de donnes
Exemple :
Voici le poids de commandes de lait vers une usine de traitement :
45 49 50 46 48 42 39 47 42 51
48 45 45 41 46 37 46 47 43 33
56 36 42 39 52 46 43 51 46 54
39 47 46 45 35 44 45 46 40 47
a) Une utilisant un intervalle de classe de 5, entrez ces donnes dans un tableau de
frquences.
b) Calculez la masse moyenne du lait livr.
Rponse:
Tableaux de frquences / Comptage
Classe Comptage Frquence
33- 37 //// 4
37-42 ///// /// 8
43-47 //////////// /// 19
48-52 //// // 7
53-57 // 2
Total 40
c) La moyenne dun groupe de donnes
Classe Comptage Frquence(f) Pointmilieu(x) fx
33- 37 //// 4
35
2
37 33
=
+
4 35 = 140
37-42 ///// /// 8 40 320
43-47 //////////// /// 19 45 855
48-52 //// // 7 50 350
53-57 // 2 55 110
Total 40 1775
ur|vers|l v|rlue||e Alr|ca|re 30
Moyenne = 375 . 44
40
1775
= =

f
fx

Exercices
Trouvez la moyenne de :
1) 63,65,67,68,69

2)
x 1 2 3 4 5
f(x) 11 10 5 3 1

3)
Poids (x) 4-8 9-13 14-18 19-23 24-28 29-33
Frquence 2 4 7 14 8 5
4) 91,78,82,73,84
5)
Hauteur (x) 61 64 67 70 73
Frquence 5 18 42 27 8
6)
Poids (x) 30.5-36.5 36.5-42.5 42.5-48.5 48.5-54.5 54.5-60.5
Frquence 4 10 14 27 45
Rponses :
1). 66.4 2). 2.1 3). 20.6
4) 80 5) 76.45 6) 51.44
ur|vers|l v|rlue||e Alr|ca|re 31
Leon trois : Le mode
Exemple:
1) Trouvez le mode dans les donnes suivantes :1,3,4,4,5,6,1,3,3,2,2,3,3,5
Solution:
Le mode est la donne qui apparat le plus souvent. Dans cette suite, le 3 est celui
qui apparat le plus de fois ou le plus frquemment : 5 fois. Donc, le mode de cette
suite de donnes est 3.
2) Trouvez le mode dans les donnes suivantes :22,24,25,22,27,22,25,30,
25,31
Solution:
22 et 25 apparaissent trois fois chacun. Donc, les modes sont 22 et 25. Cest
ce quon appelle des donnes bimodales.
3) Trouvez le mode dans les donnes suivantes :
Observation ( X) 0 1 2 3 4
Frquence ( f ) 3 7 10 16 11

Solution:
La donne qui revient le plus souvent est le 3: il apparat 16 fois.
4) Trouvez la classe modale dans les donnes suivantes :
Poids ( X) 50 54 55-59 60-64 65-69 70-74 75-79 80-84
Frquence ( f ) 3 6 8 5 15 9 13
Solution:
La classe modale est 70-74, car elle a la plus haute frquence doccurrence.
ur|vers|l v|rlue||e Alr|ca|re 32
Exercices
Trouvez les modes ou les classes modales des donnes suivantes :
1) 6, 8, 3,5,2,6,5,9,5
2) 20.4, 20.8, 22.1, 23.4, 19.7, 31.2, 23.4, 20.8, 25.5,23.4
3)
Poids (x) 4-8 9-13 14-18 19-23 24-28 29-33
Frquence 2 4 7 14 8 5
4)
Poids (x) 30.5-36.5 36.5-42.5 42.5-48.5 48.5-54.5 54.5-60.5
Frquence 4 10 14 27 45
Rponses :
1) 5 2) 23.4 3) 19-23 4) 54.5-60.5
Leon quatre : La mdiane
La mdiane
La mdiane est la valeur au centre dune distribution. Dans une suite 1, 2, 3, 4, 5, la
mdiane est 3, car elle est exactement au centre de la distribution. Pour la suite 1, 2,
2, 3, 4, 5, 6, 7, 7, 8; il y a 10 nombres et aucun nombre au centre. Dans un cas comme
celui-l, la mdiane est la moyenne des deux nombres du centre.
Ex. : 1,2,2,3, 4, 5 ,6,7,7, 8
Donc, la mdiane est
2
5 4 +
= 4.5
ur|vers|l v|rlue||e Alr|ca|re 33
La mdiane densemble de donnes
Exemple:
Trouvez la mdiane des ensembles de donnes suivants:

Masse ( X) 20-24 25-29 30-34 35-39 40-44
Fquence (f ) 4 10 16 8 2
Solution:

= 40 f , donc la mdiane est la moyenne de la 20


e
et de la 21
e
donne
2
21 20 +
=10.5
Dfinition : Les limites de classe suprieures et infrieures
La limite de classe infrieure (LCI) et la limite de classe suprieure (LCS) sont les
limites dun intervalle de classe. Ex. : Les limites infrieures et suprieures dun
intervalle de classe 20-24 sont 19.5 et 20.5 et la LCI ainsi que la LCS dun intervalle
de classe 35-39 sont 34.5 et 39.5.
Masse ( X) 20-24 25-29 30-34 35-39 40-44
Frquence (f ) 4 10 16 8 2
Frquence cumulative 4 4+10=14 14+16=30 30+8=38 39+2 =40
Voici la procdure pour calculer la mdiane :
tape1: La mdiane apparat dans lintervalle de classe 30-34
tape2: La LCI ainsi que la LCS de 30-34 sont 29.5 et 34.5.
tape3: Trouver la frquence cumulative (FC).
tape4:Trouver lintervalle de classe, LCI et LCS.
tape5:Avoir le 10.5
e
terme.
10.5
e
terme = LCI de la classe avec la mdiane + Diffrence de sommation x Intervalle de classe.
Frquence de classe
ur|vers|l v|rlue||e Alr|ca|re 31
La diffrence de sommation 20.5 14 = 6.5 o 14 est la FC de lintervalle de classe
25-29.
tape6: La mdiane 29.5+ 5
16
6.5
=31.53125.
Notez que le dnominateur 16 est la frquence de classe dans lintervalle de classe
30-34.
Ltendue
Ltendue est tout simplement la diffrence entre le chiffre le plus haut et le chiffre
le plus bas dans une suite de donnes.
Exemple : 23, 26, 34, 47, 63, ltendue est 63-23 = 40, et dans 121, 65, 78, 203,
298,174, ltendue est 298-65= 233.
Leon cinq : Les mesures de dispersion
1) Lesquartiles:
Ce sont des donnes places dans un ordre de magnitude qui peuvent tre divises en
quatre portions gales, 25 % chacune. La premire portion est le quartile le plus bas
qui apparat 25 %. Celui du milieu, ou du centre, 50 % est appele la mdiane,
tandis que le troisime quart qui apparat 75 % sappelle le quartile suprieur. Les
trois points sont gnralement crits comme ceci : Q
1
,Q
2
,Q
3.
2) Ltenduesemi-interquartile:
Ltendue semi-interquartile ou la dviation quartile est dfnie comme :

2
1 3
Q Q
Q

=

3) Lesdciles:
Si les donnes sont places dans un ordre de magnitude et divises en 10 portions
gales (10 % chacune), donc chaque portion constitue un dcile. Les dciles sont
crits comme ceci : D
1
,D
2
,D
3
,D
9.
4) Lespercentiles:
Si les donnes sont divises et places dans un ordre de magnitude subdivis en 100
parties gales (1 % chacune), donc la portion constitue un percentile. Les percentiles
sont crits comme ceci : P
1
,P
2
,P
3
,P
99.
7
ur|vers|l v|rlue||e Alr|ca|re 35
Lcart moyen
Lcart moyen dun ensemble de N nombres X
1
,X
2
,X
3
,X
4
,X
5
,,X
N
est dfni
par :
cart moyen (EM) =
N
N
j
X
j
X
=

1
=
N
X X


= X X , o X est la
moyenne arithmtique des nombres et X X est la valeur absolue de la dviation
de X
j
partir de X .
Exemple
Trouvez lcart moyen de la suite 3, 4, 6, 8, 9.
Solution
Moyenne arithmtique = 6
5
30
5
9 8 6 4 3
= =
+ + + +
cart moyen ( X ) =
5
6 9 6 8 6 6 6 4 6 3 + + +
=
5
3 2 0 2 3 + + + +
= 5
2
10
5
3 2 0 2 3
= =
+ + + +
ur|vers|l v|rlue||e Alr|ca|re 3
Lcart moyen dun groupe de donnes
Pour les donnes
Valeurs X
1
X
2
X
3
X
N
Frquences f
1
f
2
f
3
. F
m
Lcart moyen peut tre calcul ainsi :
cart moyen = X X
N
X X f
N
m
j
X
j
X
j
f
=

=

=

1
Lcart-type
Lcart-type dun ensemble de N nombres X
1
,X
2
, X
3
, X
4
, X
5
,, X
N
est reprsent
par s et est dfni par :
s =
N
N
j
X
j
X
=

1
2
) (
=
N
X X


2
) (
=
N
x

2
=
2
) ( X X
o x reprsente la dviation des nombres X
j
de la moyenne X . Il suit que lcart-
type est la variance des dviations de la moyenne.
Lcart-type dun groupe de donnes
Valeurs X
1
X
2
X
3
X
N
Frquences f
1
f
2
f
3
. F
m
Lcart-type est calcul ainsi :
s =
2
) (
2 2
) ( 1
2
) (
X X
N
fx
N
X X f
N
m
j
X X
j
f
=

=

=

=

ur|vers|l v|rlue||e Alr|ca|re 3Z
o N=
=
=
f
m
j
j
f
1
.

La variance
La variance dun ensemble de donnes est dfnie comme le carr de lcart-type :
variance = s
2
. Nous utilisons parfois s pour reprsenter lcart-type dun chantillon
de population et (sigma en lettre grecque) pour reprsenter lcart-type dune po-
pulation. De plus,
2
peut reprsenter la variance dune population et s
2
, la variance
dun chantillon dune population.
Exemples
Trouvez la moyenne et ltendue des donnes suivantes : 5, 5, 4, 4, 4, 2, 2, 2.
Solution
Moyenne = mm
n
N

x =
5 5 4 4 4 4 2 2 2
9
+ + + + + + + +
= 356 .
tendue 5-2=3
Observation de la mdiane
Exemple
Dans 13 observations
1,1,2,3,4,4,5,6,8,10,14,15,17
La mdiane =
n +
= =
1
2
14
2
607
La valeur
2
14
= 7
th
position. La mdiane est 5.
Si n est impair, la mdiane est la valeur dans la position

n + 1
2

Par contre, si elle est paire, nous ferons la moyenne des deux nombres du centre.
ur|vers|l v|rlue||e Alr|ca|re 38
Exemple
1,1,2,2,3,4,4,5,6,8,10,14,15,17
La mdiane = la moyenne des deux nombres du centre =
4 5
2
4 5
+
= .
La mdiane et les groupes de donnes
Lorsque des donnes sont regroupes ensemble, la mdiane
2
est la valeur exacte
ou en dessous de 50 % du point dobservation.
Exercices
Trouvez la mdiane des donnes suivantes.
1. 1,1,2,2,3,4,5,7,7,7,9
2. 7,8,1,1,9,19,11,2,3,4,8
Dfinition
La moyenne de lcart mis au carr est appele la variance :
N
x x
s
h 2
2
) (


=
O :

x x est la dviation de la moyenne, N est le nombre dobservations,


2
s est
la variance et
2
s est lcart type.
Exemple
Les donnes 2, 4, 5, 8, 11 vous sont donnes. Trouvez la variance et lcart type.
X

x x
2
) (

x x
2 -4 16
4 -2 4
5 -1 1
8 2 4
11 5 25

x
=5

2
) (

x x
=50

q
Travaildquipe
1. tudiez le calcul de la va-
riance et de lcart type des
exemples
ur|vers|l v|rlue||e Alr|ca|re 39
Donc, 6
5
30
= =

x 10
5
50
5
2
= =
Variance = 10
5
50
2
= = s
cart type = 10
Exercices
1. Calculez ltendue des donnes : 1,1,1,2,2,3,3,3,4,5
2. Calculez la variance et lcart type : 1,2,3,4,5
Asymtrie
Notons que lorsque la distribution dune variable travers son histogramme est sy-
mtrique, alors les trois caractristiques de tendance centrale, savoir : le mode, la
mdiane et la moyenne de cette variable, sont gaux. Dans le cas unimodal, lorsque
la distribution est asymtrique, la mdiane est gnralement comprise entre le mode
et la moyenne arithmtique : deux cas se prsentent alors :
mode<mdiane<moyenne la distribution est tale vers la droite ;
mode>mdiane>moyenne la distribution est tale vers la gauche.

Dfnition:Lasymtrie est le degr de dviation de la symtrie dune distribution.
(Voir les asymtries positives et ngatives plus haut.)
Pour les distributions asymtriques, la moyenne tend aller dans le mme sens que
celui du mode avec la queue la plus longue.
Le premier coefficient dasymtrie de Pearson
Le premier coeffcient dasymtrie est dfni par :
Asymtrie =

moyenne mode
cart type
=
X mode
s
Le deuxime coefficient dasymtrie de Pearson
Le second coeffcient de Pearson est dfni par :
Asymtrie =

3(moyenne(X ) mdiane(X ))
cart type(X )
=
3(X mediane(X ))
s
ur|vers|l v|rlue||e Alr|ca|re 10
Coefficient quartile dasymtrie
Il est dfni comme par :
Coeffcient quartile dasymtrie =
1 3
1 2
2
3
1 3
)
1 2
( )
2 3
(
Q Q
Q Q Q
Q Q
Q Q Q Q

+
=


Lasymtrie 10-90 percentile
Elle est dfnie comme ceci :
Asymtrie 10-90 percentile =
10 90
10 50
2
90
10 90
)
10 50
( )
50 90
(
P P
P P P
P P
P P P P

+
=


Exemple:Trouvez le 25
e
percentile des donnes 1, 2, 3, 4, 5, 6, 7, 9
25
e
percentile =

(n+1)x0.25
9(.25) = 22.5(centile)
2
e
= 2
3
e
= 3 25 . 2 2 ) 1 ( 25 . 0 25 . 2 = +
Trouvez le 50
e
percentile
50
e
percentile =
percentile x 5 . 4 ) 5 (. 9 50 . ) 1 8 ( = = +
4
e
= 4
5
e
= 5 5 . 4 4 5 . 0 ) 5 ( 5 . 0 = + =
Le (1) est ltendue 5-4=1.
q
Travaildquipe
1. tudiez le calcul des percen-
tiles et tentez de rpondre
la prochaine question
suivants.
ur|vers|l v|rlue||e Alr|ca|re 11
Exercices
Trouvez le 25
e
percentile, le 50
e
percentile et le 90
e
percentile.
46,21,89,42,35,36,67,53,42,75,42,75,47,85,40,73,48,32,41,20,75,48,48,32,52,61,49
,50,69,59,30,40,31,25,43,52,62,50
Rponses
a) 36 b) 48 c) 73
Kurtosis ou le coefficient daplatissement
Dfnition : Le kurtosis est le degr daplatissement dune distribution, compar
la distribution normale.
Exemples
1) Distribution leptokurtique ou hypernormale :

Une distribution avec un sommet plutt lev
2) Distribution platicurtique ou hyponormale :

Une distribution ayant un sommet plat
ur|vers|l v|rlue||e Alr|ca|re 12
3) Distribution msocurtique

Une distribution normale ni leve, ni plate
Exercices
Trouvez le mode des collectes de donnes suivantes :
1) 1,3,4,4,2,3,5,1,3,3,5,4,2,2,2,3,3,4,4,5
2) Nombre de mariages pour 1000 personnes dans la population africaine pour les
annes 1965 1975.
Anne Taux
1965 9.3
1966 9.5
1967 9.7
1968 10.4
1969 10.6
1970 10.6
1971 10.6
1972 10.9
1973 10.8
1974 10.5
1975 10.0
3) Nombre de morts pour 1000 personnes pour les annes 1960 et 1965 1975.
1960 9.5
1965 9.4
1966 9.5
1967 9.4
ur|vers|l v|rlue||e Alr|ca|re 13
1968 9.7
1969 9.5
1970 9.5
1971 9.3
1972 9.4
1973 9.3
1974 9.1
1975 8.8
Rponses
1. 3
2. 10.6
3. 9.5
lire
An introduction to probability par Charles M. Grinstead, pages 247 263.
Faire les exercices des pages 263 267, numros 4, 7, 8, 9.
Probabilits
1) Univers des possibles (ou Espace dchantillon) et vnements
Terminologies
a) Uneexpriencedeprobabilits
Lorsque vous lancez une pice de monnaie, lorsque vous prenez une carte dans un
paquet de cartes ou lorsque vous lancez un d, vous faites une exprience de proba-
bilits. Dans une exprience de probabilits, les chances sont bien dfnies avec des
chances gales doccurrence il y a seulement deux chances possibles lorsque vous
lancez une pice de monnaie. Vous aurez soit pile, soit face. Le ct face et le ct
pile ont des chances gales.
b) Unrsultat
Il est dfni comme le rsultat dun seul essai dune exprience de probabilits
lorsque vous lancez une pice de monnaie une seule fois, vous aurez soit pile, soit
face.
ur|vers|l v|rlue||e Alr|ca|re 11
c) Unessai
Il se rfre lactivit de faire une exprience, comme tirer une carte dun paquet de
cartes ou bien de lancer des ds.
d) UnUniversdespossibles
Il se rfre toutes les possibilits dune exprience de probabilits lorsque vous
lancez une pice de monnaie, vous obtiendrez soit face (F), soit pile (P). Il ny a
que deux rsultats possibles lorsque vous lancez une pice de monnaie. Les chances
dobtenir pile ou face sont gales.
e) Unvnementsimpleetunvnementcompos
Dans une exprience de probabilits, un vnement avec une seule possibilit de
rsultat est appel un vnement simple. Si un vnement a plus de deux possibilits,
il est appel vnement compos.
2) Dfinition des probabilits
Les probabilits peuvent tre dfnies comme les mathmatiques de la chance. Il y a
quatre approches principales aux probabilits;
i. Lapproche classique ou a priori ou approche pascalienne
ii. La frquence relative ou lapproche exprimentale : lapproche frquentiste
iii. Lapproche axiomatique
iv. Lapproche subjective (ou approche personnaliste)
Lapproche classique ou a priori
Les probabilits sont le ratio du nombre de cas favorables compar au total de cas
possibles. Ctait la conception originelle des probabilits initie le physicien ma-
thmaticien Pascal vers lan 1654 dans le contexte de loterie base sur un jeu de
hasard. Cette ide fut poursuivie par Fermat, contemporain de Pascal. Imaginez quun
vnement se produit N fois sur un total M de manires possibles. La probabilit
doccurrence de lvnement est dsigne par :
p=Pr(N)=
M
N
. La probabilit se rfre au rapport de rsultats favorables sur tous les
rsultats possibles.
La probabilit de non-occurrence du mme vnement est donne par (1-p(occurrence)).
La probabilit doccurrence plus celle de la non-occurrence est gale un.
Si la probabilit doccurrence est P(O) et la probabilit de non-occurrence P(O
c
),
alors P(O)+P(O
c
)=1.
ur|vers|l v|rlue||e Alr|ca|re 15
Les probabilits exprimentales : les frquences relatives
Les probabilits exprimentales surviennent lorsque la frquence des distributions
nest pas utilise. On sintresse un vnement A attach une exprience; on pro-
cde un nombre assez lev n de rptitions de ladite exprience dans les mmes
conditions et indpendamment les unes des autres : la probabilit de lvnement A
est dfnie comme la limite de sa frquence relative lorsque n tend vers plus linfnie,
soit :
P(A) =

n
limFrquence(A)
+
Ainsi, dans la pratique on interprte une frquence relative comme une probabilit,
approximativement au moins : Frquence(A) @ P(A).
Exemple :
Observation ( X) 0 1 2 3 4
Frquence ( f ) 3 7 10 16 11
La probabilit dobservation (X) qui apparat 2 fois est donne par la formule :
P(2)=

frquencede 2
sommedes frquences
=
f (2)
f
=
10
3+ 7+10+16+11
=
10
47
Lapproche axiomatique
Gense des probabilits. Sur le plan historique, de lanne 1663 jusquen 1933,
notons que les probabilits constituaient une discipline des sciences physiques,
vraisemblablement parce que la majorit des promoteurs du calcul des probabilits
furent plutt des physiciens comme Pascal, Fermat, Huyghens, Bernoulli(vers 1700),
Gauss (1809), Laplace(1812), etc. Il a fallu attendre les travaux du mathmaticien
russe N. Kolmogorov publis en 1933 qui a dmontr la possibilit dune approche
axiomatique des probabilits, y compris le concept dfe probabilit conditionnelle,
pour que celles soient enfn acceptes dintgrer les domaines des sciences math-
matiques. En 1955 et 1956, A. RENYI dmontra dans thorie despace de probabilit
conditionnelle,la possibilit de gnraliser laxiome de Kolmogorov. Ensuite, rcem-
ment, Sylvia Pulmannova (1991), dans les algbres de Von Neumann, a construit une
gnralisation de laxiomatique de A. RENYI. Tout ceci montre un rapide essor de la
thorie de probabilit partir du moment o lon sest aperu que toute probabilit
peut tre considre comme probabilit conditionnelle. Sil a fallu ainsi presque
trois sicles (de 1663 1933) pour dcouvrir cette approche axiomatique, le concept
de probabilit tant alors dgag la fois du contexte numrique, de la chronologie
et de la causalit, ce grand bond en avant na demand que quelques dizaines dan-
nes. Cependant, lemploi des mots de Formule et Loi demeurent toujours jusqu
ur|vers|l v|rlue||e Alr|ca|re 1
aujourdhui : cest une trace indlbile de lorigine physicienne des probabilits!
Il est heureux dapprcier par la suite limpact positif de cette reconnaissance du
statut de discipline mathmatique des probabilits sur lavancement notable des
mathmatiques et surtout celui de linformatique, laquelle sest avre un moteur de
la nouvelle technologie de linformation et de communication de notre re moderne.
Ceci amne penser que trop sattacher au contexte numrique ou exprimental pour
introduire les probabilits, et attacher trop de chronologie ou de causalit la notion
de probabilit conditionnelle, seraient des sources dobstacles pistmologiques dans
la comprhension des concepts de probabilit et de probabilit conditionnelle.
AxiomesdeKolmogorovetdfnition. On considre un ensemble non vide E des
rsultats possibles dune exprience et une famille T des parties de E qui contient
E lui-mme et la fois stable par complmentation et par runion dnombrable,
famille appele une tribu sur E. Alors le couple (E, T) porte le nom despace proba-
bilisable.
On appelle probabilit dfnie sur lespace probabilisable (E, T), toute application
de type P dfnie sur la tribu T valeurs relles positives et qui satisfait aux deux
proprits suivantes :
(i) Axiome de normalisation : P(E) = 1.
(ii) Axiome dadditivit dnombrable :
Pour toute suite (A
n
)
n
dvnements dans T, deux deux incompatibles, on a :
P(

n
A
n=0
+
U ) =

p(
n
A
)
n=0
+
.
Terminologies: Soit P une probabilit dfnie sur un espace probabilisable (E, T).
On dit alors que (E, T, P) est un espace probabilis. Pour tout vnement A de T, le
nombre P(A) est la probabilit pour que lvnement se ralise, ou la probabilit de
lvnement A.
Interprtation: Il y aurait 100P(A) % de chance pour que lvnement A se pro-
duise.
ur|vers|l v|rlue||e Alr|ca|re 1Z
3) Les proprits des probabilits.
Soit (E, T, P) un espace probabilis. On dmontre facilement les proprits suivan-
tes.
a) La probabilit de lvnement impossible est nulle : P(f) = 0.
La probabilit dun vnement qui va certainement arriver est 1.
Terminologies : Un vnement de probabilit nulle est dit un vnement pres-
que impossible. Celui de probabilit gale 1 est dit un vnement presque
sr ou presque certain.
b) P est une application croissante :
Pour tous vnements A, B de T, si A B, alors P(A) P(B).
c) La probabilit de nimporte quel vnement se trouve entre 0 et 1. Une pro-
babilit ne peut pas tre ngative, pas plus quelle ne peut tre plus grande
que 1.
d) Formule de passage lvnement contraire : Pour tout vnement A, on a :
P(A) = 1 P(

A). Cette formule est trs pratique, pour calculer P(A), alors que
son contraire apparat plus maniable.
e) Additivit simple : si deux vnements A et B sont incompatibles, alors :
P(A ou B) = P(AB) = P(A)+P(B).
f) La somme totale des probabilits de tous les rsultats possibles dans un espace
dchantillon est toujours gale un (1).
g) Formule des probabilits totales : pour tous vnements A et B, on a :
P(A ou B) = P(A) + P(B) P(A et B).
h) Casparticulier dunivers fni et dhypothse dquiprobabilit dvnements
lmentaires : si E = {e
1
, e
2
,, e
n
} tel que pour tout i, on a P() = p, alors pour
tout vnement A de T,
P(A) =

card(A)
Card(E )
=
Nombre de cas favorables A
Nombre de cas possibles
.
Ce dernier cas, exige une matrise de lanalyse combinatoire pour assurer le nombre
des cas favorables et celui des cas possibles.
Remarque: voici quelques locutions signifant une hypothse dquiprobabilit
dvnements lmentaires : tirage au hasard, pice parfaitement symtrique, d
homogne, boules identiques et indiscernables au toucher, etc.
ur|vers|l v|rlue||e Alr|ca|re 18
Rglesdecomptage.On dispose de deux rgles de comptage :
(ii) La rgle daddition: Si A et B sont deux ensembles fnis non vides, alors
Cardinal(A ou B) = Card(A)+Card(B) : le nombre de faons de prendre un l-
ment de A ou un lment de B est gal la somme du nombre dlments de A et
celui de B.
Soit, ou ayant le sens de ou bien donne laddition pour le comptage.
(iii)La rgle de multiplication: Si A et B sont deux ensembles fnis, alors le
nombre dlments de leur produit cartsien A x B est gal au produits de leurs
cardinaux :
Card(AxB) = Card(A) x Card(B).
Ainsi, sil y a Card(A) faons de prendre un lment de A et Card(B) faons de choisir
un lment de B, alors il y a Card(A) x Card(B) faons de choisir un lment de A
et un lment de B.
Soit, le et donne la multiplication.
Toutes les formules classiques de dnombrement, rappels ci-dessous, se dduisent
de ces deux rgles de comptage.
1) NombredepermutationsetFactorielle
Une permutation de n objets o
1
, o
2
, , o
n
est une bijection de lensemble { o
1
,
o
2
, , o
n
} sur lui-mme. Il sagit ici des permutations sans rptition.
Le nombre de permutations de n objets est : factorielle(n) = n!=n x (n-1) x
x 3x2x1.
Exemple : Factorielle(4) = 4 ! =4x3x2x1et7! =7x6x5x4x3x2x1
2) Nombredepermutationsavecrptition
Le nombre dapplications dun ensemble n objets vers un ensemble m lments
est gal la puissance m
n
.
3) Rglesdarrangements
Le nombre darrangements de n objets r par r, avec considration dordre,
est :

n
A
r
=
! ) (
!
r n
n

ur|vers|l v|rlue||e Alr|ca|re 19


Exemples

5
P
3 = 60 3 4 5
1 2
1 2 3 4 5
)! 3 5 (
! 5
= = =

x x
x
x x x x

8
P
5
= 6720 4 5 6 7 8
1 2 3
1 2 3 4 5 6 7 8
! 3
! 8
)! 5 8 (
! 8
= = = =

x x x x
x x
x x x x x x x
4) Combinaisons
Le nombre de combinaisons de n objets pris r r, sans considration dordre,
est :
n
C
r
=

n !
(n r ) ! r !
Exemples

5
C
2
= 10
1 2
4 5
! 2 ! 3
1 2 3 4 5
! 2 )! 2 5 (
! 5
= = =
x
x x x x x

10
C
6
= 210
1 2 3 4
7 8 9 10
! 6 21 3 4
! 6 7 8 9 10
! 6 ! 4
! 10
! 6 )! 6 10 (
! 10
= = = =
x x x
x x x
x x x
x x x x
Exercices
Trouvez la solution pour :
1)
8
P
3
2)
8
C
3
3)
15
C
10
4)
6
C
3
5)
15
P
4
6)
9
C
3
7)
10
C
8
8)
7
P
4
Rponses
1) 336 2) 56 3) 3003 4) 20
5) 32 760 6) 84 7) 90 8) 840
ur|vers|l v|rlue||e Alr|ca|re 50
Probabilit conditionnelle :
Thormeetdfnition: tant donn un espace probabilis (E, T, P), et un vnement
ralisable B, lapplication note P
B
dfnie sur T par :
T R:A P
B
(A)=

P(A et B)
P(B)
est une probabilit sur (E, T).
Par dfnition, cette probabilit P
B
est appele la probabilit conditionnelle sachant
B, ou probabilit conditionnelle tant donn lvnement B, et pour tout vnement
A de T, P
B
(A) est la probabilit conditionnelle sachant B de lvnement A.
Remarque: Psychologiquement, des rsultats de la recherche en didactique ont mon-
tr que la notation indicielle P
B
(A) est plus congruente sur le plan de la smantique
et moins ambigu que la notation traditionnelle P(A/B) ou P(A si B) , linstar de la
notation log
b
(x) pour le logarithme de base b de x , et celui des suites de fonctions
U
n
(x) prononc u- n- de- x .
Indpendanceetdpendancestatistiques: Pour deux vnements non impossibles,
cest--dire ralisables, A et B, des trois choses lune :
soit P
A
(B) = P(B) : alors lvnement B est statistiquement indpendant de
lvnement A ;
soit P
A
(B) > P(B) : alors lvnement B est statistiquement positivement d-
pendant de lvnement A ; on dit que A favorise B ;
soit P
A
(B) < P(B) : alors lvnement B est statistiquement ngativement
dpendant de lvnement A ; on dit que A dfavorise B.
Nota Bene: La notion dindpendance statistique est visiblement symtrique. De
mme les notions de dpendance positive et de dpendance ngative sont symtriques,
certes, mais dans les deux cas le degr de dpendance de B par rapport A nest pas
ncessairement gal celui de dpendance de A par rapport B. Aussi, savre-t-
il important de trouver un indice qui puisse rendre compte de lun ou lautre type
dindpendance statistique. Lindice not M
GK ,
dfni ci-dessous, rpond justement
une telle attente :
M
GK
(A, B) =

P
A
(B) P(B)
1 P(B)
, si A favorise B;
P
A
(B) P(B)
P(B)
, si A dfavorise B;

Il est ais de montrer que -1 M


GK
(A, B) 1, et que M
GK
(B, A) M
GK
(A, B).
ur|vers|l v|rlue||e Alr|ca|re 51
Par ailleurs, la diffrence Delta(A, B)=P(A et B) - P(A)P(B) mesure lcart lind-
pendance des deux vnements A et B. Il est facile de vrifer que Delta(A, B) > 0,
si et seulement si A et B se favorisent lun lautre, sans prcision sur lequel parmi A
et B aurait plus dinfuence sur lautre. Cependant, M
GK
(A, B) > 0 et M
GK
(A, B) >
M
GK
(B, A) impliquent que A et B se favorisent, et B dpend plus de A que A dpend
de B. En fait, cet indice savre trs effcace pour dtecter les associations orientes
apprciables qui existeraient entre des variables ou groupes des variables dans une
donne qualitative mme volume trs lev. Pour en savoir plus, notamment sur
ses proprits mathmatiques et ses relations avec dautres mesures de dpendance
statistique, il est conseill de lire les articles proposs ci-dessous.
Rfrences (certaines sont tlchargeables sur Google) :
a- Sur une tude didactique du concept de probabilit conditionnelle :
R. Gras & A. Totohasina (1995), Chronologie et causalit, conceptions sources
dobstacles pistmologiques la notion de probabilit conditionnelle, in revue Re-
cherche en Didactique des Mathmatiques, Vol.15, n1, La Pense Sauvage (dts),
Grenoble, France, 1995, 49-95.
b- Sur ltude de dpendance statistique partir des donnes qualitatives :
Totohasina A., Feno D. R.(2008), De la qualit des rgles dassociation:
Etude comparative des mesures M
GK
et Confance (8 pages), Proc. of the 9th African
Conference on research in Computer Science and Applied Mathematics(CARI08),
october 27-30, 2008, p. 561568.
Feno D, Diatta J., Totohasina A.(2007), Une base pour les rgles dassociation va-
lides au sens de la mesure de qualit M
GK
, in Revue de la Nouvelle Technologie de
lInformation, RNTI, issue spciale de SFC2006, version longue, 11 pages.
Feno D., Diatta J., Totohasina A.(2007), Galois lattices and Bases for M
GK
-valid asso-
ciation rules, Revisited version, in Lecture Note in Computer Science, Belohlavek \&
al editors, Book special issue of CLA 2006: Concept Lattices and their Applications,
LNCS Vol. 4923, pp. 186--197, march 2008.
Totohasina A., Ralambondrainy H. (2005), ION: a pertinent new measure for mining
information from many types of data, proceedings of The 2005 International Confer-
ence on Signal-Image Technology & Internet- Based Systems (SITIS05), November
27th - December 2nd 2005, The Hilton Hotel, Yaound\e, Cameroon, 202-207.
ur|vers|l v|rlue||e Alr|ca|re 52
Rgles des probabilits
1) Rgle#1:Additivitsimple : Lorsque deux vnements A et B sont mutuelle-
ment exclusifs, cest--dire incompatibles, alors P(A ou B)=P(A)+P(B).
Exemple: Lorsque A est lanc, trouvez la probabilit davoir 3 ou 5.
Solution:P(3) =1/6 and P(5) =1/6.
Donc, P( 3 or 5) = P(3) + P(5) = 1/6+1/6 =2/6=1/3.
2) Rgles#2:Formuledesprobabilitstotales. Si A et B sont deux vnements
qui ne sont pas mutuellement exclusifs, alors P(A or B) = P(A) + P(B) - P(A
et B), o A et B sont le nombre de rsultats que les vnements A et B ont en
commun.
Exemple: Lorsquune carte est tire dans un paquet de 52 cartes, trouvez la proba-
bilit que la carte soit un 10 ou un cur.
Solution:
P( 10) = 4/52 et P( coeur)=13/52
P ( 10 de coeur) = 1/52
P( A ou B) = P(A) +P(B)-P( A et B) = 4/52 _ 13/52 1/52 = 16/52.
Rgles de multiplication des probabilits
1) Rgle#1: Pour deux vnements indpendants A et B, alors :
P(A et B) = P(A) x P(B).
Exemple:Dterminez la probabilit dobtenir un 5 sur un d et le ct pile dune
pice de monnaie en un seul lancer.
Solution:P(5) = 1/6 et P(Pile) = .
P(5 et Pile)= P(5)xP(Pile)= 1/6 x = 1/12.
2) Rgle#2:Formuledesprobabilitscomposespourdesvnementsdpen-
dants.
Lorsque deux vnements sont dpendants, la probabilit que les deux vnements
se produisent est :
P(A et B) = P(A) x P(B|A), o P(B|A) est la probabilit que lvnement B se produise
en tenant pour acquis que lvnement A se soit dj produit : cest la probabilit
conditionnelle sachant lvnement A de lvnement B. Dans ce cas, A est lvne-
ment conditionnant, B lvnement conditionn.
ur|vers|l v|rlue||e Alr|ca|re 53
On emploie aussi la notation indicielle moins quivoque : P
A
(B) =P(B/A).
Reprsentationarborescentedelaformuledesprobabilitscomposes:
P(A) P
A
(B)
A B ==> P(AB) = P
A
(B)xP(A)
Univers Conditionnant Conditionn
Exemple: Trouvez la probabilit dobtenir deux As dans un paquet de 52 cartes
sans remplacement.
Solution: P(as)= 2/52 et P(deuxime as sans remplacement)= 3/51
Donc, P(as et as) = P(as) x P(deuxime as) = 4/52 x 3/51 = 1/221
Exemple:Lorsquun d est lanc une fois, trouvez la probabilit davoir un 4, en
prenant compte quun nombre gal sest produit dans un lancer prcdent.
Solution:P(4 et le nombre gal) = 1/6. P(A et B)= 1/6. P(nombre gal)= 3/6 = .
P( A|B) =

P(A et B)
P(B)
=
1
6
1
2
=
1
3
Autres exemples
1) Un sac contient 3 billes orange, 3 jaunes et 2 blanches. Trois billes sont slec-
tionnes sans remplacement. Trouvez la probabilit de slectionner deux billes
jaunes et une blanche.
Solution:P( 1er Y) =3/8, P( 2e Y) = 2/7 et P( W)= 2/6
P(Y et Y et W)=P(Y) x P(Y) x P(W) = 3/8 x 2/7 x 2/6 = 1 / 28
2) Dans une classe, il y a 8 flles et 6 garons. Si trois lves sont slectionnes au
hasard pour faire un dbat, trouvez la probabilit que ce soit uniquement des
flles.
Solution:P( G) =8/14 et P(B) =6/14. P( 1
st
G)=8/14, P(2
nd
G) 7/13 et P(3
rd
G)=
6/12.
P( trois flles) 8/14 x 7/13 x 6/12= 2/13
ur|vers|l v|rlue||e Alr|ca|re 51
3) En combien de faons est-ce que des reprsentants peuvent tre slectionns
dun groupe de 8 membres?
Solution::
8
C
3
= 56 faons
4) Une bote a 12 bulbes dans laquelle 3 sont dfectueux. Si 4 bulbes sont vendus,
trouvez la probabilit quun soit dfectueux.
Solution:
3
C
1
x
9
C
3
= =
! 3 )! 3 9 (
! 9
! 1 )! 1 3 (
! 3
x 252
P( 4 bulbes sur 12) =
12
C
4
= 495.
P( 1 bulbe dfectueux et 3 bulbes parfaits) = 295/495=0.509.
3. Rgle #3: La formule des probabilits dhypothses ou probabilits des
causes:lethormedeBays.
On considre un systme complet dvnements H
1
, H
2
, , H
k
de lunivers des
possibles :
H
1
H
2
H
k
= et Hi et Hj sont incompatibles pour i j. On considre un vne-
ment ralisable A de la tribu t tel que les k probabilits conditionnelles P
Hi
(A) sont
connues ainsi que les probabilits P(H
i
), alors pour tout ik, on a :
P
A
(H
i
) =

Hi
P
(A) P(
i
H
)
Hj
P
(A) P(
j
H
)
j =1
k

Dessiner larbredirect des probabilits permettant de voir simultanment toutes ces


k probabilits conditionnelles sachant lvnement A, en gnralisant la reprsentation
graphique de la Rgle#2ci-dessus (il vous sufft de complter la fgure ci-dessous) :
larbre pondr ainsi obtenu sappelle larbre inverse des probabilits, par opposition
larbre direct des probabilits qui correspond la transcription directe des donnes du
problme de Bays. Sur le plan didactique et en pdagogie, il est recommand dinitier
les apprenants la construction de larbre direct des probabilits dans sa dmarche
de rsolution dun problme de mettant en jeu les probabilits conditionnelles.
ur|vers|l v|rlue||e Alr|ca|re 55
P
H1
(A) A P(AH
1
) = P
H1
(A) x P(H
1
)
H
1
P(H
1
) A
P(H
2
) P
H2
(A) A P(AH
2
) = ?
H
2

P(H
k
) A
A
H
k
P
Hk
(A) A P(AH
k
) = ?
Arbre direct des probabilits P(A) = ?
Arbre direct des probabilits
Exercices
1) En combien de faons est-ce que 7 robes peuvent tre places en ligne sur une
tagre?
2) En combien de faons est-ce que 3 stylos peuvent tre slectionns dans un
ensemble de 12 stylos?
3) Dans un paquet de 52 cartes, 3 cartes sont slectionnes. Quelle est la probabilit
davoir uniquement des carreaux?
4) Contrledeperformancedesusines. Trois usines fournissent respectivement
25%, 35%, 40% des carreaux de faence ncessaires une entreprise de construc-
tion. Dans leurs livraisons, il y a respectivement en moyenne 5, 4, et 2% de
carreaux inutilisables. Un carreau est choisi au hasard dans un stock important,
ce carreau est dfectueux.
a- Quel est lunivers des possibles?
b- Donner larbre direct des probabilits qui transcrit cette situation problme.
c- Quelle est la probabilit quun carreau tir soit dfectueux?
d- Quelle est la probabilit que le carreau dfectueux tir provienne de lusine
A? B?C?
e- En dduire lidentifcation de lusine la plus performante en terme de la qualit
de production.
5) Contrle des pices et qualit dun test. Des pices mcaniques sont fabri-
ques en grande srie. On effectue un test sur chacune delles pour en contrler
la qualit. On appelle p la probabilit pour quune pice choisie au hasard soit
bonne, a la probabilit pour que le test indique comme bonne une pice qui est
ur|vers|l v|rlue||e Alr|ca|re 5
effectivement bonne, b la probabilit pour que le test indique comme bonne une
pice qui est en ralit mauvaise.
(i) Quel est lunivers des possibles en question?
(ii) Donner larbre direct des probabilits qui transcrit cette situation problme.
(iii) Calculer la probabilit pour quune pice indique, comme bonne par le test
soit effectivement bonne.
(iv) Un test est utile lorsque la probabilit pour quune pice indique, comme
bonne par le test soit effectivement bonne, est suprieure p. quelle condi-
tion le test est-il utile?
Rponses
1) 5040
2) 220
3) 0.013
4) Valeurs approches des probabilits : c) 0,345; d) 0, 36; 0, 41; 0, 23. e) C.
5) Pour la modlisation mathmatique, on prendra soin de noter les trois vne-
ments stratgiques ici : la pice est bonne , la pice est mauvaise , le
test indique que la pice est bonne . (iii)

pa
pa+(1 p)b
;(iv)

pa
pa+(1 p)b
>
p a>b.
lire
An Introduction to Probability & Random Processes par Kennet B & Gian-Carlo R,
pages
1. 1.20-1.22: Exercise Chapter 1: Sets, Events & Probability, pages 1.23-1.28,
numerous 1-12 & 14-20.
2. 2.1-2.33: Exercise Chapter 2: Finite Processes, pages 2.33, numros 1,2,3,13-
20,22-27.
3. Introduction to Probability, par Charles M. Grinstead, pages 139-141
ur|vers|l v|rlue||e Alr|ca|re 5Z
Variables alatoires (v.a)
Dfnitionintuitive:Une variable alatoire est une fonction qui assigne un nombre
rel tous les rsultats possibles dune exprience alatoire.
(Harry Frank & Steve C. Althoen, CUP, 1994, page 155)
Une variable alatoire est une variable dans le sens quelle peut tre utilise comme
signet pour un nombre dans des quations et des ingalits. Son caractre alatoire
est compltement dcrit par sa fonction de rpartition ou sa densit de probabilit
qui peuvent tre utilises pour dterminer la probabilit dobtenir certaines valeurs
particulires.
Dfnition plus formelle: Formellement, une variable alatoire est une fonction
mesurable dun espace de probabilit vers lensemble des nombres rels.
Par exemple, une variable alatoire peut tre utilise pour dcrire le processus de
rouler un d ainsi que les rsultats possibles (1, 2, 3, 4, 5, 6). La reprsentation la
plus vidente est de prendre cet ensemble comme cart-type, la mesure de probabilit
comme mesure uniforme et la fonction comme fonction didentit.
Variable alatoire
Quelques personnes considrent lexpression variable alatoire comme une fausse
appellation, puisquune variable alatoire nest pas une variable, mais plutt une
fonction qui dirige les rsultats (dune exprience) aux nombres. Soit A une -algbre
(ou tribu des parties) sur lespace de rsultats utiles dans une exprience.
Dans lexemple de lancer un d, lespace de rsultats est lensemble = { 1, 2, 3,
4, 5, 6 }, et A serait la famille des parties de . Dans ce cas, une variable alatoire
approprie peut tre la fonction didentit X() = . Si le rsultat est 1, alors la
variable alatoire est aussi gale 1. Un exemple semblable pourrait tre lorsque
vous lancez une pice de monnaie, lespace de rsultats possible est = { P, F }
(pour pile et face), et A est gal encore la famille des parties de . Une parmi les
plusieurs variables alatoires dfnies dans cet espace est

o H = Face, T = Pile.
Mathmatiquement, une variable alatoire est dfnie comme une fonction mesurable
dun espace probabilisable vers un autre espace mesurable.
ur|vers|l v|rlue||e Alr|ca|re 58
Convergence des variables alatoires
Dans la thorie des probabilits, il y a plusieurs notions de convergence pour une
suite de variables alatoires. Certaines dentre elles, les plus usuelles, sont donnes
ci-dessous en ordre croissant de force nimporte quelle notion de convergence dans
la liste implique la convergence selon toutes les notions prcdentes.
Dfinitions :
Laconvergenceenloi: Comme son nom lexplique, une suite de variables ala-
toires converge en loi vers la variable alatoire , si la suite de
ses fonctions de rpartitions respectives F
1
, F
2
, ,, converge simplement vers la
fonction de rpartition de , lorsque est continue.

La convergence en probabilit ou convergence faible: La suite de variables


alatoires X
1
, X
2
, , converge en probabilit vers la variable alatoire , si
pour tout > 0. La convergence en probabilit
est aussi appele la convergence faible.

Laconvergencepresquesreouconvergenceforte: La suite de variables ala-
toires converge presque srement vers la variable alatoire , si
Intuitivement, la convergence presque sre est plus forte que la convergence faible, et
dans les deux cas, les variables alatoires montrent une corrlation
en hausse avec . Dans le cas dune convergence en loi, les valeurs ralises des
variables alatoires nont pas besoin de converger, et nimporte quelle corrlation
possible parmi elles est immatrielle.
Laloidesgrandsnombres:Si une pice de monnaie est lance, nous savons plus
ou moins que la moiti du temps, elle tombera du ct face, et que lautre moiti du
temps, elle tombera du ct pile. Il semblerait aussi que le plus de fois nous le lan-
ons, le plus de chances nous aurions un ratio [face : pile] qui approcherait de [1 :1].
Les probabilits modernes nous permettent darriver au mme rsultat. Ce rsultat
est remarquable puisquil nest pas assum nulle part quen construisant la thorie
et est compltement une ramifcation de la thorie.
La loifortedesgrandsnombres(LFGN) affrme que si un vnement de proba-
bilit p est observ rptition pendant des expriences indpendantes, le ratio des
frquences observes de lvnement du nombre total de rptitions convergeant
presque srement vers p.
ur|vers|l v|rlue||e Alr|ca|re 59
En dautres mots, si sont des variables alatoires indpendantes de
Bernoulli qui prennent la valeur 1 avec la probabilit p et la valeur 0 avec la pro-
babilit 1-p, alors la suite de nombres variables

i
X
i =1
n

n
converge vers p presque
srement :
Ex. :
Thorme central limite (TCL)
Le thormecentrallimite est la justifcation de lomniprsence de la distribution
normale dans la nature ; il fait que les probabilits nourrissent les statistiques.
Le thorme affrme que la suite des moyennes de plusieurs variables alatoires
indpendantes et identiquement distribues tend vers une distribution normale sans
tenir compte de la distribution initiale de la variable alatoire. Offciellement, soit
une suite X
1
, X
2
, , des variables alatoires indpendantes de moyennes respectives
, et les variances respectives , alors la suite de variables
alatoires

convergent dans la distribution normale centre rduite.
Les fonctions des variables alatoires
Si nous avons une variable alatoire X sur et une fonction mesurable f : R R,
alors Y = f(X) sera aussi une variable alatoire sur , puisque la composition des
fonctions mesurables est aussi mesurable. La mme procdure qui a permis une
variable alatoire daller dun espace de probabilit (, P) vers (R, dF
X
) peut tre
utilise pour obtenir la distribution de Y. La fonction de rpartition de Y est :

Exemple
Soit X une variable alatoire relle, une variable alatoire continue, et soit Y = X
2.
.
Alors :

Si y< 0, alors P(X
2
y) = 0,
ur|vers|l v|rlue||e Alr|ca|re 0
Donc F
Y
(y) = 0, si y<0.
Si y 0, alors

Donc

Y(y)=
X
F
F
( y )
X
F
( y ), si y 0.
Les distributions de probabilits
Certaines variables alatoires se produisent trs souvent dans la thorie des probabi-
lits cause de plusieurs processus naturels et physiques. Leurs distributions gagnent
donc une importance spciale dans la thorie des probabilits. Quelques distributions
discrtes fondamentales sont les lois discrtes uniformes, lois de Bernoulli, les lois
binomiales, les lois binomiales ngatives, les lois de Poisson et lois gomtriques. Les
distributions continues importantes incluent les distributions continues et uniformes,
normales, exponentielles, gamma, beta, Khi-carr, Stuident, Fisher, Weibull, Erlang,
etc. Elles sont utilises dans divers domaines dont la modlisation stochastiques,
comme en fabilit dun systme dorganes, en conomtrie, etc.
Les fonctions de distributions
Si une variable alatoire est dfnie sur lespace de probabilit
(,A,P) donn, nous pouvons poser la question suivante : Comment est-ce que la
valeur de X peut tre plus grande que 2? , ce qui signife quelle est la probabilit de
lvnement , qui est souvent crite simplement sous
la forme P(X> 2)?
On enregistre toutes les valeurs possibles atteintes par une variable alatoire X :
elles forment lunivers-image X() de X. Ds lors, on oublie lunivers initial
des possibles . On sintresse directement la distribution des probabilits de ces
diffrentes valeurs de la variable alatoire X : on identife ainsi la loi de probabilit
de X. Une telle distribution de probabilits peut toujours tre saisie par sa fonction
de rpartition , et lon peut parfois utiliser la fonction
drive F
X
= f
X
, dite la densit de probabilit de X. Dans ce dernier cas, la densit
de probabilit reprsente la loi de probabilit de la variable alatoire X tudie.
ur|vers|l v|rlue||e Alr|ca|re 1
La thorie des probabilits discrtes
Lathoriedesprobabilitsdiscrtes cerne les vnements qui se produisent dans
un espace des rsultats possibles travers une tribu de ses parties.
Exemples: En lanant des ds, en faisant des expriences avec un jeu de cartes, ou
avec une marche alatoire.
Dfnitionclassique: Initialement, la probabilit quun vnement se produise tait
dfnie par le rapport du nombre de cas favorables la ralisation de lvnement sur
le nombre des toutes les cas possibles.
Par exemple, si lvnement est la frquence davoir un nombre pair lorsquun d est
lanc , la probabilit sera,

3
6
=
1
2
, puisque 3 faces sur 6 sont des chiffres pairs.
Dfnitionmoderne:La dfnition moderne commence avec un ensemble appel
lunivers des possibles, qui se rfre lensemble de tous les rsultats possibles dans
un sens classique, dsign par . On assume alors que pour
chaque lment , une valeur de probabilit intrinsque est attache.
Ce qui satisfait les proprits suivantes :
1.

f (x) [0, 1], pour tout x .


2.

f (x)
x
= 1.
Pour un vnement qui est dfni comme nimporte quel sous-ensemble de lunivers
des possibles , la probabilit de lvnement est :
La fonction f(x) trace un point dans lespace dchantillon de la valeur de probabilit
est appel une fonctiondeprobabilitdemasse, abrge par fpm. La dfnition
moderne nessaie pas de rpondre la question : comment la fonction de probabilit
de masse est elle obtenue? la place, elle construit une thorie qui assume son
existence.
ur|vers|l v|rlue||e Alr|ca|re 2
La thorie des probabilits continues
Lathoriedesprobabilitscontinues sintresse aux vnements qui se produisent
dans un univers des possibles continu.
Si lunivers des possibles est est un intervalle de rels, alors la fonction appele la
fonctiondedistributioncumulative (ou fdc)oulafonctionderpartition(f.r.)
de X existe et : .
La fdc ou f.r. doit satisfaire aux proprits suivantes :
1. est une fonction monotone non dcroissante et est continue droite.
2.
3.

Si est diffrentiable, alors la variable alatoire a une fonctiondedensitdepro-
babilits ou fdp ou tout simplement une densit :

Pour un ensemble , la probabilit que la variable alatoire prenne ses valeurs
dans est reprsente par :

Dans le cas o la densit de probabilit existe, on peut crire :

Alors que la fdp nexiste que pour les variables alatoires continues, la fdc existe
pour toutes les variables alatoires (incluant les variables alatoires discrtes) qui
prennent la valeur de .
Ces concepts sont gnraliss dans les cas multidimensionnels de o X prennent des
valeurs vectorielles dans .
ur|vers|l v|rlue||e Alr|ca|re 3
Fonction de la densit des probabilits
Si X est une variable qui peut prendre un ensemble de valeurs discrtes X
1
, X
2
,
X
3
,.., X
k
aux probabilits p
1
, p
2
, p
3
,., p
k
, o p
1
+ p
2
+ p
3
,., + p
k
= 1, nous
dirons quune distribution de probabilits discrtes de X a t dfnie. La fonction
p(X), qui a les valeurs respectives p
1
, p
2
, p
3
,., p
k
pour X= X
1
, X
2
, X
3
,.., X
k
,
est appel la fonction de probabilits, ou la fonction de frquences, de X. Puisque X
peut prendre certaines valeurs avec des probabilits donnes, elle est souvent appele
une variable alatoire discrte. Une variable alatoire est parfois appele une variable
de chance ou une variable stochastique (Murray R, 2006, page 130).
Distributioncontinue
Supposons que X soit une variable alatoire continue. La loi de probabilit de la va-
riable alatoire continue X est reprsente par sa fonction de densit des probabilits,
note f(x), o f(x) 0 parmi les valeurs pour lesquelles x est valide. Cette fonction
de densit des probabilits peut tre reprsente par une courbe, et une probabilit
correspondante est laire de la rgion limite par cette courbe et laxe des valeurs
de X.
Laire de toute la rgion sous la courbe est gale 1. La rgion sous la courbe entre
les lignes x=a et x=b (partie ombre) donne la probabilit X qui est entre a et w, ce
qui peut tre dsign par P(a<X<b.
Puisque la totalit de la rgion sous la courbe est gale 1, elle suit la probabilit
entre ltendue de lintervalle [a, b] qui est reprsente par :

P(a X b) = f (x)
a
b

dx

Ce qui reprsente la partie ombre.
ur|vers|l v|rlue||e Alr|ca|re 1
Note : Lorsque nous calculons la rgion de a b, nous navons pas besoin de distinguer
les ingalits

( et ) et (< et >)
. Nous assumons que les lignes de a et b nont
pas dpaisseur et que laire de la rgion correspondante gale zro.
Exemples et rponses
1) La variable alatoire continue X est distribue avec une fonction de la densit
de probabilit f dfnie par
f(x) = kx(16-x
2
), pour 0<x<4, nulle ailleurs.
Dterminez
a) La valeur de la constante k.
b) La probabilit de lespace dcart P(1<X<2).
c) La probabilit P(x3).
Solution

a b
x
f(x)
Pour nimporte quelle fonction intgrable f telle que
f(x) 0, pour
a x b,
et

f (x)dx = 1
a
b

on peut la prendre comme la fonction de densit de probabilit (f.d.p.) dune variable


alatoire continue dans lespace dcart [a, b].
Dmarche suivre :
tape1:En gnral, si X est une variable alatoire continue (v.a.) avec une f.d.p.
f(x) valable sur l'intervalle [a, b], alors :

f (x)dx = 1
Tout x


Donc f (x)dx = 1
a
b

ur|vers|l v|rlue||e Alr|ca|re 5


tape2
a) Pour trouver k, nous utilisons le fait que dans f(x) = kx(16-x
2
), pour 0<x<4,
alors

kx(16 x
2
)dx = 1
0
4

Donc k 16x x
3
)dx = 1
0
4

d' o: k =
1
64
.
tape3
b) Trouvez P(1<X<2)
Solution
P(1<X<2)= f (x)dx
1
2



=
1
64
(16x x
3
1
2

)dx =
81
256

tape4
c) Pour trouver P(x ) 3 crivons :

P(x 3) =
1
64
(16x x
3
3
4

)dx =
49
256
Exemple 2
2) X est la variable alatoire continue gale la masse dune substance, en kg,
par minute dans un processus industriel de production , telle que :

f (x) =
1
12
x(6 x)
0,

,
(0 x 3) ;
sinon.

ur|vers|l v|rlue||e Alr|ca|re
Trouvez la probabilit que la masse soit suprieure 2 kg.
Solution
X peut prendre des valeurs de 0 3 seulement. Nous dessinons sa densit de proba-
bilit f(x) et la partie ombre est requise.

0 3
x
f(x) ) 6 (
12
1
) ( x x x f =
2
P(x > 2) =
1
12
2
3

x(6 x)dx
=
1
12
(6x x
2
2
3

)dx
=
1
12
3x
2

x
3
3

2
3
= 0.722 (3 d.p)
La probabilit que la masse soit suprieure 2 kg est de 0,722.`
Ainsi, il y aurait 72, 2 % de chance pour que la masse dpasse les 2 kg.
Exemple 3
3) Une variable alatoire continue a une f.d.p. f(x) o

. 6 0 , ) (
2
= x kx x f
a) Trouvez la valeur de K
b) Trouvez
) 4 2 ( X P

ur|vers|l v|rlue||e Alr|ca|re Z


Solution
a) Puisque X est une variable alatoire, le total de la probabilit est de 1.


f (x)dx = 1
al l

kx
2
0
6

dx = 1
kx
3
3

0
6
= = 1
216k
3
= 1
k =
3
216
Donc f(x)= 6 0 ,
72
1
216
3
2 2
= x x x
b)

0 6
x
f(x)
4 2
2
72
1
) ( x x f =
P(2 x 4) =
1
72
x
2
dx
2
4

=
1
216
x
3
]
2
4
= 0.259
ur|vers|l v|rlue||e Alr|ca|re 8
Do la probabilit cherche est :
) 4 2 ( X P
= 0.259.
Exemple 4
La variable alatoire continue (v.a.) a une fonction de densit de probabilit (f.d.p.)
o

f (x) =
k, si 0 x < 2 ;
k(2x 3), si 2 x 5
0, sinon.

a) Trouvez la valeur de la constante K


b) Dessiner y=f(x)
c) Trouvez P(X ) 1
d) Trouvez P(X>2.5)

Solution
a) Puisque X est une v.a., alors

f (x)dx = 1
Tout x


Donc
kdx +
0
2

k(2x 3)
2
5

dx = 1

kx
0
2
+ k x
2
3x

2
5
2k +19k = 1
k =
1
21
Alors la f.d.p. de X est
ur|vers|l v|rlue||e Alr|ca|re 9
f (x) =
1
21
0 x < 2
1
21
(2x 3) 2 x 5
0 otherwise

Dessin


2
5
0
3
1

1
3 4
2.5
21
1

b) P(x ) 1 = rgion entre zro et 1 = L x W= 1 x
21
1
=
21
1
= 0.048
c) Trouvez P(X>2.5) = aire du rectangle + aire du trapze.
=(
21
1
x 2 ) + ( }
21
2
21
1
}{ 5 . 0 {
2
1
+ = 131 . 0
84
11
=
SINON
ur|vers|l v|rlue||e Alr|ca|re Z0
Exercices
1) La variable alatoire continue X a une f.d.p. f(x) o f(x)= k, 0 3 x .
a. Dessinez y=f(x).
b. Trouvez la valeur de la constante K.
c. Trouvez P(0.5 1 X .
2) La variable alatoire continue a une f.d.p. f(x) o f(x)=kx
2
, 4 1 x .
a. Trouvez la valeur de la constante.
b. Trouvez P(x ) 2
c. Trouvez P(2.5 5 . 3 x
3) La variable alatoire continue a une f.d.p f(x) o

f (x)
k, si 0 x < 2 ;
k(2x 1), si 2 x 3 ;
0, sinon.

a. Trouvez la valeur de la constante k.


b. Dessinez y=f(x)
c. Trouvez P(X
2
)
d. Trouvez P(1 X 2.2)
ur|vers|l v|rlue||e Alr|ca|re Z1
Esprance mathmatique
Dfnition: Si X est une variable continue (v.c.) avec une fonction de densit de
probabilit (f.d.p.) f(x), alors lesprance de X est E(X) dfni par :

E (X ) = x f (x)dx
toutx
= xf(x)dx.

Note: E(X) est souvent note par



: cest aussi la moyenne de X.
Exemple
1) Si X est une variable continue (v.c.) avec une f.d.p.
f (x) =
1
16
x
2
, 0 x 3

trouvez E(X).
Solution

E (X ) = x f (x)dx
toutx
= xf(x)dx.

Donc
1
16
0
3
{x} x
2
dx
=
1
16
x
4
4

0
3
=
81
64
= 1.265
q
Rfextion: Il peut tre utile pour les enseignants de trouvez un logiciel pour
faire des graphiques dans lenseignement des statistiques
Graph est un bon exemple de logiciel source ouverte.
Voir : http://www.padowan,dk/graph/
Si vous avez accs un ordinateur, tlchargez Graph et explorer ses fonctions de
statistiques.
Voici un exemple de difrents graphiques qui peuvent tre dessins partir de
Graph.


ur|vers|l v|rlue||e Alr|ca|re Z2
2) Si la variable alatoire continue X a une f.d.p 3 1 ), 1 )( 3 (
5
2
) ( + = x x x x f
trouvez E(X).

E (X ) = x f (x)dx
toutx


13 . 10
60
608
2
3
3
2
4 5
2
) 1 )( 3 ( } {
5
2
) (
3
1
2 3 4
3
1
=
=

+ =
+ =

x x x
dx x x x x E
Gnralisation
Si g(x) est une fonction quelconque dune variable alatoire continue X qui a une
f.d.p f(x), alors

E g(X )
[ ]
= g(x) f (x)dx
toutx

et en particulier
E (X
2
) = x
2
toutx
f x
( )
dx
Les rsultats suivants demeurent :
1. E (a) = a
2. E (aX ) = aE (X )
3. E (aX + b) = aE (X ) + b
4. E ( f
1
(X ) + f
2
(X )
[ ]
= E f
2
(X )
[ ]
.
ur|vers|l v|rlue||e Alr|ca|re Z3
Exemple
1) La variable alatoire continue X a une f.d.p f(x) o f(x)= . 3 0 ,
2
1
x x
Trouvez
a) E(X)
b) E(X
2
)
c) E(2X +3)

Solution
a)

E (X ) = x f (x)dx
toutx



=
1
2
0
3

x
2
dx
=
1
2
x
3
3

0
3
= 4.5

b )
E (X
2
) = x
2
al l x

f (x)dx
=
1
2
x
3
dx
0
3

=
1
2
x
4
4

0
3
=
81
8
= 10.125
c) E(2X +3) = E (2X) + 3
= 2E(X) +3
= 2(10.125)+5
= 25.25 ( voir b) plus haut)
ur|vers|l v|rlue||e Alr|ca|re Z1
Exercices
1) La variable alatoire continue X a une f.d.p f(x) o

f (x) =
kx, si 0 x < 1 ;
k, si 1 x < 3 ;
k(4 x), si 3 x 5 ;
0, sinon.


a) Trouvez k.
b) Calculez E(X).
2) La variable alatoire continue X a sa f.d.p. f dfnie par f(x) =

1
10
(x + 3), 0 x 5.
a) Trouvez E(X).
b) Trouvez E(2X+4)
c) Trouvez E(X
2
).
d) Trouvez E( X
2
+ 2X 1).
Gnralisation : moments dordres suprieurs
Dfnition: On appelle le moment dordre m dune v.a. X lesprance mathmatique
de X
m
, soit E(X
m
), sous rserve de son existence.
Applications des moments: coeffcients dasymtrie et daplatissement dune
distribution
La moyenne et la variance (ou lcart-type) dune variable donnent les premiers ren-
seignements sur sa distribution : la moyenne renseigne sur le centrage ou la position
des valeurs de la variable, et la variance (ou lcart-type) informe sur la dispersion
de ces valeurs autour de la moyenne. Les moments dordres suprieurs deux four-
nissent des informations plus prcises.
Le momentcentrdordre3: E(X-E(X))
3
; cest le premier moment centr
dordre impair non nul ; il donne une information sur la symtrie de la distri-
bution des valeurs par rapport la moyenne E(X).

Dfnition: Le coeffcient dasymtrie ou skewness de X est la quantit sans di-


mension

a =
3
E [(X E (X )) ]
X
3

ur|vers|l v|rlue||e Alr|ca|re Z5


Plus a est faible, proche de zro, plus la rpartition est approximativement symtrique
par rapport la moyenne E(X). si la distribution est symtrique, alors a est nul ; la
rciproque tant fausse!
Le momentcentrdordre4: E(X-E(X))
4
; il apporte une information sur
laplatissement de la distribution des valeurs de X.
Dfnition: Le coeffcient daplatissement ou kurtosis de X est la quantit sans
dimension

A =
4
E [(X E (X )) ]
X
4

3.
La correction par 3 vient du fait que le rapport E[(X-E(X))
4
]/
4
X
vaut 3 pour la loi
normale centre rduite. Si A >0, alors la distribution est moins aplatie que la loi
normale : la distribution est hypernormale ; Si A <0, alors la distribution est plus
aplatie que la loi normale
La loi de Bernoulli
Dans la thorie des probabilits et des statistiques, la loideBernoulli, ainsi nomme
en hommage au scientifque suisse Jakob Bernoulli, est une distribution de probabi-
lits discrtes qui prend la valeur 1, avec une probabilit de succs p, et la valeur 0,
avec une probabilit dchec q = 1 p. Donc, si X est une variable alatoire qui suit
cette distribution, nous avons :
La fonction de probabilit de masse f de cette distribution est

f (k; p) =
p, si k = 1;
1- p, si k = 0;
0, sinon.

La valeur prvue dune variable alatoire X de Bernoulli est , et sa


variance est
Le coeffcient daplatissement va vers linfni pour des valeurs hautes et basses de p,
mais pour p = 1 / 2, la distribution de Bernoulli a un coeffcient daplatissement plus
bas que nimporte quelle autre distribution de probabilits, savoir -2.
La distribution de Bernoulli est membre de la famille exponentielle.
ur|vers|l v|rlue||e Alr|ca|re Z
La distribution binomiale
Dans la thorie des probabilits et des statistiques, la distributionbinomiale est la
distribution de probabilits discrtes des nombres de succs dans une squence de n
expriences indpendantes de type oui/non, dans laquelle chacune a un succs avec
une probabilit p. Une exprience succs/chec comme celle-ci est aussi appele une
exprience de Bernoulli ou un essai de Bernoulli. La distribution binomiale est la base
pour faire des tests populaires binomiaux dune signifcation de statistique.
Exemple. Comme exemple de base : lancez un d dix fois et comptez le nombre de
1 que vous obtiendrez. Donc, ce nombre au hasard suit une distribution binomiale
avec n = 10 et p = 1/6.
Exemple. Supposons que 5 % de la population a les yeux verts. Vous prenez 500
personnes au hasard. Le nombre de personnes aux yeux verts que vous prendrez est
une variable alatoire X qui suit une distribution binomiale avec n = 500 et p = 0,05
(lorsque vous prenez des personnes avec un remplacement).
Exemples
1) Une pice de monnaie est lance 3 fois. Trouvez la probabilit davoir 2 faces
et un pile dans lordre.
Formule
Nous pouvons utiliser la formule
n
C
x
. (p)
x
.(1-p)
n-x
O n = le nombre dessais
X= le nombre de succs (1,2, )
P= la probabilit dun succs.
1
er
)
n
C
x
dtermine le nombre de faon quun succs peut se produire
2
e
) (p)
x
est la probabilit davoir x succs et
3
e
) (1-p)
n-x
est la probabilit davoir des checs n-x
Analyse de la loi binomiale de paramtres (n, p) ( vrifer):
E(X)=np ; V(X)=np(1-p)=npq ; asymtrie : a =

q p
npq
; aplatissement : A=

1
npq

6
n
.
ur|vers|l v|rlue||e Alr|ca|re ZZ
Solution
Lancer 3 fois veut dire que n=3
Deux faces veut dire que x=2
P(H)=1/2; P(T)=1/2
P( 2 faces) =
3
C
2
. (
2
1
)
2
.(1-
2
1
)
3-1
= 3(1/4)(1/2)= 3/8
Exercices
1) Trouvez la probabilit davoir exactement un 5 lorsquun d est lanc.
2) Trouvez la probabilit davoir 3 faces lorsque 8 pices de monnaie sont lan-
ces.
3) Un sac contient 4 balles rouges et 2 balles vertes. Une balle est tire et rem-
place 4 fois. Quelle est la probabilit davoir exactement 3 balles rouges et
une balle verte.
Rponses
1) P(un 5) =
3
C
1
. (
6
1
)
1
.(
6
5
)
2
=25/72 = 0.347 i.e. n=3, x=1, p=1/6
2) P ( 3 faces) =
8
C
3
. (
2
1
)
3
.(
2
1
)
5
=7/32 = 0.218. i.e. n=8, x=3, p=1/2
3) P( 3 balles rouges) =
4
C
3
. (
3
2
)
3
.(
3
1
)
1
= 32/81= 0.395 i.e. n=4, x=3, p=2/3
lire
1. Lectures on Statistics, par Robert B. Ash, page 1-4
Exercices numros 1,2 et 3 la page 4.
2. An Introduction to Probabilit & Random Processes par Kenneth B. & Gian-
Carlo R., pages 3.1-3.63
Exercise Chapter 3: Random Variables page 3.64-3.82, No. 1-7, 11-17, 20-24
et 34-36.
3. An Introduction to Probability par Charles M. Grinstead, pages 96-107 et
184.
Les exercices aux pages 113-118, no 1,2,3,4,5,8,9,10,19,20.
Ref:http://en.wikipedia.org/wiki/measurable_space
Ref:http://en.wikipedia.org/wiki/Probability_theory
Ref:http://en.wikipedia.org/wiki/Bernoulli_distribution
ur|vers|l v|rlue||e Alr|ca|re Z8
La loi de Poisson
Dans la thorie des statistiques, la loidePoisson est une distribution de probabilits
discrtes qui exprime la probabilit quun nombre dvnements se produise dans
une priode de temps prdtermine, si ces vnements se produisent dans un taux
moyen connu et sont indpendants du temps depuis le dernier vnement.
Cette distribution a t dcouverte par Simon-Denis Poisson, mathmaticien franais
(1781-1840), dans sa publication de 1837 sous le titre Recherches sur la probabilit
de jugements en matire criminelle et en matire civile . Elle est particulirement
adapte pour dcrire les vnements dont les chances de ralisation sont faibles, do
son appellation de la loi des vnements rares .
La loi de Poisson est utilise lorsque la variable se produit sur une certaine priode de
temps, de volume, etc ; elle a de nombreuses applications dans des domaines trs
varis tels : gestion industrielle (nombre daccidents de travail, vrifcation compta-
ble, contrle dacceptation, cartes de contrle pour le nombre de non-conformits),
larrive des avions un aroport, recherche mdicale(le nombre de globules blancs
dans une certaine rgion, nombre de bactries), le nombre daccidents survenus sur
une route, le nombre de vhicules qui passent des intervalles de temps rguliers
un endroit fx (page, frontire, etc.), recherche oprationnelle(le nombre de clients
en fle dattente devant un guichet, le nombre dappels par heure dans une station,,
etc.).
Elle peut tre dfnie comme la limite dune loi binomiale de paramtres (n, p) lorsque
n devient infnie et np =

. Elle donne ainsi une trs bonne approximation dune loi


binomiale faible probabilit de succs et avec un nombre suffsamment grand de
nombre n rptitions dune preuve de Bernoulli.
La probabilit de x succs est
! x
e
x


, o e est la constante mathmatique =
2,71828,
et

est la moyenne ou lesprance mathmatique de la variable (le taux moyen).


AnalysedelaloidePoissondeparamtre

: E(X)=V(X) =

; asymtrie : a =

; aplatissement : A=

Travail dquipe: tudiez le calcul des probabilits et essayez de rpondre la


question.
Exemple
Si il y a 100 erreurs typographiques distribues au hasard dans 500 pages manuscrites,
trouvez la probabilit que nimporte laquelle de ces pages ait 4 erreurs.
ur|vers|l v|rlue||e Alr|ca|re Z9
Solution
Trouvez la moyenne des erreurs 2 . 0
5
1
100
100
= = = x .
En dautres mots, il y a en moyenne 0,2 erreurs par page. Dans ce cas, 4 = , donc
la probabilit de tomber sur une page avec exactement 4 erreurs
( ) ( )
41
2 . 0 7183 . 2
!
.
4 2 . 0
=
x
x e
x
= 0,00168
Montant 0.2 %

Exempleetsolution
Une ligne prioritaire avec un numro sans frais reoit en moyenne 4 appels par
heure, pour nimporte quelle heure. Trouvez la probabilit de recevoir exactement
5 appels.
( ) ( )
! 5
3 7183 . 2
!
.
5 3
=
x
e
x

= 0.1001
Donc, 10 %.

Exercices
1) Une compagnie de tlmarketing reoit en moyenne 5 commandes par 100 appels.
Si une compagnie appelle 500 personnes, trouvez la probabilit de recevoir 2
commandes.
Solution
0.26, donc 26 %.
lire
1. An Introduction to Probability & Random Processes par Kenneth B. & Gian-
Carlo R., pages 187-192.
2. Robert B. Ash, Lectures on Statistics, page 1 et rpondez aux problmes 1,2,3
la page 15.
Rf.:http://en.wikipedia.org/wiki/Normal_distribution
manipuler en guise de travaux pratiques sur ordinateur : visualisation des lois
discrtes
ur|vers|l v|rlue||e Alr|ca|re 80
1. Ouvrir le logiciel Excel ; 2. Aller dans Outil : cliquer sur UtilitairedAnalyse,
si activ, sinon cliquer sur Macroscomplmentaires : faire activer Utilitaire
dAnalyse.3.Gnrationdesnombresalatoires4.Choisirvotreloi.
Loi exponentielle
Dans la thorie des probabilits et des statistiques, la loiexponentielle est lune des
deux distributions de probabilits continues :
La distribution de probabilit du chiffre X de lessai de Bernoulli ncessaire
pour obtenir un succs, sappuyant sur lensemble (1,2,3, ), ou
La distribution de probabilits du chiffre Y = X 1 des checs avant le premier
succs, sappuyant sur lensemble (1,2,3, ).
Si la probabilit de succs sur chaque essai est p
1,
alors la probabilit que les essais
k sont ncessaires pour obtenir un succs est

Pour K = 0,1,2,3,
Si la probabilit de succs pour chaque essai est p
0,
alors la probabilit quil y aie des
checs k avant le premier succs est

Pour K = 0,1,2,3,
Dans chacun des cas, la squence de probabilits est une squence exponentielle.
Comme exemple, supposons quun simple d est lanc plusieurs reprises avant
dobtenir pour la premire fois 1 . La distribution de probabilits du nombre de
fois quil est lanc est appuy par lensemble infni (1,2,3, ) et sa distribution ex-
ponentielle avec p
1
= 1/6.
Solutions utilisant la formule de distribution exponentielle
La formule de probabilits pour que le premier succs soit obtenu lessai n est
(1-p)
n-1
p ou simplement , o p est la probabilit dobtenir
un succs et n est le nombre dessais ncessaire avant le premier succs.
Exemple
Trouvez la probabilit dobtenir le premier pile lorsquon lance une pice de
monnaie pour la 3
e
fois.
ur|vers|l v|rlue||e Alr|ca|re 81
Solution
Le rsultat dobtenir un pile au troisime lanc implique FFP (face, face, pile). De
(1-p)
n-1
p , n=3, p=1/2
Et donc P(FFP) = ( 1-
2
1
)
3-1
)
2
1
( = )
2
1
( .. )
2
1
( )
2
1
( =1/8
Exemples dans une distribution exponentielle
En lanant une pice de monnaie plusieurs fois, nous appliquons la distribution
exponentielle pour obtenir la rponse de lancer une pice plusieurs fois.
Exemple
1) Une pice de monnaie est lance. Trouvez la probabilit dobtenir pour la pre-
mire fois le ct face au troisime lanc. Nous devons obtenir PPF
n = 3 et p=1/2
La probabilit dobtenir deux cts pile et un ct face est
8
1
2
1
2
1
2
1
=
Ou avec la formule


2
1
2
1
2
1
.
2
1
1
2 1 3
8
1
=
ur|vers|l v|rlue||e Alr|ca|re 82
ur|vers|l v|rlue||e Alr|ca|re 83
2) Un d est lanc; trouvez la probabilit dobtenir pour la premire fois un 3 au
quatrime lancer.
Solution
n=4 p=1/6
3 1 4
6
5
6
1
6
1
1



96 . 0
1296
125
6
1
6
5
3
= =

Exemple
Si des cartes sont tires dans un paquet de cartes et ensuite replaces, combien dessais
seront ncessaires en moyenne avant dobtenir deux piques?
P (Pique) = 13/52=1/4
Le nombre dessais prvus pour obtenir 2 piques serait 8
1
4
2
4
1
2
= = x .
Exercices
1. Une carte est tire partir dun paquet des cartes et est ensuite replace avec
une autre carte tire, etc. Trouvez la probabilit dobtenir pour la premire fois
un pique lors de la quatrime pige.
2. Un d est lanc jusqu lobtention dun 5 ou dun 6. Trouvez le nombre de
lancers ncessaires prvus.
Rponses
1. Quatrime
2. 3
ur|vers|l v|rlue||e Alr|ca|re 81
Distribution hypergomtrique
Dans la thorie des probabilits et des statistiques, la distributionhypergomtrique
est une distribution de probabilits discrtes qui dcrit le nombre de succs dans une
squence de n tirs partir dune population limite sans remplacement.
Un exemple typique est illustr par le tableau de contingence plus haut : il y a une
cargaison dobjets N dans laquelle les D sont dfectueux. La distribution hypergo-
mtrique dcrit la probabilit quun chantillon dobjets distinctifs N pris au hasard
dans la cargaison soient des k objets dfectueux.
En gnral, si une variable alatoire X suit la distribution hypergomtrique avec
les paramtres N, D et n, alors la probabilit dobtenir exactement k succs est re-
prsente par :
La probabilit est positive lorsque k est entre maximum { 0, D + n N } et minimum
{ n, D }.
La formule peut tre comprise comme suit : Il y a chantillons possibles (sans
remplacement). Il y a faons dobtenir k objets dfectueux et il y a
manires de remplir le reste de lchantillon avec des objets non dfectueux.
Lorsque le format de la population est large si on le compare au format dchantillon
(N est beaucoup plus large que n), la distribution hypergomtrique est approxime
raisonnablement par une distribution binomiale avec des paramtres n (nombre des-
sais) et p = D / N (la probabilit du succs dans un simple essai).
Formule hypergomtrique
Lorsquil y a deux groupes dobjets comme il y a a objets dans le premier groupe
et b objets dans le second groupe, donc le nombre total dobjets est (a + b), la
probabilit de slectionner x objets du premier groupe et (n-x) objets du deuxime
groupe est
n
C
b a
x n
C
b x
C
a
+
.
, o n est le total dobjets slectionns sans remplacement.
ur|vers|l v|rlue||e Alr|ca|re 85
Exemples
1. Un sac contient 3 jetons bleus et 3 jetons verts. On tire deux jetons au hasard,
Trouvez la probabilit dobtenir deux jetons bleus.
Solution
partir de la formule
n
C
b a
x n
C
b x
C
a
+
.
; a = 3, b= 3, x=2, n=2, n-x=2-2=0
La probabilit dobtenir deux jetons bleus = 2 . 0
5
1
15
1 3
2 3 3
2 2 3 . 2 3
= = =
+
x
C
C C
2. Un comit de 4 personnes est choisi au hasard sans remplacement partir dun
groupe de 6 hommes et 3 femmes. Trouvez la probabilit que le comit soit
constitu de 2 hommes et de 2 femmes.
Solution
a=6 b=3
n = 6+3=9
Puisque le comit est constitu de 2 hommes et de 2 femmes
x=2 n-.x= 3-2=1
536 . 0
28
15
84
3 15
9
3 6 Pr
3
1 2
= = =
= x
C
C C
3. Un groupe de 10 chars dassaut contient 3 chars dfectueux. Si 4 chars dassaut
sont slectionns au hasard et tests, trouvez la probabilit dobtenir un char
dfectueux.
3 sont dfectueux 7 sont bons
a=3 b=7
Pr (un dfectueux)
n = 4 x=1
n-x=4-1=3
ur|vers|l v|rlue||e Alr|ca|re 8
Pr (un dfectueux)

5 . 0
210
105
10
7 . 3
4
3 1
= =
C
C C
Exercices
1. Dans une bote de 10 chemises, 5 sont dfectueuses. Si 5 chemises sont ven-
dues au hasard, trouvez la probabilit que 2 chemises soient dfectueuses.
2. Dans une cargaison de 12 chaises de jardin, 8 sont brunes et 4 sont bleues. Si
3 chaises sont vendues au hasard, trouvez la probabilit quelles soient toutes
brunes.
Rponses
1) 0.397 2) 0.255
1) Trouvez la probabilit de choisir 5 femmes dans un comit de 15 femmes.
P(en choisir 5) =
5
15
1
C
=
3003
1
2) Quelle est la probabilit de tirer un as ou un pique dans un jeu de cartes?
( ) ( ) ( ) ( ) P Ace P AUB P A P B P AUB ( ) = = +
4
52

( ) P spade =
13
52
=
4
52
13
52
1
52
+
=
16
52
4
13
=
q
Travaildquipe
1. Rvisez les questions et rponses
de probabilits suivantes.
2. Discutez des problmes rencontrs
dans le calcul des probabilits.
ur|vers|l v|rlue||e Alr|ca|re 8Z
3) Des femmes enceintes ont des problmes. La probabilit de mourir est de
1
5
.
Quelle est la probabilit quau moins une meure chaque 5 femmes.
( ) P A =
1
51
P(au moins une mourra)
50
51
5

= utilisez une calculatrice.


( ) P A 1
1
51
50
51
=
Application et exemple
Lapplication classique de la distribution hypergomtrique est un chantillonnage
sansremplacement. Pensez une urne avec deux types de billes, des noires et des
blanches. Dfnissez le tirage dune bille blanche comme un succs et dune bille noire
comme un chec. Si la variable N dcrit le nombre de touteslesbillesdanslurne
et D dcrit le nombre de billesblanches (appeles dfectueuses dans lexemple plus
haut), alors N-D correspond au nombre de billesnoires. Maintenant, disons quil y
a 5 billes blanches et 45 billes noires dans lurne. Plac prs de lurne, vous fermez
vos yeux et vous pigez 10 billes sans les remplacer. Quelle est la probabilit p (k=4)
que vous pigiez exactement 4 billes blanches (et, bien sr, 6 billes noires)?
Le problme est rsum par ce tableau de contingences ci-dessous :
Tires Nontires Totales
Billesblan-
ches
4 (k) 1 = 5 4 (D k) 5 (D)
Billesnoires 6 = 10 4 (n k) 39 = 50 + 4 10 5 (N + k n D) 45 (N D)
Total 10 (n) 40 (N n) 50 (N)
La probabilit Pr (k = x) de tirer exactement x billes blanches (= au nombre de succs)
peut tre calcul par la formule :

Do, dans cet exemple x = 4, calculez
ur|vers|l v|rlue||e Alr|ca|re 88

Donc, la probabilit de tirer exactement 4 billes blanches et plutt basse (approximati-
vement 0.004) et lvnement est trs peu probable. Cela signife que, si vous rpter
votre exprience alatoire (tirer 10 billes de lurne de 50 billes sans remplacement)
1000 fois, vous pourriez esprer obtenir pareil rsultat 4 fois.
Mais propos de la probabilit de tirer les 5 billes? Vous serez daccord que cet
vnement est encore plus peu probable que de tirer 4 billes blanches. Calculons la
probabilit dun vnement aussi extrme.
Le tableau de contingence correspondant est donn ci-dessous :
Tires Nontires Total
Billesblanches 5 (k) 0 = 5 5 (D k) 5 (D)
Billesnoires 5 = 10 5 (n k) 40 = 50 + 5 10 5 (N + k n D) 45 (N D)
total 10 (n) 40 (N n) 50 (N)
Nous pouvons aussi calculer la probabilit qui suit (remarquez que le dnominateur
est toujours le mme) :
Comme prvu, la probabilit de tirer 5 billes blanches est encore plus basse que de
tirer 4 billes blanches.
Conclusion
Par consquent, on pourrait dvelopper la question initiale comme suit : Si vous pigez
10 billes dune urne (qui contient 5 billes blanches et 45 billes noires), quelle serait
la probabilit de tirer au moins 4 billes blanches? Ou, quelle serait la probabilit de
tirer 4 billes blanches (et encore plus extrme, 5 billes blanches)? Ceci correspond
calculer la probabilit cumulative p(k>=4) et peut tre calcul par la fonction
dedistributioncumulative (fdc). Puisque la distribution hypergomtrique est une
distributiondeprobabilitsdiscrtes, la probabilitcumulative peut tre calcule
facilement en ajoutant toutes les valeurs de probabilits correspondantes.
ur|vers|l v|rlue||e Alr|ca|re 89
Dans notre exemple, vous navez qu faire la somme de Pr (k = 4) et Pr (k = 5):
Pr (k 4) = 0.003964583 + 0.0001189375 = 0.004083520
lire
An Introduction to Probabilit & Random Processes par Kenneth B. & Gian-Carlo
R., pages 184 195.
La distribution de frquence deux variables
La distribution de frquence deux variables est la distribution statistique avec une
fonction de probabilit


O

Et

est la corrlation de of et (Kenney et Keeping 1951, pages 92 et 202-205; Whi-
taker et Robinson 1967, page 32)
, et sont souvent utiliss la place de et
de . Les probabilits marginales sont alors
= =
et
ur|vers|l v|rlue||e Alr|ca|re 90
= =
Tableaux de probabilits jointes
Ce tableau est un tableau trs bien prsent dun tableau de probabilits jointes.
Nombresdejoursavantlavente
Prixdemand Moins de 30 31-90 Plus de 90 Totaux
Moinsde50,000$ 0.06 0.05 0.01 0.13
50,000$-99,999$ 0.03 0.19 0.10 0.31
100,000-150,000$ 0.03 0.35 0.13 0.50
Plusde150,000$ 0.01 0.04 0.01 0.06
Totaux 0.13 0.63 0.25 1.00
Probabilits marginales
Laissons tre divis dans dans des ensembles disjoints et o le sous-
ensemble gnral est indiqu par . Donc, la probabilit marginale de est
lire
1. An Introduction to Probability & Random Processes par Kenneth B. & Giang-
Carlo R., pages 142 150.
2. Exercices la page 150, no 1,2,3,4,5,6,7,8,9,14,15,16,17,26.
ur|vers|l v|rlue||e Alr|ca|re 91
Unit 2 (40 heures)
Variables alatoires et essais de distribution
Les moments
La distribution de probabilits dune variable alatoire est souvent caractrise par
un petit nombre de paramtres qui ont aussi une interprtation pratique. Comme
exemple, il est souvent assez pour connatre la valeur moyenne . Ceci est captur
par le concept mathmatique de la valeur prvue dune variable alatoire, reprsente
par E[X]. Notez quen gnral, E[f(X)] nest pas la mme chose que f(E[X]). Une
fois que la valeur moyenne est connue, on pourrait alors demander jusquo cette
valeur moyenne de X est, une question qui se rpond par la variance est lcart-type
dune variable alatoire.
q
Rfexion:Les ressources TIC sont difciles accder!
Ce lien vous mnera sur un site internet pour les
enseignements de mathmatiques pour accder aux
ressources TIC.
http://www.tsm-resources.com/suppl.html
ur|vers|l v|rlue||e Alr|ca|re 92
Ingalit de Jensen
Si X est une v.a. valeurs vectorielles dans R
n
, et g une fonction relle dfnie convexe
sur R
n
et intgrable, alors E(g(X))g(E(X)).
En particulier :

E ( X ) E (X ).
Mathmatiquement, cela est connu sous le problme (gnralis) des moments : pour
une classe de variables alatoires X, trouver la famille {f
i
} de fonctions telles que
les valeurs espres E[f
i
(X)] dterminent compltement la distribution de la variable
alatoire X.
Lgalit des variables alatoires
Il existe plusieurs diffrents sens dans lesquels les variables alatoires peuvent tre
considres comme tant gales. Deux variables alatoires peuvent tre gales, gales
presque certainement, gales en moyenne ou gales en distribution.
En augmentant lordre de force, la dfnition prcise de ses notions dquivalences
est donne plus bas.
Lgalit dans la distribution
Deux variables alatoires X et Y sont gales dans la distribution, si elles sont la mme
fonction de rpartition, c--d si

pour tout rel x, P(X x) = P(Y x).


Il est facile de vrifer que deux variables alatoires qui ont leurs fonctions gnra-
trices de moments gales ont la mme distribution.
Lgalit en moyenne
Deux variables alatoires X et Y sont gales en moyenne dordre p, si le moment
dordre p de |X Y| est nul, i.e.

Lgalit en moyenne dordre p implique une galit en moyenne dordre q, pour tout
q<p. Comme dans le cas prcdent, il y a une distance associe pour les variables
alatoires, savoir, pour tout couple de v.a. (X, Y) :

ur|vers|l v|rlue||e Alr|ca|re 93
Lgalit presque sre
Deux variables alatoires X et Y sont gales P-presque srement, si lvnement

/X( { ) = Y() }
est un vnement presque sr, i.e. P(

/X( { ) = Y() } )=1, ou


encore P(

/X( { ) Y() } )= 0.
Lgalit
Finalement, les deux variables alatoires X et Y dfnies sur un mme espace pro-
babilis sont gales si elles concident en tant que fonctions sur leur espace des
probabilits, i.e. :

pour tout , X() = Y().


Fonction gnratrice des moments
Dans la thorie des probabilits et statistiques, la fonctiongnratricedesmoments
dune variable alatoire X est :

peu importe o cette prdiction existe. La fonction gnratrice des moments gnre
les moments de la distribution de probabilits.
Pour des variables alatoires valeur vectorielles X, la fonction gnratrice des
moments se donne comme suit

o t est un vecteur de mme dimension que X et

t, X est le produit scalaire.


La fonction gnratrice des moments existe un intervalle autour de t = 0, le n-ime
moment est reprsent par
Si une v.a. X admet f(x) comme fonction de la densit des probabilits, alors la fonc-
tion gnratrice des moments est reprsente par


ur|vers|l v|rlue||e Alr|ca|re 91

O m
i
, est le i-ime moment. M
X
( t) nest que la transformation Laplace deux
cts de f(x).
Sans se soucier si la distribution de probabilits est continue ou non, la fonction
gnratrice des moments est reprsente par lintgrale de Riemann-Stieltjes :

O F est la fonction de distribution cumulative de X.
Si X
1
, X
2
, ..., X
n
est une suite des variables alatoires indpendantes (et pas ncessai-
rement identiquement distribues) et que

O les a
i
sont des constantes, relles, alors le fonction de la densit des probabilits
pour S
n
est la circonvolution des fonctions de la densit des probabilits de chacun
des X
i
et la fonction gnratrice des moments pour S
n
est reprsente par

Un nombre de plusieurs autres transformations relies la fonction gnratrice des
moments est commun dans la thorie des probabilits, incluant les fonctions carac-
tristiques et la fonction gnratrice des probabilits.
Lingalit de Markov

f(x)

} { ) ( | x f X X

Lingalit de Markov donne une limite suprieure de la probabilit de lvnement

( X a)
, pour a>0 fx
.
Cette ingalit est ainsi nomme aprs le mathmaticien russe Andrey Markov, bien
quelle apparut plus tt dans les travaux de Pafnuty Chebyshev (lenseignant de
Markov).
ur|vers|l v|rlue||e Alr|ca|re 95
Pour tout a>0, pour tout rel r>0, on a :

P( X a)

E (
r
X )
r
a
.
Les ingalits de Markov (ainsi que dautres ingalits semblables) rapportent des
probabilits aux prdictions et fournissent (trs souvent) des limites dtaches,
mais tout de mme utiles pour la fonction de distribution cumulative dune variable
alatoire.
Dmonstration
Pour nimporte quel vnement E, soit I
E
lindicateur dune variable alatoire de E,
qui est I
E
= 1 seulement si E se produit, et = 0, sinon. Par consquent, I
(|X| a)
= 1, si
lvnement |X| a se produit, et I
(|X| a)
= 0 si |X| < a. Alors, a>0

Donc,

f(x)

} { ) ( | x f X X

Maintenant, observons que le ct gauche de cette ingalit est le mme que

Par consquent, nous avons

et puisque nous avons a> 0, nous pouvons diviser les deux cts par a.
lire
1. Robert B. Ash, Lectures on Statistics, pages 9 13.
2. An Introduction to Probabilit & Random Processes par Kenneth B. & Gian-
Carlo R., pages 366 374 et 404 407.
Exercices : page 376, no 1, 3, 7,8
Exercices : page 442, no 1, 2, 3, 4,5
ur|vers|l v|rlue||e Alr|ca|re 9
Rfrences
http://en.wikipedia.org/wiki/Moment-generating_function
http://en.wikipedia.org/wiki/characteristic_function_%28probability_theo-
ry%29.
http://en.wikipedia.org/wiki/Integral_transform
Lingalit de Chebyshev
Dans la thorie des probabilits, lingalitdeChebyshev (aussi connu sous lin-
galitdeTchebysheff,lethormedeChebyshev, ou lingalitdeBienaym-
Chebyshev), nomm en lhonneur de Pafnuty Chebyshev, celui qui a t le premier
dire que dans nimporte quel type dchantillon de donnes ou dans nimporte quelle
distribution de probabilits, que presque toutes les valeurs soient prs de la mme
moyenne de valeur, et fournit une description quantitative presque toutes et
prs de . Par exemple, pas plus de des valeurs sont plus que 2 carts types plus
loin que la moyenne, pas plus que 1/9 sont plus de 3 carts-types plus loin, et que pas
plus que 1/25 sont plus de 5 carts-types plus loin, et ainsi de suite.
Proposition probabiliste : la rgle de k sigma :
Si X est une variable de moyenne et de variance fnie
2
, alors pour nimporte quel
nombre rel k > 0, on a lingalit :

Seulement les cas k> 1, notamment k=3, fournissent de linformation pertinente.
Remarque: Il existe dautres formulations quivalentes moins usuelles de lingalit
de Chebyshev,par exemple :

P( X k)
2

2
k
.
Interprtation: Plus
2
est relativement grand par rapport k

, plus la probabilit
de lvnement

( X k)
est grande.Ce qui montre que est bien un paramtre
qui caractrise la dispersion de la v.a. X autour de sa moyenne : X scarte dautant
moins de sa moyenne que son cart-type (ou sa variance) est faible.
Preuve : Cette ingalit de Chebyshev dcoule de lingalit de Markov (voir plus
bas) : il sufft de considrer cette fois la v.a. X- et prendre r==2.
Comme exemple, en utilisant k=2, cela montre quau moins la moiti des valeurs
se trouvent dans lintervalle ( 2 , + 2 ).
Typiquement, le thorme fournira des limites plutt souples. Toutefois, les limites
fournies par lingalit de Chebyshev ne peuvent pas, en gnral, tre amliores.
ur|vers|l v|rlue||e Alr|ca|re 9Z
Par exemple, pour nimporte quel k> 1, lexemple suivant (o = 1/k) rencontre les
exactement les limites.

Le thorme peut tre utile malgr les limites souples, parce quil sapplique aux
variables alatoires de nimporte quelle distribution, et parce que ces limites peu-
vent tre calcules en ne sachant rien dautre de la distribution que la moyenne et
la variance.
Lingalit de Chebyshev est utilise pour prouver la loi faible de grands nombres.
Exemple
Pour illustrer ce thorme, nous avons plusieurs textes, comme des articles dune
revue. Nous savons que les articles contiennent environ 1000 caractres avec un cart-
type de 200 caractres. partir de lingalit de Chebyshev, nous pouvons en dduire
quau moins 75 % des articles contiennent entre 600 et 1400 caractres (k = 2).
Preuve probabiliste
Lingalit de Markov dit que pour nimporte quelle valeur relle dune variable
alatoire Y et pour nimporte quel nombre positif a, nous avons Pr (|Y| > a) E (|Y|)/a.
Une manire de prouver lingalit de Chebyshev est dappliquer aussi lingalit de
Markov la variable alatoire Y = (X )
2
avec a = (k)
2
.
Cela peut aussi tre prouv directement. Pour nimporte quel vnement A, I est
lindicateur de la variable alatoire de A I gal 1 si A se produit et sinon, il est
gal 0. Donc,


La preuve directe montre pourquoi les limites sont plutt fausses dans les cas typi-
ques : le nombre 1 gauche de est remplac par [(X )/(k)]
2
la droite de
peu importe o ce dernier dpasse 1. Dans certains cas, il dpasse 1 par une
marge trs large.
Consquenceimmdiate(vrifer):
V(X) = 0 si, et seulement si X=E(X) presque srement.
ur|vers|l v|rlue||e Alr|ca|re 98
lire
An Introduction to Probability & Random Processes par Kenneth B. & Gian-
Carlo R., pages 305 318.
Les exercices la page 309, no. 1,2,3,4,5.
Les exercices aux pages 320 324, no. 1,3,10,12.
Les types de corrlation
La corrlation est une mesure symtrique dassociation entre deux variables. Les
variables ne sont pas dsignes comme dpendantes ou indpendantes. Les deux
coeffcients de corrlation les plus populaires sont : le coeffcient de corrlation de
Spearman rho et le coeffcient de corrlation du produit-moment de Pearson.
Lorsque vous calculez le coeffcient de corrlation pour une donne ordinale, choi-
sissez la technique de Spearman. Pour lintervalle ou une donne ratio type, utilisez
la technique de Pearson.
La valeur dun coeffcient de corrlation peut varier de moins un plus un. La valeur
moins un indique une corrlation ngative parfaite, tandis quun plus un indique
une corrlation positive parfaite. Une corrlation de zro signife quil ny a aucune
relation entre les deux variables. Lorsquil y a une corrlation ngative entre deux
variables, alors si la valeur dune variable augmente, la valeur de lautre variable
diminue, et vice versa. Lorsquil y a une corrlation positive entre deux variables,
alors si la valeur dune variable augmente, la valeur de lautre variable augmente
aussi : les deux variables bougent ensemble dans le mme sens.
Lerreur-type dun coeffcient de corrlation est utilise pour dterminer lintervalle
de confance autour dune vraie corrlation de zro. Si votre coeffcient de corrla-
tion tombe en dehors de son tendue, alors il est diffrent de zro. Lerreur-type peut
tre calcul par intervalles ou par donnes ratio type (seulement pour la corrlation
produit-moment de Pearson).
La signifcation (en probabilit) du coeffcient de corrlation est dtermine partir de
la statistique-t. La probabilit de la statistique-t indique si le coeffcient de corrlation
observ est arriv par chance si la vraie corrlation est zro. En dautres mots, elle
demande si la corrlation est diffrente de zro. Lorsque la statistique-t est calcule
pour le coeffcient de corrlation de diffrence de rang de Spearman, il doit y avoir
au moins 30 cas avant la distribution-t pour dterminer la probabilit. Si il y a moins
de 30 cas, vous devez vous rfrer un tableau spcial pour trouver la probabilit
du coeffcient de corrlation.
Exemple
Si une compagnie voulait savoir sil y a une relation signifcative entre le nombre
total de vendeurs et le nombre total de ventes. Ils ont amass des donnes pendant
5 mois.
ur|vers|l v|rlue||e Alr|ca|re 99
Variable1 Variable2
207 6907
180 5991
220 6810
205 6553
190 6190
Coeffcient de corrlation = .921
Erreur-type du coeffcient = .068
Test-t pour la signifance du coeffcient = 4.100
Degr de libert = 3
Probabilit deux queues = .0263
Autre exemple
Des personnes ayant rpondu un sondage ont t sollicites pour juger de la qualit
dun produit sur une chelle de Likert quatre points (excellent, bon, moyen, mau-
vais). On leur a aussi demand de juger la rputation de la compagnie qui a fabriqu
le produit sur une chelle de 3 points (bon, moyenne, mauvais). Y-a-t-il une relation
signifcative entre les perceptions de la compagnie des rpondants et entre les per-
ceptions de la qualit du produit?
Puisque les deux variables sont ordinales, la mthode de Spearman est choisie. La
premire variable est la note pour la qualit du produit. Les rponses sont codes
comme suit : 4 = excellent, 3 = bon, 2 = moyen et 1 = mauvais. La deuxime varia-
ble est la rputation perue de la compagnie et est code comme suit : 3 = bon, 2 =
moyen et 1 = mauvais.
Variable1 Variable2
4 3
2 2
1 2
3 3
4 3
1 1
2 1
ur|vers|l v|rlue||e Alr|ca|re 100
Coeffcient de corrlation rho = .830
Test-t pour la signifance du coeffcient = 3.332
Nombre de paires de donnes = 7
La probabilit doit tre dtermine partir dun tableau cause du petit format
de lchantillon.
Rgression
La rgression simple est utilise pour examiner la relation fonctionnelle entre une
variable dpendante et une variable indpendante. Aprs avoir fait une analyse, les
statistiques de rgression peuvent tre utilises pour prdire la variable dpendante
lorsque la variable indpendante est connue. La rgression va plus loin que la corr-
lation en ajoutant des capacits de prdictions.
On utilise intuitivement la rgression tous les jours. Dans le domaine des affaires,
un homme bien habill semble avoir du succs fnancirement. Une mre sait que
plus de sucre dans lalimentation de ses enfants leur donnera un niveau dnergie
plus lev. La facilit de se lever le matin dpendra d quelle heure vous vous tes
couch la veille. Les rgressions quantitatives ajoutent de la prcision en dveloppant
une formule mathmatique qui peut tre utilise des fns de prdictions.
Par exemple, un chercheur mdical pourrait vouloir utiliser le poids corporel (variable
indpendante) pour prdire la dose la plus approprie pour un nouveau mdicament
(variable dpendante). Le but de faire une rgression est de trouver une formule qui
va avec la relation entre les deux variables. Ensuite, vous pouvez utiliser cette formule
pour prdire les valeurs de la variable dpendante seulement si la variable indpen-
dante est connue. Un docteur pourrait prescrire la bonne dose dun mdicament en
se basant sur le poids de la personne.
La droite de rgression est un lot de la valeur prvue de la variable indpendante
pour toutes les valeurs de la variable indpendante. Techniquement, cest la ligne
qui minimise des rsidus au carr . La ligne de rgression est celle qui sadapte
le mieux la donne sur une dispersion.
En utilisant lquation de rgression, la variable dpendante peut tre prdite ou
ajuste partir de la variable indpendante. Linclinaison de la ligne de rgression
(b) est dfnie par la hausse divise par la course. Le point dintersection y (a) est le
point sur laxe des y o la ligne de rgression rencontrerait laxe des y. La pente ou
linclinaison et le point dintersection y sont incorpors dans lquation de rgression.
Le point dintersection est normalement appel la constante, et la pente est rfre
comme tant le coeffcient. Puisque le modle de rgression nest habituellement
pas un outil parfait de prvision, il y a aussi un terme derreur dans lquation. La
droite de rgression ne permet pas dtablir avec exactitude la relation fonctionnelle
qui lie une variable dpendante une variable explicative ; elle nen fournit quune
approximation.
ur|vers|l v|rlue||e Alr|ca|re 101
Dans lquation de rgression, y est toujours la variable dpendante et x est toujours
la variable indpendante. Il y a trois faons quivalentes pour dcrire mathmatique-
ment un modle de rgression linaire.
Y = point dintersection + (pente x) + erreur
Y = constante + (coeffcient x) + erreur
Y = a + bx + e
La signifcation de la pente de la droite de rgression est dtermine par la statistique-t.
Cest la probabilit que le coeffcient de corrlation observ sest produit par chance
si la vraie corrlation est zro. Quelques chercheurs ont prfr se reporter au ratio-f
plutt que la statistique-t. Le ratio-f est gal la statistique-t au carr.
La statistique-t pour la signifcation de la pente est essentiellement un test pour dter-
miner si le modle de rgression (quation) est utilisable. Si la pente est considra-
blement diffrente de zro, alors nous utilisons le modle de rgression pour prdire
la variable dpendante de nimporte quelle valeur de la variable indpendante.
Dun autre ct, prenez un exemple o la pente est gale zro. Il ny a pas dhabilit
de prdiction parce que pour chacun des valeurs de la variable indpendante, la prdic-
tion pour la variable dpendante serait la mme. Sachant que la valeur de la variable
indpendante namliorerait pas notre habilet prdire la variable dpendante. Par
consquent, si la pente nest pas considrablement diffrente de zro, nutilisez pas
le modle pour faire des prdictions.
Le coeffcient de dtermination (r-carr) est le carr du coeffcient de corrlation. Sa
valeur peut varier de zro un. Il a lavantage sur le coeffcient de corrlation puis-
quil peut tre interprt directement la proportion de la variance dans la variable
dpendante qui peut tre explique par la rgression de lquation. Par exemple, une
valeur r-carr de .49 eut dire que 49 % de la variance dans la variable dpendante peut
tre explique par lquation de rgression. Le 51 % restant reste inexpliqu.
Lerreur-type de lestimation de la rgression mesure le montant de variabilit dans
les points autour de la droite de rgression. Elle a lcart-type des points de donnes
lorsquils sont distribus autour de la ligne de rgression. Lerreur-type de lestim
peut tre utilise pour dvelopper lintervalle autour dune prdiction.
Exemple
Une compagnie veut savoir sil y a une relation signifcative entre ses dpenses en
publicit et son volume de ventes. La variable indpendante est le budget de publicit
et la variable dpendante est le volume de ventes. Un retard dune moins sera utilis
puisque les ventes sont prvues pour prendre du retard derrire les dpenses actuelles
de publicits. Des donnes ont t amasses sur une priode de six mois. Toutes les
fgures sont en milliers de dollars. Y-a-t-il une relation signifcative entre le budget
de publicit et le volume de ventes?
ur|vers|l v|rlue||e Alr|ca|re 102
Variableindpendante Variabledpendante
4.2 27.1
6.1 30.4
3.9 25.0
5.7 29.7
7.3 40.1
5.9 28.8
Modle: y = 10.079 + (3.700 x) + erreur
Erreur-type de lestim = 2.568
Test-t pour la signifcation de linclinaison = 4.095
Degrs de libert = 4
Probabilit deux queues = .0149
R-carr = .807
manipuler: sur Excel, dans la barre de menus, slectionner Outils /utilitaire
danalyse/choisirRgressionlinaire, se laisser guid par Aides.
lire
1) An Introduction to Probability & Random ProcessesAn Introduction to Pro-
bability & Random Processes par Kenneth B. & Gian-Carlo R., pages 18-30,
212-215 et 300-303
2) Robert B. Ash, Lectures on Statistics, pages 28-29.
Rf.:http://en.wikipedia.org/wiki/Correlation
Rf.:http://en.wikipedia.org/wiki/Regression
Test khi-deux (ou khi-carr)
Un testkhi-carr(oukhi-deux) teste une hypothse telle que la variable statistique
considre suit une distribution de khi-deux sous lhypothse nulle, ou nimporte la-
quelle dans laquelle la la loi de probabilit de la variable statistique (sous lhypothse
nulle) peut tre considre pour approximer une distribution de khi-deux le plus prs
possible, pour un chantillon de taille suffsamment grande.
Spcifquement, un test de khi-deux pour lindpendance value statistiquement une
diffrence signifcative entre des proportions pour deux groupes ou plus dans un
ensemble de donnes.
ur|vers|l v|rlue||e Alr|ca|re 103
Le test de khi-deux de Pearson
Le test de khi-deux de Yates, aussi connu comme la correction de Yates pour
la continuit.
Le test de khi-deux de Mantel-Haenszel
Le test de khi-deux par association linaire-par-linaire

Dans la thorie des probabilits et des statistiques, la loi de khi-deux (ou khi-au
carrou distribution
2
) est lune des distributions les plus utilises en statistique
infrentielle, i.e. test de signifcation statistique. Elle est utile parce que, sous des
conditions raisonnables, la statistique correspondante dpendent des quantits faci-
lement calculables et peut tre prise comme une bonne approximation de la loi de
khi-deux, si lhypothse nulle est vraie.
Si X
i
sont k variables alatoires indpendantes, normalement distribues avec une
moyenne commune de 0 et une variance commune de 1, alors la variable alatoire

suit la distribution de khi-deux k degr de libert, et lon note :

La loi de khi-deux a un paramtre k, un nombre entier positif qui donne le nombre
de degrs de libert (le nombre des variables X
i
).
La loi de khi-deux est un cas particulier de la loi Gamma.
Les situations les plus connues, dans lesquelles la loi de khi-deux est utilise, sont
les usuels tests de khi-deux de Pearson de la qualit dajustement dune distribution
observe une distribution thorique, et de lindpendance de deux critres de
classifcation de donnes qualitatives. Cependant, dautres tests statistiques peuvent
amener lutilisation de cette loi.
La fonction caractristique
On dmondre que la fonction caractristique de la distribution de khi-deux k degrs
de libert est :

ur|vers|l v|rlue||e Alr|ca|re 101
Proprits
La loi de khi-deux a beaucoup dapplications dans les statistiques infrentielles,
comme par exemple dans les tests de khi-deux et dans lestimation de variances. Elle
entre dans le problme destimation de la moyenne dune population normalement
distribue et dans le problme destimation de la pente dune droite de rgression
via son rle dans la distribution-t de Student. Elle entre dans toutes les analyses de
problmes de variances via son rle dans la distribution-f de Fisher, qui est la dis-
tribution du rapport de deux variables alatoires indpendantes suivant des lois de
khi-deux diviss par leurs degrs de libert respectifs.
TypesdeLoiskhietkhi-deux
Nom Statistique
Loidekhi-deux
Loidekhi-deuxnon-centre
Distributionkhi
Distributionkhinon-centre
manipuler: sur Excel, dans la barre de menus, slectionner Outils /utilitaire
danalyse/choisirTestdeKhi-deux, testdgalitdesesprances, se laisser guid
par Aides.
lire
Rf.:http://en.wikipedia.org/wiki/pearson%chi-square_test
Rf.:http://en.wikipedia.org/wiki/Chi-Square_test
Le test t de Student
Un test t est un test statistique dhypothse pour comparer deux groupes tels que la
variable statistique tudie suit une loi t de Student, si lhypothse nulle est vraie.
ur|vers|l v|rlue||e Alr|ca|re 105
Historique
La statistique t a t introduite par William Sealy Gosset en surveillant la qualit le
brassage de bires. Student tait son nom de plume. Gosset tait un statisticien
pour la brasserie Guinness Dublin, en Irlande, et il a t engag parce que la po-
litique innovatrice de Claude Guiness voulait que les meilleurs diplms dOxford
et de Cambridge soient engags en biochimie et en statistiques pour le processus
industriel de Guinness. Gosset a publi le test t dans Biometrika en 1908, mais il a
t forc dutiliser un nom de plume par son employeur qui considrait le fait quils
utilisaient les statistiques comme secret en commerce. En fait, lidentit de Gosset
tait inconnue non seulement par ses compatriotes statisticiens, mais aussi par son
employeur. La compagnie a insist pour quil prenne un pseudonyme pour quelle
puisse fermer les yeux sur le non-respect des rgles.
Aujourdhui, le test t est plutt appliqu la confance qui peut tre situe dans les
jugements faits partir de petits chantillons.
Utilisation
Parmi les tests t les plus utiliss, il y a :
Un test de lhypothse nulle dgalit des moyennes de deux populations
normalement distribues. Avec les deux ensembles de donnes, chacun ca-
ractris par sa moyenne, son cart-type et le nombre de points de donnes,
nous pouvons utiliser un genre de test t pour dterminer si les moyennes sont
distinctes, fournies par les distributions sous-jacentes qui peuvent prsumer
tre normales. Des tests de ce genre sont gnralement appels des test t
deStudent, mais ce terme ne devrait tre utilis seulement si les variances
de deux populations sont aussi prsumes gales ; la forme du test utilise
lorsque cette hypothse est lance est parfois appele le test t de Welch. Il y
a diffrentes versions du test t dpendamment si les deux chantillons sont :
o Indpendants lun de lautre (ex. : des individus assigns alatoirement dans
deux groupes), ou
o apparis, pour que chaque membre dun chantillon aie une relation unique
avec un membre particulier de lautre chantillon (ex. : si les mmes personnes
observes avant et aprs une intervention, ou les rsultats de test de QI dun
mari et de sa femme).
Si les valeurs t calcules sont suprieures au seuil choisi pour la signifcation statis-
tique (normalement le niveau 0.05), alors lhypothse nulle que les deux groupes ne
sont pas diffrents sont rejets en faveur dune autre hypothse, qui mentionne que
les groupes ne sont pas diffrents.
Un test si la moyenne est une population normalement distribue qui a une
valeur spcife dans une hypothse nulle.
Un test si la pente dune ligne de rgression est considrablement diffrente
de 0.
ur|vers|l v|rlue||e Alr|ca|re 10
Lorsquune valeur t est dtermine, une valeur p peut tre trouve en utilisant un
tableau de valeurs de la distribution t de Student.
Les intervalles de confiance utilisant un petit format dchantillon
Prenons une population normalement distribue. Pour estimer la variance de la po-
pulation, prenez un chantillon de taille n et calculez la variance de celui-ci, s. Un
estimateur non biais de la variance de la population est

Pour les petites valeurs de n, cette estimation est imprcise, do les chantillons de
petits formats plutt que de calculer la valeur z pour le nombre dcart-types de la
moyenne

On peut utiliser aussi, sous lhypothse dune population gaussienne, la statistique
de student en estimant lcart-type :

t =
X
n1
s
n
.
La probabilit que la valeur t soit dans un intervalle particulier peut tre trouve en
utilisant la distribution t. Le degr de libert de lchantillon est le nombre de donnes
qui doivent tre connues avant que le reste des donnes puissent tre calcules.
Ex.: Un chantillon alatoire de choses avec un poids
30.02, 29.99, 30.11, 29.97, 30.01, 29.99
Calculez un intervalle de confance pour la moyenne de poids de la population.
Supposons que la population ~ N(,
2
).
Le poids moyen de lchantillon est de 30.015 avec un cart-type de 0.045. Avec la
moyenne et les cinq premiers poids, il est possible de calculer le sixime poids. Cest
pourquoi il y a cinq degrs de libert.
La distribution t nous dit que, pour cinq degrs de libert, la probabilit que t > 2.571
est 0.025. Aussi, la probabilit que t < 2.571 est 0.025. En utilisant la formule pour
t avec t = 2.571 un intervalle de confance pour la moyenne de la population peut
tre trouve en faisant de le sujet de lquation.
ur|vers|l v|rlue||e Alr|ca|re 10Z
Ex.:
(29.97 < < 30.06)
lire
1. Introduction to Probability par Charles M. Grinstead, pages 18-30, 212-215,
300-303.
2. Robert B. Ash, Lectures on Statistics, pages 23-29
Faire les problmes 1-6 la page 23.
Rf.:http://en.wikipedia.org/wiki/Statistical_Hypothesis_testing
Rf.:http://en.wikipedia.org/wiki/Null_hypothesis
ur|vers|l v|rlue||e Alr|ca|re 108
q
Rfextion
Ltude des corrlations, des tests de lhypothse de la rgression
ainsi que de dautres modles de mathmatiques peut tre simplife
avec le TIC. Le lien suivant aide les stagiaires apprendre modelage
facilement
http://www.ncaction.org.uk/subjects/maths/ict-lrn.htm
ur|vers|l v|rlue||e Alr|ca|re 109
Unit 3 : La thorie des probabilits (40 heures)
Fonction Indicatrice
En mathmatiques, une fonction indicatrice ou une fonction caractristique est une
fonction dfnie par un ensemble X qui indique lappartenance dun lment un
sous-ensemble A de X.
La fonction indicatrice dun sous-ensemble A dun ensemble X est une fonction

dfnie par : Pour tout x dans X,

A
1
(x) =
1, si x A ;
0, si x A.

La fonction indicatrice de A est parfois note comme suit :



A
(x) ,ou ou mme A(x).
Lingalit de Bonferoni : sous-additivit dune probabilit.
Soit la probabilit que soit vrai, et que la probabilit quau
moins un des , , ..., soit vrai. Alors, lingalit de Bonferoni, aussi connue
comme lingalit de Boole, dit que :

O reprsente lunion. Si et sont des ensembles disjoints pour tous les
et les , alors lingalit devient une galit. Un merveilleux thorme qui exprime
cette exacte relation entre la probabilit dunion et les probabilits dvnements
individuels est appel un principe inclusion-exclusion.
Une classe dingalits un peu plus large est aussi appele ingalits de Bonfer-
roni .
Fonction gnratrice
En mathmatiques, une fonction gnratrice est une srie de puissances formelles
(ou une srie entire) avec des coeffcients qui encodent linformation sur une suite
a
n
qui est indexe par les nombres naturels.
Il y a plusieurs types de fonctions gnratrices, incluant les fonctions gnratrices
ordinaires, les fonctions gnratrices exponentielles, les sries de Lambert, les sries
ur|vers|l v|rlue||e Alr|ca|re 110
de Bell et les sries de Dirichlet; des dfnitions et des exemples sont donns plus bas.
Chaque squence a une fonction gnratrice de chaque type. La fonction gnratrice
particulire qui est la plus utilise dans un contexte donn dpendra de la nature des
squences et des dtails du problme pos.
Les fonctions gnratrices sont souvent exprimes dans une forme ferme comme des
fonctions dun argument formel x. Parfois, une fonction gnratrice est value avec
une valeur spcifque x. Cependant, on doit se rappeler que les fonctions gnratrices
sont des sries de puissances formelles, et quelles ne convergent pas ncessairement
pour toutes les valeurs de x.
Si a
n
est la probabilit de la fonction de masse dune variable alatoire discrte, alors sa
fonction gnratrice ordinaire est appele une fonction gnratrice de probabilits.
La fonction gnratrice ordinaire peut tre gnralise en suites avec des indices
multiples, en sries entires doubles. Par exemple, la fonction gnratrice ordinaire
dune suite a
m,n
(o n et m sont des entiers naturels) est

Fonction caractristique (la thorie de probabilits)
Dans la thorie des probabilits, la fonction caractristique dune variable alatoire
dfnit compltement sa distribution de probabilits. Elle est donne par les formules
suivantes, o X est une variable alatoire quelconque de loi fxe :

o t est un nombre rel, i est lunit imaginaire, et E reprsente loprateur esprance
mathmatique. Si F
X
est la fonction de rpartition de X, alors la fonction caractris-
tique de X est donne par lintgrale de Riemann-Stieltjes

Dans le cas o la fonction densit de probabilit f
X
existe, la fonction caractristique
de X devient :

X
(t) = E (
itX
e
) =
itx
e

X
. f (x)dx.
Si X est une variable alatoire vectorielle, t devient un vecteur et tX devient un pro-
duit scalaire.
ur|vers|l v|rlue||e Alr|ca|re 111
Chaque distribution de probabilits sur R ou sur R
n
a une fonction caractristique,
parce quon intgre une fonction borne sur un espace de mesure fnie.
Le thorme de continuit
Si la suite des fonctions caractristiques dune distribution F
n
converge vers la fonc-
tion caractristique dune distribution F, alors F
n
(x) converge vers F(x) pour toute
valeur de x o F est continue.
Utilisation des fonctions caractristiques
Les fonctions caractristiques sont particulirement utiles pour traiter les fonctions
de variables alatoires indpendantes. Par exemple, si X
1
, X
2
, ..., X
n
est une suite de
variables alatoires indpendantes (mais pas ncessairement identiquement distri-
bues) et

o a
i
sont des constantes, alors la fonction caractristique pour S
n
est donne par

En part i cul i er, pour deux vari abl es i ndpendant es X et Y, on a :
, Pour le vrifer, crivez la dfnition de la fonc-
tion caractristique :
Observer que lindpendance de X et de Y est requise pour tablir la troisime, ainsi
que la quatrime expression.
Grce au thorme de continuit, les fonctions caractristiques sont utilises trs
souvent dans la preuve du thorme centrale limite.
Les fonctions caractristiques peuvent aussi tre utilises pour calculer les moments
des variables alatoires. Si on sait que le moment dordre n existe, les fonctions
caractristiques peuvent tre diffrencies n fois et


ur|vers|l v|rlue||e Alr|ca|re 112
lire
Robert B. Ash, Lectures on Statistics, pages 32 45.
Rf. : http://en.wikipedia.org/wiki/Characteristic_function_%28probabi-
lity_theory%29
Lindpendance statistique
Dans la thorie des probabilits, dire que deux vnements sont indpendants intui-
tivement veut dire que loccurrence dun vnement ne le rend pas plus ou moins
probable que lautre se produise. Par exemple :
Lvnement davoir un 6 la premire fois quun d est lanc et lvne-
ment davoir un 6 la seconde fois sont indpendants.
Lvnement davoir un 6 la premire fois quun d est lanc et lvne-
ment que la somme des nombres obtenus au premier et au second essai est
8 sont dpendants.
Si deux cartes sont tires avec un remplacement dans un jeu de cartes, lv-
nement de tirer une carte rouge au premier essai et de tirer une carte rouge au
second essai sont indpendants.
Si deux cartes sont tires sans remplacement dans un jeu de cartes, lvnement
de tirer une carte rouge au premier essai et de tirer une carte rouge au second
essai sont dpendants.
De faon similaire, deux variables alatoires sont indpendantes si la distribution de
probabilits conditionnelle de la valeur observe de lautre valeur est la mme que
si lautre valeur navait pas t observe.
vnements indpendants
La dfnition classique dit :
Deux vnements A et B sont indpendants, si Pr(A B) = Pr(A)Pr(B).
Ici, A B est lintersection de A et B, cest--dire lvnement qui se ralise si les
deux vnements A et B se produisent simultanment.
Plus gnralement, une collection dvnements, possiblement plus que deux, sont
mutuellementindpendants, si, pour nimporte quel sous-ensemble fni A
1
, ..., A
n

de la famille, nous avons

Ceci est appel la rgle de multiplication des probabilits pour des vnements
indpendants.
ur|vers|l v|rlue||e Alr|ca|re 113
Si deux vnements A et B sont indpendants, alors la probabilit conditionnelle sa-
chant B de A est la mme que la probabilit inconditionnelle (ou marginale )
de A,

Il y a au moins deux raisons pour lesquelles cette galit nest pas prise comme d-
fnition de lindpendance : (1) les deux vnements A et B ne jouent pas des rles
symtriques dans cet nonc, et (2) les problmes surviennent avec cet nonc lorsque
deux vnements de probabilit 0 sont impliqus.
Lorsquon se rappelle que la probabilit conditionnelle Pr(A | B) est dfnie par
(sous rserve que Pr(B) 0 )
On peut voir que lnonc ci-dessus est quivalent

Qui est la dfnition standard donne ci-haut.
chantillon alatoire
Un chantillon est un sous-ensemble choisi partir dune population tudie. Un
chantillon alatoire est choisi par une mthode qui implique un composant imprdic-
tible. Lchantillonnage alatoire peut aussi impliquer de prendre un certain nombre
dobservations indpendantes partir de la mme distribution de probabilits, sans
impliquer aucune population relle. Un chantillon de probabilits est celui dans
lequel chaque objet a une probabilit connue dtre dans lchantillon.
Lchantillon ne sera habituellement pas compltement reprsentatif de la population
partir de laquelle il a t tir, cette variation alatoire dans le rsultat est connue
comme erreur dchantillonnage. Dans le cas dchantillons alatoires, la thorie
mathmatique est disponible pour estimer lerreur dchantillonnage. Ainsi, lesti-
mation obtenue partir dchantillons alatoires peut tre accompagne de mesures
dincertitude associes lestim. Il peut prendre la forme dune erreur standard,
ou si lchantillon est assez grand pour que le thorme central limite prenne effet,
lintervalle de confance peut tre calcul.
Types dchantillons alatoires
Un chantillon alatoire simple est choisi pour que les chantillons possibles
aient la mme chance dtre slectionns.
Un chantillon dauto-pondration est celui dans lequel chaque individu, ou ob-
jet, dans lintrt de la population ait une opportunit gale dtre slectionne
comme chantillon. Des chantillons alatoires simples sont auto-pondrs.
ur|vers|l v|rlue||e Alr|ca|re 111
Lchantillonnage stratif implique de slectionner des chantillons indpen-
dants partir dun nombre de subpopulation (ou strates) dans la population.
Lchantillonnage par groupement implique de slectionner des units dchan-
tillon dans des groupes. Par exemple, un chantillon dappels tlphoniques
peut tre rassembl en prenant une collection des lignes de tlphones et
de rassembler tous les appels sur les lignes dchantillonnage. Lanalyse de
lchantillonnage par groupement doit prendre en compte la corrlation par
groupement intra dans lequel se refte le fait que les units dans le mme
groupe ont tendance tre plus similaires que deux units prises au hasard.
La distribution multinomiale
Dans la thorie des probabilits, la distributionmultinomiale est une gnralisation
de la distribution binomiale.
La distribution binomiale est la distribution de probabilits du nombre de succs
dans n essais indpendants dune preuve de Bernoulli, avec la mme probabilit
de succs pour chaque essai. Dans une distribution multinomiale, chaque essai
occasionne exactement un de quelques nombres limits fxs k de rsultats possi-
bles, avec les probabilits respectives p
1
, ..., p
k
tels que p
i
0 pour i = 1, ..., k et
, et il y a n essais indpendants. Ensuite, supposons que les variables
alatoires X
i
indiquent le nombre de fois que le nombre i a t observ dans les essais
n, alors suit une loi multinomiale avec des paramtres n
et p=(p
1
, ..., p
k
).
Solution tire de la formule de distribution multinomiale
Une version courte de la formule multinomiale pour trois rsultats alternatifs est
donne ci-dessous.
Si X est constitu dvnements E1, E
2
, E
3,
qui ont des probabilits correspondantes
de p
1,
p
2,
et p
3
de se produire, o x
1
est le nombre de fois que E
1
se produira, x
2
est
le nombre de fois que E
2
se produira et x
3
est le nombre de fois que E
3
se produira,
donc la probabilit de X est

n!
x
1
! x
2
! x
3
!
.
1
x
1
p
.
2
x
2
p
.
3
x
3
p

O x
1
+ x
2
+ x
3
= n et p
1
+
p
2
+ p
3
= 1
ur|vers|l v|rlue||e Alr|ca|re 115
Exemple
1) Dans une grande ville, 60 % des travailleurs conduisent pour aller travailler, 30 %
prennent lautobus, et 10 % prennent le train. Si 5 travailleurs sont slectionns
au hasard, trouvez la probabilit que 2 conduisent, que 2 prennent lautobus et
que 1 prenne le train.
Solution
n= 5, x
1
=2, x
2
= 2, x
3
= 1 et p
1
=0.6, p
2
= 0.3, et p
3
= 0.1
Donc, la probabilit que 2 travailleurs prennent lautobus et que 1 prenne le train
est

0972 . 0 ( .
! 1 ! 2 ! 2
! 5
) 1 . 0 ( ) 3 . 0 ( ) 6 . 0
1 2 2
=
2) Une bote contient 5 balles rouges, 3 balles bleues et 2 balles blanches. Si 4 balles
sont slectionnes avec un remplacement, trouvez la probabilit davoir 2 balles
rouges, une balle bleue et une balle blanche
Solution
n=4, x
1
=2, x
2
=1, x
3
=1, et p
1
=
10
5
, p
2
=
10
3
, et p
3
=
10
2
.

Donc, la probabilit davoir 2 balles rouges, une balle bleue et une balle blanche
est

18 . 0
50
9
200
3
12
10
2
10
3
10
5
! 1 ! 1 ! 2
! 4
1 1 2
= =


{ Allan G, 2005, page 132}
Statistique dordre
Les distributions de probabilits pour le n = 5 de statistique dordre dune distribution
exponentielle avec = 3.
ur|vers|l v|rlue||e Alr|ca|re 11
En statistiques, la k-ime statistiques dordre dun chantillon de statistiques est gal
sa k-ime valeur la plus petite. Avec des statistiques de rang, les statistiques dor-
dre sont parmi les outils les plus essentiels dans les statistiques non paramtriques
et infrentielles.
Des cas spciaux importants des statistiques dordre sont la valeur minimum et maxi-
mum dun chantillon, lchantillon de mdiane et les chantillons quartiles.
Lorsque vous utilisez la thorie de probabilits pour analyse lordre des statistiques
dchantillons alatoires dune distribution continue, la fonction de rpartition est
utilise pour rduire lanalyse du cas des statistiques dordre de la loi uniforme.
lire
Robert B. Ash, Lectures on Statistics, pages 25-26, rpondre aux problmes
1-4 aux pages 26-27.
Rf.:http://en.wikipedia.org/wiki/probability _distribution
Rf.:http://en.wikipedia.org/wiki/Ranking
Rf.:http://en.wikipedia.org/wiki/non-parametric_Statistics
Notations et exemples
Par exemple, supposons que quatre nombres sont observs ou enregistrs, entranant
un chantillon de grandeur n = 4. Si les valeurs dchantillons sont 6,9,3,8
Ils seront gnralement reprsents comme suit :

O le lindice (i) est entre parenthses pour indiquer le lordre statistique ith de
lchantillon.
La premire statistique dordre est toujours le minimum de lchantillon, qui est

O, en suivant une convention commune, nous utilisons des lettres majuscules pour
les variables alatoires, et des lettres minuscules pour les valeurs observes.
De faon similaire, pour un chantillon de grandeur n, la n
ime
statistique est le maxi-
mum, qui est

Ltendue de lchantillon est la diffrence entre le maximum et le minimum. Cest
une fonction dans les statistiques dordre :

ur|vers|l v|rlue||e Alr|ca|re 11Z
Une statistique importante et similaire dans lanalyse dexploration des donnes qui
est simplement relie aux statistiques dordre est lcart dchantillon interquartile.
La mdiane dchantillon peut, ou ne peut pas tre une statistique dordre, puisquil
ny a quune seule valeur du milieu seulement lorsque le nombre n dobservations est
impair. Plus prcisment, si n = 2 m + 1 pour quelques m, alors la mdiane dchan-
tillon est X
(m + 1)
et ainsi cest une statistique dordre. Dun autre ct, lorsque n est gal,
n = 2 m et quil y a deux valeurs du milieu, X
(m)
et X
(m + 1)
, et la mdiane dchantillon
est une fonction de deux (habituellement la moyenne) et pas une statistique dordre.
Des remarques similaires sappliquent tous les quantiles dchantillon.
La loi normale multidimensionnelle
Dans la thorie des probabilits et des statistiques, une loinormalemultidimension-
nelle, aussi appele une loiGausiennemultidimensionnelle, est une distribution de
probabilits spcifque, qui peut tre apprise comme une gnralisation de dimensions
plus grandes que les distributions normales une dimension.
Moments dordres suprieurs
Les moments dordre k de X sont dfnis par :

o
Les moments dordre centr dordre k sont reprsents comme ceci
(a) Si k est impair, .
(b) Si k est gal avec k = 2, alors


O la somme est reprise par toutes les allocations de lensemble
dans paires, donnant (2 1)! / (2
1
( 1)!) termes dans la somme, chacun
tant le produit de covariances. Les covariances sont dtermines en remplaant
les termes dans la liste par les termes correspondants de la liste
qui consiste de r
1
uns, et r
2
deux, etc., aprs chacune des allocations possibles de la
premire liste en des paires.
ur|vers|l v|rlue||e Alr|ca|re 118
Plus particulirement, les moments dordre 4 sont





Pour les moments dordre 4 (quatre variables), il y a trois termes. Pour un moment
d ordre six, il y a 3 x 5 = 15 termes, et pour les moments dordre six, il y a 3 x 5 x
7 = 105 termes.
ur|vers|l v|rlue||e Alr|ca|re 119
XV. synthse du module
la fn de ce module, les lves devraient tre en mesure de calculer des me-
sures varies de dispersions, et dappliquer les rgles de calcul des probabilits
selon plusieurs lois de probabilits. Les apprenants devraient tre en mesure de
dterminer et danalyser des coeffcients de corrlation et de rgression. Lunit
une des probabilits et des statistiques couvre les distributions de frquences
relatives et les distributions cumulatives, les diffrentes courbes de frquences,
la moyenne, le mode et la mdiane, les quartiles et les percentiles, lcart-type
et les distributions symtriques et asymtriques. Lapprenant est introduit
diffrentes mesures de statistiques, ainsi qu des exemples rsolus.
Les exemples sont bien illustrs et lapprenant peut suivre sans aucune dif-
fcult. Il est recommand que lapprenant tente de faire les valuations for-
matives donnes pour assimiler leur progrs dans lapprentissage du contenu.
Llve devrait prendre du temps pour regarder le matriel de rfrence sur
les CDs, ainsi que sur le matriel source ouverte (open sources) et les sites
internet recommands. Les lves sont fortement conseills de lire le contenu
et de rpondre aux questions aprs chaque sujet. LUnit deux du module
traite du moment et de la fonction gnratrice des moments, les ingalits de
Markov et de Chebychev, les distributions une variable, les distributions de
probabilits deux variables; lindpendance stochastique, la rgression
deux variables et la corrlation ; le calcul de la rgression et du coeffcient de
corrlation pour les donnes deux variables, les fonctions de distributions
de variables alatoires, les distributions normales deux variables, les distri-
butions drives comme le khi-carr, t et F.
Lunit deux comporte plusieurs activits dapprentissage pour aider lap-
prentissage et les tudiants devraient matriser le contenu des nombreux sous-
sujets et ils devraient faire les valuations formatives. Lchec ces valuations
devrait tre un indicateur positif pour que les apprenants : ils rvisent les sous-
sujets avant daller plus loin. Les tches fournies sous les diffrentes activits
dapprentissage demandent que vous dmontriez un haut niveau dhabilet dans
le TIC. Les objectifs dapprentissage sont bien noncs au dbut du module et
devraient guider les lves dans le niveau dattentes du ce module.
Lunit trois se concentre sur la thorie des probabilits et traite des diffrentes
lois de probabilits usuelles.
Lvaluation sommative sera utilise pour juger si les apprenants ont matris
le module. Il est recommand que les tudiants rvisent le module avant de
faire lvaluation sommative fnale.
ur|vers|l v|rlue||e Alr|ca|re 120
XVi. valuation sommative
Rpondre aux quatre questions. Chaque question compte pour 15 points.
Question 1: Statistiques gnrales
1) Dans le tableau suivant, les poids de 40 vaches sont enregistrs, et arrondis au
kilogramme le plus prs.
128 161 135 142 145 156 150 145
157 138 150 147 140 125 144 173
144 146 140 176 154 148 163 164
135 146 142 142 149 119 134 158
165 168 138 147 152 153 136 126
Trouvez;
a). le poids le plus lev
b). le poids le moins lev
c). ltendue
d). construisez un tableau de frquences, distribution qui commence avec une
classe de 118-126
e). calculez la moyenne des donnes
f). calculez lcart-type
Question 2: Probabilits gnrales
2) A). Une pice de monnaie et un d sont lancs en mme temps. Dessinez un
diagramme despace possible et trouvez la probabilit dobtenir
a). un ct face
b). un nombre plus haut que 4
c). un ct face et un nombre plus haut que 4
d). un ct face ou un nombre plus haut que 4
B). Les vnements M et N sont P(M) =
30
19
, P(N) =
5
2
et P(M U N)=
5
4
. Trouvez
P(M I N)
ur|vers|l v|rlue||e Alr|ca|re 121
Question 3: Loi de Poisson
3) Un livre contient 500 pages et comporte 750 erreurs dimpression.
a). Trouvez la moyenne derreurs dimpression par page.
b) Trouvez la probabilit que la page 427 contienne
i). aucune erreur dimpression
ii). Exactement 4 erreurs dimpression
c). Trouvez la probabilit que les pages 427 et 428 ne contiennent aucune
erreur dimpression.
Question 4: Variable alatoire continue
4) Une variable alatoire continue X a une fonction de densit de probabilit f(x)
o

f (x) =
k(x + 2)
2
, 2 x p 0 ;
4k , 0 x 1
1
3
;
0 , sinon.

a) Trouvez la valeur de la constante k


b) Dessinez y=f(x)
c) Trouvez P( - 1 X 1)
d) Trouvez P(x>1)
Probabilit dun vnement
5). Supposons que P(AUB) =7/8, P(AI B)=1/4 et P(A)=5/8, trouvez les valeurs
de
a) P(A)
b) P(B)
c) P(AI B)
d) P(AU B)
e) La probabilit que seulement un de A, B se produise.
ur|vers|l v|rlue||e Alr|ca|re 122
Valeur prvue
6). La variable alatoire continue a une fonction de densit de probabilit

f (x) = x +
1
2
, pour 0 x 1 ; zro, sinon.
Trouvez:
a). E(X)
b). E(24X +6)
c). E( 1-X)
2
1
7). Les poids, arrondis au kg le plus prs, de 50 garons sont enregistrs ci-des-
sous.

Poids (kg) 60-64 65-69 70-74 75-79 80-84 85-89
Frquence (f ) 2 6 12 14 10 6
a). Construisez une courbe de frquence cumulative
b). Utilisez la courbe pour estimer ;
i) La mdiane
ii). Ltendue interquartile
iii). Le 7
e
dcile
iii). Le 60
e
percentile.
ur|vers|l v|rlue||e Alr|ca|re 123
Cl de correction de lvaluation sommative
1). a) 176
b) 119
c) 176-119=57
d) En utilisant 7 classes, cela nous donne un intervalle de classe de 9.
Poids(kg) Compte Frquence
118-126 /// 3
127-135 //// 5
136-144 //// //// 9
145-153 //// //// // 12
154-162 //// 5
163-171 //// 4
172-180 // 2
Total 40
e) Toutes les mthodes pour calculer la moyenne sont acceptes.
f). Toutes les mthodes pour calculer lcart-type sont acceptes.
2) A).Une pice de monnaie a soit Face (F) ou Pile (P) tandis quun d des faces
1,2,3,4,5&6.
Pice / D 1 2 3 4 5 6
Pice F H1 H2 H3 H4 H5 H6
Pice P T1 T2 T3 T4 T5 T6
Espace dchantillonnage =12.
a). 6/12=1/2
b). 4/12=1/3
c). 2/12=1/6
d). 8/12=2/3
ur|vers|l v|rlue||e Alr|ca|re 121
B) . P(M U N)= P(M)+P(N)-P(M I N).

5
4
=
30
19
+
5
2
- P(M
I
N).

P(M I N) =
30
19
+
30
7
30
24
30
12
=
3). a) La moyenne derreurs par page = 750/500=1.5
b) Supposons que X est le nombre derreurs par pages. Ensuite, supposons
que les erreurs dimpression se produisent au hasard X ~ P
0
(1.5)
i). P(X= 0) = e
-1.5
= 0.2231
P(il ny aura pas derreurs la page 427) = 0.223 ( 3d.p).
ii). P(X=4)= e
-1.5
! 4
4
) 5 . 1 (
= 0.0470
P(il y aura 4 erreurs la page 427) = 0.047 ( 3d.p)
c). Nous prvoyons 1.5 erreurs dimpression sur chaque page et donc, sur les pages
427 & 428 nous prvoyons 1.5 + 1.5 = 3 erreurs dimpression.
Supposons que Y est le nombre derreurs dimpression sur deux pages.
Y ~ P(3), donc P
0
(Y=0)= e
-3
= 0.4421
4). a). Puisque X est une variable alatoire, alors

f (x)dx
tout x
= 1
Donc 1
0
2
3
1
1
0
4
2
) 2 ( =


+ + kdx dx x k
ur|vers|l v|rlue||e Alr|ca|re 125
[ ] 1
3
1
1
0
4
0
2
3
) 2 (
3
= +

+ x k x
k
1
3
4
4 ) 8 (
3
=

+ k
k
8k=1
k=
8
1
a) La fonction de densit de probabilit de X est


- 2 0
3
1
1

x
y
2
1
y
c)
ur|vers|l v|rlue||e Alr|ca|re 12
P(-
24
7
) 2 (
8
1
) 0 1
0
1
2
= + =

dx x x
et

P(0 x 1) = aire du rec tangle =


1
2
Donc

24
19
2
1
24
7
) 1 1 ( = + = X P
d).
P(0
) 1 X
= aire du rectangle=
6
1
2
1
3
1
= .
Donc P(x>1) =
6
1
5) a) P(A)=1-P(A)=1- 5/8=3/8
b) P(AUB)=P(A) P(B) P(AI B)
7/8=3/8+P(B)
P(B)=3/4
c) P(AI B)=P(A) P(AI B)
= 3/8-1/4
=1/8
ur|vers|l v|rlue||e Alr|ca|re 12Z
d) A U B = (AI B) et P(AU B) = 1 P(AI B) = 3/4

e) Seulement un de A,B qui se produit = (AI B)U((A I B).
P(Seulement un de A,B qui se produit) = P(AI B)+P(A I B)
= { P(A)-P(AI B)} + { P(B)-P(A
I B)}
= 1/8 + =5/8
6). a). E(X)=7/8
b). E(24X+6)=20
c). E( 1-X)
2
1
=
5
3
)
2
1
( ) 1 (
1
0
2
1
= +

dx x x
7). a) Moyenne= 76.3 kg.
b). tendue interquartile = 9 kg
c). Estim de

7
10
50 = 35
th
decilede la courbe
.
d). Estim de

60
100
50 = 30
th
percentilede la courbe

ur|vers|l v|rlue||e Alr|ca|re 128
XVii. rfrences bibliographiques
http://en.wikipedia.org/wiki/Statistics
A concise Course in A-Level Statistics par J. Crawshaw et J.Chambers, Stanley-
Thornes Publishers, 1994
http://en.wikipedia.org/wiki/Probability
Business Calculation and Statistics Simplifed, par N.A. Saleemi, 2000
http://microblog.routed.net/wp-content/uploads/2007/01/onlinebooks.html
Statistics: concepts and applications, par Harry Frank et Steven C Althoen, Cam-
bridge University Press, 2004
http://mathworld.wolfram.com/Statistics
http://mathworld.wolfram.com/Probability
Probability Demystifed, By Allan G. Bluman, McGraw Hill, 2005.
http://directory.fsf.org/math/
http://microblog.routed.net/wp-content/uploads/2007/01/onlinebooks.html
Lectures on Statistics, par Robert B. Ash, 2005.
Introduction to Probability, par Charles M. Grinstead et J. Laurie Snell, Swarth-
more College.
http://directory.fsf.org/math/
Simple Statistics, par Frances Clegg, Cambridge University Press 1982.
Statistics for Advanced Level Mathematics, par I. Gwyn Evans University College
of Wales, 1984.

ur|vers|l v|rlue||e Alr|ca|re 129
XViii. Fiche dvaluation
Nommez le fchier EXCEL
Mathmatiques : Probabilit et statistiques, fche dvaluation de ltudiant
XiX. auteur du module
M. Paul Chege (B.Ed(Sc), M.Ed)
paulamoud@yahoo.com
Lauteur du module est un formateur denseignants lUniversit Amound, Borama,
Rpublique de Somaliland.
Il a t un formateur denseignants au Kenya, en Rpublique de Seychelles et au So-
mali. Il a t impliqu pour renforcer les mathmatiques et les sciences aux niveaux
secondaires et tertiaires avec lAgence de Corporation Internationale du Japon (JICA)
dans quinze pays africains.
Il est mari et a trois enfants.
ur|vers|l v|rlue||e Alr|ca|re 130
XX. structure du fchier
Conseildelditeurdumodule. Le nom du module et la structure doivent suivre
le modle AVU/PI comme dfni et expliqu par lAVU. Les diteurs du module
doivent fournir les noms de tous les fchiers (le module et les autres fchiers qui
accompagnent le module)
Tous les jours, chaque module sera charg dans leportfolio de chaque consultant.
Pour cela, la formation sera fournie par le professeur Thierry Karsenti et son quipe
(Salomon Tchamni Ngamo et Toby Harper).
Nom du module (WORD) fchier : Mathmatiques : Probabilits et statistiques
(Word)
Nom de tous les autres fchiers (WORD, PDF, PPT, etc) pour le module.
1. Mathmatiques : Probabilits et Statistiques, fche dvaluation de ltudiant
(Excel)
2. Probabilits et statistiques : Cl de correction pour lvaluation sommative
(Word)
3. An Introduction to Probabilit et Random Processes, par Kenneth Baclawski
et Gian-Carolo Rota (1979) (PDF).
4. Introduction to Probability, par Charles M. Grinstead et J. Laurie Snell
(PDF).
5. Lectures on Statistics, par Robert B. Ash (PDF).


1







PROBABILIT ET STATISTIQUES

Lectures Obligatoires



Source: Wikipedia.org










2

Table des matires
Test d'hypothse .......................................................................................................................................... 4
Risque de premire espce et de deuxime espce .............................................................................. 4
Tests classiques et tests baysiens ......................................................................................................... 4
Classification .......................................................................................................................................... 5
Droulement d'un test ............................................................................................................................ 5
Tests classiques ....................................................................................................................................... 6
Plan d'exprience ..............................................................................................................................6
Position du problme ....................................................................................................................7
Plans d'exprience en sciences appliques (plans exprimentaux) ..................................................8
En sciences humaines ................................................................................................................9
Limites des plans exprimentaux exhaustifs ................................................................................. 10
Exemple ...................................................................................................................................... 10
Les plans factoriels ...................................................................................................................... 12
Interactions logiques ................................................................................................................................. 14
Notion dinteraction ............................................................................................................................. 14
Un cas particulier de tableau de donne ............................................................................................ 14
Gnralisation aux tableaux quelconques .......................................................................................... 15
Interprtation physique du produit crois ......................................................................................... 15
Notion d interaction logique ......................................................................................................... 17
Signification des symboles dinteractions logiques ........................................................................... 18
Modles de rgression multiple postuls et non postuls ....................................................................... 19
Modle ................................................................................................................................................... 19
Rgression multiple .............................................................................................................................. 19
Modle postul ...................................................................................................................................... 20
Le problme de la slection des variables explicatives ..................................................................... 20
Modle non postul .............................................................................................................................. 20
Dcomposition harmonique ................................................................................................................ 21
Exemples ............................................................................................................................................... 22
Application au marketing ................................................................................................................ 22
Amlioration de la qualit industrielle ........................................................................................... 23
Thorie des probabilits ........................................................................................................................... 27
3

Historique ............................................................................................................................................. 28
Thorie des probabilits discrte .................................................................................................... 28
Thorie des probabilits continue ................................................................................................... 29
Principes fondamentaux ...................................................................................................................... 30
La thorie des probabilits aujourd'hui ............................................................................................. 31
Lois de probabilit ............................................................................................................................... 32
Convergence de variables alatoires .................................................................................................. 32
Le calcul stochastique .......................................................................................................................... 32
Chane de Markov ............................................................................................................................ 33
quations diffrentielles stochastiques .......................................................................................... 34
Processus stochastique .............................................................................................................................. 35
Mathmatiquement .............................................................................................................................. 35
Espace des trajectoires ........................................................................................................................ 35
Pratiquement ........................................................................................................................................ 35
Notion de processus .......................................................................................................................... 35
Types de processus ........................................................................................................................... 36
Exemples ........................................................................................................................................... 36
Rgression linaire .................................................................................................................................... 37
Situation ................................................................................................................................................ 37
Dfinitions ............................................................................................................................................. 38
Rsultat de la rgression ...................................................................................................................... 39
Erreur commise .................................................................................................................................... 39
Coefficient de corrlation linaire ...................................................................................................... 40
Dmonstration des formules par tude d'un minimum .................................................................... 41
Dmonstration des formules grce aux espaces vectoriels de dimension n .................................... 42
Gnralisation: le cas matriciel ........................................................................................................... 43



4

Test d'hypothse
En statistiques, un test d'hypothse est une dmarche consistant rejeter (ou plus rarement
accepter) une hypothse statistique, appele hypothse nulle, en fonction d'un jeu de donnes
(chantillon).
On cherche par exemple tester si un certain paramtre , qui peut par exemple tre la valeur
moyenne d'une grandeur, prend une certaine valeur
0
. L'hypothse nulle dans ce cas est la
moyenne vaut
0
et l'hypothse contraire sera la moyenne est diffrente de
0
.
Risque de premire espce et de deuxime espce []
Une notion fondamentale concernant les tests est la probabilit que l'on a de se tromper. Dans
l'idal on souhaiterait avoir un test qui renvoie toujours le "bon" rsultat. Par exemple on
aimerait avoir un test qui choisisse toujours l'hypothse nulle lorsque celle-ci est vrifie et qui
rejette tout le temps l'hypothse nulle lorsque celle-ci est fausse.
Il y a deux faons de se tromper lors d'un test statistique:
la possibilit de rejeter tort l'hypothse nulle lorsqu'elle est vraie. On appelle ce risque
le risque de premire espce et en gnral on note la probabilit de se tromper dans ce
sens. est alors la probabilit d'avoir un faux positif : de rejeter une hypothse alors
qu'en fait elle tait vraie.
la possibilit d'accepter tort l'hypothse nulle lorsqu'elle est fausse. On appelle ce
risque le risque de deuxime espce et en gnral on note la probabilit de se tromper
dans ce sens. est alors la probabilit d'avoir un faux ngatif : d'accepter une hypothse
alors qu'en fait elle tait fausse.
Dans l'idal on aimerait bien que ces deux erreurs soient nulles, malheureusement ce n'est pas
possible, en tout cas lorsque l'on ne dispose que d'un nombre fini d'observations, et il faut alors
faire un choix.
Tests classiques et tests baysiens []
Pour les tests classiques qui constituent l'essentiel des tests statistiques, ces deux erreurs jouent
un rle asymtrique. On contrle uniquement le risque de premire espce un niveau
(principe de Neyman); cela revient considrer que le risque de rejeter l'hypothse nulle alors
que cette hypothse est vraie est beaucoup plus coteux que celui de la conserver tort (ce
dernier risque n'tant pas matris).
Pour les tests baysiens on peut parfois pondrer ces deux risques grce la connaissance d'une
probabilit a priori. La connaissance de cette probabilit a priori est l'un des fondements de la
statistiques baysienne et constitue l'une de ses difficults majeures. Si on cherche par exemple
tester le fait qu'un certain paramtre vaut une certaine valeur
0
cette probabilit a priori sera
5

une loi de probabilit sur qui donne la probabilit que l'on a d'observer . Cette loi a priori est
galement appele croyance a priori ou croyance baysienne. Ces tests sont souvent d'une mise
en uvre plus complexe que les tests statistiques la raison principale est qu'ils ncessitent de
"trouver" une bonne loi a priori puis de la rviser grce la rvision des croyances.
Classification []
D'ordinaire on range les tests dans deux catgories les tests paramtriques et les tests non
paramtriques. Les premiers testent la valeur d'un certain paramtre. Ces tests sont gnralement
les tests les plus simples. Les tests non paramtriques quant eux ne font pas intervenir de
paramtre. C'est par exemple le cas des tests d'adquation une loi ou des Test du .
On peut galement distinguer les tests d'homognit et les tests d'adquations:
Dans le cas d'un test d'homognit, on veut comparer deux chantillons entre eux.
L'hypothse nulle H
0
supposera l'homognit des deux chantillons. Par exemple on
comparera deux moyennes.
Dans le cas d'un test d'adquation, on veut dterminer si un chantillon suit une loi
statistique connue. L'hypothse nulle H
0
supposera l'adquation de l'chantillon cette
loi.
Droulement d'un test []
Pour le cas spcifique d'un test unilatral, le test suit une succession d'tapes dfinies:
1. nonc de l'hypothse nulle H
0
et de l'hypothse alternative H
1
.
2. Calcul d'une variable de dcision correspondant une mesure de la distance entre les
deux chantillons dans le cas de l'homognit, ou entre l'chantillon et la loi statistique
dans le cas de la conformit. Plus cette distance sera grande et moins l'hypothse nulle H
0

sera probable. En rgle gnrale, cette variable de dcision se base sur une statistique qui
se calcule partir des observations. Par exemple, la variable de dcision pour un test
unilatral correspond rejeter l'hypothse nulle si la statistique dpasse une certaine
valeur fixe en fonction du risque de premire espce.
3. Calcul de la probabilit, en supposant que H
0
est vraie, d'obtenir une valeur de la variable
de dcision au moins aussi grande que la valeur de la statistique que l'on a obtenue avec
notre chantillon. Cette probabilit est appele la p-value.
4. Conclusion du test, en fonction d'un risque seuil
seuil
, en dessous duquel on est prt
rejeter H
0
. Souvent, un risque de 5% est considr comme acceptable (c'est--dire que
dans 5% des cas quand H
0
est vraie, l'exprimentateur se trompera et la rejettera). Mais le
choix du seuil employer dpendra de la certitude dsire et de la vraisemblance des
alternatives.
5. Si la p-value est plus grande que on accepte l'hypothse H
0
. Si la p-value est plus petite
que on la rejette.
6

La probabilit pour que H
0
soit accepte alors qu'elle est fausse est , le risque de deuxime
espce. C'est le risque de ne pas rejeter H
0
quand on devrait la rejeter. Sa valeur dpend du
contexte, et est trs difficilement valuable (voire impossible valuer), c'est pourquoi seul le
risque est utilis comme critre de dcision.
Tests classiques []
Article dtaill : Test (statistique).
Il existe de nombreux tests statistiques classiques parmi lesquels on peut citer :
le test de Student, qui sert la comparaison d'une moyenne observe avec une valeur
attendue .
le test de Fisher, aussi appel test de Fisher-Sndcor, qui sert la comparaison de deux
variances observes.
l'Analyse de la variance ou Anova, permet de comparer entre elles plusieurs moyennes
observes (pour les groupes tudis), selon un plan exprimental prdtermin. Elle se
base sur une dcomposition de la variance en une partie explicable (variance inter-
groupes) et une partie erreur (variance globale intragroupe - ou variance rsiduelle),
suppose distribue selon une loi normale. Ce test est particulirement utilis en sciences
humaines, sciences sociales, sciences cognitives, en mdecine et en biologie.
le test du , galement appel test du
2
de Pearson, qui sert notamment la comparaison
d'un couple d'effectifs observs, ou la comparaison globale de plusieurs couples
d'effectifs observs, et plus gnralement la comparaison de deux distributions
observes.
le test de Kolmogorov-Smirnov, qui comme le test du
2
constitue un test d'adquation
entre des chantillons observs et une distribution de probabilit. Il compare la fonction
de rpartition observe et la fonction de rpartition attendue. Il est particulirement utilis
pour les variables alatoires continues.
En mthodes baysiennes, on utilise le psi-test (mesure de distance dans l'espace des possibles)
dont on dmontre que le test du
2
reprsente une excellente approximation asymptotique
lorsqu'il existe un grand nombre d'observations.

Plan d'exprience
L'exprimentation est un moyen permettant d'acqurir de nouvelles connaissances l'aide d'un
dispositif sur lequel l'exprimentateur est capable de contrler certains paramtres de
fonctionnement (en entre), de faon permettre de recueillir (en sortie) des rponses
7

modlisables de faon suffisamment prcise et avec une bonne conomie (un nombre d'essais le
plus faible possible par exemple). La diffrence par rapport l'observation de systmes naturels,
spontans ou fortuits, rside dans le contrle des paramtres qu'elle ralise en fixant par exemple
la valeur des principaux paramtres d'entre (ou facteurs) au cours de chaque essai lmentaire,
dans le choix de certaines combinaisons des valeurs de ces paramtres ralises sur chacun des
essais ncessaires la dtermination d'un modle. Les systmes naturels prsentent gnralement
une structure de donnes qui ne permet pas d'en dduire un modle fiable, mme si les
observations sont trs nombreuses, et malgr l'utilisation de techniques d'analyse de donnes trs
sophistiques. Dans ce cas les facteurs sont souvent nombreux (complexit du rel), embrouills
(mauvaise structure de donnes), les rponses sont souvent brouilles par ce que l'on peut appeler
des bruits de fond. Cette difficult de lisibilit de la nature explique en partie pourquoi le progrs
des connaissances a t trs lent. L'exprimentation comme moyen de connaissance n'est pas si
ancienne et elle est reste longtemps trs fragmentaire ; le concept n'a pu se dvelopper qu'une
fois que l'on a su construire des systmes contrlables (grce aux progrs de la mcanique) et
faire des mesures facilement, notamment la mesure du temps qui a permis de franchir des tapes
dcisives.
On nomme plan d'exprience la suite ordonne des essais lmentaires d'une l'exprimentation.
Ce plan s'intgre dans une mthode qui va de la recherche des connaissances sur le domaine o
elle se droule, la dfinition trs prcise des objectifs, la stratgie exprimentale qui dfinit un
droulement pouvant tre conditionn par les rsultats obtenus en cours de route
(exprimentation squentielle), en passant par la coordination des diffrents intervenants. Cette
mthode est indispensable chaque fois que les essais prsentent une certaine complexit, sous
peine d'chec (donnes inexploitables), de surcot conomique (dlais de rponse), de cots
humains, de souffrance animale par exemple. Un exemple trs classique de plan est constitu par
un plan en toile o en partant d'une valeur choisie pour chacun des paramtres dans une
exprience centrale, on complte celle-ci par des expriences o chaque fois un seul des facteurs
varie toutes choses gales par ailleurs . L'exprience de l'exprience montre que ce dispositif
est gnralement trs mauvais, contrairement ce que peut suggrer l'intuition. Un autre type de
plan qui en prend le contrepied est un plan factoriel consistant choisir des valeurs pour
chacun des facteurs de faon pouvoir exprimenter toutes les combinaisons entre tous les
niveaux de tous les facteurs (lorsque cela est possible). Dans ce dispositif le nombre d'essais peut
devenir trs grand (explosion combinatoire), mais il est possible d'obtenir un modle trs
exhaustif (comprenant toutes les interactions possibles entre facteurs), ci qui n'est gnralement
pas ncessaire. L'objectif de l'article est de donner au lecteur des exemples qui illustrent
l'importance de la notion de plan d'expriences et d'exposer des cas qui sont la fois les plus
simples conceptuellement et qui sont utiliss le plus frquemment.
Position du problme []
Supposons que nous dsirions savoir si la proportion de boules noires d'une urne est suprieure
5%, l'urne contenant 1000 boules. Nous partons avec l'ide d'en tirer 100 dans l'espoir d'avoir
une bonne approximation de la proportion.
8

Si au cours du tirage, nous ramenons 51 boules noires, celui-ci peut tre arrt immdiatement :
le poursuivre n'aurait pas de sens, puisqu'avec 51 boules noires sur 1000 une proportion
suprieure 5% est maintenant certaine.
On peut raffiner encore en remarquant que la probabilit de tirer par exemple 5 boules noires
dans les 5 premiers tirages ramne 0,3 x 10
-6
la probabilit que la proportion de boules noires
soit infrieure 5%.
Dans la pratique, le calcul permet d'tablir des rgles strictes indiquant en fonction des rsultats
quel moment le tirage doit s'arrter - avec dcision prise dans un sens ou dans l'autre - ou s'il
doit tre poursuivi.
Un plan d'exprience permet donc de rduire le nombre d'essais ce qui est strictement
ncessaire pour prendre une dcision, ce qui peut sauver du temps, de l'argent et des vies.
C'est un plan d'exprience de ce type qui a permis d'arrter en cours de route une exprience
visant dterminer si l'aspirine avait un effet de prvention sur les crises cardiaques, les rsultats
tablissant sans ambigut que c'tait le cas (rduction de 25% des risques). Continuer
l'exprimentation serait revenu dans ces conditions priver jusqu' la date initialement prvue les
malades du lot-tmoin d'accs l'aspirine, ce qui aurait pu coter la vie certains d'entre eux.
Voir aussi l'article Infrence baysienne et le problme dit du bandit manchot.
Plans d'exprience en sciences appliques (plans
exprimentaux) []
Il existe de nombreux processus qu'on sait dpendre d'un grand nombre de paramtres externes
(on parle de facteurs) mais sans que l'on en ait des modles analytiques.
Lorsque l'on est intress de connatre la dpendance d'une variable de sortie F d'un tel
processus, on se trouve confront plusieurs difficults :
Quels sont les facteurs les plus influents ?
Existe-t-il des interactions entre les facteurs (corrlations) ?
Peut-on linariser le processus en fonction de ces facteurs et le modle ainsi obtenu est-il
prdictif ?
Comment minimiser le nombre de points de mesure du processus pour obtenir le maximum
d'informations ?
Existe-t-il des biais dans les rsultats des mesures ?
La mthode du plan d'exprience rpond ces questions et peut ainsi tre applique dans de
nombreux processus qui vont par exemple des essais cliniques l'valuation de la qualit des
processus industriels les plus complexes.
9

On peut ainsi pour l'industrie poser cette nouvelle dfinition : Un plan d'expriences est une suite
dessais rigoureusement organiss, afin de dterminer avec un minimum dessais et un maximum
de prcision, linfluence respectives des diffrents paramtres de conception ou de fabrication
dun produit, afin den optimiser les performances.
En sciences humaines []
Les symboles utiliss []
<...> = Embot, c'est--dire qu'il y a un groupe par modalit !
* ... = Crois, c'est--dire qu'il n'y a qu'un seul groupe pour toutes les modalits.
S = Signifie sujet.
S10<M2> = Signifie qu'il y a 20 sujets (car 10 sujets x 2 modalits)
S10*M2 = Signifie qu'il y a 10 sujets
M2 = M est le symbole d'une VI (Variable Indpendante), et 2 en indice, indique le nombre de
modalits.
Plan monofactoriel []
On peut avoir deux types de plan monofactoriel :

Mthode 1 Mthode 2
Type de plan Embot Crois
Type de groupe Groupes indpendants Groupes appareills
Formule S10<M2> S10*M2
Nombre de
donnes
20 donnes pour 20 sujets
10 sujets pour M1 et 10 pour M2
20 donnes pour 10 sujets
les 10 sujets passent M1 et
M2
Problme
Il est difficile d'avoir 2 groupes rellement
quivalents
Il y a des interfrences d'une activit
l'autre
Plan multifactoriel []
On aura ici, au moins 2 VI tester en mme temps. On peut avoir trois types de plan
multifactoriel :
10


Mthode 1 Mthode 2 Mthode 3
Type de
plan
Embot complet Crois complet Mixte ou quasi complet
Type de
groupe
Un Groupe de sujets par
groupe exprimental
Chaque sujet rencontre toutes
les conditions exprimentales
On a deux groupes
embots, qui passe
chacun toutes les
conditions
Formule S10<M2*R3> S10*M2*R3 S10<M2>*R3
Nombre de
donnes
60 donnes pour 60 sujets 60 donnes pour 10 sujets
60 donnes pour 20
sujets
Problme
Il est difficile d'avoir des
groupes rellement
quivalents + Besoin de
beaucoup de sujets
Peut tre fatiguant pour les
sujets + Il va y avoir un effet
d'une condition l'autre
.
Limites des plans exprimentaux exhaustifs []
Supposons que l'on soit en prsence d'un processus qui dpende de 3 facteurs A, B et C qui ont
chacun leur domaine de dfinition (discret) {a
i
| i = 1,..,l} , {b
j
| j = 1,...,m} , {c
k
| k = 1,...,n}.
Une approche systmatique consisterait effectuer toutes les expriences possibles du processus
en faisant varier chacun des paramtres dans son domaine de dfinition:
Exprience 1: {a
1
,b
1
,c
1
} Rsultat F
1

Exprience 2:{a
2
,b
1
,c
1
} Rsultat F
2

Exprience 3:{a
3
,b
1
,c
1
} Rsultat F
3


Exprience l mn:{a
l
,b
m
,c
n
} Rsultat
Le nombre d'expriences ncessaires, qui est gal au produit l mn, peut tre tout fait
considrable et hors de porte pour des raisons de cot et/ou de temps.
Exemple []
11

Supposons que l'on souhaite caractriser un processus lectrolytique par la mesure du courant
entre les lectrodes.
Pour une solution d'lectrolyte donne, un modle grossier laisse supposer que ce courant va
dpendre de trois facteurs principaux: (1) la dilution de la solution C, comprise entre 10% et
90%, (2) la temprature de la solution T, comprise entre 50C et 100C, et (3) la nature des
lectrodes utilises (tain, or et en platine). Dans ces conditions, en prenant des pas de 10%
pour la concentration et de 10C pour la temprature, le plan exprimental exhaustif sera
constitu de 6x8x3, soit 144 expriences indpendantes qu'il faudra faire dans des conditions par
ailleurs identiques.
En supposant que chaque exprience prend 1 heure (en comptant le temps de prparation),
l'tude de ce simple processus ne demanderait pas moins de 4 semaines de travail plein temps.
De plus, des expriences tales sur un aussi grand laps de temps pourrait faire intervenir des
facteurs non-connus mais variant sur la dure de cette tude et pouvant fausser les rsultats.
On comprend aisment que les points relevs ci-dessus deviennent dramatiques ds que l'on a
affaire des processus un peu plus complexes et le cot exprimental d'une tude exhaustive
devient vite prohibitif, voir inapplicable. C'est un problme courant dans les processus industriels
qui exigent une reproductibilit et un contrle qualit total.
La manire correcte d'aborder un plan d'exprience optimal est de procder d'une manire tout
fait analogue au principe de la droite de rgression en supposant que l'on a des dpendances
linaires (ou tout au plus quadratiques) du processus dans chacune de ces variables ainsi que des
interactions entre les variables. On se basera le plus souvent sur des hypothses simples et/ou des
expriences limites pour se donner une ide de l'existence ou non de dpendances croises.
Reprenons le processus dcrit plus haut en supposant que en plus de T et C, on dfinisse m
comme une grandeur physique qui caractrise la matire de l'lectrode (par exemple son poids
molculaire ou son lectrovalence, etc.):
On souhaite le dcrire par une formule simplifie du type:
F(T,C,m)=
b
1
T
2
+ b
2
C
2
+ b
3
m
2
+ b
4
T + b
5
C + b
6
m + b
7
T C + b
8
T m + b
9
Cm + b
10
T Cm + b
11
T
2
C + b
12
T
2
m + b
13
C
2
T + b
14
C
2
m + b
15
T m
2
+ b
16
Cm
2

Pour simplifier, on supposera raisonnablement que les termes en T
2
C , T
2
m , C
2
T , C
2
m , T m
2

et Cm
2
sont ngligeables par rapport aux termes du premier ordre, ce qui revient dire que les
coefficients b
11
, b
12
, b
13
, b
14
, b
15
et b
16
sont nuls (en gnral, le terme en T Cm est aussi
ngligeables).
Il reste alors 10 variables b
1
, .. , b
10
dterminer pour avoir une connaissance analytique du
processus dans les intervalles spcifis.
12

On choisit 10 points dans l'espace (T, C , m), pour lesquels on effectue l'exprience, obtenant
ainsi les valeurs de {F
i
} pour chacun de ces points. On veillera videmment ce que tous les
autres paramtres de l'exprience restent constants.
NB : on travaille de prfrence avec des variables rduites, cest--dire des variables T, C et m
qui sont sans dimensions et normalises 1 sur leur intervalle de dfinition
Il en rsulte le systme de 10 quations 10 inconnues:
F
i
= a
i1
b
1
+ a
i2
b
2
+ a
i3
b
3
+ a
i4
b
4
+ a
i5
b
5
+ a
i6
b
6
+ a
i7
b
7
+ a
i8
b
8
+ a
i9
b
9
+ a
i10
b
10

avec i = 1,..,10.
Les a
ij
sont obtenus simplement en remplaant T,C et m par leur valeurs aux points o l'on a fait
les expriences.
En criture matricielle:
=
Pour rsoudre ce systme, il faut inverser la matrice :
=
La thorie des plans exprimentaux permet partir de modles spcifiques plus ou moins
complexes de dterminer prcisment en quels points les mesures doivent tre faites.
Les plans factoriels []
Parmi les diffrents plans exprimentaux, les plans factoriels sont courants car ils sont les plus
simples mettre en uvre et ils permettent de mettre en vidence trs rapidement l'existence
d'interactions entre les facteurs.
L'hypothse de base est d'assigner chaque facteur (normalis) sa valeur la plus basse ( 1) et
sa valeur la plus haute ( + 1). Ainsi, pour k facteurs, on se retrouve avec un ensemble de 2
k

valeurs possibles.
13

Sans entrer dans les dtails, la matrice d'exprience possde alors des proprits
intressantes (on a par exemple: a
T
a = k 1) qui sont largement exploites par les logiciels qui
tablissent des plans exprimentaux. En particulier, l'ajout d'expriences supplmentaires ainsi
que des algorithmes de randomisation efficace du plan d'exprience initial permettent de mettre
en vidence des biais systmatiques et de les supprimer ou alors de mettre en vidence
l'influence d'une variable cache dont il faut tenir compte.
Pour reprendre l'exemple ci-dessus, on se retrouve avec un plan 12 expriences (2 tempratures
extrmes, 2 concentrations extrmes et 3 paires d'lectrodes).
Travaillons avec la temprature et la concentration normalise:
t =
c =
On cherche maintenant uniquement des dpendances linaires en t et en c, c'est--dire une
relation du type:
I
X
(t,c) = b
1
t+ b
2
c+ b
3
tc pour X=1,2 ou 3 selon le type d'lectrode.
En effectuant les mesures du courant aux 4 points (50C,10%) , (50C,90%) , (100C,10%),
(100C,90%) correspondant aux points ( 1, 1),( 1, + 1), ( + 1, 1) et ( + 1, + 1) dans
l'espace des facteurs rduits, on a, pour chaque type d'lectrode, on est ramen un plan factoriel
2
2

=
On vrifie effectivement que a
T
a = k 1, et on obtient la rsolution du systme:
=
Soit:
14

b
1
= (-I
1
- I
2
+ I
3
+ I
4
)
b
2
= (-I
1
+ I
2
- I
3
+ I
4
)
b
3
= (I
1
- I
2
- I
3
+ I
4
)
Ainsi, moyennant quelques prcautions, on a ramen une tude d'un processus non analytique
constitu de 144 expriences distinctes un processus d'une douzaine d'expriences, qui donne
des rsultats intressants sur les intervalles considrs, en particulier sur l'existence et l'amplitude
des interactions entre les diffrents facteurs.

Interactions logiques
La notion mathmatique d interaction logique , conue comme gnralisation de celle
d interaction , issue du Plan dExpriences, a t introduite la fin des annes 1990. Dabord
utilise en analyse des donnes (Iconographie des corrlations), elle a trouv un champ
dapplication dans les modles de rgression multiple non postuls.
Notion dinteraction []
La notion dinteraction ne doit pas tre confondue avec celle de corrlation. On parle deffet
dinteraction lorsquune variable expliquer Y est conditionne par le couplage de deux
variables explicatives A et B.
Dans lexemple suivant, Y nest corrl ni A ni B ; mais Y est corrl ngativement au
produit A.B. En effet, Y prsente de fortes valeurs lorsque A.B prsente de faibles valeurs :

A B A.B Y
Essai 1 -1 -1 1 10
Essai 2 -1 1 -1 21
Essai 3 1 -1 -1 19
Essai 4 1 1 1 9
L' interaction A.B est aussi appel produit crois de A et de B.
Un cas particulier de tableau de donne []
15

Le tableau ci-dessus est parfois appel plan dexpriences complet 2 niveaux . En effet,
chaque variable explicative na que 2 niveaux (faible et fort), et tous les cas sont considrs,
savoir :
A faible et B faible,
A faible et B fort,
A fort et B faible,
A fort et B fort.
La variable expliquer Y est aussi appele la "rponse" de l'exprience.

Cest un cas particulier du plan dexpriences complet k niveaux .
Dans un plan complet , les variables A, B et A.B sont orthogonales, c'est--dire que leur
corrlation est nulle.
Le plan complet est lui-mme un cas particulier du plan dexprience , dans lequel les
variables explicatives A et B sont contrles de faon raisonne pour obtenir le maximum
dinformation concernant leurs influences sur Y, dans le minimum dessais.
Enfin, le plan dexpriences est un cas particulier des tableaux de donnes, dans lesquels les
variables explicatives ne sont pas forcment contrles.
Gnralisation aux tableaux quelconques []
La notion dinteraction logique, qui va tre introduite ci-aprs, sapplique aux tableaux de
donnes en gnral, sur variables quantitatives et/ou qualitatives (pourvu que ces dernires
utilisent un codage disjonctif complet).
Quand les variables A et B n'ont pas la mme unit, comment calculer le produit A.B pour quil
garde un sens physique ?
Il faut se ramener une unit commune dvaluation. Lusage est de centrer rduire les variables
A et B, avant de calculer le produit crois A.B (les variables centres rduites ont une moyenne
nulle et un cart type gal un). Dans ces nouvelles units, notre tableau devient :

A B A.B Y
Essai 1 -0.866 -0.866 .866 10
Essai 2 -0.866 0.866 -0.866 21
Essai 3 0.866 -0.866 -0.866 19
Essai 4 0.866 0.866 0.866 9
Interprtation physique du produit crois []
16

Linterprtation physique du produit de deux variables de mme unit, comme la longueur et la
largeur, est aise (cest une surface).
Mais que signifie leffet sur Y du produit crois A.B de deux variables qui taient l'origine
dunits diffrentes, et qui ont t centres rduites ?


Figure 1 : A en abscisse, B en ordonne ; et les valeurs correspondantes de Y. La
variable expliquer Y est faible si A et B sont faibles, ou bien si A et B sont forts.
Figure 2 :
en rouge : variation de Y en fonction de A, pour B faible ;
en bleu : variation de Y en fonction de A, pour B fort.
Y varie donc de faon diffrente en fonction de A, selon que B est faible ou fort.
Figure 3 : profils de variation, en fonction de la suite des essais : Y ressemble surtout
A*B . Ou si lon prfre, Y est corrl positivement avec A*B et ngativement
avec A.B.

Ces figures montrent que Y est fort si A est faible et B est fort, ou bien si A est fort et B est faible.
En dautres termes lopration A*B = -A.B correspond au ou exclusif de la logique.

La figure 1 reprsentait le ou exclusif dans le cas o les variables A et B sont discontinues
deux niveaux.
Dans le cas o les variables A et B sont continues, on obtient la figure 4 caractrise par des
montagnes en rouge lorsque A est fort et B faible, ou bien A est faible et B est fort. Dans le
cas contraire, il y a des valles (en bleu).
17


Figure 4 : surfaces de rponse de la variable A*B
Notion d interaction logique []
Puisque la variable artificielle A*B = -A.B correspond au ou exclusif de la logique, il est
naturel de s'intresser aussi une interaction logique beaucoup plus frquente en physique,
savoir le et logique : A&B .
Dans le cas des variables 2 niveaux, la colonne A&B aura les valeurs suivantes (valeur
forte seulement si A et B sont forts):

A B A.B A*B A&B Y
Essai 1 -1 -1 1 -1 -1 10
Essai 2 -1 1 -1 1 -1 21
Essai 3 1 -1 -1 1 -1 19
Essai 4 1 1 1 -1 1 9
Et, dans le cas gnral des variables continues, nous avons la figure suivante :

18

Figure 5 : surface de rponse du Et logique
Les figures suivantes montrent dautres "interactions logiques", dont on trouvera la description
ci-aprs, et les formules mathmatiques en rfrences.


Signification des symboles dinteractions logiques []
19

f(A,B) Signification La rponse Y est forte lorsque...
A*B A ou-exclusif B ...A est fort et B faible ou A est faible et B fort
A^B A ou B ...A est fort ou B est fort
A^-B A ou non B ...A est fort ou B est faible
A&B A et B ...A et B sont forts
A&-B A et non B ...A est fort et B est faible
A]B A modul par B ...A est fort si B est fort
A]-B A modul par non B ...A est fort si B est faible
A}B A modul par B moyen ...A est fort si B est moyen
A{B A moyen si B ...A est moyen si B est fort
A{-B A moyen si non B ...A est moyen si B est faible
A'B ni A ni B (sens large) ...ni A ni B ne sont extrmes (ils sont moyens)
A!B ni A ni B (sens strict) ...ni A ni B ne sont extrmes (ils sont strictement moyens)
A#B A comme B ...A varie comme B
A+B "A plus B" ...la somme de A et B (centrs-rduits) est forte
A-B "A moins B" ...la diffrence de A et B (centrs-rduits) est forte

Modles de rgression multiple postuls et
non postuls
Modle []
Un modle relie une ou plusieurs variables expliquer Y des variables explicatives X, par une
relation fonctionnelle Y = F(X)
Un modle physique est un modle explicatif soutenu par une thorie.
Un modle statistique, au contraire, est un modle empirique issu de donnes disponibles,
sans connaissance a priori sur les mcanismes en jeu. On peut cependant y intgrer des
quations physiques (lors du pr traitement des donnes).
Rgression multiple []
Cest le plus utilis des modles statistiques.
On dispose de n observations (i = 1,, n) de p variables. L'quation de rgression s'crit

o
20


i
est l'erreur du modle;
a
0
, a
1
, , a
p
sont les coefficients du modle estimer.
Le calcul des coefficients a
j
et de l'erreur du modle, partir des observations, est un problme
bien matris (voir la Rgression linaire multiple).
Plus dlicat est le choix des variables entrant dans le modle. Il peut tre postul ou non postul.
Modle postul []
Dans le modle prcdent, seuls les coefficients sont dirigs par les donnes , la structure
polynomiale du modle est impose par lutilisateur (selon son expertise du problme), qui
postule a priori :
le type de modle : linaire ou polynomial, et le degr du polynme,
les variables qui entreront dans le modle.
Exemple de modle polynomial avec deux variables explicatives :

Le problme de la slection des variables explicatives []
Lorsque le nombre de variables explicatives est grand, il peut se faire que certaines variables
soient corrles entre elles. Dans ce cas il faut liminer les doublons. Les logiciels utilisent pour
ce faire des mthodes de slection pas pas (ascendante, descendante ou mixte).
Il nen reste pas moins que la qualit du modle final repose en grande partie sur le choix des
variables, et le degr du polynme.
Modle non postul []
Le modle non postul est au contraire entirement dirig par les donnes , aussi bien sa
structure mathmatique que ses coefficients.
La slection des variables explicatives ne demande pas de connaissance a priori sur le modle :
elle a lieu parmi un ensemble trs grand de variables, comprenant :
les variables explicatives simples : A, B, C,... (proposes par les experts du domaine
considr et dont le nombre p peut tre suprieur n) ;
des interactions ou couplage de ces variables, par exemple A*B (produit
crois sur variables centres-rduites), mais aussi des interactions logiques tel A et
B , A ou B , A et B moyens , A si B est fort , A si B est moyen , A si B est
faible , etc. ;
21

des fonctions de ces variables : par exemple cos(A) ou nimporte quelle fonction
sinusodale amortie ou amplifie, fonction priodique non sinusodale, effet de seuil, etc.

La slection est faite avant le calcul des coefficients de la rgression selon le principe suivant :
On cherche le facteur, ou l' interaction , ou la fonction, le mieux corrl la rponse.
L'ayant trouv, on cherche le facteur, ou l'interaction, le mieux corrl au rsidu non
expliqu par la corrlation prcdente; etc. Cette mthode vise ne pas compter deux fois
la mme influence, lorsque les facteurs sont corrls, et les ordonner par importance
dcroissante.
La liste trouve, classe par ordre dimportance dcroissante, ne peut pas compter plus de
termes que dinconnues (n). Si lon ne garde quun terme dans le modle, ce devra tre le
premier de la liste. Si lon nen garde que deux, ce seront les deux premiers, etc.
En effet, puisque chacun des termes de la liste "explique" le rsidu non expliqu par les
prcdents, les derniers n'expliquent peut-tre que du "bruit". Quel critre d'arrt choisir ?
Le nombre de termes conservs dans le modle peut tre, par exemple, celui qui minimise
lerreur standard de prdiction SEP (Standard error of Prediction), ou celui qui maximise le F de
Fisher. Ce nombre de terme peu aussi tre choisi par lutilisateur partir de considrations
physiques.

Exemple : on suppose que lensemble des variables explicatives candidates est
{A,B,C,D,E,F,G}, et que le modle obtenu est :
Y = constante + a.A + b.( E et G ) + c.( D et F moyens )
On remarque que
* les variables B et C, non pertinentes, ne figurent pas dans le modle
* la variable A est apparue comme terme simple,
* les variables E et G dune part, et D et F, dautre part, napparaissent que comme
interactions logiques .

Ce modle parcimonieux ,c'est--dire comportant peu de termes (ici trois), fait intervenir 5
variables, et collera mieux la ralit physique quun modle polynomial. En effet la
conjonction E et G qui signifie E et G forts simultanment est plus souvent rencontre
dans la ralit physique (exemple : la catalyse en chimie) qu'un terme polynomial de type E.G.
Dcomposition harmonique []
Un modle non postul sera galement efficace dans la dcomposition harmonique des sries.
22

En effet, le principe s'applique aussi bien en cas dchantillonnage irrgulier (o les mthodes de
type moyenne mobile, ARIMA ou Box et Jenkins sont mises en dfaut) que dans les cas non
stationnaires (o lanalyse de Fourier ne sapplique pas). Il permet de dceler et dmler les
interfrences de divers cycles et saisonnalits avec des ruptures de tendances en marches
d'escaliers , en V , des ruptures logistiques , des motifs priodiques, et des vnements
accidentels tels que des pics isols ou des morceaux d'ondes .
Exemples []
Application au marketing []
Les donnes de cet exemple sont disponibles sur internet (voir Effet Prix Promo Colas [1])
Dans un magasin de grande surface, deux produits sont prsents la vente. Les gondoles
peuvent tre, ou non, mises en avant, les prix peuvent varier, de mme que la frquentation du
magasin.
Voici les modles non postuls obtenus pour chacun des deux produits :
1VENTES = 311.6 - 1386. Pri]1GondoleEnAvant + 492.4 Frq&2Prix
R2a = 0.849, Q2 = 0.841, F = 220.4 , SEP= 86.28

2VENTES = 396.1 - 1701. (2Pri-2GondoleEnAvant) + 346.0 Frq]1Prix
R2a = 0.854, Q2 = 0.851, F = 229.3, SEP= 81.27
Les termes de ces quations sont rangs par importance dcroissante, et leur influence positive
ou ngative dpend du signe des coefficients.
Do, compte tenu de la signification des symboles dinteractions logiques, lon dduit que :
Les ventes du produit 1 diminuent lorsque son prix augmente, si la gondole est mise en
avant. Elles augmentent avec la frquentation du magasin, si le prix du produit 2,
concurrent ,est fort.
Les ventes du produit 2 diminuent lorsque son prix augmente, augmentent lorsque la
gondole est mise en avant. Elles augmentent aussi avec la frquentation du magasin, si le
prix du produit 1, concurrent, est fort.

Il est souvent utile dassocier aux modles une analyse de donnes de type Iconographie des
corrlations :

23



Marketing prix promo
Figure 1, analyse des liens.
Traits pleins : corrlations positives remarquables.
Pointills : corrlations ngatives remarquables.

D'une part, on remarque les liens positifs des ventes du produit 1 avec :
la frquentation,
la mise en avant de la gondole de prsentation.
le prix du produit 2, concurrent.
D'autre part les liens ngatifs des ventes du produit 1 avec :
le prix du produit 1
la mise en avant du produit 2, concurrent.
Amlioration de la qualit industrielle []
Les donnes de Kackar (1985) utilises ici ont servi dillustration diverses techniques de
traitement de donnes. Voir D. Collombier : Plan dexpriences et amlioration de la qualit
industrielle. Une alternative la mthode Taguchi. RSA, tome 40, n2 (1992), p.31-43. [2]

On veut amliorer le cintrage de ressorts lame servant la suspension de camions. Les lames
sont chauffes dans un four, cintres sous presse, puis refroidies dans un bain dhuile. On
souhaite obtenir un flche de cintrage proche de 8 pouces.
24

Les facteurs contrls de la fabrication, deux niveaux (une valeur faible et une valeur forte),
sont :
TFour = temprature du four (1840 et 1880F)
tChauffage = dure de chauffage (25 et 23 sec.)
tTransfertFourPresse = dure du transfert four-presse (10 et 12 sec)
tSousPresse = temps sous presse (2 et 3 sec.)
TRefroidissement = temprature de refroidissement. Difficile contrler en cours de
fabrication, elle peut ltre seulement lors des essais. On la traite comme un facteur de
bruit deux niveaux (130-160F et 150-170F)

Le plan dexpriences choisi, comprenant 8 essais (pour les facteurs de fabrication), est donc
rpt deux fois, pour chacune des tempratures de refroidissement. Soit 16 essais.
En outre chacun des essais est rpt 3 fois pour prendre en compte les sources de bruit non
contrles. Soit au total 48 essais.
Les rponses de lexprience sont
Ymoy = flche moyen pour la faible temprature de refroidissement (moyenne sur 3
mesures)
Ymoy = flche moyen pour la forte temprature de refroidissement (moyenne sur 3
mesures)
Rapport Signal/Bruit = calcul daprs les 6 mesures par essai de fabrication.

Dans le tableau suivant, les niveaux des facteurs de fabrication sont nots -1 pour faible, et 1
pour fort. Le niveau de temprature de refroidissement est not 1 pour faible et 2 pour fort.


TFour tChauffage
tTransfert
FourPresse
tSousPresse TRefroid Ymoy Signal/Bruit
1 -1 -1 -1 -1 1 7.79 5,426739
2 -1 -1 -1 -1 2 7.29 5,426739
3 1 -1 -1 1 1 8.07 11,6357
4 1 -1 -1 1 2 7.733 11,6357
5 -1 1 -1 1 1 7.52 6,360121
6 -1 1 -1 1 2 7.52 6,360121
7 1 1 -1 -1 1 7.63 8,658226
8 1 1 -1 -1 2 7.647 8,658226
9 -1 -1 1 1 1 7.94 7,337677
10 -1 -1 1 1 2 7.4 7,337677
25

11 1 -1 1 -1 1 7.947 10,44231
12 1 -1 1 -1 2 7.623 10,44231
13 -1 1 1 -1 1 7.54 3,700976
14 -1 1 1 -1 2 7.203 3,700976
15 1 1 1 1 1 7.687 8,860563
16 1 1 1 1 2 7.633 8,860563

Voici les modles non postuls obtenus pour le flche Ymoy et pour le rapport Signal/Bruit :
Ymoy = 7.636 - 0.5687 tCha^TRefroid + 0.3174 (TFo+tSousPresse) - 0.3127
TRe&-TFour
R2a = 0.934, Q2 = 0.918, F = 71.59, SEP= 0.7446E-01
Signal/Bruit = 7.803 + 7.449 (TFo-tChauffage) + 4.201 TFo^tSousPresse + 1.874
tCha]-TFour
R2a = 0.969, Q2 = 0.964, F = 155.3, SEP= 0.5413
Les termes de ces quations sont rangs par importance dcroissante (chacun expliquant le rsidu
non expliqu par les prcdents), et leur influence positive ou ngative dpend du signe des
coefficients.
Do, compte tenu de la signification des symboles dinteractions logiques, lon dduit que :
La rponse moyenne diminue si tChauffage ou TRefroidissement diminuent ; le rsidu
non expliqu par les termes prcdents augmente si TFour +tSousPresse augmente ; et
enfin le rsidu de ces rsidus non expliqus diminue si Trefroidissement augmente en
mme temps que diminue TFour.
Le rapport Signal/Bruit augmente (donc la dispersion diminue) quand TFour augmente,
et aussi lorsque tChauffage diminue ; le rsidu non expliqu par les termes prcdents
augmente avec TFour ou tSousPresse ; et enfin le rsidu de ces rsidus non expliqus
augmente avec tChauffage si TFour est faible.

Ces modles permettent (par de multiples tirages en faisant varier les facteurs), de trouver le
compromis optimum pour un flche moyen Y de 8 pouces avec un rapport Signal/bruit lev. On
peut pour cela dfinir des courbes de dsirabilits (le dsir global est un compromis des deux) :


26

Desirabilit Signal/Bruit


Dsirabilit Ymoy
Le tableau suivant donne dans la colonne "Choix", les valeurs favorisant ce compromis. Elles
pourront faire l'objet d'un essai de validation.

Bas Haut Choix
TFour -1 1 0.99
tChauffage -1 1 -0.92
tTransfertFourPresse -1 1 0
tSousPresse -1 1 0.17
TRefroid 1 2 1.03
Ymoy 7,203 8,07 7.98
Signal/Bruit 3,701 11,636 11.04
Pour une vision plus synthtique du phnomne on peut associer aux modles une analyse de
donnes de type Iconographie des corrlations :


Cintrage ressorts suspension
Figure 2, analyse des liens.
Traits pleins : corrlations positives remarquables.
Pointills : corrlations ngatives remarquables.
27


D'une part, on remarque les liens positifs de Ymoy (flche des ressorts) avec :
le rapport Signal/Bruit,
la TFour.
D'autre part les liens ngatifs Ymoy avec:
la dure tChauffage
la temprature de refroidissement.
Quant au rapport Signal/Bruit il dpend
positivement de TFour,
ngativement de tChauffage.
Thorie des probabilits


Courbes de probabilit.
La Thorie des probabilits est l'tude mathmatique des phnomnes caractriss par le hasard
et l'incertitude. Les objets centraux de la thorie des probabilits sont les variables alatoires, les
28

processus stochastiques, et les vnements: ils traduisent de manire abstraite des vnements
non dterministes ou des quantits mesures qui peuvent parfois voluer dans le temps d'une
manire apparemment alatoire. En tant que fondement mathmatique des statistiques, la thorie
des probabilits est essentielle la plupart des activits humaines qui ncessitent une analyse
quantitative d'un grand nombre de mesures. Les mthodes de la thorie des probabilits
s'appliquent galement la description de systmes complexes dont on ne connait qu'en partie
l'tat, comme en mcanique statistique. Une grande dcouverte de la physique du vingtime
sicle fut la nature probabiliste de phnomnes physiques une chelle microscopique, dcrite
par la mcanique quantique.
Historique []
La thorie mathmatique des probabilits trouve ses origines dans l'analyse de jeux de hasard par
Gerolamo Cardano au seizime sicle, et par Pierre de Fermat et Blaise Pascal au dix-septime
sicle. Bien qu'un simple pile ou face ou un lancer de ds soit un vnement alatoire, en les
rptant de nombreuses fois on obtient une srie de rsultats qui va possder certaines proprits
statistiques, que l'on peut tudier et prvoir. Deux rsultats mathmatiques fondamentaux ce
propos sont la loi des grands nombres et le thorme de la limite centrale.
Initialement, la thorie des probabilits considrait surtout les vnements discrets, et ses
mthodes taient principalement combinatoires. Mais des considrations analytiques ont forc
l'introduction de variables alatoires continues dans la thorie. Cette ide prend tout son essor
dans la thorie moderne des probabilits, dont les fondations ont t poses par Andre
Nikolaevich Kolmogorov. Kolmogorov combina la notion d'univers, introduite par Richard von
Mises et la thorie de la mesure pour prsenter son systme d'axiomes pour la thorie des
probabilits en 1933. Trs vite, son approche devint la base inconteste des probabilits
modernes.
Thorie des probabilits discrte []
La thorie discrte des probabilits s'occupe d'vnements dans le cadre d'un univers fini ou
dnombrable.
Exemples: lancer de ds, expriences avec des paquets de cartes, et marche alatoire.
Dfinition classique: Initialement, la probabilit d'un vnement tait dfinie comme le nombre
de cas favorables pour l'vnement, divis par le nombre total d'issues possibles l'exprience
alatoire.
Par exemple, si l'vnement est obtenir un nombre pair en lanant le d, sa probabilit est
donne par , puisque trois faces sur six ont un nombre pair.
Dfinition moderne : La dfinition moderne commence par un ensemble appel univers, qui
correspond l'ensemble des issues possibles l'exprience dans la dfinition classique. Il est
29

not . Ensuite, on a besoin d'une fonction f dfinie sur , qui va associer
chaque lment de sa probabilit, satisfaisant donc les proprits suivantes :
1.
2.
On dfinit ensuite un vnement comme un ensemble d'issues, c'est--dire un sous-ensemble de
. La probabilit d'un vnement E est alors dfinie de manire naturelle par :

Ainsi, la probabilit de l'univers est 1, et la probabilit de l'vnement impossible (l'ensemble
vide) est 0.
Pour revenir l'exemple du lancer de ds, on peut modliser cette exprience en se donnant un
univers = {1;2;3;4;5;6} correspondant aux valeurs possibles du d, et une fonction f qui
chaque associe .
Thorie des probabilits continue []
La thorie des probabilits continue s'occupe des vnements qui se produisent dans un
univers continu (par exemple la droite relle).
Dfinition classique: La dfinition classique est mise en chec lorsqu'elle est confronte au cas
continu (cf. paradoxe de Bertrand).
Dfinition moderne Si l'univers est la droite relle , alors on admet l'existence d'une fonction
appele fonction de rpartition , qui donne pour une variable alatoire
X. Autrement dit, F(x) retourne la probabilit que X soit infrieur ou gal x.
La fonction de rpartition doit satisfaire les proprits suivantes :
1. est une fonction croissante et continue droite.
2.
3.
Si est drivable, alors on dit que la variable alatoire X a une densit de probabilit
.
30

Pour un ensemble , la probabilit que la variable alatoire X soit dans est dfinie
comme :

Si la densit de probabilit existe, on peut alors la rcrire :

Tandis que la densit de probabilit n'existe que pour les variables alatoires continues, la
fonction de rpartition existe pour toute variable alatoire (y compris les variables discrtes)
valeurs dans .
Ces concepts peuvent tre gnraliss dans les cas multidimensionnel sur et d'autres univers
continus.
Principes fondamentaux []
La probabilit d'un vnement donn A, , est reprsente par un nombre compris entre 0 et
1. L'vnement impossible a une probabilit de 0 et l'vnement certain a une probabilit de 1. Il
faut savoir que la rciproque n'est pas vraie. Un vnement qui a une probabilit 0 peut trs bien
se produire dans le cas o un nombre infini d'vnements diffrents peut se produire. Ceci est
dtaill dans l'article Ensemble ngligeable.
Quelques notions ou proprits fondamentales
vnement Probabilit
probabilit de A

probabilit de ne pas
avoir A

probabilit d'avoir A ou B

probabilit conditionnelle
de A,
sachant B
probabilit d'avoir A et B

est la runion de A et B. est l'intersection de A et de B. est appel la
probabilit conditionnelle de A sachant B. C'est la probabilit d'avoir A quand on sait que l'on a
B. Par exemple, pour un d 6 faces la probabilit d'avoir un 2 (A) quand on sait que le rsultat
31

est pair (B) est gal car la probabilit d'avoir la fois un 2 et un nombre pair est
gal 1/6 et la probabilit d'avoir un nombre pair est gal 1/2. Ici on remarque que
car on a toujours un nombre pair quand on a 2.
La thorie des probabilits aujourd'hui []
Article dtaill : axiomes des probabilits.
Article dtaill : espace probabilis.
Certaines distributions peuvent tre un mlange de distributions discrtes et continues, et donc
n'avoir ni densit de probabilit ni fonction de masse. La distribution de Cantor constitue un tel
exemple. L'approche moderne des probabilits rsout ces problmes par l'utilisation de la thorie
de la mesure pour dfinir un espace probabilis et aboutir aux axiomes des probabilits
dvelopps par Kolmogorov
Un espace probabilis comporte trois parties:
un univers : L'univers est l'ensemble de tous les rsultats possibles de l'venement
alatoire. Par exemple pour un d a 6 faces l'univers est {1, 2, 3, 4, 5, 6}.
un ensemble d'vnements : C'est une tribu sur les vnements . Cet ensemble
contient tous les rsultats possibles de l'vnement au sens large. Par exemple pour un d
6 faces il contient la possibilit d'avoir un 1 ou un 2: {1, 2}, la possibilit de ne rien
sortir comme rsultat: l'ensemble vide , la possibilit de sortir n'importe quel face du d
{1, 2, 3, 4, 5, 6}. En gnral en probabilit on se contente de prendre la tribu borlienne.
titre d'exemple la tribu borlienne pour le rsultat d'un d 4 faces est donn (celle
pour le d 6 faces est encore plus grande mais suit le mme principe):
{, {1}, {2}, {3}, {4}, {1,2}, {1,3}, {1,4}, {2,3}, {2,4}, {3,4}, {1,2,3}, {1,2,4}, {1,3,4},
{2,3,4}, {1,2,3,4}}. On remarque que cette tribu contient l'ensemble vide et
={1,2,3,4}. Ceci est le cas pour toutes les tribus.
une mesure : Cette mesure ou probabilit est la probabilit de raliser l'un des lments
de . Cette probabilit est comprise entre 0 et 1 pour tous les lments de , c'est le
premier axiome des probabilits. Par exemple pour un d a 6 faces: la probabilit d'avoir
{1} est 1/6, la probabilit de ={1, 2, 3, 4, 5, 6}, tirer n'importe laquelle des 6 faces, est 1
(ceci est aussi toujours le cas, c'est le deuxime axiome des probabilits), la probabilit
de l'ensemble vide est 0. Ceci est toujours le cas, c'est galement une consquence des
axiomes des probabilits.
Dans cette optique, pour des vnements deux deux disjoints (c'est--dire, d'intersection deux
deux vide) A
1
, A
2
, A
3
, la probabilit de leur union apparat comme la somme de leurs
probabilits, ou, avec les notations mathmatiques,

32

C'est le troisime et dernier axiome des probabilits. Par exemple, et toujours pour un d 6
faces, la probabilit de tirer un 1 ou un 2
En plus de permettre une meilleure comprhension et une unification des thories discrtes et
continues des probabilits, l'approche de la thorie de la mesure nous permet aussi de parler de
probabilits en dehors de , notamment dans la thorie des processus stochastiques. Par
exemple pour l'tude du mouvement brownien, la probabilit est dfinie sur un espace de
fonctions.
Lois de probabilit []
Article dtaill : Loi de probabilit.
Certaines variables alatoires sont frquemment rencontres en thorie des probabilits car on les
retrouve dans de nombreux processus naturels ; leur loi a donc une importance particulire. Les
lois discrtes les plus frquentes sont la loi uniforme discrte, la loi de Bernoulli, ainsi que les
lois binomiale, de Poisson et gomtrique. Les lois uniforme continue, normale, exponentielle et
gamma sont parmi les plus importantes lois continues.
Convergence de variables alatoires []
Article dtaill : convergence de variables alatoires.
En thorie des probabilits, il y a plusieurs notions de convergence pour les variables alatoires.
En voici une liste:
Convergence en loi: une suite de variables alatoires converge en loi vers la
variable alatoire si et seulement si la suite des mesures images
converge troitement vers la mesure image
X
. En particulier dans le cas rel, il faut et il
suffit que les fonctions de rpartition convergent simplement vers la fonction de
rpartition de X en tout point de continuit de cette dernire.
Convergence en probabilit: converge en probabilit vers ssi ,
. Cette convergence implique la convergence en loi.
Convergence presque sre: converge presque srement vers ssi
. Elle implique la convergence en probabilit,
donc la convergence en loi.
Convergence dans : converge dans vers ssi
. Elle implique aussi la convergence en probabilit.
Le calcul stochastique []
33

Article dtaill : calcul stochastique.
Un processus stochastique est un processus alatoire qui dpend du temps. Un processus
stochastique est donc une fonction de deux variables : le temps et la ralisation d'une certaine
exprience alatoire. Quelques exemples d'utilisation des processus stochastiques incluent le
mouvement brownien, les fluctuations du march boursier, ou la reconnaissance vocale. En
temps discret, ces processus sont aussi connus sous le nom de Sries temporelles et servent entre
autres en conomtrie.
Parmi les processus stochastiques, les chanes de Markov constituent l'exemple le plus simple et
sans doute celui qui a le plus d'applications pratiques.
Chane de Markov []
Article dtaill : chane de Markov.
Une chane de Markov est un processus stochastique possdant la proprit markovienne. Dans
un tel processus, la prdiction du futur partir du prsent ne ncessite pas la connaissance du
pass. Il suffit alors de connatre l'tat de la chane un instant t pour savoir comme elle voluera
au temps t+1, il n'est pas ncessaire de connatre tout le pass entre 0 et t pour prvoir l'volution
de la chane.
Une chane en temps discret est une squence X
1
, X
2
, X
3
, ... de variables alatoires. La valeur X
n

tant l'tat du processus au moment n. Si la distribution de probabilit conditionnelle de X
n+1
sur
les tats passs est une fonction de X
n
seulement, alors de faon mathmatique:

o x est un tat quelconque du processus, est la probabilit d'avoir A quand on sait que
l'on a B par exemple ici la probabilit d'avoir une certaine valeur pour X
n + 1
quand on connat la
valeur de X
n
. L'identit ci-dessus est la proprit de Markov pour le cas particulier d'une chane
en temps discret. La probabilit P(X
n + 1
= x | X
n
= y) est appele la probabilit de transition de x
y ; c'est la probabilit d'aller de x y au temps n et a une importance particulire pour l'tude de
ces chanes. Nous considrons ici uniquement des chanes de Markov en temps discret mais il
faut savoir qu'il existe une gnralisation en temps continu.
Cette proprit de Markov s'oppose la notion d'hystrsis o l'tat actuel dpend de l'histoire et
non seulement de l'tat actuel. Ces chanes de Markov ou des modles de Markov cachs
interviennent dans l'tude de la marche alatoire et ont de nombreux champs d'application: filtre
anti-spam, mouvement brownien, hypothse ergodique, thorie de l'information, reconnaissance
des formes, algorithme de Viterbi utilis en tlphonie mobile, etc...
34



Trois marches alatoires (indpendantes) isotropes sur le rseau ; 10 000 pas.
Article dtaill : marche alatoire.
Citons entre autres comme cas particuliers de chanes de Markov la marche alatoire qui sert en
particulier l'tude de la diffusion ou du jeu de pile ou face. Une marche alatoire est une chane
de Markov o la probabilit de transition ne dpend que de x-y. Autrement dit une chane de
Markov o l'on a: P(X
n + 1
= x | X
n
= y) = f(x y).
Un jeu de pile ou face o l'on jouerait 1 chaque lancer est un exemple de marche alatoire. Si
on a y aprs n lancers, P(X
n + 1
= x | X
n
= y) = 1 / 2 si (x-y)=+1 ou -1 et 0 sinon. (on a une chance
sur deux de gagner 1 et une chance sur deux de perdre 1)
quations diffrentielles stochastiques []
Article dtaill : quation diffrentielle stochastique.
Les quations diffrentielles stochastiques sont une forme d'quation diffrentielle incluant un
terme de bruit blanc. Ces quations diffrentielles stochastiques remplacent les quations
diffrentielles ordinaires lorsque l'alatoire entre en jeu. Au premier ordre par exemple:

Pour faire une analogie avec la physique, (X(t)) est la vitesse moyenne au point X(t) et est li
au coefficient de diffusion (voir ce propos l'exemple donn dans lemme d'It). Le lemme d'It
et l'intgrale d'It permettent alors de passer de ces quations stochastiques des quations aux
drives partielles classiques ou des quations intgrales. Par exemple en utilisant le lemme
d'It on obtient pour la probabilit de se trouver l'instant t au point x:

Ce lemme est particulirement important car il permet de faire le lien entre l'tude d'quations
stochastiques et les quations aux drives partielles qui relvent de l'analyse. Ce lemme permet
entre autres d'obtenir les quation de Fokker-Planck en physique et de traiter le mouvement
brownien par des quations aux drives partielles classiques ou de modliser les cours de la
bourse en Mathmatiques financires.
35


Processus stochastique
Le calcul des probabilits classique concerne des preuves o chaque rsultat possible (ou
ralisation) est un nombre, ce qui conduit la notion de variable alatoire. Un processus
stochastique ou processus alatoire (voir Calcul stochastique) ou fonction alatoire (voir
Probabilit) reprsente une volution, gnralement dans le temps, d'une variable alatoire.
Mathmatiquement []
Soit un espace de probabilit. On appelle processus alatoire valeur dans
un lment , o pour tout est une variable alatoire
valeur dans .

Si est une filtration, on appelle processus alatoire adapt, valeur dans , un
lment o est une variable alatoire -mesurable valeur
dans

La fonction est appele la trajectoire associe la ralisation .
Espace des trajectoires []
On appelle espace des trajectoires l'ensemble . Pour , on
peut alors poser, pour t > 0, X
t
() =
t
.
On est souvent amen, notamment dans l'tude des processus markoviens, introduire la famille
des oprateurs de translation . Pour , .
Les oprateurs forment un semi-groupe puisque
On a X
s
(
t
) = X
s + t
() =
s + t
, en particulier X
0
(
t
) = X
t
() =
t
.
Pratiquement []
Notion de processus []
36

De nombreux domaines utilisent des observations en fonction du temps (ou, plus
exceptionnellement, d'une variable d'espace). Dans les cas les plus simples, ces observations se
traduisent par une courbe bien dfinie. Malheureusement, des sciences de la Terre aux sciences
humaines, les observations se prsentent souvent de manire plus ou moins erratique. Il est donc
tentant d'introduire des probabilits.
Un processus alatoire gnralise la notion de variable alatoire utilise en statistiques
lmentaires. On le dfinit comme une famille de variables alatoires qui associe une telle
variable chaque valeur . L'ensemble des observations disponibles constitue une
ralisation du processus.
Un premier problme concerne le fait que la dure sur laquelle est construit le processus est
gnralement infinie alors qu'une ralisation porte sur une dure finie. Il est donc impossible de
reprsenter parfaitement la ralit. Il y a une seconde difficult beaucoup plus srieuse : la
diffrence du problme des variables alatoires, la seule information disponible sur un processus
se rduit gnralement une seule ralisation.
Types de processus []
On distingue gnralement les processus en temps discret et en temps continu, valeurs discrtes
et valeurs continues.
Si l'ensemble est dnombrable on parle de processus discret ou de srie temporelle, si
l'ensemble est indnombrable on parle de processus continu. La diffrence n'a rien de
fondamental : en particulier la stationnarit, constance en fonction du temps des proprits
statistiques, se dfinit de la mme faon. Il ne s'agit mme pas d'une diffrence pratique car les
calculs sur un processus continu s'effectuent partir de l'chantillonnage d'une ralisation du
processus. La diffrence porte plutt sur l'attitude adopte face l'utilisation d'une seule
ralisation.
Il existe une diffrence un peu plus nette entre les processus valeurs continues et les processus
de comptage valeurs discrtes. Les seconds remplacent par des sommes algbriques les
intgrales utilises par les premiers.
Exemples []
En matire de processus valeurs continues, les processus de Gauss sont particulirement
utiliss pour les mmes raisons que les variables de Gauss en statistiques lmentaires. Une
application intuitive du thorme de la limite centrale conduit penser que bon nombre de
phnomnes, dus des causes nombreuses, sont approximativement gaussiens. D'autre part, un
tel processus prsente l'avantage d'tre entirement dfini par ses caractristiques au second
ordre, esprance et autocovariance.
La description d'un phnomne par des valeurs discrtes conduit des processus de comptage
dont le plus simple est le processus de Poisson utilis dans la thorie des files d'attente
37

La notion de proprit markovienne dfinit une classe de processus discrets ou continus,
valeurs discrtes ou continues, qui repose sur l'hypothse selon laquelle l'avenir ne dpend que
de l'instant prsent.

Rgression linaire


Un exemple graphique
En statistiques, tant donn un chantillon alatoire un modle de
rgression simple suppose la relation affine suivante entre Y
i
et X
i
:

La rgression linaire consiste dterminer une estimation des valeurs a et b et quantifier la
validit de cette relation grce au coefficient de corrlation linaire. La gnralisation p
variables explicatives de ce modle est donne par

et s'appelle la rgression linaire multiple.
Situation []
38

Empiriquement, partir d'observations , on a reprsent dans un graphe
l'ensemble de ces points reprsentant des mesures d'une grandeur y
i
en fonction d'une autre x
i
,
par exemple la taille y
i
des enfants en fonction de leur ge x
i
.
Les points paraissent aligns. On peut alors proposer un modle linaire, c'est--dire chercher la
droite dont l'quation est y
i
= ax
i
+ b et qui passe au plus prs des points du graphe.
Passer au plus prs, selon la mthode des moindres carrs, c'est rendre minimale la somme des
carrs des carts des points la droite

o (y
i
- ax
i
- b) reprsente le carr de la distance verticale du point exprimental (y
i
,x
i
) la droite
considre comme la meilleure.
Cela revient donc dterminer les valeurs des paramtres a et b (respectivement le coefficient
directeur de la droite et son ordonne l'origine) qui minimisent la somme ci-dessus.
Dfinitions []
Moyenne empirique des x
i
: .
Moyenne empirique des y
i
: .
Point moyen: .
Variance empirique des x
i
: .
Ecart-type empirique des x
i
: .
Variance empirique des y
i
: .
Ecart-type empirique des y
i
: .
Covariance empirique des x
i
, y
i
: .
La formule de la variance se retient par la mnmonique : La moyenne des carrs moins le carr
de la moyenne
de mme pour la covariance : La moyenne du produit moins le produit des moyennes.
39

Rsultat de la rgression []
La droite rendant minimale la somme prcdente passe par le point G et a pour coefficient
directeur . Son quation est donc :

soit


Erreur commise []
Si l'on appelle
i
l'cart vertical entre la droite et le point (x
i
, y
i
)

alors l'estimateur de la variance rsiduelle

est :

la variance de a,
a
, est estime par
.
On est dans le cadre d'un test de Student sur l'esprance avec cart type inconnu. Pour un niveau
de confiance donn, on estime que l'erreur sur a est :

o t
n-2
(1-)/2
est le quantile d'ordre /2 de la loi de Student n-2 degrs de libert.
L'erreur commise en remplaant la valeur mesure y
i
par le point de la droite ax
i
+ b est :
40


titre d'illustration, voici quelques valeurs de quantiles.
Exemples de quantiles de la loi de Student
n
niveau de confiance
90 % 95 % 99 % 99,9 %
5 2,02 2,57 4,032 6,869
10 1,812 2,228 3,169 4,587
100 1,660 1,984 2,626 3,390
Lorsque le nombre de points est important (plus de 100), on prend souvent une erreur 3, qui
correspond un niveau de confiance de 99,7 %.
Voir aussi : Erreur (mtrologie).
Coefficient de corrlation linaire []
On peut aussi chercher la droite D' : x = a'y + b' qui rende minimale la somme :

On trouve alors une droite qui passe aussi par le point moyen G et telle que
.
On souhaite videmment tomber sur la mme droite. Ce sera le cas si et seulement si
a' = 1/a,
c'est--dire si
aa' = 1.
Les droites sont confondues si et seulement si

c'est--dire si et seulement si
41


On appelle cette quantit le coefficient de corrlation linaire entre x et y. On peut
dmontrer que ce nombre est toujours compris entre -1 et 1.
En pratique sa valeur absolue est rarement gale 1, mais on estime gnralement que
l'ajustement est valide ds que ce coefficient a une valeur absolue suprieure
Voir galement : Corrlation (mathmatiques).
Dmonstration des formules par tude d'un minimum []
Pour tout rel a, on pose . Il suffit de dvelopper et ordonner ce
polynme du second degr en b. On obtient:

Ce polynme atteint son minimum en

Ce qui signifie que la droite passe par le point moyen G
Il reste remplacer dans la somme de dpart, b par cette valeur.
Pour tout rel a, . Il suffit de dvelopper et ordonner
ce polynme du second degr en a. On obtient

.
Ce polynme atteint son minimum en
42


La droite de rgression est bien la droite passant par G et de coefficient directeur
.
Dmonstration des formules grce aux espaces vectoriels de
dimension n []
Dans l'espace , muni du produit scalaire canonique, on considre le vecteur X de coordonnes
(x
1
,x
2
,...,x
n
), le vecteur Y de coordonnes (y
1
,y
2
,...,y
n
), le vecteur U de coordonnes (1, 1, ..., 1).
On peut remarquer que :





On note alors le vecteur et le vecteur
Le vecteur Z de coordonnes (ax
1
+ b,ax
2
+ b,...,ax
n
+ b) appartient l'espace vectoriel engendr
par X et U.
La somme reprsente le carr de la norme du vecteur Y Z.
Cette norme est minimale si et seulement si Z est le projet orthogonal de Y dans l'espace
vectoriel vect(X,U).
Z est le projet de Y dans l'espace vectoriel vect(X,U) si et seulement si (Z Y).U = 0 et
.
Or donc (Z-Y).U=0 signifie
que .
En remplaant dans , on obtient
43

donc
signifie que
Enfin le coefficient de corrlation linaire s'crit alors . Cette
quantit reprsente le cosinus de l'angle form par les vecteurs et .
On retrouve alors les rsultats suivants:
si le coefficient de corrlation linaire est 1 ou -1, les vecteurs et sont
colinaires de coefficient de colinarit a et . L'ajustement
linaire est parfait.
si le coefficient de corrlation linaire est en valeur absolue suprieur alors
l'angle form par les deux vecteurs est compris entre / 6 et / 6 ou entre 5 / 6 et 7 /
6.
Gnralisation: le cas matriciel []
Article dtaill : Rgression linaire multiple.
Lorsqu'on dispose de plusieurs variables explicatives dans une rgression linaire, il est
souhaitable d'avoir recours aux notations matricielles. Si l'on dispose d'un jeu de n donnes (y
i
)
i =
1..n
que l'on souhaite expliquer par k variables explicatives (y compris la constante)
, on peut poser:

La rgression linaire s'exprime sous forme matricielle:

et il est question d'estimer le vecteur de coefficients k 1 .
Son estimateur par moindre carr est:
44


Il faut que la matrice X soit de plein rang ( ) afin que soit inversible.
L'estimation de la matrice (symtrique) de variance-covariance de cet estimateur est:

Le terme reprsente la somme des carrs des rsidus .
La qualit de l'ajustement linaire se mesure encore par un coefficient de corrlation R
2
, dfini ici
par:

o SCE (respectivement SCT) reprsente la somme des carrs expliqus (respectivement la
somme des carrs totaux). Ces sommes se donnent par et
.