Académique Documents
Professionnel Documents
Culture Documents
INTRODUCTION
Qu’est ce que l’inférence
statistique?
2
FONCTION DE REPARTITION DE LA LOI NORMALE :
La fonction de répartition de la loi normale est donnée par:
x
F ( x)
f (t )dt
x
On a : (x
) ( x) 1 ( x)
P( X x) 2( x) 1
Théorème central limite
Soit X1, X 2 ,.........., X n une suite de n v.a
mutuellement indépendantes, de même loi
de moyenne et d’écart-type .
1 n
Pour n 30, la v.a X X i
n i 1
suit ,approximativement, la loi normale de
moyenne et d’écart-type
n
Remarque:
Si une v.a est la résultante d’un grand
nombre de causes, petites, indépendantes,
à effet additif alors cette v.a suit
approximativement une loi normal.
Inégalité de Bienayme-Chebychev
Soit X une variable aléatoire d’espérance
mathématique et d’écart-type .
Pour tout réel t strictement positif, on a:
1
P ( t X t ) 1 2
t
Soit encore
X 1
P( t) 2
t
Inégalité de B.T
Pour t =2. Pour t =3.
La probabilité pour La probabilité pour
que X prenne une que X prenne une
valeur dans valeur dans
l’intervalle l’intervalle
2 , 2 3 , 3
est au moins égale à est au moins égale à
3/4 8/9
Amélioration de l’inégalité de B.T
dans le cas d’une loi normale
P( t X t ) 2 P( Z t ) 1
X
avec Z N (0,1)
Applications
P( X ) 0, 68 68%
P( 2 X 2 ) 0,954 95, 4%
P( 3 X 3 ) 0,997 99, 7%
t = ? Pour que t = ? Pour que
P( t X t ) 0,95 95% P( t X t ) 0,99 99%
La table de la loi N(0,1) La table de la loi
donne N(0,1) donne
t 1,96 t 2,58
effectifs 6 13 16 22 18 10 6 4 3 2
Fréquences
cumulées
croissantes 0,06 0,19 0,35 0,67 0,75 0,85 0,91 0,95 0,98 1
1,5
0,5
0
0 0,5 1 1,5 2 2,5 3 3,5
-0,5
-1
-1,5
-2
Estimation de la moyenne et de l’écart-type
La méthode des moindres carrés donne
pour équation de la droite d’ajustement :
z=2,2.x-4,38 avec un coefficient de
corrélation r=0,991 .Donc la normalité
de la répartition est acceptable.
La moyenne de la loi normale est
l’abscisse du point d’ordonné 0,d’où 1,99
L’abscisse du point de (D) d’ordonnée 1
est , soit ici , 2,45 . alors : 0,46
Histogramme des effectifs
25
20
15
10
0
LA FONCTION GAMMA
On a :
0 , ( 1) ( )
, ( 1) !
LOI DE KHI-DEUX
Définition:
Soient X1 , X 2 ,..........., X n n variables aléatoires
indépendantes suivants toutes la loi N(0,1).
n
La v.a n2 X i2 suit une loi dite de khi-deux à
i 1
n degrés de libertés.
Sa fonction de densité est donnée par:
0 ; si x 0
n
x
f ( x) n 1 x 2 e 2 ; si x 0
1
2 2 ( n )
2
Courbes représentatives des fonctions de densités
de la loi khi-deux pour certaines valeurs de n
La probabilité donnée dans la table est
unilatérale: P( 2 (2 , ) )
LOI DE STUDENT
Définition:
Soient X , X1 , X 2 ,............, X ndes v.a indépendantes
suivants toutes la loi N(0,1).
X
La variable aléatoire Tn n suit une loi
1
dite de Student à i
n i 1
X 2
n degrés de liberté.
Sa fonction de densité est donnée par:
n 1
( ) 2
n 1
2 x
f ( x) (1 ) 2 ; x
n n
n ( )
2
Courbes représentatives des fonctions de densités
de la loi de Student pour certaines valeurs de n
LOI DE FISHER
Définition:
Soient X1 , X 2 ,............, X n et Y1 , Y2 ,..........,Ym
des v.a indépendantes suivantsn toutes la loi
1
N(0,1). i
n i 1
X 2
n et m degrés de liberté.
Sa fonction de densité est donnée par:
0 ; si x 0
nm
( ) n m 1
f ( x) 2
nm
n m n 2
.m 2
( m nx ) 2
; si x 0
( ) ( )
2 2
Lecture de la table de Fisher
On lit, pour diverses couples (n,m) et une
probabilité donnée, la valeur f 0 tel que :
P( Fn,m f0 )
1.METHODOLOGIE
Etudier un caractère
C d’une population
Cout
Cout élève
raisonnable
Population de
taille N
Méthodes utilisées?????
Echantillon
de taille n
1.1.METHODES PAR CHOIX
RAISONNES:
Ces méthodes ont généralement recours
au bon sens.
Requiert la connaissance de la répartition
de la population selon les variables de
contrôle.
Ne nécessitent pas vraiment de
mécanismes de calculs élaborés.
Méthode des quotas:
avantages inconvénients
Couts Manque de
financiers fondement
théorique
permettant la
Rapidité mesure de l’erreur
de mise commise lors de
en œuvre l’extrapolation des
résultats de
l’échantillon vers la
population
1.2.METHODE DES SONDAGES
ALEATOIRES:
Types de tirages
Loi normale
11.ESTIMATION
Population de
taille N
Extrapolation des résultats
Echantillon
de taille n
Quelques remarques sur la
méthode des sondages aléatoires:
Toute grandeur de la population
(moyenne, variance, fréquence, effectif,….)
peut être estimée à partir d’un
échantillon.
On peut associer à l’extrapolation, vers la
population, des résultats trouvés sur
l’échantillon, une mesure de l’erreur
susceptible d’avoir été commise.
2.ESTIMATION D’UN PARAMETRE:
2.1.Notion de biais:
L’estimation consiste à évaluer un
paramètre inconnu à l’aide de la valeur
de ce paramètre calculée à partir d’un
échantillon.
La valeur estimée du paramètre est
souvent notée .
=valeur réelle du paramètre.
=valeur estimée de .
Soit ε= = l’erreur commise
puisque θ dépend de l’échantillon choisi, alors ε est
une variable aléatoire.
Définition:
θ est dit sans biais si E( )=0
Remarque:
Le biais d’un estimateur est en général E( )
2.2.Distribution d’échantillonnage des moyennes:
P( , )
E3 (m3 , 3 ) E1 (m1 , 1 )
E2 (m2 , 2 )
E4 (m4 , 4 )
Ei (mi , i )
.
.
.
Ei .......................mi
Si on considère la variable aléatoire X qui à
chaque échantillon fait correspondre sa
moyenne. On démontre que E( X )
donc la valeur espérée de la moyenne d’un
échantillon de taille n est la moyenne de
la population .
Le théorème central limite permet
d’énoncer le résultat suivant:
Estimation de la variance 2
Estimation de la
moyenne
n 1 i 1
i i e
p
1
Soit e 2 ni ( xi me )2 la variance de
n i 1
l’échantillon . Alors,
2 n n
e
2
e
n 1 n 1
Conclusion2:
L’écart-type est estimé par
e ; ou e est l’écart-type de
n
n 1
l’échantillon .
n 1 2
Remarquons que E (S )
2
n
n 2
et puisque E ( S ) 2 ; alors est un
n 1
X
loi ( Z ) N (0,1)
n
N n
Dans le cas des tirages exhaustifs , n est remplacé par
n N 1
2.4.1.Cas ou est connu:
On se fixe un seuil de risque et donc un
seuil de confiance 1 .
Soit t tel que P( Z t ) 1
Et donc:
P( X t X t ) 1
n n
D’autre part,
P( Z t ) 2(t ) 1 (t ) 1
2
d’où : 1
t (1 )
2
me t , me t
n n
est l’intervalle de confiance de au
seuil de risque
t est lu sur la table de la loi normale
Applications:
5% me 1,96 , me 1,96
n n
1% me 2,58 , me 2,58
n n
Avec une population mère de plus de 500 personnes,
nous avons calculé à partir d’un échantillon la
moyenne d’âge qui est de 25 ans:
Exemple1: Exemple 2:
Remarque:
L’intervalle se resserre au fur et à mesure
que la taille de l’échantillon augmente.
2.4.2.Cas ou est inconnu:
On remplaçant par son estimateur ˆ
X
la v.a suit une loi de Student Tn 1.
S
n
On estime que Tn N (0,1) dés que n 30
ˆ ˆ
me tn1, , me t
2 n n 1,
2 n
est un intervalle de confiance de la moyenne au
seuil de confiance 1 .
Cet intervalle est légèrement plus grand que celui lorsque
est connu. Et ceci du fait qu’on a moins d’informations que
dans le premier cas.
Tableau récapitulatif des lois de X
Écart-type
LOI DE LA TAILLE DE
POPULATION L’ECHANTILLON
connu inconnu
NORMALE STUDENT
NORMALE n 30
NORMALE NORMALE
n 30
NORMALE NORMALE
NON NORMALE n 30
INCONNU INCONNU
n 30
Exemple 1
Un fabricant reçoit de son fournisseur une livraison de
pièces dont il veut contrôler la longueur. La dimension
X d’une pièce suit une loi normale de moyenne m et
d’écart-type inconnus. Il extrait un échantillon de six
pièces qui donnent les dimensions suivantes (en cm):
50 , 40 , 45 , 43 , 47 , 45
(x m )
i e
2
s
2 i 1
11,6 avec n 6
n 1
E1......................... f1
E2 ........................ f 2
..............................
..............................
Ei ......................... f i
On montre que :
pq
E(F ) p et V (F )
n
Remarque:
Le biais sur la fréquence du caractère
étant l’erreur commise quand on
remplace la fréquence p du caractère par
la fréquence f observée sur l’échantillon.
Donc la v.a F p . or E( ) 0 ,alors
la fréquence f observée sur un échantillon
est un estimateur sans biais.
Le théorème central limite permet
d’énoncer le résultat:
pq pq
i e : P( F t p F t ) 1
n n
est un estimateur sans biais de , dont
2
on aura :
2 (n 1) S 2
P 2
1
n 1,1
2 2 n 1,
2
( n 1)ˆ ( n 1)ˆ 2
2
2 ,
2
n 1,
2
n 1,1
2
est l’intervalle de confiance de 2 au seuil de
confiance 1 .
Notez que cet intervalle n’est pas
symétrique
TESTS D’HYPOTHESES
0. GENERALITES
◦ Tests d’hypothèses : procédures basées sur l’analyse
statistique de résultats expérimentaux, permettant de
décider -avec un risque d’erreur – entre une hypothèse
et l’hypothèse alternative.
Test
d’hypothèses
Hypothèse Hypothèse
nulle alternative
Différents tests d’hypothèses
Soit un paramètre inconnu d’une population sur
lequel on veut faire des tests d’hypothèses
Test bilatéral:
H0 :" 0 " H1 :" 0 "
Test unilatéral droit:
H0 :" 0 " H1 :" 0 "
H 0 est vraie
Rejet de H 0
Non rejet de H 0
H 0 est fausse
Rejet de H 0
Erreur de 2éme
Accepter Décision correcte espèce
(risque de l’acheteur)
t t
donc : tobs t
2
Donc, on ne rejette pas H 0 et on conclut
que le pourcentage de conducteur
utilisant le cellulaire au volant n’est pas
significativement différent de 10%.
4-TESTS D’HOMOGENEITE
4.1ETUDE DES MOYENNES:
Position du problème:
On étudie un caractère quantitatif C et on
dispose de deux échantillons indépendants.
A(nA ; mA , A ) B(nB ; mB , B )
P( N ; , ) P( N ; , )
A(nA ; mA , A ) B(nB ; mB , B )
Si nA 30, alors : X A N ( , )
nA
et si nB 30, alors : X B N ( , )
nB
les v.a X A et X B sont indépendantes ,
alors la v.a X A X B suit approximativement
2 2
la loi N ( , )
nA nB
1
2 2
Mise en œuvre du test:
mA mB
On calcule le nombre t et on compare t à t ;
2 2
nA nB
et on utilise la régle de décision pour conclure.
En général et sont inconnus et remplacés par leurs estimateurs
nA nB
respectifs ˆ A A et ˆ B B
nA 1 nB 1
2 2 ( n )
2
Courbes représentatives des fonctions de densités
de la loi khi-deux pour certaines valeurs de n
La probabilité donnée dans la table est
unilatérale: P( 2 (2 , ) )
Extrait de la table de khi-deux:
elles donnent en fonction de et , la valeur ,
notée lu2 , telle que P( 2 lu2 ) .
0,05
5 8 20
lu2 11,070 15,507 31,410
8
0,01 0,05 0,10
lu2 20,090 15,507 13,362
Position du problème:
On connait une distribution observée
(résultat d’une expérience)
Valeurs du
C1 C2 Ci Cn
caractère …………….. …………………….
Effectifs
O1 O2 Oi On
observés …………….. …………………….
T n
(Oi Ti )2
Et on définit la variable aléatoire: S
i
i 1 Ti
Soit l’hypothèse du test:
H0 :"les observations suivent la loi théorique "
Pearson a montré que sous l’hypothèse H 0
S suit une loi de à (n p ) ddl .
2
=0,05
11,07