Vous êtes sur la page 1sur 8

1

lois usuelles

1.1

Loi Binomiale

B(n, p). q = 1 p.
p(X = k) = Cnk pk q nk
Esperance E(X) = np.
Variance : V ar(X) = npq.

Ecart
type : = npq.

1.2

Loi de Poisson

P() : loi de Poisson de param`etre > 0 :


X() = N
k
pk = P (X = k) = e
k!
Esperance mathematique : E(X) =
Variance : V ar(X)
= .

Ecart type : = .
Utilisation pratique :
On consid`ere une loi binomiale B(n, p) avec n grand et p petit, i.e. on cherche un
evenement rare. La loi de Poisson P(np) (i.e. = np) est une bonne approximation dun
tel tirage d`es que n 30 p 0, 1 et np 10.
= np represente le nombre devenements attendus pour la periode consideree.

1.3

Loi normale

Loi normale centree reduite N (0, 1)


Esperance : 0
Variance : 1

Ecart
type : 1
Loi normale N (, )
Esperance :
Variance : 2

Ecart
type :

2
2.1

Estimation
Estimation ponctuelle de la moyenne

X variable aleatoire sur une population .


Esperance E(X) =

Ecart
type
Variance : V ar(X) = 2 .
n

X
= 1
Xi : variable aleatoire moyenne aleatoire de lechantillon de taille n :
X
n i=1
=
Esperance : E(X)

Ecart
type : / n
= 2 /n
Variance :V ar(X

2.2

Estimation ponctuelle de la variance

n
n
X
1X
2= 1
Ve =
(Xi X)
(Xi )2
n i=1
n i=1
lechantillon
:
p
e = Ve .
n1 2
Esperance : E(Ve ) =

n
e

Ecart
type : =
n
n1

2.3

!
2 : variable aleatoire variance empirique de
X

Estimation ponctuelle dune fr


equence ou dun pourcentage

On cherche `a determiner la frequence p dun caract`ere A sur une population .


On tire un echantillon de taille n, on observe la frequence f obtenue.
F : variable aleatoire frequence observee de lechantillon.
Esperance : E(F ) = p
p(1 p)
.
Variance : V ar(F ) =
n
Application :
si on obtient une frequence observee f dun echantillon de taille n, on estime
la frequence p par f
p(1 p)
f (1 f )
la variance =
par
n
n1

Estimation par intervalle de confiance

3.1

Estimation dune fr
equence par un intervalle de confiance

Soit p la frequence dapparition dun caract`ere A dans une population .


Soit f la frequence dapparition de ce caract`ere dans un echantillon d taille n.
On cherche `a determiner un intervalle I =]f b; f +b[ tel que p I avec une probabilite
1 ou un risque derreur 1 .
Pour n grand et p pas
p trop voisin de 1 ou 0 (n 30, np 5 et nq 5), la variable
aleatoire X = (F p)/ p(1 p)/n suit la loi normale centree reduite.
M
ethode :
On estime p par f et

p(1 p)/n par

f (1 f )/n 1

On lit dans la table 2 la valeur a tel que p(|X| a) = .


Lintervalle
p de confiance est alors : p
]f a f (1 f )/(n 1), f + a f (1 f )/(n 1)[.

3.2

Estimation dune moyenne par un intervalle de confiance,


cas des grands
echantillons (n > 30)

X variable aleatoire desperance et decart type .


et sont inconnus. On cherche `a estimer au risque de .
La variable aleatoire U =

s
n

suit sensiblement la loi normale reduite centree N (0, 1).

On dispose dun echantillon de n valeurs x1 , . . .,xn .


1
Moyenne observee : x = (x1 + . . . + xn )
nr
1 2

(x + . . . + x2n )
Ecart
type observe : e =
n 1
M
ethode :

se
s
On estime par x et par
n
n1
On lit dans la table 2 la valeur a tel que p(|U | a) = .
Lintervalle de confiance est alors :
se
se
I =]
x a
, x a
[.
n1
n1

3.3

Estimation dune moyenne par un intervalle de confiance,


cas des petits
echantillons (n < 30) sur une variable Gaussienne

X variable aleatoire Gaussienne desperance et decart type , cest-`a-dire X suit la


loi normale N (, ).
et sont inconnus.
On cherche `a estimer au risque de .
La variable aleatoire U =

s
n

suit la loi de Student `a n 1 degres de liberte.

On dispose dun echantillon de n valeurs x1 , . . .,xn .


3

1
(x1 + . . . + xn )
nr
1 2

(x + . . . + x2n )
Ecart
type observe : e =
n 1
Moyenne observee : x =

M
ethode :

se
s
On estime par x et par
n
n1
On lit dans la table 3 (Table de Student, ligne n 1 degres de liberte) la valeur a tel
que p(|U | a) = .
Lintervalle de confiance est alors :
se
se
, x a
[.
I =]
x a
n1
n1

4
4.1

Tests de conformit
e dune fr
equence
Test bilat
eral

On dispose dune frequence theorique p et dune frequence observee f .


A priori, la frequence observee peut etre au dessus ou au dessous de p.
On veut savoir si la difference entre f et p est due `a lechantillonnage (hypoth`ese H0 )
au risque derreur .
p
Sous lhypoth`ese H0 F suit sensiblement la loi normale N (p; p(1 p)/n.
M
ethode :
On calcule lintervalle
de confiance
pde p au risque pour un echantillon de taille n :
p
u a est obtenu dans la table 2 par
I =]p a p(1 p)/n; p + a p(1 p)/n[, o`
p(|X] a) = .
Si f I on accepte lhypoth`ese : la difference est due aux variations dechantillonnage.
Sinon on rejette lhypoth`ese.
1er exemple. On lance 100 fois une pi`ece de monnaie. On observe 45 piles et 55 faces.
Hypoth`ese H0 la pi`ece equilibree, hypoth`ese H1 : la pi`ece nest pas equilibree.
Si H0 est vraie, la probabilite dobtenir le cote pile est p = 1/2.
p
La proportion de pile est approchee par la loi normale N (0, 5; 0, 52 /100) = N (0, 5; 0, 05).
On a p(|X| a) = 0, 05 pour a = 1, 96.
Ceci donne un intervalle de confiance [0, 50 1, 96 0, 05; 0, 50 + 1, 96 0, 05] =
[0, 402; 0, 598].
Comme 0, 45 est dans lintervalle, on ne peut rejetter lhypoth`ese que la pi`ece est
equilibree au risque de 5%.

4.2

Test unilat
eral

On dispose dune frequence theorique p et dune frequence observee f > p.


Hypoth`ese H0 : la difference entre f et p est liee aux variations de lechantillonnage.
Hypoth`ese H1 : la frequence reelle est plus grande que la frequence theorique (par
exemple sous leffet dun medicament). La frequence f observee ne correspond donc pas
`a la frequence theorique.
La difference essentielle est que lon sait `a priori que f ne peut pas etre plus petite
que p (aux variations dechantillonnage pr`es).
4

Sous lhypoth`ese H0 F suit sensiblement la loi normale N (p;

p(1 p)/n.

M
ethode :
On cherche a dans les tables de la loi normale N (0, 1) tel que p(F > a) =
p
On calcule b = p + a p(1 p)/n
Si f b on accepte lhypoth`ese H0 .
Sinon on rejette lhypoth`ese H0 .
Remarque : la valeur a peut etre lue de 2 mani`eres :
Table 1 en lecture inverse.
Table 2 en utilisant la propriete p(X > a) = p(|X| > a) = 2.
1er exemple, bis. On lance 100 fois une pi`ece de monnaie. On observe 45 piles et 55
faces. On soupconne que la pi`ece est truquee, et donc que la frequence reelle p dobtenir
pile est plus faible que p0 = 0, 5.
Hypoth`ese H0 la pi`ece nest pas truquee : p = 0, 5.
Hypoth`ese H1 : la pi`ece est truquee : p <= 0, 5.
Si H0 est vraie, la probabilite dobtenir le cote pile est p = 1/2.
p
La proportion de pile est approchee par la loi normale N (0, 5; 0, 52 /100) = N (0, 5; 0, 05).
On a p(X a) = 0, 05 pour a = 1, 64.
Ceci donne une borne b = p + a = 0, 5 1, 64 0, 05 = 0, 418.
Comme la frequence observee f est de 45%, on ne peut pas rejeter H0 . On ne peut
pas rejeter lhypoth`ese que la pi`ece nest pas truquee au risque de 0, 05.
Comme 0, 45 est dans lintervalle, la pi`ece nest pas truquee au risque de 5%.

Tests de conformit
e dune moyenne

5.1

Test bilat
eral

On dispose dune moyenne theorique et dun echantillon de taille n. On dispose ou


on ne dispose pas de la valeur de la variance theorique .
1
On calcule la moyenne observee : x = (x1 + . . . + xn )
n
Si on ne connat pas on lestime sur lechantillon (avec correction du biais) :
r
r
n
1
s=
e =
(x2 + . . . + x2n ).
n1
n1 1
On veut savoir si la difference entre x et est due `a lechantillonnage (hypoth`ese H0 )
au risque derreur .
Cas des grands
echantillons (n 30)

suit sensiblement la loi normale N (p; / n)).


Sous lhypoth`ese H0 X
M
ethode :
On calcule lintervalle de confiance de au risque pour un echantillon de taille n :

I =] a/ n; + a/ n[, o`
u a est obtenu dans la table 2 par p(|X] a) = .
Si f I on accepte lhypoth`ese : la difference est due aux variations dechantillonnage.
Sinon on rejette lhypoth`ese.

Exemple : On consid`ere une serie statistique de 60 taux dhemoglobine dans le sang


(g/l) mesure chez des adultes presumes en bonne sante.
On observe une moyenne x = 159 et un ecart type e = 9, 5. En labsence dinformation, on suppose que le prel`evement a ete fait sur une population repartie hommes/femmes
en proportion egales.
Dans ce cas la moyenne attendue est = 146.
suit
Hypoth`ese H0 , la population estbien repartie hommes/femmes. Dans ce cas, X
sensiblement la loi normale
N
(, / n).

Estimation de / n : e / n 1 = 9, 5/ 59 = 1, 237.
Au risque de 1%, p(|X| a) = 0, 01 pour a = 2, 576.
Intervallede confiance
:
I =] a/ n; + a/ n[=]146 3, 18; 146 + 3, 18[.
La valeur x = 159 obtenue nest pas dans lintervalle, la population nest donc probablement pas equilibree.
: la variance attendue pour la population totale est = 18, on a alors
Remarque
/ n = 18/ 60 = 2, 32,ce qui, au risque de 1% donne
I =] a/ n; + a/ n[=]146 5, 76; 146 + 5, 76[. On rejette toujours lhypoth`ese H0 .
L
Cas des petits
echantillons (n < 30)
On suppose que X suit une loi normale (est une variable Gaussienne).

X
suit sensiblement la loi de Student `a n 1 degres de
Sous lhypoth`ese H0
/ n
liberte.
M
ethode : Identique au cas precedent, sauf lecture de a dans la table 3

5.2

Test unilat
eral sur les grands
echantillons

M
ethode : Identique au cas bilateral sur les grands echantillons, excepte que a est lu
dans la table 1 :
On cherche a dans les tables de la loi normale N (0, 1) tel que p(F > a) =
Exemple : On reprend lexercice precedent. On suppose que la loi theorique est = 146
et = 18.

On a toujours / n = 18/ 60 = 2, 32.


On cherche a dans la table 1 tel que
p(X > a) = 0, 01, soit a = 2, 33.
La borne obtenue est b = + a/ n = 146 + 5, 4 = 151, 4. Comme x = 159, on rejette
H0 , cest-`a-dire que lon consid`ere quil sagit dune population dhommes.

Tests dhomog
en
eit
e

6.1

Pr
esentation du probl`
eme

On ne dispose pas de loi theorique, mais de 2 echantillons de tailles respectives n1 et


n2 .
On veut savoir si les differences de resultats sur chaque echantillon peut sexpliquer
ou non par les fluctuations dues `a lechantillonnage ou non.
On note Y
Soit Y la variable etudiee (par exemple frequence F ou moyenne X).
lecart type de Y .
6

On dispose de 2 echantillons que lon modelise par 2 variables Y1 et Y2 .


Hypoth`ese H0 : les echantillons proviennent de la meme population. Les tirages sont
independants.
Sous cette hypoth`ese,
q
la variable Z = Y1 Y2 a pour esperance 0 et ecart type Z =

6.2

Y21 + Y22 .

Comparaison de deux fr
equences
s

p(1 p) p(1 p)
+
.
n1
n2
Si lechantillon est suffisamment grand, et les frequences pas trop proches de 0 ou 1,
Z suit sensiblement la loi normale N (0, Z ).
n1 f1 + n2 f2
.
Estimation de p : on reunit les 2 echantillons, on trouve p =
n1 + n2
p
Si Y = F est une frequence, F = p(1 p)/n et Z =

Test bilat
eral
M
ethode :
n1 f1 + n2 f2
.
n1 + n2
r
1
1
p(1 p)( + ).
On calcule s = (
n1 n2
On determine a dans la table 1 tel que p(|X] a) = .
On determine lintervalle de confiance de Z au risque : I =] as; as[,
Si f1 f2 I on accepte lhypoth`ese : la difference est due aux variations dechantillonnage.
Sinon on rejette lhypoth`ese.

On calcule p =

6.3

Comparaison de deux moyennes. Cas des grands


echantillons
(n 30)

est une moyenne, X = / n et Z =


Si Y = X

12 22
+ .
n1 n2
r
ni
On estime 1 et 2 par la methode habituelle si =
e,i .
ni 1
Test bilat
eral
M
ethode :
On estime 1 er 2 .
s
12 22
On calcule sZ =
+ .
n1 n2
On determine a dans la table 1 tel que p(|X] a) = .
On determine lintervalle de confiance de Z au risque : I =] as; as[,
Si x1 x2 I on accepte lhypoth`ese : la difference est due aux variations dechantillonnage.
Sinon on rejette lhypoth`ese.
7

Test de conformit
e par la loi du 2 : ajustement `
a
une loi th
eorique

Situation : on dispose dun syst`eme complet devenements E1 , . . .Ek et dune distribution de probabilite theorique de ces evenements : pi = p(Ei ) avec p1 + . . . + pk = 1.
On dispose dun echantillon de taille n sur lequel on calcule les effectifs observes Oi et
les frequences observees fi = Oi /n de chaque evenement.
On veut tester si lechantillon est conforme `a la distribution theorique, aux ecarts
dechantillonnage pr`es.
On calcule les effectifs theoriques de chaque evenements sur un echantillon de taille
n : Ci = n pi .
Hypoth`ese H0 : la distribution de lechantillon est conforme `a la distribution theorique.
(O1 C1 ))2
Sous lhypoth`ese H0 , la variable aleatoire Y 2 qui prends les valeurs 2c =
+
C1
(Ok Ck ))2
... +
suit la loi du 2 avec n 1 degre de liberte.
Ck
M
ethode :
On choisit un coefficient de risque .
On calcule les effectifs theoriques Ci = n pi .
(Ok Ck ))2
(O1 C1 ))2
On calcule 2c =
+ ... +
.
C1
Ck
On lit dans la table 4 la valeur 2 telle que p(Y 2 2 ) = .
Si 2c 2 , on ecarte lhypoth`ese H0 avec une probabilite de se tromper de .
Sinon on ne peut pas rejeter cette hypoth`ese.
Remarque : si un effectif est inferieur `a 5, il faut faire un regroupement de classe.
Exemple : On a effectue le croisement de balsamines blanches et de balsamines pourpres.
En premi`ere generation, les fleurs sont toutes pourpres. On obtient en deuxi`eme generation
quatre categories avec les effectifs suivants :
couleurs
effectifs

pourpre
1790

rose
547

blanc lavande
548

blanc
213

9 3 3 1
; ; ; ).
16 16 16 16
Peut-on accepter cette hypoth`ese avec un risque de premi`ere esp`ece de 5% ?
Effectif total : n = 1790 + 547 + 548 + 213 = 3098.
Lhypoth`ese de repartition mendelienne donne (

couleurs
effectifs observes
effectifs theoriques

pourpre
1790
1742, 6

rose
547
580, 9

blanc lavande
548
580, 9

blanc
213
193, 6

(1790 1742, 6)2 (547 580, 9)2 (548 580, 9)2 (213 193, 6)2
+
+
+
= 7, 07.
1742, 6
580, 9
580, 9
193, 6
Nombre de degres de liberte : n 1m4 1 = 3
Si = 0, 05, on lit dans la table 20,05 = 7, 81.
On ne peut pas rejeter lhypoth`ese dune repartition mendelienne.
2c =

Vous aimerez peut-être aussi