Vous êtes sur la page 1sur 8

1

1.1

lois usuelles
Loi Binomiale
B(n, p). q = 1 p. k p(X = k) = Cn pk q nk Esprance E(X) = np. e Variance : V ar(X) = npq. Ecart type : = npq.

1.2

Loi de Poisson

P() : loi de Poisson de param`tre > 0 : e X() = N k pk = P (X = k) = e k! Esprance mathmatique : E(X) = e e Variance : V ar(X) = . Ecart type : = . Utilisation pratique : On consid`re une loi binomiale B(n, p) avec n grand et p petit, i.e. on cherche un e vnement rare. La loi de Poisson P(np) (i.e. = np) est une bonne approximation dun e e tel tirage d`s que n 30 p 0, 1 et np 10. e = np reprsente le nombre dvnements attendus pour la priode considre. e e e e ee

1.3

Loi normale

Loi normale centre rduite N (0, 1) e e Esprance : 0 e Variance : 1 Ecart type : 1 Loi normale N (, ) Esprance : e Variance : 2 Ecart type :

2
2.1

Estimation
Estimation ponctuelle de la moyenne

X variable alatoire sur une population . e Esprance E(X) = e Ecart type Variance : V ar(X) = 2 . 1 Xi : variable alatoire moyenne alatoire de lchantillon de taille n : e e e X= n i=1 Esprance : E(X) = e
n

Ecart type : / n Variance :V ar(X = 2 /n

2.2
Ve =

Estimation ponctuelle de la variance


n n

1 1 (Xi X)2 = (Xi )2 n i=1 n i=1 lchantillon : e e = Ve . n1 2 Esprance : E(Ve ) = e n e Ecart type : = n n1

X 2 : variable alatoire variance empirique de e

2.3

Estimation ponctuelle dune frquence ou dun pourcentage e

On cherche ` dterminer la frquence p dun caract`re A sur une population . a e e e On tire un chantillon de taille n, on observe la frquence f obtenue. e e F : variable alatoire frquence observe de lchantillon. e e e e Esprance : E(F ) = p e p(1 p) . Variance : V ar(F ) = n Application : si on obtient une frquence observe f dun chantillon de taille n, on estime e e e la frquence p par f e p(1 p) f (1 f ) la variance = par n n1

3
3.1

Estimation par intervalle de conance


Estimation dune frquence par un intervalle de conance e

Soit p la frquence dapparition dun caract`re A dans une population . e e Soit f la frquence dapparition de ce caract`re dans un chantillon d taille n. e e e On cherche ` dterminer un intervalle I =]f b; f +b[ tel que p I avec une probabilit a e e 1 ou un risque derreur 1 . Pour n grand et p pas trop voisin de 1 ou 0 (n 30, np 5 et nq 5), la variable e e alatoire X = (F p)/ p(1 p)/n suit la loi normale centre rduite. e Mthode : e On estime p par f et p(1 p)/n par f (1 f )/n 1 On lit dans la table 2 la valeur a tel que p(|X| a) = . Lintervalle de conance est alors : ]f a f (1 f )/(n 1), f + a f (1 f )/(n 1)[.

3.2

Estimation dune moyenne par un intervalle de conance, cas des grands chantillons (n > 30) e

X variable alatoire desprance et dcart type . e e e et sont inconnus. On cherche ` estimer au risque de . a La variable alatoire U = e
X s n

suit sensiblement la loi normale rduite centre N (0, 1). e e

On dispose dun chantillon de n valeurs x1 , . . .,xn . e 1 Moyenne observe : x = (x1 + . . . + xn ) e n 1 2 (x + . . . + x2 ) Ecart type observ : e = e n n 1 se s On estime par x et par n n1 On lit dans la table 2 la valeur a tel que p(|U | a) = . Lintervalle de conance est alors : se se I =] a x , x a [. n1 n1 Mthode : e

3.3

Estimation dune moyenne par un intervalle de conance, cas des petits chantillons (n < 30) sur une variable Gause sienne

X variable alatoire Gaussienne desprance et dcart type , cest-`-dire X suit la e e e a loi normale N (, ). et sont inconnus. On cherche ` estimer au risque de . a La variable alatoire U = e
X s n

suit la loi de Student ` n 1 degrs de libert. a e e

On dispose dun chantillon de n valeurs x1 , . . .,xn . e 3

1 (x1 + . . . + xn ) n 1 2 (x + . . . + x2 ) Ecart type observ : e = e n n 1 Moyenne observe : x = e se s On estime par x et par n n1 On lit dans la table 3 (Table de Student, ligne n 1 degrs de libert) la valeur a tel e e que p(|U | a) = . Lintervalle de conance est alors : se se , x a [. I =] a x n1 n1 Mthode : e

4
4.1

Tests de conformit dune frquence e e


Test bilatral e

On dispose dune frquence thorique p et dune frquence observe f . e e e e A priori, la frquence observe peut tre au dessus ou au dessous de p. e e e On veut savoir si la dirence entre f et p est due ` lchantillonnage (hypoth`se H0 ) e a e e au risque derreur . Sous lhypoth`se H0 F suit sensiblement la loi normale N (p; p(1 p)/n. e Mthode : e On calcule lintervalle de conance de p au risque pour un chantillon de taille n : e u I =]p a p(1 p)/n; p + a p(1 p)/n[, o` a est obtenu dans la table 2 par p(|X] a) = . Si f I on accepte lhypoth`se : la dirence est due aux variations dchantillonnage. e e e Sinon on rejette lhypoth`se. e 1er exemple. On lance 100 fois une pi`ce de monnaie. On observe 45 piles et 55 faces. e Hypoth`se H0 la pi`ce quilibre, hypoth`se H1 : la pi`ce nest pas quilibre. e e e e e e e e Si H0 est vraie, la probabilit dobtenir le cot pile est p = 1/2. e e La proportion de pile est approche par la loi normale N (0, 5; 0, 52 /100) = N (0, 5; 0, 05). e On a p(|X| a) = 0, 05 pour a = 1, 96. Ceci donne un intervalle de conance [0, 50 1, 96 0, 05; 0, 50 + 1, 96 0, 05] = [0, 402; 0, 598]. Comme 0, 45 est dans lintervalle, on ne peut rejetter lhypoth`se que la pi`ce est e e quilibre au risque de 5%. e e

4.2

Test unilatral e

On dispose dune frquence thorique p et dune frquence observe f > p. e e e e Hypoth`se H0 : la dirence entre f et p est lie aux variations de lchantillonnage. e e e e Hypoth`se H1 : la frquence relle est plus grande que la frquence thorique (par e e e e e exemple sous leet dun mdicament). La frquence f observe ne correspond donc pas e e e a ` la frquence thorique. e e La dirence essentielle est que lon sait ` priori que f ne peut pas tre plus petite e a e que p (aux variations dchantillonnage pr`s). e e 4

Sous lhypoth`se H0 F suit sensiblement la loi normale N (p; e Mthode : e

p(1 p)/n.

On cherche a dans les tables de la loi normale N (0, 1) tel que p(F > a) = On calcule b = p + a p(1 p)/n Si f b on accepte lhypoth`se H0 . e Sinon on rejette lhypoth`se H0 . e Remarque : la valeur a peut tre lue de 2 mani`res : e e Table 1 en lecture inverse. Table 2 en utilisant la proprit p(X > a) = p(|X| > a) = 2. ee 1er exemple, bis. On lance 100 fois une pi`ce de monnaie. On observe 45 piles et 55 e faces. On souponne que la pi`ce est truque, et donc que la frquence relle p dobtenir c e e e e pile est plus faible que p0 = 0, 5. Hypoth`se H0 la pi`ce nest pas truque : p = 0, 5. e e e Hypoth`se H1 : la pi`ce est truque : p <= 0, 5. e e e Si H0 est vraie, la probabilit dobtenir le cot pile est p = 1/2. e e La proportion de pile est approche par la loi normale N (0, 5; 0, 52 /100) = N (0, 5; 0, 05). e On a p(X a) = 0, 05 pour a = 1, 64. Ceci donne une borne b = p + a = 0, 5 1, 64 0, 05 = 0, 418. Comme la frquence observe f est de 45%, on ne peut pas rejeter H0 . On ne peut e e pas rejeter lhypoth`se que la pi`ce nest pas truque au risque de 0, 05. e e e Comme 0, 45 est dans lintervalle, la pi`ce nest pas truque au risque de 5%. e e

5
5.1

Tests de conformit dune moyenne e


Test bilatral e

On dispose dune moyenne thorique et dun chantillon de taille n. On dispose ou e e on ne dispose pas de la valeur de la variance thorique . e 1 On calcule la moyenne observe : x = (x1 + . . . + xn ) e n Si on ne conna pas on lestime sur lchantillon (avec correction du biais) : t e s= n e = n1 1 (x2 + . . . + x2 ). n n1 1

On veut savoir si la dirence entre x et est due ` lchantillonnage (hypoth`se H0 ) e a e e au risque derreur . Cas des grands chantillons (n 30) e Sous lhypoth`se H0 X suit sensiblement la loi normale N (p; / n)). e Mthode : e On calcule lintervalle de conance de au risque pour un chantillon de taille n : e I =] a/ n; + a/ n[, o` a est obtenu dans la table 2 par p(|X] a) = . u Si f I on accepte lhypoth`se : la dirence est due aux variations dchantillonnage. e e e Sinon on rejette lhypoth`se. e

Exemple : On consid`re une srie statistique de 60 taux dhmoglobine dans le sang e e e (g/l) mesur chez des adultes prsums en bonne sant. e e e e On observe une moyenne x = 159 et un cart type e = 9, 5. En labsence dinforma e tion, on suppose que le prl`vement a t fait sur une population rpartie hommes/femmes ee ee e en proportion gales. e Dans ce cas la moyenne attendue est = 146. Hypoth`se H0 , la population est e bien rpartie hommes/femmes. Dans ce cas, X suit e sensiblement la loi normale N / n). (, Estimation de / n : e / n 1 = 9, 5/ 59 = 1, 237. Au risque de 1%, p(|X| a) = 0, 01 pour a = 2, 576. Intervalle de conance : I =] a/ n; + a/ n[=]146 3, 18; 146 + 3, 18[. La valeur x = 159 obtenue nest pas dans lintervalle, la population nest donc proba blement pas quilibre. e e Remarque : la variance attendue pour la population totale est = 18, on a alors / n = 18/ 60 = 2, 32, ce qui, au risque de 1% donne I =] a/ n; + a/ n[=]146 5, 76; 146 + 5, 76[. On rejette toujours lhypoth`se H0 . e L Cas des petits chantillons (n < 30) e On suppose que X suit une loi normale (est une variable Gaussienne). X suit sensiblement la loi de Student ` n 1 degrs de a e Sous lhypoth`se H0 e / n libert. e Mthode : Identique au cas prcdent, sauf lecture de a dans la table 3 e e e

5.2

Test unilatral sur les grands chantillons e e

Mthode : Identique au cas bilatral sur les grands chantillons, except que a est lu e e e e dans la table 1 : On cherche a dans les tables de la loi normale N (0, 1) tel que p(F > a) = Exemple : On reprend lexercice prcdent. On suppose que la loi thorique est = 146 e e e et = 18. On a toujours / n = 18/ 60 = 2, 32. On cherche a dans la table 1 tel que p(X > a) = 0, 01, soit a = 2, 33. La borne obtenue est b = + a/ n = 146 + 5, 4 = 151, 4. Comme x = 159, on rejette H0 , cest-`-dire que lon consid`re quil sagit dune population dhommes. a e

6
6.1
n2 .

Tests dhomognit e e e
Prsentation du probl`me e e
On ne dispose pas de loi thorique, mais de 2 chantillons de tailles respectives n1 et e e

On veut savoir si les dirences de rsultats sur chaque chantillon peut sexpliquer e e e ou non par les uctuations dues ` lchantillonnage ou non. a e Soit Y la variable tudie (par exemple frquence F ou moyenne X). On note Y e e e lcart type de Y . e 6

On dispose de 2 chantillons que lon modlise par 2 variables Y1 et Y2 . e e Hypoth`se H0 : les chantillons proviennent de la mme population. Les tirages sont e e e indpendants. e Sous cette hypoth`se, e la variable Z = Y1 Y2 a pour esprance 0 et cart type Z = e e
2 2 Y1 + Y2 .

6.2

Comparaison de deux frquences e


p(1 p)/n et Z =

p(1 p) p(1 p) + . n1 n2 Si lchantillon est susamment grand, et les frquences pas trop proches de 0 ou 1, e e Z suit sensiblement la loi normale N (0, Z ). n1 f1 + n2 f2 . Estimation de p : on runit les 2 chantillons, on trouve p = e e n1 + n2 Si Y = F est une frquence, F = e Test bilatral e Mthode : e On calcule p = On calcule s = n1 f1 + n2 f2 . n1 + n2 ((1 p)( p

1 1 + ). n1 n2 On dtermine a dans la table 1 tel que p(|X] a) = . e On dtermine lintervalle de conance de Z au risque : I =] as; as[, e Si f1 f2 I on accepte lhypoth`se : la dirence est due aux variations dchantillonnage. e e e Sinon on rejette lhypoth`se. e

6.3

Comparaison de deux moyennes. Cas des grands chantillons e (n 30)

2 2 1 2 + . n1 n2 ni On estime 1 et 2 par la mthode habituelle si = e e,i . ni 1

Si Y = X est une moyenne, X = / n et Z =

Test bilatral e Mthode : e On estime 1 er 2 . On calcule sZ =


2 2 1 2 + . n1 n2

On dtermine a dans la table 1 tel que p(|X] a) = . e On dtermine lintervalle de conance de Z au risque : I =] as; as[, e Si x1 x2 I on accepte lhypoth`se : la dirence est due aux variations dchantillonnage. e e e Sinon on rejette lhypoth`se. e 7

Test de conformit par la loi du 2 : ajustement ` e a une loi thorique e

Situation : on dispose dun syst`me complet dvnements E1 , . . .Ek et dune distrie e e bution de probabilit thorique de ces vnements : pi = p(Ei ) avec p1 + . . . + pk = 1. e e e e On dispose dun chantillon de taille n sur lequel on calcule les eectifs observs Oi et e e les frquences observes fi = Oi /n de chaque vnement. e e e e On veut tester si lchantillon est conforme ` la distribution thorique, aux carts e a e e dchantillonnage pr`s. e e On calcule les eectifs thoriques de chaque vnements sur un chantillon de taille e e e e n : Ci = n pi . Hypoth`se H0 : la distribution de lchantillon est conforme ` la distribution thorique. e e a e (O1 C1 ))2 Sous lhypoth`se H0 , la variable alatoire Y 2 qui prends les valeurs 2 = e e + c C1 (Ok Ck ))2 ... + suit la loi du 2 avec n 1 degr de libert. e e Ck Mthode : e On choisit un coecient de risque . On calcule les eectifs thoriques Ci = n pi . e (Ok Ck ))2 (O1 C1 ))2 On calcule 2 = + ... + . c C1 Ck On lit dans la table 4 la valeur 2 telle que p(Y 2 2 ) = . Si 2 2 , on carte lhypoth`se H0 avec une probabilit de se tromper de . e e e c Sinon on ne peut pas rejeter cette hypoth`se. e Remarque : si un eectif est infrieur ` 5, il faut faire un regroupement de classe. e a Exemple : On a eectu le croisement de balsamines blanches et de balsamines pourpres. e En premi`re gnration, les eurs sont toutes pourpres. On obtient en deuxi`me gnration e e e e e e quatre catgories avec les eectifs suivants : e couleurs eectifs pourpre 1790 rose 547 blanc lavande 548 blanc 213

9 3 3 1 ; ; ; ). 16 16 16 16 Peut-on accepter cette hypoth`se avec un risque de premi`re esp`ce de 5% ? e e e Eectif total : n = 1790 + 547 + 548 + 213 = 3098. Lhypoth`se de rpartition mendlienne donne ( e e e couleurs eectifs observs e eectifs thoriques e 2 = c pourpre 1790 1742, 6 rose 547 580, 9 blanc lavande 548 580, 9 blanc 213 193, 6

(1790 1742, 6)2 (547 580, 9)2 (548 580, 9)2 (213 193, 6)2 + + + = 7, 07. 1742, 6 580, 9 580, 9 193, 6 Nombre de degrs de libert : n 1m4 1 = 3 e e Si = 0, 05, on lit dans la table 2 = 7, 81. 0,05 On ne peut pas rejeter lhypoth`se dune rpartition mendlienne. e e e