Vous êtes sur la page 1sur 8

1 A.

HAQIQ

Lchantillonnage e
1 Introduction

Supposons que nous voulons avoir des informations sur la consommation dlectricit par mnage e e e marocain (par exemple, nous voulons conna la consommation moyenne, la dispersion par rapport ` tre a cette moyenne, la consommation minimale, la consommation maximale, ...). Pour cela, nous pouvons procder de deux mani`res direntes: e e e 1- Utiliser les rsultats dun recensement gnral. Linconvnient de cette mthode est dabord quelle e e e e e est tr`s coteuse et ensuite elle est entache derreurs provenant de fait que les rsultats du recensement e u e e sont anciens et quils ne prennent pas compte les derni`res volutions sociales et conomiques. e e e 2- Choisir un chantillon reprsentatif de mnages marocains. Calculer les caractristiques de cette e e e e chantillon (la moyenne, la variance, lcart-type,...). Extrapoler (gnraliser, tendre) les rsultats de e e e e e e cette chantillon ` la population statistique totale tudie. e a e e Un chantillon reprsentatif de la population tudie est une partie de cette population qui re`te en e e e e e mieux la structure de la population tudie. Autrement dit, si dans la population tudie il y a 60 % e e e e de femmes et 40 % dhommes, alors lchantillon doit comprendre 60 % de femmes et 40 % dhommes. e Dans la pratique, deux cas peuvent tre rencontrs: e e 1- Le cas o` la population tudie est nie. u e e 2- Le cas o` on ne peut pas parler dune population nie, dans ce cas l`, le concepte dexprience u a e alatoire est plus convenable. e Exemple: On veut tester lhonntet dune pi`ce de monnaie, pour cela on la lance de faon rptitive. e e e c e e La population sera reprsente par lensemble des lancers possibles. Un chantillon peut tre constitu, e e e e e par exemple, par les 50 premiers lancers o` lon notera les pourcentages de faces et de piles. u

2
2.1

Cas dun mod`le dchantillonnage e e


Gnralits et dnitions e e e e

Dnition 1 : Soit X une variable alatoire (v.a) dnie de (, A, P ) vers ( , A , PX ), o` tant e e e u e lespace des valeurs possibles de X, A tant la tribu dnie sur et PX la loi de probabilit de X. On e e e n e appelle mod`le dchantillonnage de taille n lespace produit: ( , A , PX )n = (( )n , An , PX ) associ e e n n e e a ` n expriences alatoires indpendantes o` An est la tribu produit des vnements de ( ) et PX e e e u la loi de probabilit jointe du n-upl (X1 , X2 , ...., Xn ); o` Xi est la v.a. correspondante ` lexprience e e u a e numro i. e Dnition 2 : Soit X une variable alatoire de loi de probabilit PX . On appelle chantillon de taille e e e e n de la variable X le n-upl (X1 , X2 , ...., Xn ) constitu de n v.a. totalement indpendantes et possdant e e e e toutes la mme distribution que X. e e e e e Dnition 3 : On appelle chantillon observ (x1 , x2 , ...., xn ) une ralisation de lchantillon e (X1 , X2 , ...., Xn ). Autrement dit un chantillon observ est un point de lRn dont les coordonnes sont e e e des relles, alors quun chantillon (X1 , X2 , ...., Xn ) est une suite de v.a. e e

A. HAQIQ

Dnition 4 : Soient h une fonction dnie de lRn vers lR et (X1 , X2 , ...., Xn ) un chantillon. On e e e appelle statistique la v.a. Y = h(X1 , X2 , ...., Xn ). Autrement dit une statistique est une fonction ` a valeurs relles de lchantillon. Si (x1 , x2 , ...., xn ) est lchantillon observ, la valeur observe de la e e e e e statistique h est y = h(x1 , x2 , ...., xn ).

2.2

Exemples de Statistiques

Les statistiques suivantes sont tr`s utilises dans la pratique: e e n 1 1) X = Xi : la moyenne de lchantillon. e n i=1 n 1 2) V = e (Xi X)2 : la variance de lchantillon. n i=1 n 1 3) V = (Xi X)2 : la quasi-variance de lechantillon. n 1 i=1 4) M = M in(X1 , X2 , ...., Xn ) : le minimum de lchantillon. e 5) K = M ax(X1 , X2 , ...., Xn ) : le maximum de lchantillon. e 6) E = K M : ltendue de lchantillon. e e

2.3

Proprits de X, V et V e e

Soit (X1 , X2 , ...., Xn ) un chantillon dune v.a. de moyenne m et de variance 2 . Les statistiques X, e V et V poss`dent les proprits suivantes: e ee 1) E(X) = m, 2 2) V ar(X) = , (X) = , n n n1 2 3) E(V ) = , n m4 3m2 2m2 4) V ar(V ) = + , o` m4 = E [(Xi m)4 ] et m2 = E 2 [(Xi m)2 ], u n n1 5) E(V ) tend vers 2 et V ar(V ) tend vers 0 lorsque n tend vers + , n n.(m4 3m2 ) 2n2 .m2 2 6) V = V , E(V ) = (do` lintrt de V ) , V ar(V ) = u ee + , n1 (n 1)2 (n 1)3 P 7) V 2 quand n +. Preuves:
n n 1 1 1 1) E(X) = E Xi = E(Xi ) = n.m = m. n i=1 n i=1 n 2) n 1 V ar(X) = V ar Xi n i=1

n 1 = V ar Xi n2 i=1

n 1 V ar(Xi ) n2 i=1

car les Xi sont indpendantes e

n 1 2 1 2 = 2 .n. 2 = . = n2 i=1 n n

A. HAQIQ Do` (X) = . u n n n n ]2 1 1 1 [ 2 2 3) V = (Xi X) = (Xi m + m X) = (Xi m) (X m) . n i=1 n i=1 n i=1 E(V ) =
n ] 1 [ E (Xi m)2 + (X m)2 2(Xi m)(X m) n i=1

n n n n 1 2 = E(Xi m)2 + E(X m)2 E [(Xi m)(Xj m)] n i=1 n i=1 j=1 i=1 n n 1 2 2 = n. + 2 Cov(Xi , Xj ) n n i=1 j=1

On a Cov(Xi , Xj ) = 0 si i = j (car les Xi sont indpendantes). e 2 Cov(Xi , Xj[ = si i = j. ) ] n ] 1 2 1[ 2 n1 2 2 2 E(V ) = n. + V ar(Xi ) = n. + 2 2 2 = . . n n i=1 n n Donc n1 2 E(V ) = . n 4) Le calcul de V ar(V ) est laiss ` titre dexercice. ea ( ) n1 2 1 tend 5) E(V ) = . = 1 . 2 2 quand n +. n n m4 3m2 2m2 V ar(V ) = + n n1 m4 et m2 tant constantes, donc V ar(V ) 0 quand n +. e n n V ; E(V ) = E(V ) = 2 . 6) V = n1 n1 n2 n.(m4 3m2 ) 2n2 .m2 V ar(V ) = V ar(V ) = + . (n 1)2 (n 1)2 (n 1)3 7) La proprit 7 rsulte de lingalit de Bienaym Tchebychev et de la proprit 5. ee e e e e ee V ar(V ) En eet: > 0, P [|V E(V )| ] (dapr`s lI.B.T). e 2 tend Nous avons dmontr que: V ar(V ) 0 quand n +, e e donc lim P [|V E(V )| ] = 0, > 0. Donc V 2 quand n +.
n+ P tend

2.4

Lois dchantillonnage e

Dans cette section nous allons analyser les lois de probabilit des statistique X et V . Dans la pratique, e il est frquent davoir aaire, soit ` un grand chantillon soit ` un chantillon dune loi normale de e a e a e taille quelconque. Envisageons ces deux cas. 2.4.1 Cas dun chantillon de grande taille e

e Thor`me 1 : Soit X une v.a. dnie de (, A, P ) vers (lR, BlR ). Nous supposons que la loi de e e probabilit PX de X est quelconque et que E(X) = m et V ar(X) = 2 (on suppose que m et 2 e

A. HAQIQ existent). Si (X1 , X2 , ..., Xn ) est un chantillon de X, alors e X m n


( )

N (0, 1) quand n +.

Lois

Preuve: Ce rsultat dcoule du thor`me central limite (voir chapitre prcdent). e e e e e e Application: Si n = 5000, m = 50, 2 = 10, alors ( ) 10 N 50, 5000 = N (50; 2.103 ). 2.4.2 X suit approximativement la loi

Cas dun chantillon dune loi normale (de taille quelconque) e

2 2 Thor`me 2 : Soient X1 et X2 deux v.a.i. telles que X1 ; N (m1 , 1 ) et X2 ; N (m2 , 2 ), alors e e 2 2 X1 + X2 ; N (m1 + m2 , 1 + 2 ).

Preuve: laiss ` titre dexercice. ea


2 Plus gnralement, si X1 , X2 , ..., Xn sont des v.a.i. telles que Xi ; N (mi , i ); e e n i=1 n i=1 n i=1

i = 1, 2, ..., n,

alors Z =

2 Xi ; N (m, Z ), avec m =

2 mi et Z =

2 i .

2.4.3

Loi de probabilit de X e

Supposons que X ; N (m, 2 ) et soit (X1 , X2 , ..., Xn ) un chantillon tir suivant la loi de X. Il est e e ( ) 2 facile de voir que X ; N m, . En eet, il sut dappliquer le thor`me prcdent. e e e e n Remarque 1 : La dirence entrre les deux cas 2.4.1 et 2.4.2 cest que dans le premier cas la loi e normale est une loi limite (approche) de X lorsque n devient grand, alors que dans le second cas, X e suit exactement la loi normale 2.4.4 Loi de probabilt de V et de X e

Thor`me 3 (Thor`me de Fisher): Soit (X1 , X2 , ..., Xn ) un chantillon tir suivant la loi de X ; e e e e e e 2 N (m, ( Alors: ). ) X m 1) n ; N (0, 1). n.V 2) ; 2 . n1 2 ( ) X m n.V 3) Les v.a. n et sont indpendantes. e 2 Preuve de la 2 `me assertion du thor`me: e e e On a: et
n

(Xi m)2 =
)2

n i=1

(Xi X)2 + n.(X m)2


2

i=1 n ( i=1

Xi m

n.V X m = 2 + . n

A. HAQIQ
n ( Xi m )2 i=1

Or

2 n

et

X m
n

; 2 , alors 1

n.V ; 2 . n1 2

Rappel: Loi de Student Dnition 5 : Soient X et Y deux variables alatoires indpendantes telles que: X ; N (0, 1) et e e e Y ; 2 . On appelle loi de Student ` n degrs de libert la loi suivie par la variable alatoire T dnie a e e e e n X par: T = . Y n On note: T ; Stn . La densit de probabilit de T est donne par: e e e n+1 t2 2 , f (t, n) = .(1 + ) 1 n n n.( , ) 2 2 1 o` u (a, b) =
0

n1

xa1 .(1 x)b1 dx =

(a).(b) , (a + b)

a, b > 0.

Thor`me 4 (Thor`me de Student): Soit (X1 , X2 , ...., Xn ) un chantillon tir suivant la loi de e e e e e e 2 X ; N (m, ). Alors: ( ) X m n ; Stn1 . n.V 2 n1 Preuve: La preuve dcoule du thor`me de Fisher et de la dnition de la loi de Student. e e e e Remarquons que: X m n n.V 2 n1
( )

n 1.(X m) n.(X m) = = . V V

Remarque 2 : Dans la pratique, d`s que n 30 nous pouvons approximer une loi de Student ` n e a degrs de libert par une loi normale centre rduite, et donc dans les calculs on utilise la table de la e e e e loi normale N (0, 1). Cette remarque est justie par le fait que: e Stn N (0, 1) quand n +.
Lois

3
3.1

Cas dune population nie


Notations

Soit une population statistique compose de N individus (ou units statistiques) reprs par leur e e ee numro. Dans cette population on tire un chantillon de n individus (n < N ). e e

A. HAQIQ

On dsigne par: e X: la variable statistique que nous voulons tudier (revenu, dpense, dimension des pi`ces fabriques, e e e e ...). j : la valeur de la variable X pour lindividu numro j de la population tudie. Par exemple, si e e e nous analysons le caract`re quantitatif, le revenu dun mnage, alors j sera la valeur de revenu pour e e le mnage j dans la population tudie. e e e Xj : la variable de rang j dans lchantillon tir. e e

3.2
3.2.1

Les caractristques de la population e


La moyenne
N j=1 N 1 j N j=1

m= 3.2.2 La variance 2 =
N

j P [X = j ] =

(j m)2 P [X = j ] =

j=1

N 1 (j m)2 N j=1

En toute rigueur, pour calculer m et 2 il faudrait faire un recensement, ce qui est tr`s coteux en e u argent et en temps, pour cela, on a recours ` lchantillonnage. On extrapole ensuite les rsultats de a e e lchantillon reprsentatif ` la population globale. e e a

3.3
3.3.1

Les caractristique dun chantillon e e


La moyenne
n 1 Xi X= n i=1

3.3.2

La variance
n 1 (Xi X)2 n i=1

V = 3.3.3 La quasi-variance V =

n 1 (Xi X)2 n 1 i=1

A. HAQIQ

3.4

Les caractristques de X e
N j=1 N j=1 N N 1 1 = j = m N N j=1 N 1 1 = (j m)2 N N j=1

On suppose que lchantillon est tir avec remise (ou indpendance). e e e E(Xi ) = j P [Xi = j ] = j

V ar(Xi ) = E[(Xi m)2 ] = E(X) = E[ V ar(X) = V ar[ car les Xi sont indpendantes. e

(j m)2

j=1

n n 1 1 Xi ] = E(Xi ) = m n i=1 n i=1

n n 1 1 2 n. 2 Xi ] = 2 V ar(Xi ) = 2 = , n i=1 n i=1 n n

Pr. Abdelkrim HAQIQ Dpartement de Mathmatiques et Informatique e e Facult des Sciences et Techniques de Settat e Email: ahaqiq@gmail.com

A. HAQIQ

Exercices Exercice 1: Soit X1 , X2 , X3 , X4 4 variables alatoires indpendantes qui suivent toutes la loi normale e e centre rduite N (0, 1). e e 4 4 2 1 X 2 + X2 X1 Posons: X = Xi , U = (Xi X)2 , V = 1 , W = . 2 2 2 2 4 i=1 X3 + X4 X2 + X3 i=1 2 Dterminer les valeurs u1 , v1 , v2 et w1 satisfaisant aux quations suivantes: e e a) P (U < u1 ) = 0.95 ; b) P (V v1 ) = 0.05 ; c) P (V v2 ) = 0.05 ; d) P (w1 W w1 ) = 0.80. 1 Rsultat: X ; F (n, m) = e ; F (m, n), X) ( 1 1 1 et P (X < v) = = > = , i.e. le fractile dordre (1 ) de la loi F (m, n) est . X v v Exercice 2: Les lampes lectriques fabriques par un industriel A ont une dure de vie moyenne e e e de 1400 heures avec un cart-type de 200 heures, tandis que celles fabriques par un industriel B ont e e une dure de vie moyenne de 1200 heures avec un cart-type de 100 heures. e e Si lon teste des chantillons alatoires de 125 lampes de chaque marque, quelle est la probabilit pour e e e que les lampes A aient une dure moyenne de vie au moins: e a) suprieure de 160 heures, e b) suprieure de 250 heures e aux lampes B ? Exercice 3: Une marque donne de lampes lectriques ` une dure de vie moyenne de 1500 heures e e a e avec un cart-type de 150 heures. e Trois lampes sont connectes de mani`re telle que si lune dentre elles claque, une autre sallume. e e En supposant que les dures de vie sont normalement distribues, quelle est la probabilit pour que e e e lclairage dure: e a) au moins 5000 heures ? b) au plus 4200 heures ? Exercice 4: Lors des lections, les rsultats ont montr quun des condidats a obtenu 46 % des e e e voix. Dterminer la probabilit pour que le vote e e a) de 200 b) de 1000 personnes choisies au hasard parmi le corps lectoral donne une majorit de voix en faveur de ce e e condidat.

Vous aimerez peut-être aussi