Vous êtes sur la page 1sur 168

Bases mathmatiques pour lconomie et la gestion

Bases mathmatiques Pour lconomie et la gestion


-

Table des matires


PREMIERE PARTIE : QUELQUES OUTILS Chapitre 1 : Traitement de systmes d'quations 1.1. Rsolution de systmes par substitution
1.2. Traitement de systmes linaires par la mthode dite de Gauss-Jordan Solutions des exercices (Chapitre 1)

page 5 page 8 page 12

Chapitre 2 : Matrices
2.1. Calcul matriciel : somme, produit, multiplication par un rel 2.2. Inversion dune matrice par la mthode de la matrice compagnon 2.3. Calcul du dterminant dune matrice carre 2.3.1. Pour les matrices 1x1, 2x2, 3x3 2.3.2. Pour les matrices quelconques 2.4. Inversion dune matrice par la mthode de la matrice adjointe 2.5. Rsoudre un systme linaire par la mthode de Cramer Solutions des exercices (Chapitre 2) page 14 page 15 page 16 page 16 page 17 page 20 page 23 page 25

DEUXIEME PARTIE : VARIATIONS ET CALCUL DIFFERENTIEL Chapitre 3 : Variations


3.1. Modles 2 variables 3.1.1. Variation absolue (ou en valeur) 3.1.2. Variation relative (ou en pourcentage) 3.2. Modles 3 variables ou plus Solutions des exercices (Chapitre 3) page 29 page 29 page 32 page 35 page 38

Chapitre 4 : Drives partielles de fonctions de plusieurs variables


1. Technique de drivation 2. Application : approximation linaire 2.1. Mthode de Newton page 40 page 41 page 41

Chapitre 5 : Diffrentielles
1. Diffrentier une fonction 2. Equations aux variations diffrentielles 3. Systmes dquations aux variations diffrentielles page 49 page 50 page 55

TROISIEME PARTIE : OPTIMISATION Chapitre 6 : Optimisation


1. Recherche d'extrema de fonctions d'une variable page 66 2. Recherche d'extrema de fonctions de plusieurs variables page 72 3. Recherche d'extrema de fonctions de plusieurs variables sous contrainte Mthode de Lagrange page 81 4. Vision graphique page 85

Chapitre 7 :

Premire partie Quelques outils

Chapitre 1 : Traitement de systmes dquations


1.1. Rsolution de systmes par substitution
Quand on travaille avec un systme dquations, on envisage plusieurs quations simultanment (laccolade {, regroupant les quations du systme, est l pour nous le rappeler). Rsoudre un systme dquations consiste trouver les solutions communes toutes les quations du systme. Une technique de rsolution dun systme : la substitution. Supposons quon ait affaire un systme de deux quations deux inconnues x et y. 1. Utiliser lune des deux quations pour exprimer une inconnue, disons x en fonction de lautre, disons y. 2. Substituer x trouv ltape 1 dans lautre quation, pour obtenir une quation en y uniquement. 3. Trouver les solutions de lquation en y obtenue ltape 2. 4. Substituer les valeurs de y trouves ltape 3 dans lquation de ltape 1 pour trouver les valeurs correspondantes de x. La mthode substitution peut tre tendue des systmes plus de deux inconnues, ou mme des systmes indtermins.

Exercice rsolu
Rsoudre le systme en (x,y) :

x + y2 = 6 x+2y=3
Etape 1 : On peut utiliser la seconde quation pour exprimer x en fonction de y :

x = -2 y + 3
Etape 2 : On substitue x trouv ltape 1 dans la premire quation : 2 (-2 y + 3) + y = 6 Cest--dire

y2 2 y 3 = 0

Etape 3 : On rsout lquation de ltape 2 par rapport y :

= (-2)2 4 . 1 . (-3) = 4+12 = 16 (2) + 16 (2) 16 y= = 3 ou y = = -1 2.1 2.1

Etape 4 : On substitue les valeurs de y trouves ltape 3 dans lquation de ltape 1 pour trouver les valeurs correspondantes de x : Si y = 3, alors x = -2 . (3) + 3 = -3.

Si y = -1, alors x = -2 . (-1) + 3 = 5. Les solutions du systme dquations sont donc (-3,3) et (5,-1) (on note S = {(-3,3),(5,-1)}).

Exercices
1. Rsoudre le systme en (x,y) :

x.y=0 x+y=1
2. Rsoudre le systme en (x,y) :

y=2 y = -x2 2x
3. Rsoudre le systme en (x,y) :

y 1 = x2 2x y 2x = -3
4. Rsoudre le systme en (p, qd, qp) :

qd = 11 p2 qp = p 1 qp = qd
5. Rsoudre le systme en (p, p*, qd, qp) :

qd = 17 p2 qp = p* 2 p* = p 1 qp = qd
6. Rsoudre le systme en (p, p*, qd, qp) :

qd = 11 p2 qp = p* 2 3 p* = p 4 qp = qd
7. Rsoudre le systme en (, x1, x2) :

(x1 4)2 + (x2 3)2 = 25 6 - 2 (x1 4) = 0 8 - 2 (x2 3) = 0


8. Rsoudre le systme en (x,y) :

3x = 81y 2x = 16y
9. Rsoudre le systme en (x,y) :

x+y=7 log(x) + log(y) = 1


10. Rsoudre le systme en (x,y) :

y log 3 (x+2) = 1 y = log 3 (x) + log 3 (x+4)


11. Rsoudre le systme en (x,y,z) :

xy+z=2 xyz=0 2y + z = 1
12. Rsoudre le systme en (x1,x2) :

x12 + x22 = 25 x12 + (x2 4)2 = 9


13. Rsoudre le systme en (x1,x2) :

x12 + x22 = 25 x12 + x2 = 19


14. Rsoudre le systme en (, x1, x2) :

(x1 2)2 + x22 = 4 x2 - 2 (x1 2) = 0 x1 - 2 x2 = 0


15. Rsoudre le systme en (x,y,z) :

5x + 4y + 10z = 20 x + 2y + 2z = 4 4x + 4y + z = 4
16. Rsoudre le systme en (x,z) :

x2y+1=0 z = 3 x + 5 y2

1.2. Traitement de systmes linaires par la mthode dite de GAUSS-JORDAN


La mthode de Gauss-Jordan est une mthode qui permet de traiter un systme linaire, quel que soit le nombre dquations et de variables que ce systme contienne.

Description de la mthode de GAUSS-JORDAN


Supposons que le systme rsoudre soit un systme de 3 quations linaires 3 variables (x,y,z).

a1,1.x + a1,2 . y + a1,3 .z = b1 1. Ordonner le systme rsoudre a 2,1.x + a 2,2 . y + a 2,3 .z = b2 a .x + a . y + a .z = b 3,2 3,3 3 3,1
en faisant attention faire apparatre un rel non nul la place du terme a 1,1. Il faut parfois permuter deux lignes du systme.

2. Noter uniquement les coefficients , dans lordre :

a1,1 a 2,1 a3,1

a1,2 a 2, 2 a3,2

a1,3 b1 a 2,3 b2 a3,3 b3

3. Faire apparatre 0 la place du terme a 2,1 par une combinaison linaire utilisant uniquement la ligne 2 et la ligne 1. Faire apparatre 0 la place du terme a 3,1 par une combinaison linaire utilisant uniquement la ligne 3 et la ligne 1.

* * * *
On obtient

0 * * * 0 * * *

4. Faire apparatre 0 la place du terme a 3,2 par une combinaison linaire utilisant uniquement la ligne 3 et la ligne 2.

* * **
On obtient

0 * ** 0 0 **

5. Faire apparatre 0 la place du terme a 2,3 par une combinaison linaire utilisant uniquement la ligne 2 et la ligne 3. Faire apparatre 0 la place du terme a 1,3 par une combinaison linaire utilisant uniquement la ligne 1 et la ligne 3.

* * 0 *
On obtient

0 * 0 * . 0 0 * *

6. Faire apparatre 0 la place du terme a 1,2 par une combinaison linaire utilisant uniquement la ligne 1 et la ligne 2.

* 0 0*
On obtient

0 * 0* . 0 0 **

7. Faire apparatre 1 la place du terme a 1,1 par division de la ligne 1. Faire apparatre 1 la place du terme a 2,2 par division de la ligne 2. Faire apparatre 1 la place du terme a 3,3 par division de la ligne 3. . . . ( attention : pas de division par 0 )

1
8. Si le systme admet une solution unique, on obtient

0 1 0

0 0 1

r s , t
x = r y = s z = t

0 0

1.x + 0. y + 0.z = r ce qui est quivalent au systme 0.x + 1. y + 0.z = s 0.x + 0. y + 1.z = t
dont la solution unique vidente est le triple ( r , s , t ).

Attention : Lors de lapplication de la mthode , si on obtient une ligne constitue de 0 alors le systme est indtermin ; une ligne constitue de 0 sauf pour le terme indpendant alors le systme est impossible.

Exercice rsolu
Traiter ce systme en (x,y,z) grce la mthode de Gauss-Jordan :

x+2yz=2 2xy+z=3 3x+yz=2 Rsolution

1 2 3 1 0 0 1 0 0 1 0 0 5 0 0 1 0 0

2 -1 2 -1 1 3 1 -1 2 2 -1 2 -5 3 -1 -5 2 -4 2 -1 2 -5 3 -1 0 -1 -3 2 0 5 -5 0 -10 0 -1 -3 0 0 5 -5 0 -10 0 -1 -3 0 1 0 0 0 1 1 2 3

L2 L2 2 L1 L3 L3 3 L1

L3 L3 L2 L1 L1 L3 L2 L2 + 3 L3 L1 5.L1 + 2 L3

L1 L1 / 5 L2 -L2 / 5 L3 -L3
est quivalent au systme

x=1 y=2 z=3

Le systme admet donc une solution unique : le triple (1,2,3). On note aussi S = { (1,2,3) }.

Exercices
Grce la mthode de GAUSS-JORDAN , trouvez lensemble des solutions des 6 systmes suivants. 17.

x + 2 y + 3 z = 14 2xy+z=3 3 x + 2 y 4 z = -5 x+2y+z=3 2x+3y+4z=5 4x+7y+6z=9

18.

10

19.

x+y+2z=3 2x+yz4=0 3x+2y=7z 10 3 z = 3 y + 4 x x+2yz+3t=0 2x+y+zt=0 4x+5yz+5t=0 5x+4y+z+t=0 x y + 2 z t = -2 2x+y+z =4 -3 x z + 2 t = 5 x+y+t=8 x+2yz=4 x+3y=7z 2x4z=53y 2x+1=8zy

20.

21.

22.

23. Peut-on exprimer y1 et y2 en fonction de x ?

2y1 + 3y2 + x = 5 4y1 + 6y2 x = 0


24. Soit le systme de 3 quations 6 variables r, s, t, u, v, w :

2 r + 2 s 2 t + u 2 v = 0 -r+s5t2u+3vw=0 3r+s+3t+uv=0
a) Ce systme permet-il de dfinir les variables r, s, t en fonction des variables u, v, w ? b) Ce systme permet-il de dfinir les variables u, v, w en fonction des variables r, s, t ? 25. Traiter analytiquement puis reprsenter graphiquement l'ensemble des solutions du systme de 3 quations linaires 3 variables x, y, z suivant :

6 x + 10 y + 15 z = 30 4 x + 3 y + 6 z = 12 5y8z=0

11

Solution des exercices (Chapitre 1)


1. S = { (0,1) , (1,0) } 2. S = 3. S = { (2,1) } 4. S = { (3,2,2) , (-4,-5,-5) } 5. S = { (4,3,1,1) , (-5,-6,-8,-8) } 6. S = { (

13 39 7 7 , , , ) , (-4,-3,-5,-5) } 4 4 16 16

7. S = { (-1,1,-1) , (1,7,7) } 8. S = {(4,1)} 9. S = { (5,2) , (2,5) } 10. S = { ( 2 , 1 + log 3 (4) )} 11. S = { (0,-1/3,5/3) , (1,0,1) , (5/2,1/2,0) } 12. S = { (2.997,31/8) ; (-2.997,31/8) } 13. S = { (4,3) , (-4,3) , ( 21 ,-2) , (- 21 ,-2) }

3 3 ,3, 3 ) , (,3,- 3 )} 2 2 15. S = { (4/7,0,12/7)}


14. S = { (0,0,0) , ( 16.

x=2y1 z = 5 y2 + 6 y 3

17. S = {(1,2,3)} 18. S = 19.

x = 3z + 1 y = 2 5z

5.t 3.z x = 3 20. 3.z 7.t y = 3


21. S = {(3,-2,0,7)} 22.

x = 5z 2 y = 3 2z

12

23. Non, on ne peut pas exprimer y1 et y2 en fonction de x.


Commentaires : Et pourtant, le systme nest pas impossible Cet exercice est l pour attirer votre attention sur le fait important suivant : en gnral, les conomistes ne cherchent pas connatre les solutions dun systme, mais bien savoir sils peuvent exprimer certaines variables (les endognes) en fonction dautres (les exognes).

24. a) Non b) Oui

5 x = 8 .y 25. 11 z = .y + 2 12
Graphiquement :

13

Chapitre 2 : Matrices
2.1. Calcul matriciel : somme, produit, multiplication par un rel
Exercices
Exercice 1

2 8 Soient les matrices suivantes : A = 3 0 , B = 5 1


Calculer, si possible : 1. A+B 2. B+C 3. A+D 4. - A 5. 2.B 3.C 6. B.A 7. A.B 8. C.B

2 0 3 8 , C =

7 2 6 3 , D =

2 0 1 1 1 1 .

9. B.C
Exercice 2 Si possible , effectuer les multiplications suivantes. 1.

2 1 0 1 3 4 . 2 1 2 1 1 . 6 0 4

2. 3.

(2

1 0) .

4 0 1

0 2 1

4.

4 2 1 0 . 3 1 0 1 9 6 2 2 4 . 4 3 1 0 2
1)

5.

6. . (3 3

14

2.2. Inversion dune matrice par la mthode de la matrice compagnon


Inverser la matrice A =

1 2 a b revient trouver la matrice A 1 = c d 3 4

telle que 3 4

1 2

. a
c

b 1 0 = d 0 1

Pour inverser la matrice Anxn par la mthode de la matrice compagnon : 1. Ecrire cte cte la matrice A et la matrice identit I : Anxn | Inxn 2. Appliquer la mthode de Gauss Jordan la matrice A jusqu obtenir la matrice I. Appliquer au fur et mesure les mmes modifications la matrice compagnon . 3. On obtient -1 La matrice inverse est A nxn .

Inxn | A-1nxn

Remarque 1 : La matrice Inxn est la matrice identit. Elle comporte des 0 partout sauf sur la diagonale descendante o elle ne comporte que des 1.

1 0 0 Exemple : I 3X 3 = 0 1 0 0 0 1
Remarque 2 : Sil est impossible de faire apparatre la matrice Inxn gauche (par exemple si on obtient une ligne entire de zros), cest que la matrice Anxn nest pas inversible.

Exercices
Exercice 3 Inverser les matrices suivantes par la mthode de la matrice compagnon

3 1 1 1. A = 2 1 2 1 3 2

15

2 4 8 2. B = 1 3 5 3 8 14 1 1 3. C = 1 1 1 1 1 1 0 1 2 3 0 0 0 2

2.3.
2.3.1.
dt (4 ) = 4

Calcul du dterminant dune matrice carre


Pour les matrices 1x1, 2x2, 3x3 :

3 2 dt 1 5 = 3.5 1.2 = 13
3 1 1 3 1 dt 2 1 2 2 1 1 3 2 1 3
Remarque :

= 3.1.2 + 1.2.1 + 1.2.3 1.1.1 3.2.3 2.2.1 = -9

La mthode applique ici (dite de SARRUS) nest valable que pour le calcul dun dterminant dune matrice 3X3 .

Exercices
Exercice 4 : calculer

2 4 8 1. dt 1 3 5 3 8 14
2. dt 3 4

1 2

16

a 3. dt d e

0 b f

0 0 c

0 0 a 4. dt 0 b d c e f

2.3.2.

Pour les matrices quelconques :


Le mineur associ un terme dune matrice A est le dterminant obtenu en supprimant dans la matrice A la ligne et la colonne comprenant ce terme.

Exemple :

a 1,1 Soit A = a 2,1 a 3,1

a 1, 2 a 2, 2 a 3, 2

a 1,3 a 2,3 a 3,3

calcul du mineur associ au terme a1,1 :

dt a 2,2 a 3, 2

a 2,3 a3,3

a 2,2 dt a3,2

a 2,3 a3,3

= a2,2 . a3,3 a3,2 . a2,3

calcul du mineur associ au terme a1,2 :

dt a 2,1 a 2,3 a 3,1 a3,3

a 2,1 dt a3,1

a 2,3 a3,3

= a2,1 . a3,3 a3,1 . a2,3

calcul du mineur associ au terme a1,3 :

dt a 2,1 a 3,1

a 2, 2 a 2,3

a 2,1 dt a3,1

a 2, 2 a 2,3

= a2,1 . a2,3 a3,1 . a2,2

17

Le cofacteur associ un lment a i j dune matrice A i+j . est le produit du mineur associ cet lment par (-1)

a 1,1 Exemple : soit A = a 2,1 a 3,1

a 1, 2 a 2, 2 a 3, 2

a 1,3 a 2,3 a 3,3

calcul du cofacteur associ au terme a1,1 :

a 2,2 (-1)1+1 . dt a3,2

a 2,3 a = (-1)2 . dt 2,2 a3, 2 a3,3

a 2,3 a3,3

a 2,2 dt a3, 2

a 2,3 a3,3

calcul du cofacteur associ au terme a1,2 :

a 2,1 (-1)1+2 . dt a3,1

a 2,3 a = (-1)3 . dt 2,1 a3,1 a3,3

a 2,3 a3,3

= dt

a 2,1 a3,1

a 2,3 a3,3

calcul du cofacteur associ au terme a1,3 :

a 2,1 (-1)1+3 . dt a3,1

a 2,2 a = (-1)4 . dt 2,1 a3,1 a 2,3

a 2,2 a 2,3

= dt a3,1

a 2,1

a 2,2 a 2,3

Calcul dun dterminant par la mthode des cofacteurs


Le dterminant de la matrice A est gal la somme des produits des lments dune range de cette matrice par les cofacteurs associs ces lments.

Exemple :

a 1,1 Calcul du dterminant de la matrice A = a 2,1 a 3,1

a 1, 2 a 2, 2 a 3, 2

a 1,3 a 2,3 a 3,3

18

par la mthode des cofacteurs en dveloppant selon la premire ligne de la matrice .

a1,1 dt a 2,1 a 3,1

a1,2 a 2,2 a3,2

a1,3 a 2,3 = a3,3

a1,1 . (-1)

1+1

dt a 2,2 a 3, 2

a 2,3 a3,3

+ a1,2 . (-1)

1+2

. dt a 2,1 a 2,3 a 3,1 a3,3 . dt a 2,1 a 3,1 a 2, 2 a3,2

+ a1,3 . (-1)

1+3

a1,1 dt a 2,1 a 3,1

a1,2 a 2,2 a3,2

a1,3 a 2,3 = a3,3

a1,1 . (a2,2 . a3,3 a3,2 . a2,3) a1,2 . (a2,1 . a3,3 a3,1 . a2,3)
+ a1,3 . (a2,1 . a3,2 a3,1 . a2,2)

Intrt de la mthode des cofacteurs

1) La rgle des cofacteurs est valable pour calculer le dterminant de toute matrice carre nxn. 2) La rgle des cofacteurs est trs simple lorsquelle est applique une range qui comporte beaucoup dlments nuls.

1 7 5 Exemple : calculer dt 2 0 0 3 4 6
La range comportant le plus de zros est la deuxime ligne : La rgle des cofacteurs applique cette ligne donne

a2,1

a2,2

a2,3 = 2 0 0

19

1 7 5 dt 2 0 0 = 2 . cofacteur (a2,1) + 0 . cofacteur (a2,2) + 0 . cofacteur (a2,3) 3 4 6 = 2 . cofacteur (a2,1) 7 5 2+1 = 2 . (-1) . dt 4 6
= -2 . dt 4 = -124

7 5 6

Exercices
Exercice 5 Calculer les dterminants suivants en utilisant la mthode des cofacteurs.

1.

1 2 dt 3 4

3 1 1 2. dt 2 1 2 1 3 2 3 2 4. dt 0 0

2 4 8 3. dt 1 3 5 3 8 14 a dt d e

0 1 0 1 0 4 3 2 0 0 0 1

0 b f

0 0 c

0 0 a 6. dt 0 b d c e f

2.4. Inversion dune matrice par la mthode de la matrice adjointe


Inverser la matrice A =

1 2 a b revient trouver la matrice A-1 = c d 3 4

telle que 3 4

1 2

. a
c

b 1 0 = d 0 1

On peut inverser cette matrice en utilisant la mthode de la matrice compagnon.

20

On peut aussi inverser cette matrice en utilisant la mthode de la matrice adjointe.

Inversion dune matrice par la mthode de la matrice adjointe


1. Calculer le dterminant de la matrice A inverser. Si dt(A) = 0, alors la matrice A nest pas inversible Si dt(A) 0, alors la matrice A est inversible 2. Ecrire la matrice des cofacteurs. 3. Transposer la matrice des cofacteurs. On obtient la matrice adjointe adj(A). 4. La matrice inverse est donne par A =
-1

1 . adj(A) dt ( A)

Exercice rsolu
Inverser la matrice A =

1 2 par la mthode des cofacteurs 3 4

1. Calculer le dterminant.

1 2 dt 3 4 = -2 0 : la matrice A est inversible.


2. Ecrire la matrice des cofacteurs. Cofacteur du terme a1,1 :

(-1)1+1 . dt 4 = 4 (-1)1+2 . dt 3 = -3 2 (-1)2+1 . dt = -2

Cofacteur du terme a1,2 :

Cofacteur du terme a2,1 :

21

Cofacteur du terme a2,2 :

1 (-1)2+2 . dt = 1 4 3 2 1

La matrice des cofacteurs est cft(A) =

3. Transposer la matrice des cofacteurs.


t

4 3 4 2 2 1 = 3 1 = adj(A)

4. Ecrire la matrice inverse.

A-1 =

1 1 4 2 . adj(A) = . 2 3 1 dt ( A) 2 1 1 = 3 2 2

Exercices
Exercice 6 Pour chacune des matrices suivantes, - dterminer si la matrice est inversible - si oui , calculer la matrice inverse.

3 1 1 A = 2 1 2 1 3 2

2 4 8 B = 1 3 5 3 8 14

3 2 C= 0 0

0 1 0 1 0 4 3 2 0 0 0 1

22

2.5. Rsoudre un systme linaire par la mthode de Cramer


La mthode de Cramer permet de rsoudre un systme linaire

a1,1.z1 + a1,2 .z 2 a .z + a .z 2,1 1 2, 2 2 de n quations n variables ... ... an,1.z1 + an,2 .z 2 a1,1 a 2,1 crit sous forme matricielle ... a n,1
ou encore

+ ... + a1, n .z n + ... + a2, n .z n ... ... + ... + an, n .z n

= b1 = b2 ... = bn

a1, 2 a 2,2 ... a n, 2

... a1, n z1 ... a 2, n z 2 . ... ... ... ... a n, n z n

b1 b2 = ... b n

Anxn . Znx1 = Bnx1

Rsolution dun systme linaire par la mthode de Cramer


1. Calculer dt(A) ; si dt(A) 0 alors le systme possde une solution unique. 2. Quel que soit lindice i, la valeur de la variable zi est donn par :

a1,1 a 2,1 dt ... a n,1

a1,2 ... b1 ... a1, n a 2,2 ... b2 ... a 2, n ... ... ... ... ... a n,2 ... bn ... a n, n

zi =
dt ( A)
La i
me

colonne de A est remplace par la colonne B des termes indpendants

23

Exercice rsolu
Rsoudre le systme

x + 2. y = 5 par la mthode de Cramer. 3.x + 4. y = 11 1 2 x 5

Le systme scrit, sous forme matricielle : 3 4 . y = 11

A2x2 . Z2x1 = B2x1 1 2 A= 3 4


1. Calculer le dterminant de A :

1 2 dt A = dt 3 4 = -2 0 le systme possde une solution unique.


2. Cette solution est donne par :

dt
la premire variable x =

2 11 4 5

=
1 2 dt 3 4
1 dt 3 5 11

2 =1 2

la deuxime variable

y=

=
1 2 dt 3 4

4 =2 2

La solution du systme est :

x=1 y=2

Exercices
Exercice 7 Dterminer si les systmes suivants ont une solution unique. Si oui, utiliser la mthode de Cramer pour rsoudre le systme.

24

1. 3 x + y + z = 0 2x+y+2z=0 x+3y+2z=0 2 4 8 2. 1 3 5 . 3 8 14 x 1 y = 1 z 6

3. 3 x + z = 1 2 x + y + 4 t = -1 3y+2z=0 t=1

Exercice 8 Dterminer si les systmes suivants ont une solution unique. Si oui, utiliser la mthode de Cramer pour rsoudre le systme.

1.

x-4y=2 2x+y=1

2.

2x+5y+3z=1 3x+y+2z=1 x+2y+z=0 2 x + 3 y - 3 z = 13 5 x - y + 2 z = 21 x + y + z = 12


x+y+z2=0 2zy=4 2x+2y=1

3.

4.

Solutions des exercices (Chapitre 2)


Exercice 1 1. A + B impossible vu la dimension des matrices 2. B + C = 9 11

25

3. A + D

impossible vu la dimension des matrices

2 8 4. - A = 3 0 5 1
5.

17 6 2.B 3.C = 12 7

6. B.A impossible vu la dimension des matrices

28 64 7. A.B = 6 0 13 8
8. C.B = 21 24 9. B.C = 69 30 Exercice 2 1.

20 16

14

2 1 8 1 2 6

2. 3.

(8

2)

4.

4 2 3 1

5. impossible vu la dimension des matrices 6.

6 2 9 3

26

Exercice 3

4 9 2 -1 1. A = 9 5 9

1 9 5 9 8 9

1 9 4 9 1 9

2 4 8 2. La matrice B = 1 3 5 nest pas inversible. 3 8 14

3 8 3 -1 3. C = 16 1 4 3 16
Exercice 4 1. 0 2. -2 3. a.b.c

5 1 8 8 11 1 16 16 1 1 4 4 5 1 16 16

1 8 7 16 1 4 9 16

4. a.b.c
Exercice 5 1. -2 2. -9 3. 0 4. 12 5. a.b.c 6. -a.b.c Exercice 6

4 9 2 -1 1. A = 9 5 9

1 9 5 9 8 9

1 9 4 9 1 9

27

2 4 8 2. La matrice B = 1 3 5 nest pas inversible. 3 8 14


1 1 4 6 1 1 -1 3. C = 3 2 1 3 4 2 0 0 1 12 1 6 1 4 0 1 2 3 1

Exercice 7

1.

x=0 y=0 z=0


systme homogne solution unique

2.

Le systme na pas de solution unique

3.

13 x = 12 17 y = 6 17 z= 4 t =1

Exercice 8

1.

x = 2/3 y = -1/3 x = -1/2 y = -1/2 z = 3/2 x=3 y=4 z=5 x = 1/2 y = -1 z = 1/2

2.

3.

4.

28

Chapitre 3 : Variations
Remarque prliminaire importante ! ! !
Dans tout ce chapitre, nous travaillerons avec des modles mathmatiques pour lesquels il est possible dexprimer explicitement les variables endognes en fonctions des variables exognes. Les autres cas devront tre traits diffremment, comme nous le verrons plus tard dans ce cours.

3.1. Modles deux variables


Soit y = f (x) un modle explicitant la variable y en fonction de la variable x. Objectif : tudier le comportement de la variable endogne y au voisinage de x*, valeur particulire de la variable exogne x (on dit aussi tudier le comportement local de la fonction f au voisinage de x*).

3.1.1. Variation absolue (ou en valeur)


On envisage une variation en valeur de la variable x partir de x*. Cette variation sera positive ou ngative ; on la notera x.
Image de x* par f

x* x x*+x

f (x*) y f (x*+x)

Nous allons nous intresser la variation y (induite par la variation x) :

comment varie y
(cest--dire comment la fonction f ragit-elle) (cest--dire si lon fait subir x une variation absolue de valeur x ?)

si x* devient x* + x ?

29

(ou encore variation en valeur de la fonction f)

La variation absolue y de y est gale : y = f (x*+x) f (x*)

La variation absolue dune variable sexprime dans la mme unit que cette variable. Elle peut tre un nombre positif ou ngatif.

Attention : Pour un mme x mais pour deux valeurs diffrentes de la variable x, le y peut tre diffrent !
y y x**,x
f (x** + x ) f (x**) f (x* + x ) f (x*)

y = f (x)

y x*,x

x
x* x* + x

x
x** x** + x

fois de x* et de x. Une notation du type y(x*,x) ou yx*,x serait donc meilleure. Afin de ne pas alourdir la prsentation, nous continuerons cependant crire y (mais il faut veiller garder cette remarque en mmoire).

DONC : Pour tre prcis, il faudrait faire apparatre dans la notation que y dpend la

Exemple
Considrons lexpression suivante :

C = 3.Q3 1800.Q2 + 360000.Q + 1000000 f(Q) Nous allons faire varier Q et voir ce qui se passe.

30

Choisissons Q = 1 et regardons comment C varie autour de Q* = 100 autour de Q* = 200

Pour Q* =100,
f(Q*) = 22000000 Pour Q*+Q =101, f(Q*+Q) = 22089103

Quand Q* =200,
f(Q*) = 25000000 Quand Q*+Q =201, f(Q*+Q) = 25000003

C vaut donc C = 89103 C = 3

Remarquons que pour un mme Q , C varie d'aprs la valeur de Q*!!!

Exercice 1 2 Soit f : R R : x y = x . Partant de x* = 1, on donne la variable x une variation absolue de valeur

a) 2 b) 1.
Quelles sont les variations absolues de la variable y correspondantes ? Calculez aussi les rapports des variations absolues

Exercice 2 2 Soit f : R R : x y = x . Partant de x* = 0, on donne la variable x une variation absolue de valeur

y correspondants. x

a) 2 b) 1.
Quelles sont les variations absolues de la variable y correspondantes ? Calculez aussi les rapports des variations absolues

y correspondants. x

Cas particulier : Fonction linaire une variable


Soit le modle linaire y = a x + b . Rappelons que la reprsentation graphique de ce modle dans un repre oxy est une droite, de pente a. Nous travaillons au voisinage du point x* et nous recherchons la variation y correspondant une variation x de x. Rappel : La variation y de y est y = f (x*+x) f (x*)
En appliquant cette formule dans ce cas particulier, on obtient :

y = [a (x* + x) +b] [a (x*) + b] = a . x.

31

Dans le cas linaire, on a donc :

y y

y = a . x
o a est la pente de la droite.

Donc, si x est constant, y est constant aussi : y ne dpend pas de la valeur x* partir de laquelle on considre la variation x. y De plus, on constate que le rapport est constant x et vaut la pente de la droite dquation y = ax + b .

x*

x* + x

Exemple
Soit un modle linaire de type y = a.x + b : C = 150000.Q + 1000000 o C est la variable endogne et Q la variable exogne. Dans ce cas , a = 150000 et b= 1000000. Choisissons une variation en valeur dune unit de la variable Q ( Q = 1) ; quelle que soit la valeur Q* de Q partir de laquelle on travaille, on obtient :

Q*

C (Q*) = 150000.Q* + 1000000

Q = 1

Q* + 1

C (Q* +1) = 150000.(Q* +1) + 1000000

ce qui donne

C = C (Q*+1) C (Q*) = 150000.

Quel que soit Q*, on constate donc que la variation C correspondant une variation en valeur dune unit de Q est gale 150000. Observons aussi que C = a. Q ( ce qui est caractristique du linaire ).

3.1.2. Variation relative (ou en pourcentage)


Mathmatiquement, on appelle variation relative de la variable x (en un point x*, par rapport une variation absolue de valeur x), le rapport

x . x*

De la mme manire, la variation relative de la variable y (correspondant une variation relative x de la variable x partir du point x*) est le rapport

y . y*

32

Les variations relatives sont des nombres sans units, qui peuvent tre positifs ou ngatifs. Signalons que la tradition est dexprimer les variations relatives en pourcentages. Au lieu de variation relative , on dit parfois (taux de) variation en pourcentage . Il est parfois intressant de calculer le rapport des variations relatives :

Exercice 3

y y* . x x*

a) Augmenter la valeur de x* de 25% revient multiplier x* par ? b) Diminuer la valeur de x* de 10% revient multiplier x* par ?

Exercice 4 a) Quelle variation relative de la variable x correspond une variation absolue x = 0,5 partir de la valeur x* = 2 ? (Exprimez votre rponse en %.) b) Calculez la variation absolue de la variable y correspondant une variation absolue de x de 0,5 partir de la valeur 2. c) Calculez la variation relative de y correspondante. d) Calculez le rapport des variations absolues correspondant. e) Calculez le rapport des variations relatives correspondant. Exercice 5 :

Soit y = 3x + 2.

Mme question avec x* = 5 et x = -0,2. Exercice 6 :


y

0,5

x
1

a) Donnez lquation de la droite d, et lexpression de la fonction correspondante (dont le graphe est d). b) On donne, partir de x* = 5, une variation relative la variable x de 20%.

33

Calculez le y correspondant, ainsi que les rapports des variations absolues et relatives. c) Idem partir de x* = 7, avec la mme variation relative de x. d) Peut-on dire quune mme variation relative de la variable x impliquera une mme variation relative de la variable y ? Exercice 7 : 2 Soit f : R R : x x . On donne la variable x une augmentation relative de 25% partir de a) x* = 4 b) x* = 12 c) x* = 20. Calculez les variations relatives de y correspondantes, et les rapports des variations relatives correspondants. Que constate-t-on ? Pouvait-on le prvoir ?

Exercice 8 :

Mmes questions, en donnant x une augmentation relative de 5%.

34

3.2. Modles trois variables ou plus


Soit y = f(x1, , xn) un modle explicitant la variable y en fonction des variables x1, , xn.

Question : comment varie y au voisinage de (x1*,,xn*) [valeurs particulires des variables exognes x1, x2, , xn ] ?

(x1*,

, xn*) xn

On applique f

f(x1*,,xn*) = y
Variation y

x1

(x1*+ x1, , xn*+ xn)

f(x1*+ x1,,xn*+ xn) = y+y

Un point voisin de (x1*, , xn*) peut scrire f(x1*+ x1, , xn*+ xn) o chaque xi reprsente une variation en valeur de la variable xi. Aux variations en valeur x1, , xn des variables exognes x1, x2, , xn [au dpart de (x1*, , xn*)] correspond une variation en valeur de la variable y. Elle est note y. Cest cette variation que nous allons nous intresser. Il sagit l dune simple gnralisation au cas de plusieurs variables exognes de ce que nous venons de faire dans le cas o il ny a quune seule variable exogne.

Variation de valeur y de y (induite par x , ..., x n ) : 1


y = f ( x * + x , ..., xn* + x ) f( x *, ..., xn* ) 1 1 n 1
(variation de la valeur de la fonction f)

N.B. Pour tre prcis, il faudrait faire apparatre dans la notation que y dpend de x1*,,
xn* et de x1, , xn. Une notation du type y(x1*,,xn*, x1, , xn) serait donc meilleure. Afin de ne pas alourdir la prsentation, nous continuerons cependant crire y mais il faut veiller garder cette remarque en mmoire.

35

Exercice rsolu
Le revenu dune compagnie est donn par lquation : R = 5 . W 2. A 3 Nous avons donc un modle du type y = f (x1, x2) [R correspond y, W correspond x1 et A correspond x2]. W reprsentent les salaires pays (en millions de francs) et A les dpenses en publicit (en millions de francs).

a) Si W* = 30 et A* = 2 , alors R* = R(W*,A*) =.. . b) Que devient le revenu (de combien saccrot-il ?) si W augmente de 5% (au dpart
de W* = 30) sans modifier A ? c) Que devient le revenu si A diminue de 2% (au dpart de A*=2) sans modifier W ? d) Que devient le revenu si la fois W augmente de 5% (au dpart de W* = 30) et A diminue de 2 % (au dpart de A*=2) ?
Rsolution

Quand on envisage une variation des salaires de 5% (au dpart dune valeur donne pour les salaires), on parle de variation relative. W Mathmatiquement, la variation relative en W* est gale . W* 5.W * 150 W 5 = la variation en valeur est : W = = = 1.5 Dans ce cas, W*=30 et 100 100 W * 100
Pour A, nous avons :

2. A * A 2 = la variation en valeur est : A = = -0.04 A* 100 100 a) Notre modle est R = 5 . W 2. A 3 et nous travaillons au dpart de (W* , A* ) = (30, 2) Nous avons R(W*, A*) = 5. (30).(2) = 36000.

b) R ( W* + W, A*) = 5. (30+1,5).(2) = 39690. Donc la variation R de R est gale 39690 36000 = 3690. c) R ( W*, A*+ A) = 5. (30).(2-0,04) = 33882,912. Donc la variation R de R est gale 33882,912 36000 = 2117,088. d) R ( W*+ W, A*+ A) = 5. (30+1,5).(2-0,04) = 37355,91048. Donc la variation R de R est gale 37355,91048 36000 = 1355,91048.

Exercice 9 : 2 3 Soit y = 2 x1 3 x1 x2 + x2 et prenons x1* = 40 et x2*=30. a) Si x1 = 1 et x2 = 1, que vaut y ? b) Si x1 = 1 et x2 = 1, que vaut y ?

36

Cas particulier : fonction linaire plusieurs variables


Soit le modle linaire y = a1 . x1 ++ an . xn + b. Nous travaillons au voisinage du point (x1*, , xn*) et nous recherchons la variation y correspondant des variations x1 de x1, , xn de xn.

Rappel : La variation y de y est y = f (x1*+x1, , xn*+xn) f (x1*, , xn*).


Comme, dans ce cas,

f(x1, , xn) = a1 . x1 ++ an . xn + b, il vient :

8 f(x1, , xn) = a1 . x1* ++ an . xn* + b 8 f (x1*+x1, , xn*+xn) = a1 . (x1* + x1) ++ an . (xn* + xn ) + b


Donc,

y = a1.x1* + a1.x1 + + an.xn* + an.xn + b [ a1.x1* + +an.xn* + b]


ce qui donne, aprs simplifications :

y = a1 .x1 + ... + an .x n
o a1, , an sont les coefficients du modle linaire sur lequel on travaille au dpart ( ou encore, o a1, , an sont les coefficients directeurs de l'hyperplan d'quation y = a1 . x1 ++ an . xn + b ). N.B. Cest une gnralisation directe de ce qui se passe pour des modles du type y = a.x + b : on a vu que dans ce cas, y = a. x , o a est la pente de la droite dquation y = a.x + b.

exercice 10

Soit f : R3 R : (x1, x2, x3) y = 3 x1 2x2 + x3 . a) Calculez la variation de y correspondant des variations x1 = 2/3 et x2 = -1, en partant du point (x1*, x2*, x3*) = (1, 2, 3).
b) Partant de (x1*, x2*, x3*) = (1, 2, 3), on a effectu une variation absolue de 1 unit sur

lune des variables x1, x2, x3. La nouvelle valeur de la variable y (induite par cette variation) est de 0. Sur quelle variable a port la variation ?

37

Solution des exercices (Chapitre 3)


Exercice 1 2 a) On donne f(x) = x , x* = 1 , x = 2 ; on a donc f(x*) = f(1) = 1 et f(x*+x) = f(1+2) = f(3) = 9 . La variation absolue de y est donne par y = f(x*+x) - f(x*) = 8 .

y =4. x y b) Le rapport des variations absolues est donne par =1. x


Le rapport des variations absolues est donn par

a) Le rapport des variations absolues est donn par

y = 2. x y = -1. b) Le rapport des variations absolues est donn par x


Exercice 3

Exercice 2

a) Augmenter la valeur de x* de 25% revient multiplier x* par 1,25. b) Diminuer la valeur de x* de 10% revient multiplier x* par 0,9.

Exercice 4 La variation relative de x est de 25%. a) La variation absolue de y est 1,5. b) La variation relative de y est de 18,75%. c) Le rapport des variations absolues est 3. d) Le rapport des variations relatives est 0,75. Exercice 5 La variation relative de x est de - 4% . La variation absolue de y est- 0,6 . La variation relative de y est de 3,53% . Le rapport des variations absolues est 3 .

a) b) c) d)

e) Le rapport des variations relatives est 0,875 .

Exercice 6

a)

b) Le rapport des variations relatives est 0,714285714 . c) Le rapport des variations relatives est 1,27777 . d) Non .

1 f ( x ) = .x + 1 2

38

Exercice 7 a) Le rapport des variations relatives est 2,25 . b) Le rapport des variations relatives est 2,25 . c) Le rapport des variations relatives est 2,25 .

Conclusion : La variation relative de y est constante pour une mme variation relative de x quelle que soit la valeur de x*.

Exercice 8 a) Le rapport des variations relatives est de 2,05 . b) Le rapport des variations relatives est de 2,05 . c) Le rapport des variations relatives est de 2,05 .

Remarque : On constate dans cet exercice quen partant dune variation de x plus petite qu lexercice 8, le rapport des variations relatives se rapproche de la valeur 2. A la limite, pour des variations de x de plus en plus petite :

y x* y x * y* x* lim lim . f ' ( x*) = = = .2 x * = 2 x 0 x x 0 x y* y* ( x*) 2 x*

cest llasticit de type point (cf. syllabus thorie, page 123-124) , qui, dans le cas dune fonction puissance, est constante (et vaut lexposant de la fonction)

Exercice 9 a) y = -2416 b) y = 2606


Exercice 10 a) La fonction est linaire : f(x1, x2, x3) = 3 x1 2 x2 + x3 . Les coefficients sont a1 = 3 , a2 = -2 et a3 = 1 . On a donc : y = 3 . 2 2 . (-1) + 1.0 = 4 .

3 b) f(1+x1, 2+x2, 3+x3) = 3 (1+x1) 2 (2+x2) + (3+x3) = 2 + 3 x1 2 x2 + x3 =0


or 2 + 3 x1 2 x2 + x3 = 0 si x1 =0, x2 = 1 et x3 = 0 . La variation a donc port sur la variable x2 .

39

Chapitre 4 : Drives partielles de fonctions de plusieurs variables


4.1. Technique de drivation
4.1.1. Drives partielles du premier ordre
Soit f : Rn R : (x1, x2, , xn) f(x1, x2, , xn), une fonction de n variables. Notation de la drive partielle du premier ordre de f par rapport la variable xi pour lconomiste : f x'i pour le mathmaticien :

f xi

ou

f xi

Exercice
Exercice 1 Calculer les drives partielles du premier ordre de la fonction f : Rn R : (x1, x2, , xn) f(x1, x2, , xn) dans les cas suivants 1. f(x1, x2) = x13 + x23 3 x1 x2 + 5 2. f(x1, x2) = 3. f(x1, x2) =

e ( x1

+ x2 2 )

x1 + x2 ln x1 x2 4. f(x1, x2) = ln (x1 x2) 2 5. f(x1, x2) = sin x1 + x2 cos (x1 ) 3 x .x 2 6. f(x1, x2, x3) = e 1 2 + x1 ln (x2 x3 )

4.1.2. Drives partielles du second ordre


Soit f : R R, une fonction de n variables.
n

Notation de la drive partielle du second ordre de f par rapport la variable xi puis par rapport la variable xk pour lconomiste : f x'i pour le mathmaticien :

( )

' xk

ou f x'i' x k

xk

f x i

ou

2 f 2 ou f xk xi xk xi

40

NB :

2 2 f est aussi not f xi xi (xi )2

Exercice
Exercice 2 Calculer les drives partielles du second ordre des fonctions n1, 2 et 3 donnes dans lexercice 1.

4.2. Application : approximation linaire


4.2.1. Fonctions dune variable (cf. cours p. 85)
Soit

f une fonction de R dans R, soit x* un lment du domaine de f.


flin de f en x* , la fonction dfinie comme suit :

On appelle fonction approximation linaire

flin (x*) (x) = f(x*) + f(x*) . (x x*)


Notons que

(x*, f ( x*)) .

y = f(x*) + f(x*) . (x x*)

est une quation de la droite tangente au graphe de

au point

Exercice rsolu
Dterminer la fonction approximation linaire flin de la fonction f en x* = 1 si f est f : R R : x f(x) = x2 ln x dfinie par : Rsolution On sait que flin (x*) (x) = f(x*) + f(x*) . (x x*) . Ici,

x* = 1 f(x*) = f(1) = 0 f(x) = 2 x ln x + x f(x*) = f(1) = 1 flin (1) (x) = 0 + 1 . (x 1) flin (1) (x) = x 1

On en dduit que ou encore

Graphiquement, y = x 1 est une quation de la droite tangente au graphe de f au point

(1,0).

41

y=x2 ln(x) y=x1

(1,0)

4.2.2. Fonctions de plusieurs variables (cf. cours p. 96)


Soit

F une fonction de R2 dans R, soit (x1*, x2*) un lment du domaine de F.


Flin de F en (x1*, x2*), la fonction dfinie comme suit :
F F (x1*, x2*) . (x1 x1*) + (x1*, x2*) . (x2 x2*) x1 x 2

On appelle fonction approximation linaire

Flin ( x1 *, x2 *) (x1, x2) = F(x1*, x2*) +

F F (x1*, x2*) . (x1 x1*) + (x1*, x2*) . (x2 x2*) est une x1 x 2 quation du plan tangent au graphe de F au point ( x1 *, x 2 *, F ( x1 *, x 2 *) ) .
Notons que y = F(x1*, x2*) + De manire gnrale :
Soit

F une fonction de Rn dans R, soit (x1*,, xn*) un lment du domaine de F.


Flin de F en (x1*,, xn*), la fonction dfinie comme suit :

On appelle fonction approximation linaire

Flin ( x1 *,..., xn *) (x1, , xn) = F(x1*, , xn*) +


F F (x1*, , xn*) . (x1 x1*) + + (x1*, , xn*) . (xn xn*) x1 x n F F (x1*, , xn*) . (x1x1*) + + (x1*, , xn*) . (xn xn*) x1 x n

Notons que y = F(x1*, , xn*) + est une quation

de lhyperplan tangent au graphe de (x1 *,..., xn *, F ( x1 *,..., xn *)) (plus de reprsentation graphique possible).

au

point

42

Exercice rsolu
Dterminer la fonction approximation linaire Flin de la fonction F en (1,-2), avec

F : R2 R : (x1,x2) F(x1,x2) = x22 . e ( 2. x1 + x2 ) + x13 . x2


Rsolution On sait que

Flin ( x1 *, x2 *) (x1, x2) = F(x1*, x2*) +


Ici, (x1*, x2*) = (1,-2) F(x1*, x2*) = F(1,-2) = 2

F F (x1*, x2*) . (x1 x1*) + (x1*, x2*) . (x2 x2*) x1 x 2

F F F 2 ( 2. x + x ) 2 (x1, x2) = 2 x2 e 1 2 + 3 x1 x2 (x1*, x2*) = (1,-2) = 2 x1 x1 x1 F F F (x1, x2) = 2 x2 e ( 2. x1 + x2 ) + x22 e ( 2. x1 + x2 ) + x13 (x1*, x2*) = (1,-2) = 1 x 2 x 2 x 2

La fonction approximation linaire Flin de la fonction F en (1,-2) est donc donne par Flin(1,-2) (x1, x2) = 2 + 2.(x1 1) + 1.(x2 + 2) Flin(1,-2) (x1, x2) = 2.x1 + x2 + 2 cest--dire Graphiquement, y = 2.x1 + x2 + 2 est une quation du plan tangent au graphe de F au point (1,-2,2).

Exercices
Exercice 3 1. Dterminer la fonction approximation linaire flin de la fonction f en x*=2, o

f : R R : x f(x) =

3.x 2 + 2 2.x + 3

2. Dterminer la fonction approximation linaire glin de la fonction g en x*=0, o

g : R R : x g(x) = ex

3. Dterminer la fonction approximation linaire Glin de la fonction G en (z1*, z2*, z3*) = (2,1,0), o

G : R3 R : (z1, z2, z3) G(z1, z2, z3) = (z12 + z23) . e z3


4. Dterminer la fonction approximation linaire Hlin de la fonction H en (x1*, x2*, x3*) = (3,e,1), o

H : R3 R : (x1, x2, x3) H(x1, x2, x3) = x13 . ln(x22) + x1 x2 x33

43

4.2.3. Mthode de Newton (voir cours p. 119-123)


A quoi sert la mthode de Newton ?
La mthode de Newton permet de trouver une solution de lquation f(x) = 0 (o f est une fonction dune variable x), ou du moins une approximation de cette solution. En dautres termes, la mthode de Newton permet de trouver un rel x* tel que

f(x*)=0.

Description de la mthode
La formule de rcurrence de la mthode de Newton est donn par
x n +1 = x n f ( xn ) f ( x n )

(pour comprendre lorigine de cette formule, voir cours p. 120).


Comment lappliquer ? a) Choisir x0 tel que f(x0) 0 (tangente au graphe de f en x0 non horizontale). f ( x0 ) b) Calculer x1 = x0 f ( x 0 ) f ( x1 ) c) Calculer x2 = x1 f ( x1 ) d) etc . . . e) Si la suite de rels x0, x1, x2, , xk converge vers un certain rel x*,

alors x* est une solution de lquation f(x) = 0.

Exercice rsolu
En utilisant la mthode de Newton et en partant de x0 = 0, trouver la valeur approche dune solution de lquation suivante :

4 x3 + 8 x2 31 x 35 = 0
Rsolution 2 Posons f(x) = 4 x + 8 x 31 x 35 ; donc, f(x) = 12 x + 16 x 31 . Valeur initiale : x0 = 0 . 35 f ( x0 ) 1re itration : x1 = x0 = 0 f (0) = 0 -1,129032258 31 f ( x 0 ) f (0)
3 2

44

me

itration : x2 = x1

35 f ( x1 ) = 31 f ( x1 )

3me itration : x3 = x2 4me itration : x4 = x3

35 ) 31 -0,997518839 35 f ( ) 31 f (x2 ) = -0,997518839 f (-0,997518839) -0,9999993 f ( x 2 ) f (-0,997518839) f ( x3 ) = -0,9999993 f (-0,9999993) = -1 ( x 3 ) f f (-0,9999993) f(

Vrification : -1 est bien une solution de lquation 4 x3 + 8 x2 31 x 35 = 0 car 4.(-1)3 + 8.(-1)2 31.(-1) 35 = 0 Question subsidiaire : Comment pourrait-on continuer lexercice pour dterminer toutes les solutions de lquation ?

Exercices
Exercice 4 En utilisant la mthode de Newton et en partant de x0 = 0 , trouver la valeur approche dune solution de chacune des quations suivantes, obtenue aprs 3 itrations. a)

1 3 q + 7 q2 + 111 q + 500 = 0 3

b) x3 1,5 x2 5,5 x + 3 = 0 c) cos (x) = 0 d) ex = x4 Exercice 5

Dessinez le graphe dune fonction

f telle que f(2) = 0 et pour laquelle, en prenant comme point de dpart pour lapplication de la mthode de Newton la valeur x0 = 1, vous obtenez pour x1 une solution de lquation f(x) = 0.
Exercice 6 Trouver graphiquement (cf. graphe ci-dessous) vers quelle solution de lquation

x4 + 3 x3 11 x2 3 x + 10 = 0
la mthode de Newton convergerait en prenant comme valeur de dpart x0 = 0. Le graphe ci-dessous prsente une reprsentation de la fonction

f(x) = x4+3x311x23x+10 .

45

46

Solutions des exercices (Chapitre 4)


Exercice 1
1.

f (x1, x2) = 3 x12 3 x2 x1 f (x1, x2) = 3 x22 3 x1 x 2

2.

2 2 f (x1, x2) = 2 x1 .e ( x1 + x 2 ) x1 2 2 f (x1, x2) =2 x2 .e ( x1 + x 2 ) x 2

3.

f 1 1 (x1, x2) = + x2 . x1 x2 x1 f x (x1, x2) = 1 2 + ln x1 (x2 ) x 2 f (x1, x2) = cos x1 2 x1 x2 sin (x12) x1 f (x1, x2) = cos (x12) x 2

4.

f 1 (x1, x2) = x1 x1 f 1 (x1, x2) = x2 x 2


2 f (x1, x2, x3) = x22 . e x1 . x 2 + ln (x2 x33) x1 2 f 1 (x1, x2, x3) = 2 x1 x2 e x1 . x 2 + x1. x2 x 2 f 1 (x1, x2, x3) = 3 x1 x3 x3

5.

6.

Exercice 2

1.

(x1 )
2

2 f

(x1, x2) = 6 x1

2.

(x1 )

2 f

2 2 2 2 (x1, x2) = 2.e ( x1 + x 2 ) + 4. x1 2 .e ( x1 + x 2 )

f (x1, x2) = -3 x1 .x 2 2 f (x1, x2) = 6 x2 (x2 )2 2 f (x1, x2)= -3 x 2 .x1

2 2 2 f (x1, x2) = 4 x1 x2 .e ( x1 + x 2 ) x1 .x 2 2 2 2 2 2 f (x1, x2) = 2.e ( x1 + x 2 ) + 4.x 2 2 .e ( x1 + x 2 ) (x2 )2 2 2 2 f (x1, x2) = 4 x1 x2 .e ( x1 + x2 ) x 2 .x1

3.

x (x , x ) = 2 2 1 2 (x1 ) x12 2 f (x1 , x2 ) = 12 + 1 x1.x2 x1 x2

2 f

2 f

(x2 )

x ( x1 , x 2 ) = 2. 1 x2 3

2 f (x1 , x2 ) = 12 + 1 x 2 .x1 x1 x2

47

Exercice 3 1. flin(2)(x) =

8 2 x 7 7

2. glin(0)(x) = x + 1 3. Glin(2,1,0) (z1, z2, z3) = 4 z1 + 3 z2 + 5 z3 - 6 4. Hlin(3,e,1) (x1, x2, x3) = (54 + e) . x1 + (

54 + 3) . x2 + 9 e x3 162 18 e e

Exercice 4 a) q0 = 0

q1 -4,5045045 q2 -3,616946 q3 -3,56640929

Solution relle -3,56625339 b) x0 = 0

x1 0,54545454 x2 0,49996991757 x3 0,5 Solution relle = 0,5


c) Impossible dappliquer la mthode de Newton au dpart de 0 car sin (0) = 0 d) x0 = 0

x1 = -1 x2 -0,85527976 x3 -0,817730774 Solution relle -0,8155534188

Exercice 6 Convergence vers la valeur x* = 2.

48

Chapitre 5 : Diffrentielles
5.1. Diffrentier une fonction
5.1.1. Notion de diffrentielle dune fonction de R dans R
Soit f une fonction de R dans R continment diffrentiable sur un sous-ensemble D de son domaine de dfinition et soit x* D. On appelle diffrentielle de f en x* et on note df(x*) lexpression f(x*).x . Remarques 1) df(x*) est une expression linaire en la variation x de la variable x (au dpart de la valeur x*). 2) df(x*) = flin(x*)(x*,x) ( vrifier)

y = f(x) f (x*+x) f lin(x*) (x*+x) f(x*,x) f(x*) = f lin(x*) (x*) flin(x*)(x*,x) = df(x*) y = f lin(x*) (x)

x x* x*+x

3) Pour la fonction identit I : R R : x x, on a I (x*) = 1. Par consquent, dI(x*) = 1. x = x. Comme la diffrentielle dI(x*) est conventionnellement note dx, il vient : dI(x*) dx = x . On substitue gnralement dx x dans lcriture de la diffrentielle dune fonction dune variable x et on obtient alors lexpression : df(x*) = f(x*).dx. On voit mme parfois crit : df(x) = f(x).dx

49

5.1.2. Notion de diffrentielle dune fonction de Rn dans R


Soit F une fonction de R dans R continment diffrentiable sur un sous-ensemble D de son domaine de dfinition et soit x* = (x1*,x2*,,xn*) D.
n

On appelle diffrentielle de F en x* et on note dF(x*) lexpression linaire en les variations x1, x2, , xn : Remarques 1) dF(x*) = Flin(x*)(x*,x) 2) Pour des raisons analogues celles expliques dans le cas dune fonction dune variable, on crit gnralement :

F F F ( x*).x1 + ( x*).x 2 + ... + ( x*).x n . x1 x 2 x n

F F F ( x*).dx1 + ( x*).dx 2 + ... + ( x*).dx n x n x1 x 2 o, pour chaque valeur de i, dxi peut tre considr soit comme une variation de la variable xi au dpart de la valeur xi* (dxi = xi xi*) dF ( x*) =
soit comme une diffrentielle (diffrentielle de la fonction identit).

Exercices
Exercice 1 Calculer la diffrentielle de 2

a) f(x) = x . ln(x) b) f(x) = sin (2x) c) F(x1,x2) = x1 x23 3 d) G(z1,z2) = (z1 z2) e) F(x,y,t,v) = x.y + a . t2 v.x + 2 (o a est un paramtre) 2 x.y et v(y) = 2 y f) F(x,y,t,v) = x.y + a . t v.x + 2 o a est un paramtre, et o t(x,y) = e g) H(z) = -5
Exercice 2

F : R2 R : (x1,x2) f(x1,x2) = x12 . x23 Dterminer l approximation de la variation de valeur de F 3 2 correspondant aux variations de valeur x1 = et x2 = au point (x1*,x2*) = (3,1). 10 10 x 2 b) On donne F : R R : (x1,x2) F(x1,x2) = x2 . e 1 Dterminer l approximation de la variation de valeur de F 1 1 correspondant aux variations de valeur x1 = et x2 = au point (x1*,x2*) = (1,4). 10 10
a) On donne

5.2. Equations aux variations diffrentielles


50

Soit E(x,y) = b, un modle mathmatique qui ne permet pas ncessairement de dfinir y en fonction de x. L quation linaire approche , au voisinage de (x*,y*), du modle E(x,y) = b est

E E (x*,y*) . (xx*) + (x*,y*) . (yy*) = 0 y x


Cest l quation de la droite tangente, en (x*,y*), la courbe dquation E(x,y) = b.

L quation aux variations diffrentielles associe au modle E(x,y) = b en sa solution (x*,y*) est

E E (x*,y*) . dx + (x*,y*) . dy = 0 x y

L quation

dfinit localement, au voisinage de (x*,y*), la variable y en fonction de la variable x

E(x,y) = b

son quation linaire approche , en (x*,y*), dfinit (explicitement) la variable y en fonction de la variable x.

si et seulement si

son quation aux variations diffrentielles, en (x*,y*), dfinit (explicitement) la variable dy en fonction de la variable dx.

si et seulement si

Si l quation E(x,y) = b dfinit, au voisinage de (x*,y*), la fonction y = y(x) (mme si on ne possde pas explicitement lexpression de cette fonction) alors, le nombre driv de cette fonction en x* est gal

d dy

dy y (x*) = dx

51

Exercice rsolu
a) Lquation x2 + y2 = 25 dfinit-elle globalement la variable y en fonction de la variable x ? . . . autre formulation : Peut-on exprimer explicitement la variable y en fonction de la variable x
partir de lquation x + y = 25 ?
2 2

b) Lquation dfinit-elle localement, autour de sa solution (x*,y*) = (3,4), la variable y en fonction de la variable x ? Dterminer le nombre driv de la fonction ainsi dfinie en (x*,y*) = (3,4). c) Quelle est lquation de la droite tangente la courbe dquation x + y = 25 en (x*,y*) = (3,4) ?
2 2

d) Lquation dfinit-elle localement, autour de sa solution (x*,y*) = (5,0), la variable y en fonction de la variable x ? Dterminer le nombre driv de la fonction ainsi dfinie en (x*,y*) = (5,0). e) Quelle est lquation de la droite tangente la courbe dquation x + y = 25 en (x*,y*) = (5,0) ?
2 2

Rsolution : a) b) Non , car y =

25 x 2 ou y = 25 x 2

Considrons lquation aux variations diffrentielles en (3,4) associe lquation de dpart :

E E (3,4) . dx + (3,4) . dy = 0 x y

E (x,y) = 2 x x E (x,y) = 2 y y
On obtient


6 dx + 8 dy = 0

E (3,4) = 6 x E (3,4) = 8 y
dy =

3 dx 4 Lquation aux variations diffrentielles en (3,4) dfinit la variable dy en fonction de la variable dx.

Lquation de dpart dfinit donc localement, au voisinage de (3,4), la variable y en fonction de la variable x. En (3,4), y est positif et donc y =

25 x 2

Le nombre driv demand est dy y (3) = dx = 4 c) Lquation de la droite tangente en (3,4), est donne par

dy

E E (3,4) . (x-3) + (3,4) . (y-4) = 0 (quation linaire approche) y x 6 (x-3) + 8 (y-4) = 0


52

6 x + 8 y 50 = 0
Notons que lquation linaire approche en (3,4) dfinit (explicitement), la variable y en fonction de la variable x : y = .x +

3 4

25 4

d) Considrons lquation aux variations diffrentielles en (5,0) associe lquation de dpart : Puisque

E E (5,0) . dx + (5,0) . dy = 0 x y

E E (5,0) = 5 et (5,0) = 0, on obtient 5 dx + 0 dy = 0 x y Lquation aux variations diffrentielles en (5,0) ne dfinit pas la variable dy en fonction de la variable dx. Lquation de dpart ne dfinit donc pas localement, au voisinage de (5,0), la variable y en fonction de la variable x.
e) La droite tangente en (5,0) existe et a pour quation x = 5 (tangente verticale).

Exercices
Exercice 3 a) Lquation x 2 x y + 3 x y 22 = 0 dfinit-elle globalement la variable y en fonction de la variable x ? Peut-on exprimer explicitement la variable y en fonction de la variable x . . . autre formulation : 3 2 2 partir de lquation x 2 x y + 3 x y 22 = 0 ? b) Si non, lquation dfinit-elle localement, autour de sa solution (x*,y*) = (1,3), la variable y en fonction de la variable x ? Dterminer le nombre driv de la fonction ainsi dfinie en (x*,y*) = (1,3).
3 2 2

c)

Quelle est lquation de la droite tangente la courbe dquation

x3 2 x2 y + 3 x y2 22 = 0 en (x*,y*) = (1,3) ?

Exercice 4 a) Lquation x . y2 2 x.y 1 = 0 dfinit-elle globalement la variable y en fonction de la variable x ? b) Si non, lquation dfinit-elle localement, autour de sa solution (x*,y*) = (1,3), la variable y en fonction de la variable x ? Dterminer le nombre driv de la fonction ainsi dfinie en x* = 1. 2 x.y c) Quelle est lquation de la droite tangente la courbe dquation x . y 2 1 = 0 en (x*,y*) = (1,3) ? d) Quelle est le nombre drive de y par rapport x en x* = 1 ?

53

Exercice 5 : gnralisation pour un modle trois variables a) Lquation x12 .x 2 . y + x1. y 2 2.x 2 . y + 2. y 2 12 = 0 dfinit-elle globalement la variable y en fonction des variables x1 et x2 ? b) Si non , lquation dfinit-elle localement, au voisinage de sa solution (x1*, x2*,y*) = (1,0,2), la variable y en fonction des variables x1 et x2 ? c) Quelle est lquation du plan tangent la courbe dquation

x12 .x 2 . y + x1. y 2 2.x 2 . y + 2. y 2 12 = 0 en (x1*, x2*,y*) = (1,0,2) ?

Exercice 6 : gnralisation pour un modle trois variables a) Lquation e

b) Quelle est lquation du plan tangent la courbe dquation


2 3

.x 2 . + 2.x1 .x 2 3. y 2 4.x1 .x 2 1 = 0 dfinit-elle localement, autour de (x1*, x2*,y*) = (2,1,0), la variable y en fonction des variables x1 et x2 ?
x1 . y

e x1 . y .x 2 . + 2.x1 .x 2 3. y 2 4.x1 .x 2 1 = 0 en (x1*, x2*,y*) = (2,1,0) ?


Exercice 7

Soit lquation 2 variables x et y :

x 2 . y 2 x3. y + 2. x . y 3 = 0

Comme on le vrifie aisment, cette quation permet dexprimer la variable y en fonction de la variable x localement au voisinage de sa solution (x*,y*) = (2,1).
a) Dterminez le nombre driv de cette fonction en x*

= 2. b) Dterminez llasticit de type point de y par rapport x au point (x*,y*) .

54

5.3. Systmes dquations aux variations diffrentielles


Un modle conomique se prsente, en gnral, sous la forme suivante : m variables endognes n variables exognes m quations non linaires dans le cas gnral

E1 ( y1 ,.... y m , x1 ,....x n ) = c1 E 2 ( y1 ,.... y m , x1 ,....x n ) = c 2 E m ( y1 ,.... y m , x1 ,....x n ) = c m

exemple thorique

2 variables endognes

3 variables exognes 2 quations :

y1, y2

: x1, x2, x3

E1 ( y1 , y 2 , x1 , x 2 , x3 ) = c1 E 2 ( y1 , y 2 , x1 , x 2 , x3 ) = c 2

Parfois (comme ctait aussi le cas pour certaines quations), ce systme ne permet pas dexprimer les variables endognes y1 et y2 en fonction des variables exognes x1, x2, x3
(car les quations en jeu sont trop compliques les variables sont trop mlanges , etc. ).

Considrons le systme dquations aux variations diffrentielles (associ au systme de dpart) en un point (y1*, y2*, x1*, x2*, x3*) qui est solution du systme de dpart.

Si on peut exprimer les variations des variables endognes dy1 et dy 2 en fonction des variations des variables exognes dx1 , dx 2 , dx3 alors on dit que les variables endognes y1 et y 2

peuvent sexprimer localement, au voisinage du point (y1*, y2*, x1*, x2*, x3*), en fonction des variables exognes x1 , x 2 , x3 , (. . . mais on nen connat pas la forme explicite pour autant).

55

Exercice rsolu
Le modle

x1 . y1 + x 2 . y 2 = 0
y1 . y 2

y1 + 2 . x1 . x 2 + e

=5

ne dfinit pas globalement les variables y1 et y2 en fonction des variables x1 et x2. Ce modle dfinit-il localement, au voisinage de sa solution (x1*, x2*, y1*, y2*) = (0,1,2,0), les variables y1 et y2 en fonction des variables x1 et x2 ?
(Cest--dire le systme dquations aux variations diffrentielles dfinit-il dy1 et dy2 en fonction de dx1 et dx2 ?)

Rsolution : NB : (0,1,2,0) est bien solution du modle

x1 . y1 + x 2 . y 2 = 0

y1 . y 2 =5 y1 + 2 . x1 . x 2 + e

Passage la diffrentielle en (0,1,2,0) (syst. dqu. aux variations diffrentielles)

y1 . dx1 + y 2 . dx 2 + x1 . dy1 + x 2 . dy 2 = 0 y .y y1 . y 2 ) . dy1 + ( y1 . e 1 2 ) . dy 2 = 0 2 . x 2 . dx1 + 2 . x1 . dx 2 + (2 . y1 + y 2 . e


en (0,1,2,0) :

2 . dx1 + 0 . dx 2 + 0 . dy1 + 1. dy 2 = 0 2 . dx1 + 0 . dx 2 + 4 . dy1 + 2 . dy 2 = 0

On peut facilement exprimer dy1 en fonction de dx1, dx2 et dy2 en fonction de dx1, dx2

dy 2 = 2 . dx1 4 . dy1 + 2 . dy 2 = 2 . dx1 dy 2 = 2.dx1 4.dy1 = 2.dx1

dy 2 = 2 . dx1 dy 2 = 2 . dx1 4 . dy1 = 2 . dx1 2 . dy 2 4 . dy1 = 2 . dx1 2 .(2 . dx1 )

dy 2 = 2 . dx1 dy = 1 . dx 1 2 1

ce qui prouve la capacit dexprimer dy1 et dy2 en fonction de dx1 et dx2

En consquence, le systme de dpart dfinit localement, au voisinage de sa solution (0,1,2,0), les variables y1 et y2 en fonction des variables x1 et x2.

56

Exercices
Exercice 8

x1 . y1 . y 2 + x1 .x 2 . y 2 = 15 Le modle x1 y1 2 e . y + x 2 . y 2 .(1 x1 ) = 0 2
2 3

ne dfinit pas globalement les variables y1 et y2 en fonction des variables x1 et x2. Ce modle dfinit-il localement, au voisinage de sa solution (x1*, x2*, y1*, y2*) = (1,3,0,5), les variables y1 et y2 en fonction des variables x1 et x2 ?

Exercice 9

2.x1. y1 + x2 .x32 . y2 x1. y1. y2 2 = 2 , o on considre les variables On donne le modle x 3. y 2 + 3.x ..x .x + 4. y1 = 3 1 2 3 1 1 y2 y1 et y2 comme endognes et les variables x1 , x2 et x3 comme exognes.
Ce modle dfinit-il localement, au voisinage de (y1*, y2*, x1*, x2*, x3*) = (3,-2,1,-1,2) les variables y1 et y2 en fonction des variables x1, x2 et x3 ? Si oui, exprimer explicitement dy1 en fonction de dx1, dx2 et dx3 dy2 en fonction de dx1, dx2 et dx3.

Exercice 10 On donne le modle

e y1 . y 2 . x + 2. y 2 . y 3 e 2. x1 4.x . x 2. y 6 = 0 1 1 2 1 2 2 , o on 2 3 3 x1 . x 2 y1 + x 2 . y 2 + x1. y1. y 2 + 6 = 0 considre les variables y1 et y2 comme endognes et les variables x1 et x2 comme

exognes. Ce modle dfinit-il localement, au voisinage de sa solution (x1*, x2*, y1*, y2*) = (1,0,2,1), les variables y1 et y2 en fonction des variables x1 et x2 ? Si oui, exprimer explicitement dy1 en fonction de dx1 et dx2 dy2 en fonction de dx1 et dx2.

57

Exercice 11

x1.x 2 . y1. y 2 . y3 x 2 2 = 0 2 3 2 Le modle x1. y 2 + x 2 . y1. y3 5. y 2 . y3 = 0 dfinit-il localement, autour de sa x 3 .x . y y 2 . y + 2. y . y = 0 1 2 2 3 1 2 3 solution (x1*, x2*, y1*, y2*, y3*) = (1,2,2,1,1), les variables y1, y2 et y3 en fonction des variables x1 et x2 ? Si oui, exprimer dy1, dy2 et dy3 en fonction de dx1 et dx2.
Exercice 12 Le modle

x 2 . y 3 x . y 2 . y x 2 .x + y 2 10 = 0 2 2 1 1 2 1 2 2 dfinit-il localement, au 3.x12 + 2.x1. y1 + y1. y 2 3 + 5.x 2 3 3. y 2 2 13 = 0 voisinage de sa solution (x1*, x2*, y1*, y2*) = (3,0,1,-2), les variables y1 et y2 en fonction des variables x1 et x2 ? Cest--dire le systme dquations aux variations diffrentielles dfinit-il dy1 et dy2 en fonction de dx1 et dx2 ? Si oui, exprimer explicitement dy1 en fonction de dx1 et dx2 dy2 en fonction de dx1 et dx2.

Exercice 13 Soit le systme de 3 quations 5 variables y1, y2, y3, x1 et x2

x1 = a.y1 + f(y3 ) y2 = g(y3 ,x2 ) y = h(y ) 1 2


o -

a est une constante relle f() et h() sont deux fonctions dune variable de classe C1 g(,) est une fonction de deux variables de classe C1 les variables endognes sont y1 , y2 et y3 les variables exognes sont x1 et x2.

Soit dautre part (y1*, y2*, y3*, x1*, x2*) une solution de ce systme. a) Ecrire le systme dquations aux variations diffrentielles associ au systme cidessus en (y1*, y2*, y3*, x1*, x2*). b) Est-il possible dexprimer les variables y1 , y2 et y3 en fonction des variables x1 et x2 localement, autour de la solution (y1*, y2*, y3*, x1*, x2*) ? Justifiez votre rponse.

58

Exercice 14 Soit le systme de 2 quations 5 variables y1, y2, x1, x2 et x3


2 a.y1.y2 + x13.x2.x3 (a + 1 ).x2 = 0 2.y1 + a.x1.y2 x2.x3 2.a.x1 = 0

a dsigne une constante relle les variables endognes sont y1 et y2 les variables exognes sont x1, x2 et x3 .

On vrifie aisment que (y1*, y2*, x1*, x2*, x3*) = (1,2,1,2,1) est une solution de ce systme. a) Ecrivez le systme dquations aux variations diffrentielles associ au systme cidessus en ( y1*, y2*, x1*, x2*, x3* ) = (1,2,1,2,1).
b) Pour quelles valeurs de localement au voisinage de

a est-il possible dexprimer les variables endognes en fonction des variables ( y1*, y2*, x1*, x2*, x3* ) = (1,2,1,2,1) ? Justifiez votre rponse.

exognes

c) En donnant la constante relle a la valeur 2 , crivez le systme aux variations diffrentielles de la question a) en compltant les 6 cases ci-dessous :

dy1 + dy1 +

dy2 = dy2=

d) Au dpart du systme de la question c) et en utilisant la mthode de Cramer, exprimez dy1 et dy2 en fonction de dx1, dx2 et dx3 .
e) Lorsque a

= 2, le systme
2 a.y 1 . y 2 + x13 .x 2 .x 3 (a + 1).x 2 = 0 2.y 1 + a.x1 . y 2 x 2 .x 3 2.a.x1 = 0

y1, y2 en fonction des variables x1 x2 et x3 localement au voisinage de ( y1*, y2*, x1*, x2*, x3* ) = (1,2,1,2,1). Notons F et G les deux fonctions ainsi dfinies : y1 = F (x1, x2, x3) et y2 = G (x1, x2, x3). Quelle est la valeur du nombre drive partielle par rapport x1 de la fonction F en (x1*,x2*,x3* ) = (1,2,1) ? Justifiez votre rponse.
permet dexprimer les variables

59

Solutions des exercices (Chapitre 4)


Exercice 1 a) df(x) = f'(x) dx = (2.x.ln(x) + x) dx b) df(x) = 2.cos(2x) dx c) dF(x1,x2) = dx1 3 x22 dx2 d) dG(z1,z2) = 3 (z1 z2) dz1 3 (z1 z2) dz2
2 2

e) dF(x,y,t,v) = (y v) dx + x dy + 2 a t dt x dv f) NB : dt(x,y) = y ex.y dx + x ex.y dy et dv(y) = - dy

dF(x,y) = (2y 2 + 2 a y ex.y) dx + x (2 + ex.y) dy


g) dH(z) = 0

Exercice 2

F F (x1*, x2*) . x1 + (x1*, x2*) . x2 x1 x2 F F (x1*, x2*) = 2 x1 x23 (3,1) = 6 x1 x1 F F (3,1) = 27 (x1*, x2*) = 3 x12 x22 x 2 x 2 3 2 3 2 Finalement, dF ( (3,1),( , ) ) = 6. + 27 . = 7,2 10 10 10 10
a) dF((x1*, x2*),(x1,x2)) = . . . alors que la variation en valeur vaut

F((x1*, x2*),(x1,x2)) = F(x1*+x1, x2*+x2) - F(x1*, x2*) F( (3,1),( 3 2 33 12 , ) ) = F( , ) F(3,1) = 9,817932 10 10 10 10 1 1 e , ) ) = 1,36 10 10 2

b) dF ( (1,4),(

. . . alors que la variation en valeur vaut

F( (1,4),(

1 1 11 41 , ) ) = F( , ) F(1,4) = 1,444 10 10 10 10

60

Exercice 3 a) non b) Equation aux variations diffrentielles :

18.dx + 16.dy = 0 , qui peut encore scrire

9 dy = .dx . 8
Lquation aux variations diffrentielles en (1,3) dfinit la variable dy en fonction de la variable dx . Lquation de dpart dfinit donc localement, au voisinage de (1,3) , la variable y en fonction de la variable x (mais on ne sait pas comment, on na pas une criture explicite de cette fonction).

dy 9 y (1) = = dx 8 c) Lquation de la droite tangente en (1,3) est donne par 18.x + 16. y 66 = 0
Le nombre driv demand est

d dy

Exercice 4 a) non b) Equation aux variations diffrentielles : encore scrire dy =

(9 24. ln 2).dx + (6 8. ln 2).dy = 0 , qui peut

(9 24. ln 2) .dx (6 8. ln 2)

Lquation aux variations diffrentielles en (1,3) dfinit la variable dy en fonction de la variable dx . Lquation de dpart dfinit donc localement, autour de sa solution (1,3), la variable y en fonction de la variable x (mais on ne sait pas comment, on na pas une criture explicite de cette fonction). Le nombre driv demand est

d dy

(9 24. ln 2) dy = . y (1) = dx (6 8. ln 2)

c) Lquation de la droite tangente en (1,3) est donne par

(9 24. ln 2).x + (6 8. ln 2). y + (27 + 48. ln 2) = 0

Exercice 5 a) non b) Equation aux variations diffrentielles : 4.dx1 2.dx 2 + 12.dy = 0 , qui peut encore scrire dy = .dx1 +

1 3

1 .dx 2 6

Lquation aux variations diffrentielles en (1,0,2) dfinit la variable dy en fonction des variables dx1 et dx 2 . Lquation de dpart dfinit donc localement, autour de sa solution (1,0,2) , la variable
fonction).

y en fonction des variables x1 et x 2 (mais on ne sait pas comment, on na pas une criture explicite de la

c) Le plan tangent en (1,0,2) a pour quation 2.x1 x 2 + 6. y 14 = 0

61

Exercice 6

a) Equation aux variations diffrentielles : 4. dx1 + 17. dx 2 + 2. dy = 0 , qui peut encore scrire dy = 2 . dx1

17 . dx 2 2

Lquation de dpart ( E ( x1 , x 2 , y ) = 0 ) dfinit donc, au voisinage de (2,1,0) , la variable


fonction).

Lquation aux variations diffrentielles dfinit donc localement, autour de sa solution (2,1,0) , la variable dy en fonction des variables dx1 et dx 2 .

y en fonction des variables x1 et x 2 (mais on ne sait pas comment, on na pas une criture explicite de la

b) Le plan tangent (au graphe des solutions de E ( x1 , x 2 , y ) = 0 ) en (2,1,0) a pour quation

4 . x1 + 17 . x 2 + 2 . y 25 = 0

Exercice 7

a) Le nombre driv demand est donn par b) y ( x * ) = f ( x * ).


x

dy 1 = dx 2

x* =1 y*
Exercice 8

x1 2 . y1 . y 2 3 + x1 .x 2 . y 2 = 15 (1,3,0,5) est bien solution du modle x1 y1 2 e . y + x 2 . y 2 .(1 x1 ) = 0 2


Systme dquations aux variations diffrentielles en (1,3,0,5) :

15.dx1 + 5.dx 2 + 125.dy1 + 3.dy 2 = 0 15.dx1 + 0.dx 2 + 0.dy1 + 0.dy 2 = 0


Le systme est indtermin ; on ne peut pas crire dy1 et dy2 en fonction de dx1 et dx2. En consquence, le systme ne dfinit pas localement, au voisinage de sa solution (1,3,5,0), les variables y1 et y2 en fonction des variables x1 et x2. Autre justification : Puisque

25.dy1 + 3.dy 2 = 5.dx 2 scrit aussi 0.dy1 + 0.dy 2 = 15.dx1

25 3 dy1 5.dx1 0 0 . dy = 15.dx 2 2

25 3 dt 0 0 = 0 , on ne peut pas exprimer dy1 et dy2 en fonction de dx1 et dx2.

62

Exercice 9 Systme dquations aux variations diffrentielles en (3,2, 1,1, 2) :

dy1 + 4.dy 2 3.dx1 4.dx 2 + 4.dx3 = 0 4.dy1 3.dy 2 + 21.dx1 + 6.dx 2 3.dx3 = 0

4 = 13 , on peut exprimer les variables dy1 , dy 2 en fonction 3 des variables dx1 , dx 2 , dx3 . On peut en dduire que les variables endognes y1 , y 2 du systme non linaire de
Puisque dt 4 dpart sont dfinies localement, autour de (3,2, 1,1, 2) , en fonctions des variables

x1 , x 2 , x3
(mais on ne sait pas comment, on na pas une criture explicite de ce modle). En appliquant par exemple la mthode de Cramer, on trouve

75 12 dy1 = 13 .dx1 13 .dx 2 . 9 10 dy 2 = .dx1 + .dx 2 dx3 13 13

Exercice 10 Systme d quations aux variations diffrentielles en (1,0,2,1) :

e 2 .dx1 4.dx2 + 8 + e 2 .dy1 + 22 + 2.e 2 .dy 2 = 0 2.dx1 + dx 2 11.dy1 + 2.dy 2 = 0

8 + e 2 22 + 2.e 2 = 258 + 24.e 2 , on peut exprimer les variables dt Puisque 11 2 dy1 , dy 2 en fonction des variables dx1 , dx2 .
On peut en dduire que les variables endognes y1 , y 2 du systme de dpart sont dfinies localement, autour de

( x1* , x 2* , y1* , y 2* ) = (1,0,2,1) ,

en

fonctions

des

variables x1 , x2 (mais on ne sait pas comment, on na pas une criture explicite de ce modle).

44 + 6.e 2 30 + 2.e 2 .dx1 + .dx 2 dy1 = 258 + 24.e 2 258 + 24.e 2 . On trouve 2 2 dy = 16 + 9.e .dx + 36 e .dx 2 258 + 24.e 2 1 258 + 24.e 2 2

63

Exercice 13

f a . dy1 + ( y3* ) . dy3 dx1 = 0 y3 g g a) dy 2 ( y3* , x 2* ). dy3 ( y3* , x2* ). dx 2 = 0 x 2 y3 h ( y1* ). dy1 dy 2 = 0 y1
b) Il est possible dexprimer les variables dy1 , dy 2 et dy3 en fonction de dx1 et dx 2 si

f a 0 ( y3* ) y3 h f g g ( y1* ). ( y3* ) a. ( y3* , x 2* ) dt 0 1 ( y3* , x 2* ) = y1 y3 y3 y3 h ( y * ) 1 0 1 y 1 f g h ( y1* ). ( y3* ) a. ( y3* , x 2* ) 0 cest--dire si y1 y3 y3

Exercice 14 a)

2a dy1 + a dy2 + 6 dx1 + (-a) dx2 + 4 dx3 = 0 2 dy1 + a dy2 + 0 dx1 + (-1) dx2 + (-2) dx3 = 0 2a a 0 a soit 2 a2 2a 0 ce qui est le cas si a 0 ou a 1.
Il faut que det 2

b)

c)

4 2

dy1 + dy1 +

2 2

dy2 = dy2=

-6 dx1 + 2 dx2 4 dx3 dx2 + 2 dx3

d)

1 dx2 3 dx3 2 dy2 = 3 dx1 + 0 dx2 + 4 dx3 dy1 = -3 dx1 + -3


64

e)

Troisime partie Optimisation

65

Chapitre 6 : Optimisation
1. Recherche dextrema de fonctions dune variable
Recherche dun extremum local de la fonction 1. Calculer la drive premire f 2. Rsoudre lquation

f : R R : x f(x)

f(x) = 0

Les solutions x* appartenant au domaine de dfinition de f sont appels les points stationnaires de f. La tangente au graphe de f en x* est horizontale (parallle laxe des abscisses). 3. Calculer la drive seconde f 4. En chaque point stationnaire, calculer la valeur de la drive seconde : f(x*) Si f(x*) est positive alors le point stationnaire x* est un minimum local Si f(x*) est ngative alors le point stationnaire x* est un maximum local Si f(x*) est nulle et change de signe gauche et droite de x* , alors le point stationnaire x* est un point dinflexion .

Exercice rsolu
a) Rechercher les extrema ventuels de f : R R : x f(x) = b) En se basant sur le graphe de f, rechercher les extrema 1. sur le domaine de dfinition de f 2. sur lintervalle R +
+ 3. sur lintervalle R0

x 4 x 3 3. x 2 +2 20 15 5

4. 5. 6. 7. 8.

1 9. sur lintervalle ] ,2[

sur sur sur sur sur

lintervalle [-2,0] lintervalle ]-2,0[ lintervalle [-1,1] lintervalle]-1,1[ lintervalle [1,2]

66

Rsolution : a) f(x) =

1 3 2 (x x 6x) 5

1 x (x2 x 6) 5 f(x) = 0 x = 0 ou =

x = -2

ou

x=3

x* = 0, x* = -2 et x* = 3 sont des points stationnaires (tangente horizontale)


Ces points stationnaires sont-il des extrema locaux ?

1 (3x2 2 x 6) 5 en x* = 0 6 f(0) = - < 0 : la concavit est tourne vers le bas ; 5 le point stationnaire x* = 0 est un maximum local de f. en x* = -2 f(-2) = 2 > 0 : la concavit est tourne vers le haut ; le point stationnaire x* = -2 est un minimum local de f. en x* = 3 f(3) = 3 > 0 : la concavit est tourne vers le haut ; le point stationnaire x* = 3 est un minimum local de f.

f(x) =

67

b) 1. 2. 3. 4. 5. 6.

min local en x* = -2, max local en x* = 0 et min global en x* = 3 max local en x* = 0 et min global en x* = 3 min global en x* = 3 min global en x* = -2, max global en x* = 0 pas dextremum min local en x* = 1 et min global en x* = 1 (f(-1) = 91/60 et f(1) = 83/60) = , max global en x* = 0 7. max global en x* = 0 8. max global en x* = 1, min global en x* = 2 9. pas dextremum

Exercices
Exercice 1 La fonction f : R R : x f(x) = (x 1)3 . (x + 1) possde-t-elle un extremum ? a) en x* = 0 ? b) en x* = -

c) en x* = 1 ?

1 ? 2

Exercice 2 3 Rechercher les extrema ventuels de la fonction f : R R : x f(x) = x - 1 Exercice 3 Rechercher les extrema ventuels de la fonction f : R R : x f(x) = x3 + x2 - 1
Exercice 4

Rechercher les extrema ventuels de la fonction f : R0+ R : q f(q) = q2 5q + 8 Exercice 5 Rechercher les extrema ventuels de la fonction g : R0 R : x g(x) = 2x +
+

8 x

Exercice 6 Rechercher les extrema ventuels de la fonction

h : R R : x h(x) =

1 3 (x 6 x2 + 9 x + 6 ) 6

Exercice 7 Rechercher les extrema ventuels de la fonction i : R R : x i(x) = 5 x2 . ex Exercice 8 x Rechercher les extrema ventuels de la fonction j : R R : x j(x) = (x 1) . e

68

Exercice 9 Soient C(q) le cot total dune firme q la demande de son produit p le prix de vente de ce produit . Si q = 100 - p et C(q) =

1 3 q 7 q2 + 111 q + 50 , 3

quel est le niveau q qui maximise le profit ? Exercice 10 Le revenu R que procure la vente dun article est li au prix de vente unitaire p de cet article par lexpression R(p) = 1500 . p . e
p 100

Dterminer (sil en existe) une valeur de p qui maximise R. Exercice 11 Un fabricant de lecteurs de c.d. produit q exemplaires par semaine un cot total de 4 q2 + 300 q + 10000 . La demande hebdomadaire du produit est q = 100 2.

p , p tant le prix unitaire en

euros. Si le fabricant rgle sa production sur la demande, quel niveau de production lui procurera un bnfice maximum ? Exercice 12 Une firme fabrique un nouvel alliage. Si elle vend cet alliage p dollars la tonne , elle peut vendre 240 - p tonnes. On sait aussi que le cot de production est

32000 + 30 dollars au total. 240 2. p Combien de tonnes (q) doit-elle produire et quel prix (p) pour maximiser son bnfice ?

Exercice 13 La firme Channel fabrique des tlvisions. La demande journalire q = 100 2 p si elle vend au prix unitaire p et le cot de production de q appareils est de

1 2 q + 35 q + 25 par jour. 4

a) Quel niveau de production maximise le bnfice ? b) Pour quel niveau de production le cot de production unitaire est-il minimum ? Exercice 14 Lentreprise S.E. (sans ennuis) fabrique q machine laver mensuellement. Elle utilise cet effet plus ou moins de main duvre (MO). Sa fonction de production sur courte priode est dfinie par q = o MO dsigne le nombre de travailleurs.

MO 2 MO .( 3 ) 25 12

69

Quel est leffectif qui maximise la production ?

70

6.2. Recherche dextrema de fonctions de n variables


6.2.1. Caractre dfini positif, dfini ngatif dune matrice carre symtrique
Soit une matrice carre symtrique A. On appelle sous-matrice principale de A toute matrice obtenue en supprimant les ranges se correspondant dans les lignes et les colonnes de la matrice A. Une sous-matrice particulire est la matrice obtenue en gardant les j premires lignes et les j premires colonnes de la matrice A. (j) Ces sous-matrices particulires sont symtriques et se notent A . Exemple

a1,1 Soit la matrice carre symtrique A = a 2,1 a 3,1

a1, 2 a 2, 2 a 3, 2

a1,3 a 2,3 a 3, 3

A(1) = (a1,1) matrice compose dun seul lment


a1,1 A(2) = a 2,1
a1,2 a 2,2

(3)

a1,1 = a 2,1 a 3,1

a1,2 a 2,2 a3,2

a1,3 a 2,3 = A a3,3

Soit A une matrice carre symtrique dordre n. (j) A est dfinie positive ssi j {1, 2, , n} : dt A > 0 Par exemple , pour la matrice carre symtrique A dordre 3 : A est dfinie positive ssi dt (a1,1) > 0

a1,1 dt

a 2,1

a1,2 >0 a 2,2

a1,1 dt a 2,1 a 3,1

a1,2 a 2,2 a3,2

a1,3 a 2,3 > 0 a3,3

A est dfinie ngative ssi j {1, 2, , n} : (-1)j . dt A(j) > 0


Autrement dit, la matrice

A est dfinie ngative ssi les dtA( j) sont successivement ngatifs puis positifs,

71

en commenant par tre ngatif .

Par exemple, pour la matrice carre symtrique A dordre 3 :

A est dfinie ngative

ssi

dt (a1,1) < 0

a1,1 dt

a 2,1

a1,2 >0 a 2,2

a1,1 dt a 2,1 a 3,1

a1,2 a 2,2 a3,2

a1,3 a 2,3 < 0 a3,3

Exercices
Exercice 15 Les matrices symtriques suivantes sont-elles dfinies positives, dfinies ngatives ?

2 2 2 1. 2 4 0 2 0 8 6 6 0 3. 0 2 0 6 0 12

1 0 0 2. 0 1 0 0 0 1

4.

3 2 2 1

1 0 2 5. 0 1 0 o a est un paramtre rel 2 0 a 2 2 2 6. 2 5 1 2 1 5

72

6.2.2. Recherche des extrema libres dune fonction de n variables


Soit une fonction de n variables F : R* R : (x1, x2, , xn) F(x1, x2, , xn) Calculer toutes les drives partielles dordre 1 :

F (x1, x2, , xn) x1 F (x1, x2, , xn) x 2 F (x1, x2, , xn) x n

Rsoudre le systme

F (x1, x2, , xn) = 0 x1 F (x1, x2, , xn) = 0 x 2

F (x1, x2, , xn) = 0 x n * * * Les solutions (x1 , x2 , , xn ) de ce systme sont les points stationnaires.

Calculer toutes les drives partielles dordre 2.

2 F 2 F (x1 , x2 ,...,xn ) (x1 , x2 ,...,xn ) 2 x1.x2 ( x1 ) 2 F 2 F (x1 , x2 ,...,xn ) (x , x ,...,x ) HF(x1, x2, , xn) = x .x ( x2 )2 1 2 n 2 1 ..... ..... 2 F 2 F (x , x ,...,xn ) (x1 , x2 ,...,xn ) x .x 1 2 xn .x2 n 1

2 F (x1 , x2 ,...,xn ) x1.xn 2 F ..... (x1 , x2 ,...,xn ) x2 .xn ..... ..... 2 F ..... (x1 , x2 ,...,xn ) ( xn )2 .....

Pour chaque point stationnaire (x1*, x2*, , xn*), crire la matrice hessienne HF(x1*, x2*, , xn*). Si HF(x1 , x2 , , xn ) est dfinie positive * * * le point stationnaire (x1 , x2 , , xn ) est un minimum local.
* * *

Si HF(x1 , x2 , , xn ) est dfinie ngative le point stationnaire (x1*, x2*, , xn*) est un maximum local.
* * *

Sinon, si dt HF(x1*, x2*, , xn*) 0 * * * le point stationnaire (x1 , x2 , , xn ) est un point de selle.

73

Exercice rsolu
Optimiser la fonction f dfinie par f(x1, x2) = 5 x1 + 6x2 - x1x2 .
2 2

Rsolution : Calculer toutes les drives partielles dordre 1.

f (x1, x2) = 10 x1 - x2 x1 f (x1, x2) = 12 x2 x1 x 2

Rsoudre le systme f (x1, x2) = 0 10 x1 - x2 = 0 x1 f (x1, x2) = 0 12 x2 x1 = 0 x 2

x2 = 10 x1
12.(10 x1) x1 = 0

x2 = 10 x1
119.x1 = 0

x2 = 0 x1 = 0

La solution (0,0) de ce systme est le seul point stationnaire de la fonction. Calculer toutes les drives partielles dordre 2.

2 f ( x1 , x 2 ) 2 ( x1 ) HF(x1, x2) = 2 f x x ( x1 , x 2 ) 2 1 10 1 HF(x1, x2) = 1 12

2 f ( x1 , x 2 ) x1 x 2 f ( x1 , x 2 ) ( x2 )2

dt(10) = 10 > 0 10 1 dt 1 12 = 119 > 0 HF(x1, x2) est dfinie positive ; le point stationnaire (0,0) est donc un minimum local et F (0,0) = 0.

74

Exercices
Trouver les extrema et points de selle ventuels des fonctions suivantes Exercice 16 : f : R R : (x1, x2) f(x1, x2) = x1 + x2
2 2 2

Exercice 17 : f : R2 R : (x1, x2) f(x1, x2) = x12 x22 Exercice 18 : f : R2 R : (x1, x2) f(x1, x2) = x13 x22 + 3x12 + 3x22 9 x1 Exercice 19 : f : R R : (x1, x2) f(x1, x2) = x1 + x1.x2 + x2 + x1 4 x2 + 4
2 2 2

Exercice 20 : f : R R : (x1, x2) f(x1, x2) = 12 x1 24 x1.x2 + x2 + 15 x2 24 x2


2 2 3 2

Exercice 21 : f : R2 R : (x1, x2) f(x1, x2) = 3 x12 + 2.x23 + 21 x22 12 x1 x2 24 x2

Problme rsolu
Une firme produit deux types de biens A et B. Son cot total de fabrication, not C, et la demande respective des deux biens qA et qB sont donns par

Quels sont les niveaux de production qui maximisent le profit ? Quels sont les prix de A et B qui suscitent une demande correspondant ces niveaux optimaux ? Rsolution : La fonction profit est donne par (qA,qB) = qA . pA + qB . pB C(qA,qB) o ( q A , q B ) ne dpend que des variables de

C = qA2 + 2 qB2 + 10 qA = 40 2 pA pB qA = 35 pA pB

q A et q B

q A = 40 2 . p A p B p A = 5 q A + qB on peut dduire q B = 35 p A p B p B = 30 + q A 2.q B


(q A , q B ) = 5.q A 2.q A + 2.q A .q B 4.q B + 30.q B 10
2 2

et donc que

Maximiser le profit en fonction niveau de production : 1) Recherche des points stationnaires de .

75

Calculer toutes les drives partielles dordre 1 de (drives premires), et rsoudre le systme

q (q A , q B ) = 0 A . (q , q ) = 0 q B A B
* *

Les solutions (q A , q B ) de ce systme sont les points stationnaires.

5 4.q A + 2.q B = 0 2.q A 8.q B + 30 = 0


Ce systme est un systme linaire. Il peut tre rsolu simplement par substitution.

5 q 5 qB qA = + B q A = 4 + 2 4 2 5 q 65 2.( + B ) 8.q B + 30 = 0 q B = 14 4 2 50 65 ( , ) est donc un point stationnaire. 14 14


2) Test des points stationnaires. Le point stationnaire (

50 q A = 14 65 q B = 14

50 65 , ) est-il un maximum local ? 14 14


2 (q A , q B ) q A q B 2 (q A , q B ) 2 (q B )

Calculer toutes les drives partielles dordre 2 (drives secondes ) .

2 (q , q ) (q )2 A B A H ( q A , q B ) = 2 (q , q ) A B q q B A 4 2 H (q A , q B ) = 2 8
Pour le point stationnaire (

50 65 , ) 14 14

50 65 4 2 , )= 14 14 2 8 dt ( 4 ) < 0 4 2 dt 2 8 > 0 50 65 H ( , ) est dfinie ngative. 14 14

H (

Le point stationnaire (

50 65 , ) est un maximum local. 14 14

76

Pour information : H ( q A , q B ) =

4 2 ne dpend pas des variables q A et q B . 2 8

4 2 H (q A , q B ) = 2 8 est semi-dfinie ngative en tout point du domaine. 50 65 Le point stationnaire ( , ) est un maximum global. 14 14
Rponse :

65 maximisent le profit en fonction des niveaux de production. 14 Les prix associs p A et p B sont donns par p A = 5 q A + q B et p B = 30 + q A 2.q B . 85 340 et p B = . Les prix associs ce niveau de production sont p A = 14 14

qA =

50 14

et

qB =

Exercice
Exercice 22

Une entreprise fabrique deux produits A et B dans les quantits

milliers). Elle les vend respectivement 12 et 18 lunit. Le cot de fabrication, not Quel est le niveau de production qui maximise le profit de cette entreprise ?

q A et q B (en

C , est donn par 2 . q A 2 + q A . q B + 2. q B 2 .

77

6.2.3. A propos des courbes de niveau dune fonction de deux variables


Soit la fonction suivante :

f(x,y) = x2 + y2
La reprsentation graphique de cette fonction est un parabolode de rvolution 2 2 (dquation z = x + y ).

Comment reprsenter cet objet dans un espace deux dimensions ? Si lon coupe le parabolode par un plan horizontal dquation z = k (o k est un nombre rel positif), on obtient ce quon appelle une courbe de niveau de la fonction. Equation dans lespace de la courbe de niveau hauteur k :

z = x2 + y 2 z = k
Exemple 1 2 2 Voici une reprsentation trois dimensions dun parabolode de rvolution (z = x + y ) coup par un plan horizontal hauteur 4 :

78

La courbe qui est lintersection du parabolode et du plan a pour quation (dans lespace) :

z = x2 + y 2 z = 4

La projection de cette courbe dans le plan horizontal oxy est une courbe dquation x2 + y2 = 4 . Cest un cercle, de centre (0,0) et de rayon 2 (= 4 ).

De mme, si lon coupe le parabolode hauteur 0, 1, 2, 3, 4, 5, on trouve 6 courbes de niveaux du parabolode (la premire tant rduite au point (0,0) ) :

Mme si on na pas la possibilit davoir une reprsentation graphique en 3D de la surface, on peut quand mme voir, grce aux courbes de niveau, quelle admet un minimum (global) en (0,0).

79

Exemple 2 Voici prsent une reprsentation trois dimensions de ce quon appelle une selle de cheval (z = x.y), vue sous deux angles diffrents.

Ci-dessous, on trouve les courbes de niveau de cette surface (aux hauteurs 4, -2, -1, -0.5, -0.25, -0.1, 0.1, 0.25, 0.5, 1, 2, 4).

y=x

y=x

80

Le point de coordonnes (0,0) est un point trs particulier. En effet, si lon suit un chemin imaginaire situ sur la surface la verticale de la droite dquation y = x, on constate que (0,0) est un minimum ( point le plus bas ) pour ce chemin ; dautre part, en suivant un chemin la verticale de la droite dquation y = x , le point (0,0) est un maximum. Un tel point est appel point de selle (ou encore point col, en rfrence aux cols des montagnes, o un tel phnomne se produit).

81

6.3. Recherche dextrema de fonctions de n variables sous contrainte dgalit Mthode de Lagrange
Mthode : Pour optimiser la fonction

F de 2 variables x1 , x 2 dfinie par y = F ( x1 , x 2 ) soumise la contrainte unique exprime par lgalit g ( x1 , x 2 ) C = 0 .

1. Ecrire la fonction L appele fonction Lagrangienne. Cette fonction L dpend de n+1 variables x1 , x 2 et de la variable , et est dfinie comme suit :

L( , x1 , x 2 ) = F ( x1 , x 2 ) .(g ( x1 , x 2 ) C )

2. Calculer toutes les drives partielles dordre 1 de la fonction L .

3. Rsoudre le systme

L ( , x1 , x 2 ) = 0 L ( , x1 , x 2 ) = 0 x1 L ( , x , x ) = 0 1 2 x 2
*

Les solutions (* , x1 , x 2 ) de ce systme sont les points stationnaires de L.


*

4. Calculer toutes les drives partielles dordre 2 (drives secondes).

2L ( , x1 , x 2 ) ( )2 2 L HL( , x1 , x 2 ) = ( , x1 , x 2 ) .x1 2L ( , x1 , x 2 ) .x 2

2L ( , x1 , x 2 ) x1. 2L

(x1 )2

( , x1 , x 2 )

2L ( , x1 , x 2 ) x1.x 2

2L ( , x1 , x 2 ) x 2 . 2L ( , x1 , x 2 ) x 2 .x1 2L ( , x1 , x 2 ) (x 2 )2

5. Ecrire la matrice Hessienne HL(*, x1 *, x 2 *) pour chaque point stationnaire. Si dt HL( , x1 , x 2 ) > 0
* *

(
(

)
)

alors le point stationnaire (* , x1 , x 2 ) est un maximum local sous contrainte.


* *

Si dt HL( , x1 , x 2 ) < 0
* *

alors le point stationnaire (* , x1 , x 2 ) est un minimum local sous contrainte.


* *

82

Exercice rsolu
Optimiser la fonction

F dfinie par F ( x1 , x 2 ) = 5 x1 + 6 x 2 x1 .x 2 contrainte exprime par lgalit x1 + 2.x 2 = 24 .


2 2

soumise la

Rsolution : La contrainte scrit x1 + 2.x 2 24 = 0 Ecrire la fonction L appele fonction Lagrangienne

L( , x1 , x 2 ) = F ( x1 , x 2 ) .(g ( x1 , x 2 ) C )
2 2

L( , x1 , x 2 ) = 5 x1 + 6 x 2 x1 .x 2 .( x1 + 2.x 2 24)

Calculer toutes les drives partielles dordre 1 de la fonction L ,

et rsoudre le systme

L ( , x1 , x 2 ) = 0 L ( , x1 , x 2 ) = 0 : x1 L ( , x , x ) = 0 1 2 x 2 x1 + 2.x 2 24 = 0 10.x1 x 2 = x1 6 x2 = 2
x1 + 2.x 2 24 = 0 3 x 2 = .x1 2 x1 6x = 2 2 x1 + 2.x 2 24 = 0 x1 10.x1 x 2 = 6 x 2 2 x1 6 x2 = 2 x1 + 3.x1 24 = 0 3 x 2 = .x1 2 = 9.x x1 1 2

( x1 + 2.x 2 24 ) = 0 10.x1 x 2 = 0 12 x x 2. = 0 2 1

x1 + 2.x 2 24 = 0 21 .x1 7 x 2 = 0 2 6 x x1 = 2 2

x1 = 6 x2 = 9 = 51

= 51 x1 = 6 x = 9 2

La solution (51,6,9) de ce systme est un point stationnaire de L ; (6,9) est un point stationnaire de F.

83

Calculer la Hessienne borde

2L ( , x1 , x 2 ) ( )2 2 L ( , x1 , x 2 ) HL( , x1 , x 2 ) = .x1 2L ( , x1 , x 2 ) .x 2
0 1 2 HL( , x1 , x 2 ) = 1 10 1 2 1 12

2L ( , x1 , x 2 ) x1. 2L

(x1 )2

( , x1 , x 2 )

2L ( , x1 , x 2 ) x1.x 2

2L ( , x1 , x 2 ) x 2 . 2L ( , x1 , x 2 ) x 2 .x1 2 L ( , x1 , x 2 ) (x2 )2

0 1 2 au point stationnaire HL(51,6,9) = 1 10 1 : 2 1 12

0 1 2 dt 1 10 1 = 56 < 0 2 1 12
Le point

= 51 ).

(6,9) est un minimum local de F sous la contrainte x1 + 2.x 2 = 24 (avec

Exercices
Exercice 23 Optimiser la fonction F dfinie par F ( x1 , x 2 ) = x1 .x 2 soumise la contrainte exprime par lgalit x1 + x 2 = 6 . Exercice 24 Optimiser la fonction

F dfinie par F ( x1 , x 2 ) = x1 + x 2 exprime par lgalit x1 + 4.x 2 2 = 0 .


2

soumise la contrainte

Exercice 25 Optimiser la fonction

F dfinie par F ( x1 , x2 ) = 12.x1.x2 3.x2 x1 contrainte exprime par lgalit x1 + x2 = 16 .


2

soumise la

84

Exercice 26 Optimiser la fonction exprime par lgalit

(x1 4)2 + (x2 3)2 = 25 .

F dfinie par F ( x1 , x2 ) = 6 x1 + 8.x2 8 soumise la contrainte

6.4. Optimisation sous contraintes, vision graphique


Exercice rsolu
Soit la fonction F(x,y) = (x 1)2 + (y 1) 2. a) Reprez graphiquement les extrema de F. b) Reprez graphiquement les extrema de F sous les contraintes

0 x 3 . 0 y 4
c) Reprez graphiquement les extrema de

F sous les contraintes

x 0, y 0 . x + 2 y 4
d) Reprez graphiquement les extrema de F sous la contrainte

x y = 1.

Rsolution : a) Reprez graphiquement les extrema de F.

F admet un minimum global en (1,1).

85

b) Reprez graphiquement les extrema de F sous les contraintes 0 x 3 . 0 y 4

Sous les contraintes que x soit compris entre 0 et 3 et que y soit compris entre 0 et 4, F admet un minimum en (1,1), et 4 extrema locaux en (0,0), (3,0), (3,4) et (0,4) ; parmi eux, le plus haut est (3,4) ( hauteur 13 = (3-1)2+(4-1)2 ). Visualisation en 3D du morceau de surface vrifiant les contraintes 0 x 3 et 0 y 4 :

c) Reprez graphiquement les extrema de

F sous les contraintes

x 0, y 0 . x + 2 y 4

86

Sous les contraintes ci-dessus, F admet un minimum global en (1,1) et trois maxima locaux en (0,0), (4,0) et (0,2) ; le plus haut de ces trois maxima est en (4,0) ( hauteur 10 = (41)2 + (01)2).

d) Reprez graphiquement les extrema de F sous la contrainte

x y = 1.

Sous la contrainte que x y = 1, F admet un minimum en (1.5 ; 0.5) (limage de ce point est hauteur 0.5 = F(1.5 ; 0.5) ).

Exercice
Exercice 27 Soit F la fonction de deux variables x1 et x2 dfinie par

F(x1,x2) = 2 x13 + 2 x23 9 x12 18 x22 + 12 x1 + 48 x2


(vous trouverez plus loin la reprsentation graphique de quelques courbes de niveau de cette fonction F). a) Dterminez analytiquement les extrema locaux et points de selle de F. b) Dterminez (en utilisant une technique analytique ou graphique) les extrema locaux ventuels de F sous la contrainte 2 x1 x2 = 0 . c) Dterminez (en utilisant une technique graphique) les extrema locaux ventuels de F 0.5 x1 2 sous les contraintes

1.5 x2 4

87

Courbes de niveau ( diffrentes valeurs) de la fonction F dfinie par

F(x1,x2) = 2 x13 + 2 x23 9 x12 18 x22 + 12 x1 + 48 x2

88

Solution des exercices (Chapitre 6)


Exercice 1 a) x * = 0 nest pas un extremum b) x * =

1 est un minimum local 2

c) x * = 1 nest pas un extremum mais est un point dinflexion Graphe de f :

Exercice 2 Le point stationnaire x * = 0 Graphe de f : est un point dinflexion ( tangente horizontale).

89

Exercice 3 Le point stationnaire x * = 0 Le point stationnaire x * = Graphe de f : est un minimum.

2 3

est un maximum.

Exercice 4 Le point stationnaire q * = Graphe de f :

5 2

est un minimum local

Exercice 5

90

+ Attention : 2 R0 ; x * = 2 est donc le seul point stationnaire du domaine de

dfinition. Le point stationnaire x * = 2 Graphe de f : est un minimum local

Exercice 6

x * = 1 est un maximum local de f, x * = 3 est un minimum local de f.


Exercice 7

x * = 0 est un minimum local de f, x * = 2


Exercice 8 Le point stationnaire x * = 0 Graphe de f :

est un maximum local de f.

est un minimum local de f.

91

Exercice 9 Le profit est donn par q. p C (q ) La fonction profit est donne par P (q ) = .q 3 + 6.q 2 11.q 50

1 3

q * = 11 est un maximum de P, et q * = 1 est un minimum de P.


Une demande de 11 units permet donc de maximiser le profit. Exercice 10

p * = 100

est un maximum pour R.

Exercice 11 La fonction bnfice est donne par B (q ) =

1 3 .q 54.q 2 + 2200.q 10000 4

q * = 24,6 est un maximum de B, et q * = 119,4 est un minimum de B. Une production de 25 CD par semaine procurera un bnfice maximum.
Exercice 12 La fonction bnfice est donne par B ( p ) = p 2 + 240. p

32000 30 240 2. p

p * = 100 (dollars) est un maximum de B ; dans ce cas, q * = 140 (tonnes).


Exercice 13 a) La fonction bnfice est donne par B (q ) = .q 2 + 15.q 25

3 4

q * = 10 est un maximum de B.
Le niveau de production qui maximise le bnfice est de 10 units.

92

b) Le cot de production unitaire est donn par Cu (q ) =

C (q ) q

q * = 10 est un minimum de C.
Le niveau de production qui minimise les cots de production est de 10 units. Exercice 14 La production est donne par

MO 2 MO .( 3 ). 25 12

MO * = 24 est un maximum de P et MO * = 0 est un minimum de P. Leffectif qui maximise la production est donc de 24.

Exercice 15

1.

dt (2 ) = 2 > 0

et

2 2 dt 2 4 = 4 > 0

et

2 2 2 dt 2 4 0 = 16 > 0 2 0 8

2 2 2 La matrice 2 4 0 est dfinie positive 2 0 8


2. dt (1) = 1 > 0 et

1 0 dt 0 1 = 1 > 0

1 0 0 et dt 0 1 0 = 1 > 0 0 0 1

1 0 0 La matrice 0 1 0 est dfinie positive 0 0 1


3. dt ( 6 ) = 6 < 0 et

6 0 dt 0 2 = 12 > 0

6 6 0 et dt 0 2 0 = 72 < 0 6 0 12

6 6 0 0 est dfinie ngative La matrice 0 2 6 0 12


4. dt ( 3) = 3 < 0 et dt 2

2 = 1 < 0 1

La matrice 2

2 nest ni dfinie positive, ni dfinie positive 1

93

5. dt (1) = 1 > 0

et

1 0 dt 0 1 = 1 > 0 et

1 0 2 dt 0 1 0 = a 4 2 0 a

1 0 2 La matrice 0 1 0 est dfinie positive si a > 4 2 0 a


6. dt (2 ) = 2 > 0 et

2 2 2 2 2 dt 2 5 = 6 > 0 et dt 2 5 1 = 0 2 1 5

2 2 2 La matrice 2 5 1 nest ni dfinie positive, ni dfinie positive 2 1 5


mais est semi-dfinie positive. Exercice 16 : minimum global en (0,0) Exercice 17 : point de selle en (0,0) Exercice 18 : minimum local en (1,0) point de selle en (1,2) et (3,0) maximum local en (3,2) Exercice 19 : minimum global en (2,3) Exercice 20 : minimum local en (2,2) , point de selle en (4,4) Exercice 21 : minimum local en (2,1) , point de selle en (8,4)
Exercice 22

La fonction profit est donne par le profit est donn par 12 . q A +18. q B C ( q A , q B ) Le profit est maximis par le niveau de production

q A = 2 et

qB = 4

Exercice 23 (3,3) est un maximum local de la fonction F sous la contrainte x1 + x 2 = 6 avec = 3 . Exercice 24

2 8 ( , ) est un minimum local de la fonction F sous la contrainte x1 + 4.x 2 2 = 0 17 17 4 . avec = 17


Exercice 25

94

(9,7) est un maximum local de la fonction F sous la contrainte x1 + x 2 = 16 avec = 66 .


Exercice 26 (7,7) est un maximum local de F sous contrainte avec = 1 .

(1,1) est un minimum local de F sous contrainte avec = 1 .


Exercice 27 a) La fonction F admet un maximum local en (1,2), un minimum local en (2,4), et deux points de selle en (1,4) et (2,2). b) Sous la contrainte 2 x1 x2 = 0, la fonction F admet un maximum local en (1,2) et un minimum local en (2,4). c) Max en (1,2), et min en (0.5 ;1.5), (2 ;1.5), (0.5 ;4), (2,4).

95

Chapitre III - PROBABILITES.

REGRESSION ORTHOGONALE DANS R.

I. 1. NOTION D'ESPACE VECTORIEL EUCLIDIEN.


I.1.1. Espace vectoriel Rn.
Soit n un entier strictement positif et le corps des nombres rels. L'ensemble n des n-uples (x1, ... , xn) de nombres rels est muni de sa structure usuelle d'espace vectoriel rel, dfinie par les oprations :
(x1, ... , xn) + (x'1, ... , x'n) = (x1 + x'1, ... , xn + x'n) (x1, ... , xn) = ( x1, ... , xn), .

Notations.

On identifiera un lment X = (x1, ... , xn) de colonne.

avec la matrice X =

n lignes et 1

La transpose de cette matrice est la matrice X t = Les oprations dans


n

x1 ... xn

1 ligne et n colonnes.

sont alors dfinies par des oprations sur les matrices :

Addition :
+
x1 ... xn

= =
x1 + x'1 ... xn + x'n

x'1 ... x'n

96

Multiplication par un scalaire :



n

= =

.
x1 ... xn

x1 ... xn

Dans , les n lments ei, i {1, ... , n}, dont toutes les coordonnes sont nulles, sauf la ie qui vaut 1, forment une base, appele la base canonique de n. Tout lment X = (x1, ... , xn) de
n

s'crit de manire unique sous la forme


X= xi ei

I.1.2. Produit scalaire dans Rn.


Soit une application de n n dans . On notera aussi < X | | Y > ou < X | Y >, le nombre rel (X, Y).

I.1.2.1. Dfinition.
On appelle produit scalaire dans proprits suivantes :
n

toute application de

dans

qui possde les

a) Bilinarit.
Linarit par rapport la premire variable : (X + X', Y) = (X, Y) + (X', Y) et ( X, Y) = (X, Y), quels que soient dans , X, X' et Y dans n ; cette proprit s'crit aussi
< X + X' | | Y > = < X | | Y > + < X' | | Y >

Linarit par rapport la deuxime variable : (X, Y + Y') = (X, Y) + (X, Y') et (X, Y) = (X, Y), quels que soient dans , X, Y et Y' dans n ; cette proprit s'crit aussi
< X | | Y + Y' > = < X | | Y > + < X | | Y' >

b) Symtrie.
(X, Y) = (Y, X), quels que soient X et Y dans
n

<X||Y>=<Y||X>

c) Positivit.
(X, X) est un nombre rel suprieur ou gal 0, quel que soit X dans
<X||X>0
n

d) Non dgnrescence.
(X, X) = 0 entrane X = 0 : 97

< X | | X > = 0 X = 0.

Autrement dit, le vecteur 0 = (0, ... , 0, ... , 0) de = 0.

est l'unique solution de l'quation (X, X)

On dit aussi qu'un produit scalaire sur n est une forme bilinaire symtrique positive non dgnre. Le mot "forme" fait simplement rfrence au fait que les valeurs sont des scalaires. Lorsqu'il est muni d'un produit scalaire, n est appel un espace vectoriel euclidien.

I.1.2.2. Exemples.

a) Produit scalaire canonique.


L'application de
n

dans

dfinie par :

((x1, ... , xn), (y1, ... , yn))


n

< X | Y > = tX Y =

x1 ... xj ... xn

xi yi

est un produit scalaire sur qu'on appelle le produit scalaire canonique de n. En effet, les proprits de bilinarit, de symtrie, de positivit et de non dgnrescence sont pratiquement videntes vrifier.

b) Produit scalaire dfini par une matrice diagonale lments positifs.


Considrons une matrice relle M n lignes et n colonnes dont tous les lments en dehors de la diagonale principale sont nuls (mij = 0, quels que soient les entiers i et j dans {1, ... , n} avec i j) (on dit alors que M est une matrice diagonale) et dont les lments de la diagonale principale sont des nombres rels strictement positifs (mii > 0 quel que soit l'entier i dans {1, ... , n}). Alors l'application :

(X, Y)

< X | M | Y > = tX M Y =
n

x1 ... xj ... xn

= ij mij xj yi = i mii xi yi

est un produit scalaire sur . La matrice M est appele la matrice des poids (les "poids" sont les lments de la diagonale). En effet, les proprits de bilinarit, de symtrie, de positivit et de non dgnrescence sont pratiquement videntes vrifier.

Le produit scalaire canonique correspond au cas o la matrice M est la matrice unit In (tous les lments de la diagonale sont gaux 1 et les lments en dehors de la diagonale sont 0) : tous les poids sont gaux 1.

98

Autre exemple : M = D =

In. Tous les poids sont gaux

et la somme des poids vaut 1.

I.1.2.3. Proprits.

a) Matrice d'un produit scalaire.


Pour tout produit scalaire sur
n

, on peut crire :

(X, Y) = (i xi ei, j yj ej) = ij (ei, ej) xi yj =

x1 ... xi ... xn M

La matrice M = [ (ei, ej)] s'appelle la matrice du produit scalaire dans la base canonique. Cette matrice est une matrice symtrique : (ei, ej) = (ej, ei). Les lments de sa diagonale sont des nombres rels strictement positifs : (ei, ei) > 0. Remarquons ces proprits ne sont pas suffisantes : une matrice symtrique dont les lments de la diagonale sont des nombres rels strictement positifs ne dfinit pas forcment un produit scalaire. a un dterminant qui vaut 3 < 0, donc elle possde deux Par exemple, la matrice valeurs propres relles de signe oppos (3 et 1) et la forme bilinaire ((x1, x2),(y1, y2)) (x1, x2) qu'elle dfinit n'est pas un produit scalaire car le "produit scalaire" du vecteur propre (1, 1) pour la valeur propre ngative, par lui-mme, est un nombre rel strictement ngatif ((1 1) = 2).

La matrice n'est donc pas la matrice d'un produit scalaire sur 2, bien qu'elle soit symtrique et que les lments de sa diagonale soient strictement positifs. En ralit, pour qu'une matrice carre symtrique relle soit la matrice d'un produit scalaire, il faut et il suffit que toutes ses valeurs propres, qui sont toujours des nombres rels, soient strictement positives. Mais ce rsultat ne sera dmontr, dans sa gnralit, que plus tard, en algbre.

b) Norme d'un vecteur.


Si est un produit scalaire sur n, le nombre rel positif || X || = s'appelle la norme de X, ou -longueur de X. Quand il n'y a pas de confusion craindre, on parlera simplement de norme ou de longueur, qu'on notera || X || au lieu de || X ||. On dit qu'un vecteur est norm pour si sa -longueur est 1. Par exemple, dans 2 muni du produit scalaire canonique, la longueur de X = (x1, x2) est || X || = et le vecteur (1, 0) est norm.

99

c) Angle de deux vecteurs.


Etant donns deux vecteurs X et Y de rel , on a :
n

et un produit scalaire sur

, pour tout nombre

(X + Y, X + Y) = || X + Y || 0 (Y, Y) + ( (Y, X) + (X, Y)) + (X, X) 0 (Y, Y) + 2 (X, Y) + (X, X) 0 || Y || + 2 < X | Y > + || X || 0

Comme cette relation est vraie pour tout nombre rel , c'est que le discriminant de ce trinme du deuxime degr est ngatif :
(< X | Y >) || X || || Y || 0 | < X | Y > | || X || || Y ||

Cette ingalit, valable pour tous vecteurs X et Y de n constitue l'ingalit de Schwarz. Si les deux vecteurs X et Y sont diffrents de 0, leur longueur n'est pas nulle, le produit de leurs longueurs n'est pas nul, le rapport est compris entre 1 et 1, et il existe donc un .

angle compris entre 0 et radians dont le cosinus est gal au rapport Par dfinition, cet angle unique compris entre 0 et , vrifiant :
cos =

est appel l'angle des deux vecteurs non nuls X et Y.

d) Orthogonalit.
Etant donns deux vecteurs X et Y de n et un produit scalaire sur n, on dit que X et Y sont -orthogonaux (ou simplement "orthogonaux" s'il n'y a pas de confusion craindre) si, et seulement si, leur produit scalaire est nul :
(X, Y) = < X | Y > = 0

Exemples : 0 est -orthogonal tout vecteur de

L'angle de deux vecteurs non nuls -orthogonaux est . La base canonique de n muni du produit scalaire canonique est forme de vecteurs norms orthogonaux deux deux : on parle alors de base orthonorme.

e) Projet orthogonal.
Soient X et Y deux vecteurs non nuls de n et un produit scalaire sur n. Il existe un unique vecteur Z de n, proportionnel Y et tel que X Z soit orthogonal Y. Dmonstration. Pour tout vecteur Z on peut crire :
< X Z | Y > = < X | Y > < Z | Y >

100

Si l'on prend un Z proportionnel Y, on a Z = a Y, donc :


< X Z | Y > = < X | Y > a < Y | Y > = < X | Y > a || Y ||.

Pour que X Z soit orthogonal Y., soit < X Z | Y > = 0, il faut et il suffit que l'on prenne a = .

Y, proportionnel Y et tel que X Z soit orthogonal Y, s'appelle L'unique vecteur Z = le projet orthogonal de X sur Y.

Proprit du projet orthogonal.


Le projet orthogonal Z0 de X sur Y est le vecteur Z de Z ||. Dmonstration. Soit Z un vecteur proportionnel Y. Soit Z0 = Y le projet orthogonal de X sur Y.
|| X Z || = || X Z0 + Z0 Z || .
n

proportionnel Y, qui minimise || X

Comme Z est proportionnel Y et que Z0 est proportionnel Y, la diffrence Z0 Z est proportionnelle Y. Or X Z0 est orthogonal Y, donc X Z0 est orthogonal Z0 Z qui est proportionnel Y. Il est rsulte que l'on a :
|| X Z || = || X Z0 + Z0 Z || = || X Z0 || + || Z0 Z || || X Z0 ||.

Et cette ingalit montre que || X Z || atteint son minimum lorsque Z = Z0.

I.2. APPROCHE EUCLIDIENNE DE LA REGRESSION.


Considrons une variable statistique quantitative bidimensionnelle (X, Y) valeurs dans , dfinie dans une population de taille n. Elle est dfinie par l'ensemble des couples { (X (), Y ()) } . est l'espace des individus. La variable statistique est reprsente par un nuage de points dans et chaque point du nuage statistique reprsente un individu de la population .

I.2.1. Espace des variables.


Les n valeurs X () de X pour les n individus de la population peuvent tre considres comme les coordonnes d'un vecteur de n.

Ce vecteur est not encore X = . Les n valeurs Y () de Y pour les n individus de la population peuvent tre considres

101

comme les coordonnes d'un vecteur de

Ce vecteur est not encore Y =

L'espace E = n apparat alors comme l'espace des variables. Chaque lment de E peut tre considr comme les valeurs d'une variable statistique quantitative relle dfinie sur .

I.2.2. Produit scalaire.


Dans cet espace des variables, la matrice D = colonnes, dfinit un produit scalaire :
<X|Y> =<X|D | Y > = i

In, o In est la matrice unit n lignes et n


i xi y i =

xi y i =
n

<X|Y>

en notant < X | Y > le produit scalaire canonique de

On note n = le vecteur dont toutes les coordonnes sont gales 1. On l'appelle le vecteur unit de n. On remarquera que ce vecteur unit est norm, sa longueur est || 1.
n

||

i 1 1 =

n=

I.2.3. Moyenne d'une variable statistique.


La moyenne de la variable statistique X est donne par :
=
X () = i x i = i xi 1 = < X | D

>. = < X |

>

La moyenne de X est le produit scalaire de X par le vecteur unit n. Notons X0 la variable centre correspondant X : pour chaque individu de la population, sa valeur est X () :

X0 = X = X0 +

=
n

= X0 + < X |
n

=X >
n

n.

I.2.4. Variance d'une variable statistique.


s (X) =

i (xi ) = < X0 | D s (X) = || X0 ||

| X0 > = || X0 ||

102

La variance de X est le carr de la norme de la variable centre.

I.2.5. Covariance.
La covariance de deux variables quantitatives relles X et Y dfinies sur est la moyenne du produit des variables centres :
Cov (X, Y) =

i (xi

)(yi ) = < X0 | D

| Y 0 > = < X0 | Y 0 >

Cov (X, Y) = < X0 | D

| Y 0 > = < X0 | Y 0 >

La covariance est le produit scalaire des variables centres.

I.2.6. Coefficient de corrlation linaire.

rXY =

= = cos (X0, Y0) rXY = cos (X0, Y0)

Le coefficient de corrlation linaire est le cosinus de l'angle des variables centres.

I.2.7. Prdicteur linaire.


Soient Y la variable expliquer, X la variable explicative, X0 et Y0 les variables centres. Le prdicteur linaire Y | X est y * = a + b x ou y* = b (x ), soit y0* = b x0. Il est reprsent par la droite de rgression de Y en X dans l'espace des individus.

Le coefficient b s'obtient par b =

D'aprs ce qui prcde (I.1.2.3.e), b X0 = X0 est le projet orthogonal de Y0 sur X0, Y0 b X0 est orthogonal X0 et b est la valeur qui minimise l'expression
S=

i (Y0i b X0i) = || Y0 b X0 || = s (Y b X) = s (Y a b X) = s (Y Y*) = s (Y0 Y0*) Le prdicteur linaire de la variable centre Y0 est le projet orthogonal de Y0 sur X0 dans n. C'est la variable Y0* qui minimise la variance de Y0 Y0*.

Nous avons alors :


s (Y) = || Y0 || s (Y) = S min + b || X0 ||

= || Y0 b X0 + b X0 ||

= || Y0 b X0 ||

+ || b X0 ||

s (Y)

= S min + s (X) = S min + s (Y) = S min + rXY s (Y).

Nous retrouvons la variance rsiduelle S min et la variance explique par la rgression rXY s (Y). De faon symtrique, si X est la variable explicative et Y la variable explicative, nous aurons une expression :

103

s (X) = S' min + rXY s (X).

avec la variance rsiduelle S' min et la variance explique par la rgression rXY s (X).

II - REGRESSION MULTIPLE.

II. 1. POSITION ET RESOLUTION DU PROBLEME.


II.1.1. Position du problme.
Considrons trois variables statistiques relles centres X0, Y0, Z0, dfinies par n triplets (x0i, y0i, z0i), i [1, n]. Nous considrons Z0 comme la variable expliquer et X0 et Y0 comme les variables explicatives. Nous supposons que les observations laissent penser que le nuage de points dans 3 pourrait tre modlis par un plan. Le problme de la rgression linaire multiple de Z0 en X0 et Y0 consiste trouver un prdicteur
0

= a X0 + b Y 0

de Z0, tel que le nuage de points (x0i, y0i, 0i = a x0i + b y0i), i [1, n], soit aussi proche possible du nuage de points (x0i, y0i, z0i), i [1, n], au sens des moindres carrs. L'approche euclidienne de ce problme dans que S = || Z0
0 n

consiste trouver un

= a X0 + b Y 0

tel

||

soit minimum.

Le problme est donc de trouver, dans n, un vecteur 0 du plan (= sous-espace vectoriel de dimension 2) dfini par X0 et Y0, tel que le vecteur Z0 0 ait une longueur minimum (au sens du produit scalaire dfini par la matrice des poids D ). La solution sera fournie par le projet orthogonal
0

de Z0 sur .

II.1.2. Projet orthogonal sur un plan.

a) Dfinition.
Si nous connaissons une base orthonorme { u1, u2 } d'un sous-espace vectoriel de dimension 2, dfini dans n par les deux vecteurs X0 et Y0, nous savons calculer le projet

104

orthogonal de Z0 sur u1, c'est le vecteur

u1 = < Z0 | u1 >

u1 et

nous savons calculer aussi le projet orthogonal < Z0 | u2 > sur u2. tel que Z0 On appelle projet orthogonal de Z0 sur . l'unique vecteur soit orthogonal . 0

u2 de Z0 de

Un tel vecteur existe et est unique. Dmonstration. Notons 0 le vecteur < Z0 | u1 > sur les vecteurs u1 et u2. < Z0
0

u1 + < Z0 | u2 >

u2, somme des projets orthogonaux de Z0

| u1 >

= < Z0 | u1 > < < Z0 | u1 > < Z0 | u1 > < Z0 | u1 >

<

| u1 > u2 | u1 > < u2 | u1 >

= < Z0 | u1 > = < Z0 | u1 > = < Z0 | u1 > =0 < Z0 | u2 >

u1 + < Z0 | u2 >

< u1 | u1 > + < Z0 | u2 >

= < Z0 | u2 > < < Z0 | u1 > < Z0 | u1 > < Z0 | u2 >

<

| u2 > u2 | u2 > < u2 | u2 >

= < Z0 | u2 > = < Z0 | u2 > = < Z0 | u2 > =0

u1 + < Z0 | u2 >

< u1 | u2 > + < Z0 | u2 >

Ainsi, Z0 0 est orthogonal u1 et u2, il est donc orthogonal toute combinaison linaire de u1 et u2, c'est--dire tout lment de : on dit qu'il est orthogonal . Le projet orthogonal de
0

sur u1 est
<
0

| u1 >

u1 = < Z0 | u1 >

u 1.

Le projet orthogonal de

sur u2 est
<
0

| u2 >

u2 = < Z0 | u2 >

u 2.

Nous pouvons donc crire :


0

= < Z0 | u1 >

u1 + < Z0 | u2 >

u2 = <

| u1 >

u1 + <

| u2 >

u2.

Rciproquement, si Z est un vecteur de tel que Z0 Z soit orthogonal , nous avons :

105

Z = < Z | u1 >

u1 + < Z | u2 >

u2 = < Z0 | u1 >

u1 + < Z0 | u2 >

u2 =

0.

Le vecteur :
0

= < Z0 | u1 >
0

u1 + < Z0 | u2 >

u2

est donc l'unique vecteur de tel que Z0 projet orthogonal de Z0 sur . La relation :
0

soit orthogonal : c'est, par dfinition, le

=<

0 0

| u1 >

u1 + <

| u2 >

u2

signifie que le projet orthogonal de

sur le plan est 0.

b) Proprit du projet orthogonal.


Le projet orthogonal de Z0 sur est le vecteur Z de , qui minimise la quantit || Z0 Z || . Dmonstration. Soit Z un vecteur appartenant au sous-espace . Soit
0

= < Z0 | u1 >

u1 + < Z0 | u2 >

u2 le projet orthogonal de Z0 sur .


= || Z0 + Z ||
0

|| Z0 Z ||

Or Z0 0 est orthogonal , donc orthogonal tout lment de , donc Z0 orthogonal 0 et Z, donc aussi 0 Z. Le thorme de Pythagore s'applique :
|| Z0 + Z || = || Z0 || || + || + || Z ||

est

|| Z0 Z ||

= || Z0

Z ||

Cette relation montre que || Z0 Z ||

atteint sa valeur minimum || Z0

||

lorsque Z = 0.

Notre problme initial se trouve rsolu :

Le prdicteur

= a X0 + b Y0 de Z0 qui rend minimum la quantit S = || Z0 Z0 dans le plan dfini par X0 et Y0.

||

est le projet orthogonal de

La seule chose qu'il nous reste faire dans la suite, est d'expliciter ce projet orthogonal en fonction des donnes (x0i, y0i, z0i), i [1, n].

II.1.3. Choix d'une base orthonorme { u1, u2 }.


Dans le plan dfini par X0 et Y0, nous pouvons dfinir un premier vecteur norm u1 par : 106

u1 =

On a, en effet : s (X) = || X0 ||

Le projet orthogonal de Y0 sur X0 est Le carr de sa norme est donn par :

X0 et Y0

X0 est orthogonal X0.

Y0

X0

= || Y0 ||

|| X0 || = s (Y) (1 rXY) =

.2

< Y0 | X0 >

= s (Y) s (Y)

On peut donc prendre dans le plan , pour vecteur norm u2 orthogonal u1, le vecteur :
u2 = Y0 X0

Y0

X0

Les vecteurs : u1 = u2 = Y0 X0

forment une base orthonorme du plan dfini par X0 et Y0.

II.1.4. Calcul du projet orthogonal de Z0.


Soit
0

= < Z0 | u1 >

u1 + < Z0 | u2 >

u2

le projet orthogonal de Z0 sur . La premire composante est le projet orthogonal de Z0 sur u1 :


< Z0 | u1 >
u1 = < Z0 |

>

X0

C'est aussi le projet orthogonal de Z0 sur X0. La deuxime composante est le projet orthogonal de Z0 sur u2 :

< Z0 | u2 >

u2 = < Z0 | Y0 X0

Y0

X0 >

107

= = Au total, nous obtenons :

< Z 0 | Y0 > Y0

< Z0 | X0 > X0

Y0

X0

= =

X0 + Cov (X, Z) Y0

Y0

X0 Cov (X, Y) X0 +

X0 +

Y0

X0 +

Y0

Cette expression est symtrique en X et Y. On sait calculer les quantits qui interviennent dans cette expression en fonction des donnes (x0i, y0i, z0i), i [1, n]. On commence par calculer la matrice des variances-covariances :

A=

Formellement, la relation

X0 + Y0 peut se mmoriser comme un "dterminant" :

=0

On a remplac la dernire colonne de la matrice des variances-covariances par

108

II.2. COEFFICIENT DE CORRELATION MULTIPLE.


II.2.1. Dfinition.
Nous connaissons dj les formules donnant les coefficients de corrlation linaire entre deux variables :

rXY =

; rXZ =
0

; rYZ =

Les coefficients de X0 et Y0 dans l'expression de


= =

deviennent :
=

et, en changeant X et Y :
=

En reportant, dans l'expression de 0, les expressions obtenues pour les coefficients, on obtient :
0

= =

X0 +

Y0

Les vecteurs || = s (Y).

et

sont norms pour le produit scalaire de

: || X0 ||

= s (X) et || Y0

= =

+2

rXZ + rXY rYZ 2 rXY rXZ rYZ + rYZ + rXY rXZ 2 rXY rXZ rYZ + 2 rXY (rXZ rYZ rXY

rXZ rXY rYZ + rXY rXZ rYZ) = rXZ + rXY rYZ 2 rXY rXZ rYZ + rYZ + rXY rXZ 2 rXY rXZ rYZ + 2 rXY rXZ rYZ 2 rXY

rXZ 2 rXY rYZ + 2 rXY rXZ rYZ) = rXZ + rXY rXZ 2 rXY rXZ + rYZ + rXY rYZ 2 rXY rYZ 2 rXY rXZ rYZ 2 rXY rXZ

rYZ + 2 rXY rXZ rYZ + 2 rXY rXZ rYZ)

109

= = =

rXZ rXY rXZ + rYZ rXY rYZ 2 rXY rXZ rYZ + 2 rXY rXZ rYZ) rXZ (1 rXY) + rYZ (1 rXY) 2 rXY rXZ rYZ (1 rXY) rXZ + rYZ 2 rXY rXZ rYZ

Le coefficient :
R Z | XY =

s'appelle le coefficient de corrlation linaire multiple de Z en X, Y. La variance du prdicteur de Z est donne par :
s ( ) = ||

||

= R Z | XY s (Z)

a) Validit du prdicteur de Z.
La variance de Z s'crit :
s (Z) = s (Z0) = || Z0 ||

II.2.2. Proprits.

= || Z0

||

= || Z0

||

+ ||

||

Or || Z0 ||

||

est la valeur minimum de la quantit S = || Z0 ||

pour les : || Z0

= S min, c'est la variance "rsiduelle", donc


s (Z) = S min + R Z | XY s (Z)

On retrouve la mme formule de dcomposition de la variance que pour la rgression linaire : la variance de Z est la somme de la variance explique R Z | XY s (Z) par la rgression linaire multiple, et de la variance rsiduelle S min = (1 R Z | XY ) s (Z). Plus le coefficient R Z | XY est proche de 1, plus la part de variance de Z explique par la rgression linaire multiple en X et Y est grande, donc meilleur est le prdicteur linaire 0. La validit du prdicteur 0 est mesure par le coefficient R Z | XY .

b) Calcul pratique du coefficient de corrlation linaire multiple.


En pratique, le calcul du coefficient de corrlation linaire multiple R Z | XY s'effectue de la faon suivante :

110

On calcule la matrice des corrlations de X et Y partir de la matrice VXY =

des donnes (X, Y) rduites :

C XY =

= tVXY D VXY.

On calcule l'inverse de cette matrice des corrlations :


C

La matrice des coefficients de corrlation linaire de X et Y avec Z, peut se calculer

partir de la matrice VXY et de la variable centre rduite VZ =

par la formule :

= tVXY D VZ.

Le coefficient de corrlation linaire multiple R Z | XY est donn par la formule :


R Z | XY = rXZ + rYZ 2 rXY rXZ rYZ

= (rXZ rYZ) C

formule que l'on peut crire directement en fonction des donnes centres rduites :
R Z | XY =
t

VXY D VZ

VXY D VXY

VXY D VZ .

Remarquons, l'usage des dbutants, qu'il ne faudrait pas crire :


t

VXY D VXY

= VXY 1 D

1 t

VXY 1

puisque la matrice VXY, n lignes et 2 colonnes, n'est pas inversible, alors que la matrice produit C = tVXY D VXY, 2 lignes et 2 colonnes, est inversible.

II.2.3. Application : technique de la rgression pas pas.


Pour connatre le rle de chacune des variables explicatives, on calcule les coefficients de dtermination rXZ et rYZ et le coefficient R Z | XY . Chacun de ces coefficients reprsente le pourcentage de variance de Z restitu par le prdicteur correspondant. On conservera, pour prdicteur de Z le modle qui restituera significativement le meilleur rsultat :

111

= c X0 = d Y0 0 = a X0 + b Y 0 .
0 0

La thorie de la rgression multiple que nous venons d'exposer dans le cas de deux variables explicatives peut se gnraliser au cas de p variables explicatives, avec p > 2.

III. 1. ESPACES PROBABILISABLES. III.1.1. Expriences et vnements alatoires.


III.1.1.1. Exprience dterministe.
Si nous mesurons la diffrence de potentiel U qui existe aux bornes d'un circuit rsistif de rsistance R = 10 ohms et dans lequel circule un courant d'intensit i = 2 ampres, le voltmtre indiquera une diffrence de potentiel U = R i = 20 volts. Le rsultat de cette exprience est parfaitement dtermin par la connaissance des paramtres : on dit que l'exprience est dterministe.

III.1.1.2. Exprience alatoire.


Si nous lanons un d dont les faces sont numrotes de 1 6, l'exprience consiste noter le numro de la face suprieure.

112

Le rsultat de l'exprience n'est pas connu a priori : nous disons alors que l'exprience est alatoire. L'ensemble de tous les rsultats possibles pour une exprience alatoire E donne s'appelle le rfrentiel, ou ensemble fondamental, de l'exprience alatoire E. Un lment de l'ensemble fondamental s'appelle un rsultat lmentaire. Nous supposerons, dans un premier temps, que l'ensemble des rsultats lmentaires est un ensemble fini. Dans l'exprience alatoire du jet de d, l'ensemble est l'ensemble {1, 2, 3, 4, 5, 6}. Les rsultats lmentaires sont les nombres entiers 1, 2, 3, 4, 5, 6.

III.1.1.3. Algbre d'vnements.


Etant donne une exprience alatoire E d'ensemble fondamental , nous appelons vnement alatoire, ou vnement, toute partie de . des parties de . Un vnement est donc un lment de l'ensemble

a) Dfinition.
Soit A un ensemble d'vnements. A est une partie de l'ensemble des parties de l'ensemble fondamental de l'exprience alatoire E. Nous dirons que A est une algbre d'vnements de l'exprience alatoire E si A vrifie les proprits suivantes : 1. A. 2. A A A ( dsigne le complmentaire 3. A A et B A A U B A. A de A dans ).

On appelle espace probabilisable tout couple (, A) dans lequel est l'ensemble fondamental d'une exprience alatoire E, A une algbre d'vnements de l'exprience alatoire E.

b) Proprits d'une algbre d'vnements.


Si A est une algbre d'vnements d'une exprience alatoire E d'ensemble fondamental , A possde les proprits suivantes. A1. A. En effet, d'aprs la proprit 2 de la dfinition, le complmentaire d'un lment de A est un lment de A. D'aprs la proprit 1 de la dfinition, est un lment de A. Par la rgle dite rgle de modus ponens, il rsulte de ce qui prcde que le complmentaire de est un lment de A.

113

Or le complmentaire de dans est la partie vide . Donc la partie vide est un lment de A. A2. Toute runion finie d'lments de A est un lment de A. C'est vrai dj, d'aprs la proprit prcdente A1, pour la runion de 0 lment de A, qui est vide. Supposons, hypothse de rcurrence, que la runion de toute famille de n lments de A soit un lment de A, pour un entier n 0. Considrons une famille (Ai)i {1, ... , n + 1} de n + 1 lments de A. D'aprs l'hypothse de rcurrence, la runion A1 U ... U An est un lment de A (cette runion est vide si n = 0). D'aprs la proprit 3 de la dfinition, comme An + 1 et A1 U ... U An sont des lments de A, leur runion A1 U ... U An U An + 1 est aussi un lment de A. La proprit se trouve donc vraie pour n + 1 ds qu'elle est vraie pour n. D'aprs le principe de rcurrence, la proprit est vraie pour tout entier n 0. A3. Toute intersection finie d'lments de A est un lment de A.
Ai =

Si les Ai sont des lments de A, les complmentaires sont des lments de A, d'aprs la proprit 2 de la dfinition. est un lment de A, d'aprs la proprit prcdente A2. Le complmentaire = Ai de cet lment proprit 2 de la dfinition. A4. Evnements lmentaires. Dans une algbre finie d'vnements A, les lments minimaux pour l'inclusion, dans l'ensemble A* des vnements non vides, sont appels les vnements lmentaires de A. Proprit.

de A est un lment de A d'aprs la

Tout vnement est runion des vnements lmentaires qu'il contient.

Les vnements lmentaires contenus dans un vnement non vide forment une partition de cet vnement.

Dmonstration. 1/ Considrons un vnement A A. Soit (Ai)i I la famille des vnements lmentaires de A contenus dans A. Soit B = Ai la runion de cette famille. B est un lment de A (proprit A2), contenu dans A. Soit x un lment de , appartenant A et n'appartenant pas B. La famille des vnements de A contenant x n'est pas vide, elle contient au moins A.

114

Soit X l'intersection de cette famille. X est un lment de A (proprit A3), contenu dans A et non vide, puisqu'il contient x. X est un lment minimal pour l'inclusion dans A*. En effet, si X contenait strictement un autre vnement non vide Y, Y ne contiendrait pas x, puisque X est contenu dans tout vnement contenant x. X I serait alors un lment de A contenant x, donc contenant X, ce qui ne peut pas tre, sinon X serait contenu dans , et serait donc sans point commun avec Y, contredisant le fait que Y est non vide et contenu dans X. Mais si X est un lment minimal, donc un vnement lmentaire, contenu dans A, c'est l'un des Ai. L'lment x qui appartient X appartient ainsi l'un des Ai, donc leur runion B. Ceci contredit notre hypothse de choix de x, lment de , appartenant A et n'appartenant pas B. Il n'existe donc aucun x appartenant A et n'appartenant pas B : c'est que A est gal B. Et A est la runion des vnements lmentaires qu'il contient. 2/ Si A n'est pas vide, il contient au moins un lment x. Comme prcdemment, l'intersection X de la famille des vnements contenant x est un vnement lmentaire contenant x et contenu dans A. Donc la famille des vnements lmentaires contenus dans A n'est pas vide. A chaque lment x de A, on peut ainsi faire correspondre un vnement lmentaire contenant x et contenu dans A. Comme A est fini, la famille F des vnements lmentaires ainsi dfinie est finie. L'intersection de deux vnements lmentaires diffrents est vide, sinon on pourrait trouver un vnement non vide strictement plus petit que les deux autres, ce qui n'est pas possible, s'agissant d'lments minimaux dans A*. On peut alors extraire de la famille F une famille d'vnements lmentaires distincts, et tout vnement lmentaire contenu dans A est un lment de cette famille extraite. D'aprs ce qui prcde, A est runion de cette famille : celle-ci forme donc une partition de A. En particulier, est runion des vnements lmentaires de A, puisque c'est un vnement de A qui contient tous les vnements lmentaires de A.

c) Exemples.
1. Algbre grossire d'vnements. A = {, } est une algbre d'vnements, appele l'algbre grossire des vnements.

En effet, les trois axiomes de la dfinition sont trivialement vrifis, compte tenu des relations :
U = , U = , U = , = , = .

Il y a un seul vnement lmentaire, .

115

2. Algbre de Bernoulli d'vnements.


Si A est un vnement non vide, A = {, A, , } est une algbre d'vnements qu'on appelle une algbre de Bernoulli d'vnements. En effet, est un lment de A, par dfinition. La runion de deux lments de A est un lment de A : U = U A = A U = U = U = U = U = A U = U A = A. A U A = A U = U A = A A. U = U = U = A. U = A. Le complmentaire d'un lment de A est un lment de A. = A. A. = A A. = A. Les vnements lmentaires sont A et . Toute algbre d'vnements possdant l'vnement A comme lment contient cette algbre de Bernoulli d'vnements. Cette algbre de Bernoulli d'vnements contenant A est donc la plus petite algbre d'vnements contenant A. On l'appelle l'algbre d'vnements engendre par A.

3. Ensemble des parties de l'ensemble fondamental.


L'ensemble des parties de est une algbre d'vnements. En effet, est une partie de (appele la partie pleine). La runion de deux parties de est une partie de . Le complmentaire d'une partie de est une partie de . Les vnements lmentaires sont les parties de rduites un seul lment de .
Exemple : dans l'exprience alatoire du jet de d, les vnements lmentaires sont {1}, {2}, {3}, {4}, {5}, {6}.

Tout vnement est runion des vnements lmentaires qu'il contient.


Exemple : dans l'exprience alatoire du jet de d, l'vnement "le rsultat du lancer est un nombre pair" est {2, 4, 6} = {2} U {4} U {6}.

116

d) Algbre d'vnements engendre par une partition.


Une partition finie (Ai)i {1, ... , n} de ne peut constituer, en elle-mme, une algbre d'vnements. En effet, la runion de deux lments distincts d'une partition n'est jamais un lment de la partition, puisque deux lments distincts d'une partition sont sans point commun. Par ailleurs, la partie vide est un lment de toute algbre d'vnements et aucun lment d'une partition n'est vide. Par contre, les runions de famille sont des vnements et les runions Ai des familles d'lments de la partition, pour tous les I ([1, n]), forment une algbre d'vnements, qu'on appelle l'algbre d'vnements engendre par la partition. Les vnements lmentaires de l'algbre engendre par la partition (Ai)i {1, ... , n} sont constitus des vnements (Ai)i {1, ... , n} de la partition. Toute algbre d'vnements est engendre par ses vnements lmentaires : en effet, tous les vnements de l'agbre d'vnements sont runions des vnements lmentaires qu'ils contiennent.

Exemple :
Etant donns deux vnements A et B, les vnements A I B, A I , I B, I , s'ils ne sont pas vides, forment une partition de et engendrent une algbre d'vnements, forme des runions des 2 4 = 16 familles possibles de ces vnements, et dont les vnements lmentaires sont A I B, A I , I B, I .

III. 2. PROBABILITES. III.2.1. Dfinition.


Soit (, A) un espace probabilisable dont l'ensemble fondamental est fini, de cardinal N. On appelle probabilit sur cet espace probabilisable, toute application P de A dans l'intervalle [0, 1] de , qui vrifie les deux proprits suivantes : P1. P () = 1 P2. A I B = P (A U B) = P (A) + P (B) La proprit P2 s'appelle l'axiome des probabilits totales. Lorsque deux vnements A et B ont une intersection vide, on dit qu'ils sont incompatibles. Par une rcurrence immdiate, on voit que l'axiome des probabilits totales peut se gnraliser n'importe quelle famille finie (Ai)i {1, ... , n} d'vnements incompatibles deux deux, c'est-dire vrifiant l'axiome : ( i)( j)(i [1, n] et j [1, n] et i j Ai I Aj = ).

Ai

P(Ai)

117

On appelle espace probabilis tout triplet (, A, P) dans lequel (, A) est un espace probabilisable et P une probabilit sur cet espace probabilisable.

III.2.2. Proprits.
III.2.2.1. Evnements contraires.
Deux vnements sont dits contraires s'ils sont complmentaires l'un de l'autre. Pour tout vnement A, A et sont des vnements contraires. A I = P (A U ) = P (A) + P ( ) A U = P () = P (A) + P ( ) P () = 1 P (A) + P ( ) = 1
P (A) + P ( ) = 1

III.2.2.2. Evnement impossible.


Un vnement est dit impossible si sa probabilit est nulle. La partie vide est un vnement impossible. La proprit prcdente donne, pour A = , P () + P () = 1. P () = 1 P () = 0.
P () = 0

III.2.2.3. Croissance.
Si l'vnement A est contenu dans l'vnement B, alors P (A) est infrieure ou gale P (B).
A B P (A) P (B)

En effet : ABAIB=A A I B = A B = (B I A) U (B I ) = A U (B I ), A I (B I ) = P (B) = P (A I (B I )) = P (A) + P (B I ) P (B I ) [0, 1] et P (B) = P (A) + P (B I ) P (B) P (A) En dfinitive, on obtient bien : A B P (A) P (B). Toute probabilit est une application croissante.

III.2.2.4. Probabilit d'une runion.


A U B = A U (B I ) A I (B I ) = P (A U B) = P (A U (B I )) = P (A) + P (B I ) P (B I ) = P (A U B) P (A) B = (B I A) U (B I ) (B I A) I (B I ) = P (B) = P ((B I A) U (B I )) = P (B I A) + P (B I ) P (B I ) = P (B) P (B I A) = P (B) P (A I B) P (A U B) P (A) = P (B) P (A I B) P (A U B) = P (A) + P (B) P (A I B)

118

Gnralisation : formule de Poincar.


La formule prcdente se gnralise la runion d'une famille (Ai)i {1, ... , n} de n vnements, lments de A. On intersecte les vnements distincts par 1, par 2, par 3, etc., en alternant les signes :

Ai

P(Ai)

P (Ai I Aj) + ... + (1) n P (A1 I ... I An)

Cette formule est appele la formule de Poincar.

III.2.2.5. Evnements lmentaires quiprobables dans P ().


Soit l'ensemble fondamental, suppos fini de cardinal N, associ une preuve alatoire E, P () l'algbre d'vnements des parties de . Une probabilit P sur l'espace probabilisable (, P ()) peut se dfinir en associant chaque vnement lmentaire {i}, i , un nombre rel pi, avec :
pi = P ({i}) (qu'on note aussi P (i)).

( i)(i [1, N ] N pi [ 0, 1 ] R) [les pi sont des nombres rels compris entre 0 et 1].

pi =

P ({i}) = P (

{i}) = P () = 1 [la somme des pi est gale 1].

Comme chaque vnement est runion des vnements lmentaires qu'il contient, la probabilit d'un vnement A est donne par :
P (A) = P (

{ }) =

P ({ })

Un cas particulier important est celui o tous les vnements lmentaires ont la mme probabilit p. La relation pi = 1 s'crit N p = 1, soit p = . La probabilit d'un vnement A qui est ralis dans n vnements lmentaires est alors donne par :
P (A) = P ({ }) = Card (A)

La probabilit d'un vnement A est le rapport entre le nombre de cas favorables n et le nombre de cas possibles N.
P (A) =

119

III.3. PROBABILITES CONDITIONNELLES. INDEPENDANCE. III.3.1. Dfinition.


Soit (, A, P) un espace probabilis ( fini). Soit B A, un vnement de probabilit diffrente de 0 : P (B) 0. Soit A A, un vnement. On appelle probabilit conditionnelle de A sachant que B est ralis, ou probabilit conditionne de A par B, le nombre rel :
P (A | B) =

L'application A En effet :

P (A | B) de A dans R dfinit une probabilit sur (, A).

a) Comme P est une probabilit, ses valeurs sont positives et comprises entre 0 et 1, donc, pour tout A A, P (A | B) est positif. b) Comme A I B est contenu dans B et que l'application P est croissante, P (A I B) est infrieur ou gal P (B), donc le rapport c) P ( | B) = = = 1. est infrieur ou gal 1.

d) Soient A1 et A2 deux vnements incompatibles (A1 I A2 = ).


P ((A1 U A2) | B) = = (A1 I B) I (A2 I B) A1 I A2 = (A1 I B) I (A2 I B) = (A1 I B) I (A2 I B) = P ((A1 I B) U (A2 I B)) = P (A1 I B) + P (A2 I B) P ((A1 U A2) | B) = + P ((A1 U A2) | B) = P (A1 | B) + P (A2 | B).

III.3.2. Indpendance.
III.3.2.1. Dfinition.
La relation P (A | B) = peut tre crite :
P (A I B) = P (A | B) P (B)

Si la probabilit de A n'est pas nulle, on peut crire aussi :


P (A I B) = P (B I A) = P (B | A) P (A)

Deux vnements A et B sont dits indpendants en probabilit, ou, simplement, indpendants, s'ils vrifient la relation :

120

P (A I B) = P (A) P (B)

Pour des vnements de probabilit non nulle, les proprits suivantes sont quivalentes : A et B sont indpendants. P (A I B) = P (A) P (B). P (A | B) = P (A). P (B | A) = P (B). L'information donne par la ralisation de A sur la ralisation de B est nulle et l'information donne par la ralisation de B sur la ralisation de A est nulle.

Extension de la dfinition d'une probabilit conditionnelle.


La dfinition de la probabilit conditionnelle de A lorsque B est ralis, peut s'tendre au cas o la probabilit de B est nulle. Si P (B) = 0, B est indpendant de tout vnement A, et tout vnement A est indpendant de B, puisque P (A I B) = P (A) P (B). Nous dirons, dans ce cas, que P (A | B) = P (A), par dfinition. D'o la nouvelle dfinition : Etant donns deux vnements A et B, on appelle probabilit conditionnelle de A sachant que B est ralis, ou probabilit conditionne de A par B, le nombre rel :

P (A | B) =

Cette extension de la dfinition permet d'crire la formule :


P (A I B) = P (B) P (A | B) = P (A) P (B | A)

dans tous les cas.

Remarque.
Il convient de ne pas confondre indpendance et incompatibilit. L'indpendance est une question de probabilit : si on change la probabilit, deux vnements prcdemment indpendants peuvent ne plus tre indpendants. L'incompatibilit ne fait pas intervenir la probabilit : une intersection vide reste vide quelque soit la probabilit.

III.3.2.2. Gnralisation.
La formule
P (A I B) = P (A) P (B | A)

peut tre gnralise.


P (A I B I C) = P (A) P (B | A) P (C | A I B)

En effet, on peut crire successivement :


P (A I B I C) = P (C I (A I B)) = P (A I B) P (C | A I B) = P (A) P (B | A) P (C | A I B).

Nous dirons que les trois vnements A, B, C sont indpendants dans leur ensemble si, et seulement si, les quatre relations suivantes sont vrifies :

121

P (A I B I C) = P (A) P (B) P (C) P (A I B) = P (A) P (B) P (B I C) = P (B) P (C) P (C I A) = P (C) P (A) Plus gnralement, nous dirons que n vnements (Ai)i {1, ... , n} sont indpendants dans leur ensemble si, et seulement si, pour toute partie I de l'ensemble {1, ... , n}, la relation suivante est vrifie :

Ai

P (Ai)

Dans le cas o I est vide, l'intersection d'une famille vide est vide, et il faut prendre 0 pour produit d'une famille vide.

III.3.3. Formule de Bayes.


III.3.3.1. La formule sous sa forme gnrale.
Dans un espace probabilis (, A, P), on appelle systme complet d'vnements toute partition finie de par des lments de A. Soit (Bi)i {1, ... , n} un systme complet d'vnements. Alors, pour tout vnement A de probabilit non nulle, et pour tout indice i {1, ... , n}, on a la formule de Bayes :
P (Bi | A) =

Dmonstration. Comme (Bi)i {1, ... , n} est une partition de , on a =


A=AI=AI Bi

Bi et :
= (A I Bi)

Comme les Bi sont deux deux incompatibles, les A I Bi, qui sont contenus dans les Bi d'indices correspondants, sont eux aussi, deux deux incompatibles. La probabilit de leur runion est donc la somme de leurs probabilits :
P (A) = P (A I Bi) = P (A | Bi) P (Bi) = P (A | B1) P (B1) + ... + P (A | Bn) P (Bn)

La formule P (A I Bi) = P (A | Bi) P (Bi) = P (Bi | A) P (A) s'crit alors :


P (Bi | A) [P (A | B1) P (B1) + ... + P (A | Bn) P (Bn)] = P (A | Bi) P (Bi)

et si la probabilit de A n'est pas nulle, c'est--dire si l'un au moins des P (A | Bj) P (Bj) n'est pas nul, la formule de Bayes s'en dduit.

III.3.3.2. Cas particulier.


Pour tout vnement non vide B, B et forment une partition de W. Dans ce cas, la formule de Bayes se rduit :

122

P (B | A) =

III.3.3.3. Exemple.
On prend un d au hasard parmi un lot de 100 ds dont on sait que 25 d'entre eux sont pips. Pour un d pip, la probabilit d'obtenir un 6 est 0,5. On lance le d choisi, on obtient 6 : quelle est la probabilit pour que le d choisi soit pip ? Appelons T l'vnement "le d est pip", S l'vnement "on obtient un 6". T et forment un systme complet d'vnements. La formule de Bayes donne :

P (T | S) =

Remarque.
La formule de Bayes s'applique dans le cas d'une exprience alatoire o le hasard intervient deux reprises : une premire fois dans le choix du d, une deuxime fois dans le rsultat du lancer. Un rsultat li au premier niveau de hasard est appel une "cause". Un rsultat li au deuxime niveau de hasard est appel une "consquence". Dans le cas prsent, on a calcul la probabilit que le d soit pip (la cause), sachant que nous avons obtenu les 6 (la consquence). C'est pourquoi la formule de Bayes est aussi appele la formule de probabilit des causes. Les donnes du problme peuvent tre prsentes sous forme d'un tableau des probabilits, compte tenu de la formule P (A I B) = P (B) P (A | B) :
D pip = T 6=S non 6 =
Total P (S I T) = P (T) P (S | T) = P ( I T) P (T) =

D non pip =
P (S I ) = P ( ) P( I ) P( )

Total P (S) P( ) P ()

Ces donnes suffisent pour remplir le tableau, par somme ou diffrence :


T S Total

= 1
S T

= = =
Total

+ 1 1

= =

Total

Total

123

Ce tableau de probabilits conjointes remplace la formule de Bayes et permet de rpondre toutes les questions qu'on se pose sur les probabilits conditionnelles : pour calculer P (T | S), on regarde dans la ligne de S, combien il y a de T I S .

P (T | S) =

III. 4. VARIABLES ALEATOIRES DISCRETES. III.4.1. Dfinition.


Soit (, A) un espace probabilisable associ une preuve alatoire E. Soit X une application de dans R. Nous dirons que X est une variable alatoire relle lie E si, et seulement si, pour tout rel x, l'image rciproque X 1 (] , x] ) est un lment de A. Si X () est une partie dnombrable de R, nous dirons que X est une variable alatoire discrte. Une variable alatoire discrte sera dite finie ou infinie suivant que l'ensemble de ses valeurs est fini ou infini. Rciproquement, considrons l'ensemble fondamental associ une preuve alatoire E. Soit R l'ensemble des nombres rels. Considrons une application X : R. On note X () l'ensemble des valeurs de X, qu'on suppose dnombrable. A toute partie B de R, on peut associer la partie X 1 (B) de , qui est l'ensemble, ventuellement vide, des pour lesquels X () est un lment de B. L'ensemble des parties X 1 (B) de , pour les partie B de R, forme une algbre d'vnements A. En effet : 1/ X 1 (R) = , donc A. 2/ Soit A A. Il existe une partie B de R telle que A = X 1 (B). A X () B X () X 1 ( ). La relation = X 1 ( ) entrane A. 3/ Soient A et A' des lments de A. Il existe des parties B et B' de R telles que l'on ait A = X 1 (B) et A' = X 1 (B'). X 1 (B U B') X () B U B' X () B ou X () B' X 1 (B) ou X 1 124

(B') X 1 (B U B') La relation X 1 (B U B') = X 1 (B) U X 1 (B) entrane A U A' A. Comme l'application B X 1 (B) est croissante, les vnements lmentaires de cette algbre d'vnements sont les images rciproques des valeurs xk de X. Toute application X dfinie sur et valeurs dans R permet donc de dfinir un espace probabilisable (, A), sur lequel X est une variable alatoire relle.

III.4.2. Exemple.
Soit l'ensemble fondamental associ une preuve alatoire E. Soit A une partie de . On appelle variable indicatrice de Bernoulli de A, la variable alatoire 1A dfinie, pour tout lment de , par :
1A () =

Cette variable alatoire n'a que deux valeurs : 0 et 1. Les vnements lmentaires de l'algbre d'vnements qu'elle dfinit sont : 1A 1 (1) = A 1A 1 (0) = L'algbre d'vnements dfinie par la variable indicatrice de Bernoulli de A est donc l'algbre de Bernoulli A forme des lments {, A, , } de P () et l'espace probabilisable associ est (, A).

III.4.3. Loi de probabilit d'une variable alatoire.


III.4.3.1. Dfinition.
Soit (, A, P) un espace probabilis, et X une variable alatoire discrte. Soit (xk)k I l'ensemble des valeurs de X. Soit Ak l'vnement lmentaire de A dfini par la valeur xk : Ak = { | X () = xk} = X 1 ({xk}) A. On note PX l'application R [0, 1] dfinie par :
PX (x) = P (X 1 ({x}))

Comme les valeurs de X sont les (xk)k I, X 1 ({x}) est vide lorsque x n'est pas l'un des (xk)k I et sa probabilit est nulle. Lorsque x = xk, pour un k I, on obtient :
PX (xk) = P (X 1 ({xk})) = P (Ak) = P () = P ()

Le nombre pk = PX (xk) = P () est souvent not, par abus d'criture, P (X = xk), ou P (xk). On dit que pk est la probabilit de la valeur xk de X. 125

L'ensemble des couples (xk, pk)k I est appel la loi de probabilit de la variable alatoire X.

III.4.3.2. Proprits.
a) Pour tout k I, pk [0, 1]. En effet, pk = P (X = xk) = P (Ak), et les valeurs de P sont des nombres rels compris entre 0 et 1.

b)

pk = 1.

En effet, les Ak, k I, sont les vnements lmentaires de l'algbre d'vnements A, donc ils sont incompatibles deux deux et leur runion est :
Ak = X 1 ({xk}) = X 1 (

{xk}) = X 1 (X ()) =

de sorte que l'on a :


pk = P (Ak) = P Ak

= P () = 1.

III.4.3.3.3. Exemple.
Considrons la variable indicatrice de Bernoulli 1A d'un vnement A. Notons p la probabilit de ralisation de l'vnement A, et q = 1 p. Nous avons, par dfinition :
1A () =

donc : p = P (A) = P (1A 1 (1)) = P (1A = 1) = P (1) = P (1). q = 1 P (A) = P( ) = P (1A 1 (0)) = P (1A = 0) = P (0) = P (0). La loi de probabilit de la variable indicatrice 1A est donc donne par le tableau :
xk pk

0 q

1 p

avec p + q = 1.

III.4.4. Fonction de rpartition.


III.4.4.1. Dfinition.
On appelle fonction de rpartition d'une variable alatoire X l'application F : R R dfinie par :

F (x) = P (X x) =

P (X = xk) =

pk.

126

III.4.4.2. Proprit.
Comme les pk sont des nombres positifs, la fonction de rpartition est une application croissante, dont toutes les valeurs sont positives. pk des pk est gale 1, F (x) crot de 0 1 lorsque x varie de +. Comme la somme Lorsque x atteint une valeur xk par valeurs infrieures, F (x) augmente brusquement de pk et reste constante sur l'intervalle [xk, xk + 1[. C'est une fonction en escalier, continue droite :

III.4.4.3. Exemple.
La variable indicatrice de Bernoulli d'un vnement A a pour fonction de rpartition :

F (x) =

III.4.5. Esprance mathmatique.


On appelle esprance mathmatique (ou moyenne) d'une variable alatoire X le nombre, quand il existe :

E (X) =

p k xk

Exemple : esprance mathmatique de la variable indicatrice de Bernoulli d'un vnement A.


E (1A) = q 0 + p 1 = p = P (A).

127

III.4.5.1. Proprits.

a) Esprance mathmatique d'une constante.


Si la variable alatoire X n'a qu'une seule valeur X = a, on a P (X = a) = 1 et E (X) = a P (X = a) = a.
E (a) = a

b) Linarit.
Soient X une variable alatoire relle discrte, a et b des constantes. La variable alatoire Z = a X + b prend les valeurs zk = a xk + b avec les probabilits :
P (Z = zk) = P (X = xk)

E (Z) =

P (X = xk) (a xk + b) P (X = xk) xk + b P (X = xk) = a E (X) + b


E (a X + b) = a E (X) + b

E (Z) = E (Z) = a D'o le rsultat :

Plus gnralement, nous admettrons que, pour deux variables alatoires X et Y, et deux constantes a et b, nous avons :
E (a X + b Y) = a E (X) + b E (Y)

III.4.5.2. Gnralisation.
Si est une application de R dans R, o X est une variable alatoire qu'on note (X). L'esprance mathmatique, ou moyenne, de (X) est (rsultat admis) :
E ( (X)) = pk (xk)

III.4.5.3. Moments.
Pour tout entier n, l'esprance mathmatique E (X n) s'appelle le moment d'ordre n de X, on le note mn.

mn = E (X n) =

p k xk n

128

m0 = m1 = m2 =

pk = 1 pk xk = E (X) pk xk 2 = E (X 2)

III.4.5.4. Moments centrs.


Pour tout entier n, l'esprance mathmatique E ((X E (X)) n) s'appelle le moment centr d'ordre n de X, on le note n.

n = E ((X E (X)) n) =

pk (xk E (X)) n

0 = 1 = 2 =

pk = 1 pk (xk E (X)) = E (X) E (X) = 0 pk (xk E (X)) 2

III.4.6. Variance.
Le moment centr d'ordre 2 s'appelle la variance. On note Var (X) la variance de X.
pk (xk E (X)) 2

Var (X) =

En dveloppant le carr, on obtient :

Var (X) = = =

pk (xk 2 + (E (X)) 2 2 xk E (X)) pk (E (X)) 2 2 pk xk E (X)

pk xk 2 +

pk xk 2 (E (X)) 2
Var (X) = E (X 2) (E (X)) 2 = m2 m1 2

La formule Var (X) = E (X 2) (E (X)) 2 est connue sous le nom de formule de la variance, ou formule de Koenig. Elle indique que la variance est la moyenne du carr, moins le carr de la moyenne. La racine carre de la variance s'appelle l'cart-type. On (X) ou X l'cart-type de X.
X =

129

Proprit.
Var (a X + b) = a Var (X)

En effet
Var (a X + b) = E ((a X + b E (a X + b)) ) = E ((a X + b a E (X) b)) ) = E (a (X E (X)) ) = a E ((X E (X)) ) = a Var (X)

Exemple.
Le moment d'ordre 2 de la variable indicatrice de Bernoulli d'un vnement A de probabilit p est :
m2 = E (X 2) = q 0 + p 1 = p

La variance est :

III.4.7. Fonction gnratrice.


III.4.7.1. Dfinition.
Pour une variable alatoire discrte X, valeurs entires, on appelle fonction gnratrice l'application gX de R dans R qui, un nombre rel u fait correspondre l'esprance mathmatique de la variable alatoire u X :

Var (X) = m2 m1 = p p = p (1 p) = p q.

gX (u) = E (u X) =

pk u k = p0 + p1 u + p2 u 2 + ...

III.4.7.2. Proprits.

a) Condition de normalisation. b) Esprance mathmatique et variance.


La drive de gX (u) s'obtient en drivant terme terme :
=
k pk u k 1 = k pk u k = E (X u X) gX (1) = pk = 1

Pour u = 1, cette drive prend la valeur :


= E (X) E (X) = g'X (1)

La drive seconde s'obtient en drivant la drive premire :

130

k (k 1) pk u k 2 =

k (k 1) pk u k =

E (X (X 1) u X)

Pour u = 1, cette drive seconde prend la valeur :


= E (X (X 1)) = E (X ) E (X)

On en dduit :
E (X ) =

+ E ( X) = + = g"X (1) + g'X (1) Var (X) = E (X ) (E (X)) = g"X (1) + g'X (1) (g'X (1)) Var (X) = g"X (1) + g'X (1) (g'X (1)) Var (X) = E (X (X 1)) + E (X) (E (X))

c) Probabilits.
P (X = k) = pk est le coefficient de u k dans le dveloppement de gX (u) au voisinage de 0. D'aprs la formule de Taylor, ce coefficient est gal
P (X = k) = pk =

III.4.7.3. Exemple.
La fonction gnratrice de la variable indicatrice de Bernoulli d'un vnement A de probabilit p est :
gX (u) = E (u X) = q + p u

On a bien gX (1) = q + p = 1. L'esprance mathmatique est E (X) = g'X (1) = p. La variance est Var (X) = g"X (1) + g'X (1) (g'X (1)) = 0 + p p = p (1 p) = p q.

131

III. 5. LOIS DISCRETES FINIES USUELLES. III.5.1. Loi de Bernoulli.


III.5.1.1. Dfinition.
On dit qu'une variable alatoire X est une variable de Bernoulli de paramtre p si sa loi de probabilit est :
xk pk

0 q

1 p

avec p + q = 1. Cette loi est note B (1 ; p) et on note X Bernoulli de paramtre p".

B (1 ; p) la relation "X suit la loi de

III.5.1.2. Proprits.
Si X B (1 ; p) : E (X) = p Var (X) = p q gX (u) = q + p u

III.5.2. Loi uniforme.


III.5.2.1. Dfinition.
On dit qu'une variable alatoire X suit une loi uniforme sur {x1, ... , xn} si sa loi de probabilit est : pk = P (X = xk) = , k = 1, ... , n.
xk pk x1

... xn ...

III.5.2.2. Proprits.
Si X suit une loi uniforme sur {x1, ... , xn} :

E ( X) = Var (X) =

xk xk xk

III.5.2.3. Cas particulier.


Si X suit une loi uniforme sur {1, ... , n} (relation note X
k=

U [1, n] ), les relations :

et

k=

entranent : 132

E (X) = Var (X) = gX (u) = uk = = . = =

(1 + u + ... + u n 1) =

III.5.3. Loi binomiale.


III.5.3.1. Dfinition.
On dit qu'une variable alatoire X suit une loi binomiale de paramtres n et p (relation note X B (n ; p)) si sa loi de probabilit est donne par :
P (X = k) = p k q n k, k = 0, ... , n.

avec p + q = 1, et o

est le coefficient binomial d'indices n et k. , on utilise parfois l'ancienne notation C .

Pour le coefficient binomial

III.5.3.2. Proprits.
gX (u) = pk qnk uk = (p u) k q n k = (p u + q) n (formule du binme) = n p car q + p = 1. n (n 1) p (q + p u) n 2 + n p n p = n p ((n

E (X) = g'X (1) = n p (q + p u) n 1 Var (X) = g"X (1) + g'X (1) (g'X (1)) = 1) p + 1 n p) = n p q.

III.5.3.3. Interprtation.
Pour n = 1, B (1 ; p) est la loi de Bernoulli. Soit E l'preuve alatoire consistant en n rptitions indpendantes d'une preuve de Bernoulli, E1, ... , En, de mme paramtre p. Soit X le nombre de succs obtenus. Les valeurs de X vont de 0 n. La loi de probabilit de X est une loi binomiale de paramtres n et p. En effet, une preuve de Bernoulli admet deux rsultats possibles : l'chec, not 0, de probabilit q, et le succs, not 1, de probabilit p, avec p + q = 1. Si E est l'preuve alatoire consistant en n rptitions indpendantes E1, ... , En, d'une preuve de Bernoulli de paramtre p, un rsultat possible de E est une suite de n nombres 0 ou 1, indiquant le rsultat de chaque preuve de Bernoulli. Comme les preuves sont indpendantes, les probabilits se multiplient et la probabilit d'un rsultat particulier comportant k succs et (n k) checs est p k q n k. Le nombre de rsultats possibles comportant k succs et (n k) checs est gal au nombre de choix possibles de la position des k succs, reprsents par des 1, dans la suite des n rsultats :

133

c'est le nombre des combinaisons des n places, k k, soit

. p k q n k.

La probabilit d'avoir k succs, dans aussi (n k) checs, est donc donne par

En pratique, toute variable binomiale de paramtre n et p, peut toujours s'interprter comme le nombre de succs dans une rptition indpendante n fois d'une preuve de Bernoulli de paramtre p. Remarquons aussi que si l'on note X1, ... , Xn, les variables de Bernoulli associes aux preuves de Bernoulli indpendantes successives E1, ... , En, le nombre de succs X est la somme X1 + ... + Xn. Une variable binomiale de paramtres n et p est somme de n variables de Bernoulli indpendantes de paramtre p. Chaque variable de Bernoulli a, pour fonction gnratrice, (q + p u). On a alors le rsultat :
(q + p u) n = g (u) = g (u) ... g (u)

Cette proprit caractrise les variables alatoires dites indpendantes : deux variables alatoires valeurs entires sont indpendantes si, et seulement si, la fonction gnratrice de leur somme est le produit de leurs fonctions gnratrices.

III.5.3.4. Exemple : tirage avec remise.


Considrons une urne contenant N boules, dont n1 boules blanches et n2 boules noires, avec N = n1 + n2. On tire une boule au hasard dans l'urne, on note sa couleur et on la remet dans l'urne (c'est ce qu'on appelle un tirage non exhaustif). Si la boule est blanche, c'est le succs, not 1, de probabilit p = .

Si elle est noire, c'est l'chec, not 0, de probabilit q = . On effectue ainsi n tirages successifs avec remise. Au bout de n tirages, la probabilit d'avoir tir k fois une boule blanche est donne par la loi binomiale :
P (X = k) = p k q n k,

o p est la proportion de boules blanches et q la proportion de boules noires. Le modle de l'urne avec tirages non exhaustifs peut tre utilis chaque fois que le paramtre p de la loi binomiale est un nombre rationnel.

III.5.3.5. Loi des frquences.


Soit X une variable binomiale de paramtres n et p. Considrons la variable F = Nous avons : , qu'on appelle la variable frquence.

E (F) = E Var (F) = Var

= =

E (X) = Var (X) =

n p = p. npq=

134

III.5.3.6. Tendance vers la loi de Poisson.


Soit Xn une variable binomiale de paramtres n et pn. Supposons que, lorsque n augmente indfiniment, le paramtre pn soit tel que la limite de n pn soit un nombre rel positif . Alors, pour tout k fix, dans l'expression de la probabilit :
P (Xn = k) = pn k (1 pn) n k

n (n 1) ... (n k) est quivalent n k. n (n 1) ... (n k) pn k est quivalent (n pn) k, qui tend vers k. (1 pn) n k a pour logarithme (n k) ln (1 pn) (n k) pn n pn = . Donc (1 pn) n k tend vers e . Finalement, P (Xn = k) tend vers e .

Une variable alatoire prenant des valeurs entires k avec les probabilits P (X = k) = e , s'appelle une variable de Poisson de paramtre . Sa loi de probabilit s'appelle loi de Poisson de paramtre . X P. La loi de Poisson est aussi appele la loi des phnomnes rares. On l'obtient toujours comme approximation d'une loi binomiale lorsque p devient trs petit avec une esprance n p qui tend vers une constante strictement positive .

III.5.4. Loi hypergomtrique.


III.5.4.1. Dfinition.
On dit qu'une variable alatoire X suit une loi hypergomtrique de paramtres N, n, p, si, et seulement si : 1/ X prend un certain nombre de valeurs entires formant un intervalle X () contenu dans l'intervalle [ 0 ; n ] ; 2/ N p est un entier, not N1 ; on note alors N2 l'entier N N1.

3/ Pour tout entier k appartenant X (), P (X = k) =

. H (N, n, p).

La relation "X suit une loi hypergomtrique de paramtres N, n, p" s'crit : X

III.5.4.2. Interprtation : tirage sans remise.


Dans une urne contenant N boules dont N1 blanches et N2 noires, on tire au hasard n boules, sans remise (tirage exhaustif). On note X le nombre de boules blanches tires : X est une variable alatoire dont les valeurs sont comprises entre 0 et n. La valeur maximum de X est le plus petit des deux nombres entiers n et N1 : on peut tirer jusqu' n boules blanches si n est plus petit que N1, sinon on ne peut tirer qu'au plus N1 boules blanches lorsque N1 est plus petit que n. La valeur minimum de X est le plus grand des deux entiers relatifs 0 et n N2 : on peut tirer 0

135

boule blanche si n est infrieur au nombre N2 de boules noires, sinon on tire au minimum n N2 boules blanches lorsque le nombre de boules tires n est suprieur au nombre de boules noires N2.
X () = [ Max (0, n N2) ; Min (n, N1) ].

Le nombre de tirages possibles de n boules parmi N est le coefficient binomial quiprobables. Pour un entier k appartenant X (), il y a

: ils sont

faons de choisir k boules blanches parmi les faons

N1 boules blanches et, pour chaque choix de k boules blanches parmi les N1, il y a de choisir les n k boules noires compltant le tirage. Le nombre de tirages de n boules contenant k boules noires est donc d'avoir X = k est donne par le rapport :

et la probabilit

P (X = k) =

donc X suit une loi hypergomtrique de paramtres N, n, p =

Remarquons que l'galit P (X = k) =

est valable, en fait, pour tout k [ 0 ; n ], et est nul et la

puisqu'en dehors de l'intervalle X (), l'un des coefficients binomiaux probabilit correspondante est nulle. On peut donc crire :

P (X = k) = 1

soit :

Cette galit est appele l'identit de Vandermonde.

136

III.5.4.3. Proprits.

a) Moyenne.
E (X) = k= k k=

Dans la somme, le terme correspondant k = 0 est nul. D'autre part, pour k diffrent de 0,
k

= N1
k

= N1 = N1 .

= N1

D'o :
E (X) = N1

L'identit de Vandermonde donne, en posant h = k 1, .


E (X) = N1

N1 E (X) = n p.

= n p.

b) Variance.
La variance peut se calculer par la formule :
Var (X) = E (X (X 1)) + E (X) (E (X)) .

E (X (X 1)) =

k (k 1) =

k (k 1).

Or on a, pour k > 0 :
k

= N1

et, pour k > 1 :

137

(k 1)
k (k 1)

= (N1 1) = N1 (N1 1)

= N1 (k 1)

Comme les termes correspondant k = 0 et k = 1, dans la somme nuls, il reste :


E (X (X 1)) = N1 (N1 1)

k (k 1), sont

N1 (N1 1)

L'identit de Vandermonde, applique avec h = k 2, donne :


= =

E (X (X 1)) =

N1 (N1 1)

N1 (N1 1)

= n (n 1)

Var (X) = n (n 1) = n (n 1) =n =n + N2 1) =n =n =n =n =n =n avec q = 1 p = (n 1) +n

+n

n 1n

+1n (n 1) (N1 1)(N1 + N2) + (N1 + N2 1)(N1 + N2) n N1 (N1

(N1 + N2)((n 1) (N1 1) + N1 + N2 1 n N1) + n N1 (N1 + N2)(n N1 n N1 + 1 + N1 + N2 1 n N1) + n N1 (N1 + N2)(N2 n) + n N1 (N2(N2 n) + N1 (N2 n) + n N1 (N2(N1 + N2 n) =npq et N = N1 + N2.
Var (X) = n p q

138

c) Tendance vers la loi binomiale.


Lorsqu'on compare les rsultats obtenus pour la loi hypergomtrique de paramtres N, n, p, et pour la loi binomiale de paramtres n et p, on constate que : 1/ Que les tirages soient effectus avec ou sans remise, l'esprance mathmatique du nombre de boules blanches est la mme, c'est n p, qui ne dpend pas de N. est appel rapport d'exhaustivit. Il est compris entre 2/ La variance change : le rapport 0 et 1. Autrement dit, la variable hypergomtrique est moins disperse que la variable binomiale. 3/ Lorsque N augmente indfiniment avec une proportion p = blanches constante, le rapport : = de boules

est quivalent :
=
pk qnk

On voit donc que la loi hypergomtrique tend vers la loi binomiale, lorsque le nombre de boules augmente indfiniment dans l'urne en gardant une proportion constante de boules blanches.

139

III. 6. VARIABLES ALEATOIRES ABSOLUMENT CONTINUES. III.6.1. Dfinitions.


Soit (, A, P) un espace probabilis associ une preuve alatoire E. Nous tudions, dans cette section, des variables alatoires sur (, A, P) susceptibles de prendre n'importe quelle valeur dans un intervalle rel, ou dans une runion finie d'intervalles de longueurs non nulles et pour lesquelles la probabilit de prendre une valeur particulire fixe l'avance est toujours nulle :
P (X = x) = 0, pour tout x de R.

La fonction de rpartition x

F (x) = P (X x) est alors continue.

III.6.1.1. Densit de probabilit.

a) Dfinition.
On appelle densit de probabilit sur R, toute application f : R R vrifiant : 1/ f est positive : f (x) 0, pour tout x R. 2/ f est continue sur R sauf, ventuellement en un nombre fini de points. 3/ L'intgrale f (t) dt est convergente et vaut 1.

b) Exemples.
Exemple 1.
Soient a et b deux nombres rels, avec a < b. L'application f dfinie par :

f (x) =

est une densit de probabilit, appele densit uniforme sur l'intervalle [ a ; b ].

Exemple 2.
Soit un nombre rel strictement positif. L'application f dfinie par :
f (x) =

est une densit de probabilit, appele densit exponentielle de paramtre .

140

III.6.1.2. Variable alatoire absolument continue.


Une variable alatoire relle X est dite absolument continue s'il existe une application f de R dans R, positive, continue sauf ventuellement en un nombre fini de points, telle que, pour tout nombre rel x, la fonction de rpartition de X soit donne par la formule :
F (x) = P (X x) = f (t) dt.

L'application f est alors une densit de probabilit, appele la densit de probabilit de X. En effet, l'application f est, par dfinition, positive et continue sauf ventuellement en un nombre fini de points. D'autre part, comme F est une fonction de rpartition, sa limite, lorsque x tend vers + , est 1, de sorte que l'intgrale f (t) dt = f (t) dt, est convergente et vaut 1.

Le fait de changer la valeur de f en un nombre fini de points, ne change pas la valeur de l'intgrale et ne change donc pas la fonction de rpartition de X. On exprime cette proprit en disant que la densit de probabilit d'une variable alatoire absolument continue est dfinie un nombre fini de points prs.

III.6.1.3. Proprit (admise).


Toute densit de probabilit sur R est la densit de probabilit d'une variable alatoire relle absolument continue.

III.6.1.4. Loi de probabilit.


Dfinir la loi de probabilit d'une variable alatoire absolument continue, c'est donner sa densit de probabilit : celle-ci s'obtient en drivant la fonction de rpartition partout o c'est possible. En effet, d'aprs le thorme de drivation d'une fonction dfinie par une intgrale, la drive de F est f (x) partout o f est continue.

III.6.2. Probabilit d'un intervalle.


Soit X une valariable alatoire relle absolument continue de densit de probabilit f. Soient a et b des nombres rels vrifiant a < b.
P (a < X b) = f (t) dt

En effet :
P (a < X b) = P (X b) P (X a) = F (b) F (a) = f (t) dt.

En particulier, pour a = x, et b = x + h :
P (x < X x + h) = F (x + h) F (x) = f (t) dt.

Si f est continue en x, le thorme de la moyenne entrane :


f (t) dt

= f (x)

141

et l'on crit, avec un abus d'criture usuel en notation diffrentielle, pour un intervalle infiniment petit [ x ; x + dx ], de longueur dx :
P (x X x + dx) = P (x < X x + dx) = f ( x) dx,

ce qui justifie le terme de "densit de probabilit".

III.6.3. Esprance et variance.


Soit X une variable alatoire relle absolument continue de densit de probabilit f. Pour un entier k 0, on appelle moment d'ordre k, le nombre dfini, lorsqu'il existe, par l'intgrale :
mk = t k f (t) dt.

L'esprance mathmatique de X est, par dfinition, le nombre dfini, lorsqu'il existe, par l'intgrale :
E (X) = m1 = t f (t) dt.

La variance de X est, par dfinition, le nombre dfini, lorsqu'il existe, par l'intgrale :
Var (X) =

(t E (X)) f (t) dt = E (X ) (E (X)) = m2 (m1)

Lorsque la variance existe, l'cart-type de X est la racine carre de la variance : X =

III.7. EXEMPLES : LOI UNIFORME, LOI NORMALE. III.7.1. Loi uniforme.


III.7.1.1. Dfinition.
Soient a et b deux nombres rels vrifiant a < b. On dit qu'une variable alatoire relle X suit une loi uniforme sur l'intervalle [ a ; b ], relation note X U[ a ; b ], si, et seuilement si, elle admet pour densit de probabilit l'application f dfinie par :

f (x) =

Remarquons que la surface comprise entre la courbe reprsentative des variations de f et l'axe des abscisses est toujours gale 1 puisque f (t) dt = 1.

142

III.7.1.2. Proprits.

a) Fonction de rpartition.
F (x) = f (t) dt =

b) Esprance mathmatique.
E (X) = t f (t) dt = t f (t) dt = E (X) = dt =

L'esprance mathmatique d'une variable uniforme sur un intervalle est la valeur centrale.

c) Variance.
Var (X) = E (X ) (E (X)) = t f (t) dt

= + b )

dt

(a + 2 a b

(b + a b + a )

(a + 2 a b + b ) =

(4 b + 4 a b + 4 a 3 a 6 a b 3 b ) =
a ) = Var (X) =

(b 2 a b +

La variance d'une variable uniforme sur un intervalle est la douzime partie du carr de la longueur de l'intervalle.

III.7.2. Loi normale.


III.7.2.1. Dfinition.
L'application : x (x) = e de R dans R est continue et positive. On peut montrer que son intgrale sur R vaut 1 (par changement de variables en coordonnes polaires du plan dans l'intgrale C'est donc une densit de probabilit. Sa courbe reprsentative a l'allure suivante : ).

143

De mme, tant donns deux nombres rels et , avec > 0, l'application f : x e de R dans R est continue et positive. Le changement de variable x = + u dans l'intgrale montre que l'on a :
f (x) dx =

f (x) =

(u) du = 1

de sorte que f est aussi une densit de probabilit. Remarquons que f concide avec lorsque = 0 et = 1. La courbe reprsentative de f a l'allure suivante :

Elle est symtrique par rapport et possde deux points d'inflexion, pour x = + et x = . On appelle variable normale de paramtres et , toute variable alatoire relle absolument continue dont la densit de probabilit est donne par :

144

f (x) =

La relation "X est une variable normale de paramtres et " est note X lit "X suit la loi normale de paramtres et ".

N ( ; ), qui se

On appelle variable normale centre rduite, toute variable alatoire relle absolument continue dont la densit de probabilit est donne par :
(x) =
e

La relation "X est une variable normale centre rduite" est la relation X "X suit la loi normale de paramtres 0 et 1".

N (0 ; 1), qui se lit

La loi normale est aussi appele "loi de Gauss", ou "loi de Laplace-Gauss une dimension". Elle a t dcouverte et tudie en 1780 par Pierre Simon, marquis de Laplace.

III.7.2.2. Proprits.

a) Esprance mathmatique et variance.


La variable normale de paramtres et possde une esprance mathmatique et une variance :
X N ( ; ) E (X) = et Var (X) = .

b) Fonction de rpartition.
Soit F la fonction de rpartition de la variable normale de paramtres et , la fonction de rpartition de la variable normale de paramtres 0 et 1.
F (x) =

Cette relation se voit par changement de variable t = + u dans l'intgrale :


F (x) = f (t) dt = e dt

Il rsulte alors de la relation F (x) = la relation U = N (0 ; 1).


X

que la relation X

N ( ; ) est quivalente

N ( ; ) U =

N (0 ; 1)

Autrement dit, X est une variable normale de paramtres et si, et seulement si, U = est une variable normale centre rduite.

145

permet aussi de calculer les probabilits lies la variable La relation F (x) = normale X de paramtres et , grce la table de la fonction de rpartition de la variable normale centre rduite.

III.8. LOI DES GRANDS NOMBRES.


Il y a plusieurs noncs appels "loi des grands nombres". Nous noncerons seulement celui qu'on appelle aussi la "loi faible des grands nombres" de Bernoulli. Soit A un vnement de probabilit p. Lorsqu'on rpte n fois, de faon indpendante, l'preuve alatoire o l'vnement A est susceptible de se raliser, la frquence Fn de ralisation de A suit une loi donne par la loi binomiale de paramtres n et p :
P (Fn =

)=

p k q n k, k = 0, ... , n.

avec p + q = 1, et o

est le coefficient binomial d'indices n et k. .

L'esprance mathmatique de Fn est p et sa variance est

Lorsque n augmente indfiniment, la variance tend vers 0, les valeurs de Fn sont de moins en moins disperses autour de la moyenne p et, intuitivement, la probabilit que Fn ne s'loigne pas trop de p augmente. La loi faible des grands nombres de Bernoulli nonce que, pour tout > 0, fix l'avance, la limite de la probabilit P ( | Fn p | < ) lorsque n augmente indfiniment, est 1. Ce rsultat s'nonce aussi sous la forme :
La frquence de l'vnement A converge en probabilit vers la probabilit de l'vnement A lorsque le nombre d'preuves augmente indfiniment.

Nous admettrons ce rsultat, dont la dmonstration prcise sera donne en deuxime anne de DEUG. La "loi forte des grands nombres", ou thorme central limite, fait, quant elle, rfrence la convergence "presque sre", qui est la convergence uniforme de la fonction de rpartition de la frquence vers une loi normale.

146

INITIATION A LA THEORIE DES SONDAGES.

IV. 1. GENERALITES. IV.1.1. Introduction.


L'tude exhaustive d'un caractre donn dans une population est un recensement. Elle se heurte souvent une impossibilit matrielle : cot trop lev, ou destruction des individus tudis. Les mthodes d'analise quantitative ont alors recours la thorie des sondages, qui consiste tudier un sous-ensemble de la population qu'on appelle un chantillon. La thorie des sondages pose deux types de problmes :

L'chantillon doit tre reprsentatif de la population : c'est la thorie de l'chantillonnage. Les techniques numriques utilises sur les observations exprimentales doivent conduire des rsultats fiables, c'est--dire donnant une bonne reprsentation des paramtres inconnus de la population : c'est la thorie de l'estimation et des tests.

Les deux problmes sont lis : la mthode d'chantillonnage utilise a une influence sur les estimations obtenues. En rsum, nous pouvons dire que la thorie des sondages est un outil mathmatique permettant, partir d'observations exprimentales partielles, de tenter d'atteindre une ralit inaccessible.

IV.1.2. Avantages de la mthode d'enqutes par sondages.


La mthode d'enqutes par sondages prsente sur le recensement (lorsqu'il est possible) les avantages suivants :
1. 2. 3. 4. 5. Cot plus rduit. Plus grande vitesse d'excution (notamment pour les sondages d'opinions). Plus grande fiabilit des rsultats : le personnel tant plus rduit, il peut tre plus qualifi. Moins de risque d'erreur : le volume des donnes traiter est plus faible. Plus grand champ d'application, notamment dans le cas de destruction des units testes.

IV.1.3. Etapes d'une enqute par sondage.


Pour effectuer une enqute par sondage, il est indispensable de respecter les instructions suivantes.

Dresser une liste claire des objectifs de l'enqute. Etablir avec prcision la population chantillonner. Etablir une liste prcise et courte des donnes collecter.

147

Dfinir le choix des mthodes de mesure : tlphone, convocations, visites domicile, ... Etablir, lorsque c'est possible, le degr de prcision dsir afin d'analyser le rapport des cots et des avantages. Dterminer l'unit de l'chantillonnage : personne physique, collectivit, ... Etablir le plan de l'chantillonnage ou la mthode de slection. Faire parfois une pr-enqute courte. Organiser le travail sur le terrain. Rcolter les donnes, les prsenter, les synthtiser par traitement statistique. Conserver les donnes pour pouvoir les rutiliser.

IV.2. DIVERS TYPES DE SONDAGES.


Pour effectuer un sondage dans une population, c'est--dire pour en extraire un chantillon, deux types de mthodes sont employes : mthodes empiriques et mthodes alatoires. Seules les mthodes alatoires permettent d'utiliser la thorie de l'estimation.

IV.2.1. Mthodes empiriques : sondages raisonns.


Ce sont les plus connues du grand public et les plus utilises par les instituts de sondage d'opinion. La prcision de ces mthodes ne peut tre calcule et leur russite n'est que le rsultat d'une longue pratique et de l'habilet professionnelle. Les lments sonds sont choisis dans la population suivant des critres fixs a pirori.

IV.2.1.1. Mthode des units types.


Elle repose sur l'ide suivante : les diffrentes variables attaches un individu de la population n'tant pas indpendantes, un individu qui se trouve dans la moyenne de la population pour un certain nombre de caractres impportants, sera galement peu diffrent de la moyenne pour les autres caractres. La mthode consiste donc diviser la population en un certain nombre de sous-ensembles relativement homognes et reprsenter chacun d'eux par une unit-type. On choisit donc des units d'individus que l'on considre comme fortement reprsentatives de certaines catgories de population : cantons-types, bureau de vote pilotes, dont les rsultats observs sur de longues priodes figurent les rsultats dfinitifs d'une rgion ou d'une ville, etc.

Exemple.
L'INSEE dcomposa en 1942 la France en 600 rgions agricoles et, dans chaque rgion, dsigna un canton-ype. Comme il y a en France environ 3000 cantons, la dsignation de 600 cantons-types permettait de rduire d'un facteur 5 l'ampleur d'une tude des cantons.

148

IV.2.1.2. Mthode des quotas.


L'enquteur prlve librement son chantillon, condition de respecter une composition donne l'avance (pourcentage fix d'agriculteurs, d'ouvriers, de cadres, etc., par exemple). Cette mthode est facile, mais aucun intervalle de confiance ne peut tre donn. Elle suppose implicitement que les catgories retenues pour la dtermination des quotas sont pertinentes quant l'objet de l'tude, ce qui est bien difficile tablir. Pour diminuer l'arbitraire du choix, on impose l'enquteur des normes de dplacement gographique : c'est la mthode de Politz. On utilise souvent des "panels", qui sont des chantillons permanents dont on tudie l'volution.

Panel d'audience la tlvision (mdiamtrie, centres d'tudes d'opinion, ...). Panel de consommateurs (SECODIF : 4 500 mnages). Panel de dtaillants (SOFRES).

Exemples.

Ces panels sont utiliss en marketing (lancement d'un produit, transfert de marques, etc.).

IV.2.2. Mthodes alatoires.


Les lments sonds sont extraits au hasard d'une liste connue a priori de la population, appele base de sondage.

Exemples.
1. Liste d'immatriculation des vhicules automobiles en France. C'est une trs bonne base car elle est mise jour rgulirement (cartes grises neuves, cartes grises dtruire). Rpertoire des entreprises (SIREN). Chaque entreprise possde un numro d'immatriculation neuf chiffres, un nom ou raison sociale, une adresse exacte. L'annuaire tlphonique est une mauvaise base de sondage car d'une part, tout individu ne possde pas obligatoirement un tlphone et, d'autre part, un individu peut possder un tlphone et ne pas figurer sur l'annuaire (la liste rouge reprsente environ 8 % des abonns et l'annuaire ne recense pas les tlphones portables, soit environ 40 % des tlphones).

2.

3.

Les bases de sondages sont en gnral tablies partir des rsultats d'un recensement et elles sont corriges priodiquement entre deux recensements. Le tirage de l'chantillon est effectu dans la base de sondage selon des critres spcifiques chaque mthode (plan de sondage). Cette mthode de travail ne laisse aucune initiative aux enquteurs : il est trs simple de contrler leur travail.

IV.2.2.1. Sondage lmentaire : chantillon alatoire simple.


Dans un chantillon alatoire simple, les lments constituant l'chantillon sont extraits au hasard ( l'aide d'une table de nombres au hasard, par exemple) d'une liste de la population. On extrait ainsi n individus d'une population de taille N. Le tirage peut s'effectuer avec ou sans remise, renvoyant ainsi gnralement un modle de loi binomiale (avec remise), ou hypergomtrique (sans remise).

149

Si le tirage s'effectue avec remise, l'chantillon alatoire simple est dit indpendant (EASI = Echantillon Alatoire Simple et Indpendant). La mthode permet de calculer des intervalles de confiance, comme nous le verrons plus loin. Le rapport f = s'appelle le taux de sondage. pour les enqutes sur les

Par exemple, l'INSEE utilise des taux de sondage de l'ordre de conditions de vie des mnages.

Exemple.
Nous voulons extraire un chantillon de 8 individus dans une population forme de 437 individus. Nous numrotons les individus de la population de 1 437. Nous considrons trois colonnes conscutives d'une page de nombres au hasard : ils forment des nombres au hasard trois chiffres. Nous lisons ces nombres de trois chiffres en ne retenant que ceux qui sont compris entre 001 et 437. Lorsque nous avons retenus 8 nombres, notre chantillon est constitu des 8 individus dsigns dans la population par ces huit nombres. Selon que nous effectuons un tirage avec ou sans remise, nous garderons ou carterons un individu dj tir. L'inconvnient majeur de la mthode lmentaire est son cot : les individus tirs peuvent tre trs loigns gographiquement.

IV.2.2.2. Sondage stratifi.


La population tudie est partitionne en q sous-populations 1, 2, ... , q, appeles "strates". L'chantillon est constitu de la runion de q chantillons choisis au hasard, un par strate : nous effectuons dans chaque strate un chantillonnage simple.

Exemple.
= {1, 2, 3, 4, 5}, 1 = {1, 2}, 2 = {3, 4, 5}. Nous slectionnons trois individus, dont un dans 1 et deux dans 2. Nous obtenons l'un des six chantillons possibles. Cette mthode se justifie par deux raisons essentielles : 1. L'existence d'une stratification de fait, soit pour des raisons gographiques, soit pour des raisons administratives.
Exemple 1 : enqute sur les conditions de vie pnitentiaire en France.

La population est celle des dtenus en France Les strates sont les populations de dtenus dans les divers tablissements pnitentiaires.
Exemple 2 : enqute sur la consommation par un organisme disposant de bureaux dpartementaux.

150

La population est celle des consommateurs franais. Les strates sont les consommateurs de chaque dpartement. 2. Un caractre tudi dans la population peut varier sous l'influence d'un certain nombre de facteurs. Pour liminer au mieux les risques de biais, nous crons des strates homognes et, dans chacune d'elles, nous extrayons un chantillon alatoire simple.
Exemple.

Pour tudier la consommation de tabac, si nous estimons que l'ge et le sexe sont des facteurs trs influents, nous partageons la population en strates du type : Hommes de moins de 20 ans, Hommes de 20 30 ans, etc. Femmes de moins de 20 ans, Femmes de 20 30 ans, etc. De chaque strate, nous extrayons un chantillon alatoire simple.

IV.2.2.3. Echantillonnage systmatique.


Les individus de la population sont numrots de 1 N. Pour slectionner n individus, nous partageons la population en k = groupes : {1, ... , k }, { 1 + k, ... , 2 k }, ... , { 1 + (n 1) k, ... , N }. Nous choisissons au hasard l'individu i par les individus numrots de 1 k. Nous constituons notre chantillon des individus { i, i + k, i + 2 k, ... , i + (n 1) k }. Le choix de l'individu i dtermine entirement la constitution de l'chantillon.

Exemple.
= {1, ... , 20}, k = 4. Les chantillons possibles sont : {1, 5, 9, 13, 17}, {2, 6, 10, 14, 18}, {3, 7, 11, 15, 19}, {4, 8, 12, 16, 20}. Cette mthode est bien adapte la slection de cartes dans un fichier, ou au prlvement de pices dans une fabrication pour un contrle de qualit. Elle prsente une certaine analogie avec la mthode prcdente d'chantillonnage stratifi.

IV.2.2.4. Echantillonnage plusieurs degrs.


La population est divise en sous-populations appeles units primaires. Chaque unit primaire est divise en units secondaires, etc. Nous effectuons des tirages au hasard en cascade : nous tirons des units primaires ; dans chaque unit primaire, nous tirons une unit secondaire, etc.

Exemple.
L'INSEE effectue des chantillonnages quatre niveaux : dpartements, cantons, communes, mnages.

151

Cette mthode permet une excution rapide. Elle est conomique, car elle focalise les tirages. La mthode de tirage au hasard chaque niveau peut varier suivant le cas, par exemple tirage proportionnel aux units qu'il contient, ou tirage quiprobable. Nous disons alors que nous pouvons avoir des tirages avec probabilits ingales.

Cas particulier : tirage par grappes.


Nous choisissons des grappes pour lesquelles nous gardons tous les "grains", ou individus. Une "grappe" est un groupe d'individus de mme nature.
Exemple : mnages d'un mme immeuble.

IV.2.2.5. Conclusion.
En pratique, les diverses mthodes alatoires peuvent tre mles pour amliorer le rendement. Pour chacune d'elle, nous pourrons varier les critres de tirage au hasard de chaque individu : avec remise, sans remise, avec des probabilits gales ou ingales.

IV.3. ESTIMATION DES PARAMETRES. IV.3.1. Notion de paramtre.


Nous considrons une population de taille finie N. Dans cette population, nous tudions un caractre quantitatif rel prenant les valeurs relles xi, i {1, ... N}. La fonction de rpartition empirique FN (x) est une fonction en escalier. La variable statistique reprsentant le caractre tudi peut tre une variable quantitative discrte ou continue. Le problme est de modliser la fonction de rpartition empirique FN (x), par la fonction de rpartition F (x) d'une variable alatoire X, discrte ou continue suivant le cas, vrifiant F(xi) = FN (xi), i {1, ... N}. Nous dirons que F (x) dfinit la loi de rfrence associe une population hypothtique infinie, dite population de rfrence. La population est appele la population-mre. La connaissance de la loi de rfrence du caractre tudi est d'un grand intrt pour la dduction statistique. Elle constitue un modle mathmatique du phnomne tudi. Cette distribution thorique peut dpendre d'un certain nombre de paramtres inconnus. Les sondages permettent d'estimer deux types de paramtres :

Les paramtres propres la population-mre : moyenne, variance, etc. Les paramtres propres la loi de rfrence : paramtre d'une loi de Poisson, paramtres d'une loi normale, etc.

152

IV.3.2. Notion d'estimateur d'un paramtre de .


IV.3.2.1. Estimateur et estimation ponctuelle.
Soit X un caractre quantitatif de la population . Ce caractre prend les valeurs inconnues xi, i {1, ... N}. Un rsum de l'ensemble des valeurs {x1, ... , xN} peut tre dfini par un ou plusieurs paramtres de (moyenne, variance, proportion, etc.). Soit y un tel paramtre de la population . Lorsque nous extrayons de la population un chantillon alatoire simple E de taille n, nous pouvons calculer, avec les valeurs {x1, ... , xn} prises par X dans l'chantillon, une estimation ponctuelle de y, qui sera note y*.

Exemple.
Si y est la moyenne = de X, nous obtiendrons une estimation ponctuelle * de la moyenne en prenant la moyenne arithmtique de l'chantillon :
* =
xi.

La valeur observe y* n'est que l'une des valeurs possibles que l'on peut obtenir avec les divers chantillons possibles de taille n. En ralit, avec une population de N individus, il y a un certain nombre, mettons k, d'chantillons possibles Ej de taille n, j {1, ..., k} (k dpend de la mthode d'chantillonnage). Chaque chantillon possible Ej de taille n possde une certaine probabilit pj d'tre tir. A chaque chantillon possible Ej de taille n est associe une estimation ponctuelle yj* de y. A chaque estimation ponctuelle yj* de y est donc associe la probabilit pj d'tre observe. Nous pouvons alors dfinir une variable alatoire prenant, pour chaque chantillon possible Ej de taille n, la valeur yj* avec la probabilit pj. Cette variable alatoire est appele un estimateur du paramtre y. Les valeurs de sont les estimations ponctuelles de y. La loi de probabilit de s'appelle la distribution d'chantillonnage de . On appelle fluctuation d'chantillonnage, la variation des estimations ponctuelles de y et alas d'chantillonnage les causes de ces variations.

IV.3.2.2. Caractristiques d'un estimateur.


Il est logique de souhaiter que l'estimateur prenne des valeurs aussi voisines que possible de la valeur inconnue y que nous voulons estimer. Nous sommes conduits dfinir un certain nombre de qualits que doit prsenter un "bon" estimateur.

153

a) Estimateur sans biais.


Nous dirons que est un estimateur sans biais du paramtre y, si, et seulement si, son esprance mathmatique est y.
sans biais E ( ) = y

Cette proprit traduit le fait qu'en moyenne, sur tous les chantillons possibles, nous retrouvons la valeur du paramtre que nous voulons estimer.

b) Estimateur robuste.
L'estimateur d'un paramtre y possde une variance qui traduit la dispersion des valeurs de autour de son esprance mathmatique. Cette variance dpend de la taille n de l'chantillon. Nous dirons que est un estimateur robuste, ou convergent, de y si la limite, lorsque n tend vers N de est nulle.
robuste
=0

Cette proprit traduit le fait suivant : si nous connaissons la valeur prise par le caractre pour tous les individus de la population, la valeur de est la valeur exacte y du paramtre. Un estimateur correct est un estimateur sans biais et robuste.

c) Estimateur asymptotiquement gaussien.


Nous dirons qu'un estimateur d'un paramtre y est asymptotiquement gaussien si, et seulement si, il vrifie la proprit suivante :

Lorsque n augmente indfiniment, la fonction de rpartition de rpartition d'une variable normale centre rduite.

tend uniformment vers la fonction de

En pratique, ds que n est suprieur ou gal 30, nous admettrons que la fonction de

rpartition de centre rduite.

peut tre remplace par la fonction de rpartition de la variable normale

Lorsque n est suffisamment grand (en pratique n 30), pour tout [0, 1], le nombre rel positif u donn par :
(u) = 1

, o est la fonction de rpartition de la variable normale centre rduite,

154

vrifie :

= 1 .

En effet, comme la fonction de rpartition de peut tre remplace par la fonction de rpartition de la variable normale centre rduite, ds que n est suprieur ou gal 30, la symtrie de la loi normale donne :

= (u) ( u) = (u) (1 (u)) = 2 (u) 1 = 1 .

Les valeurs de la fonction de rpartition sont donnes par des tables. Un estimateur CAG est un estimateur correct et asymptotiquement gaussien.

d) Amlioration d'un estimateur.


Etant donns deux estimateurs meilleur que l'estimateur .
2 1

et

du mme paramtre y, on dit que l'estimateur

est

si l'esprance de ( 1 y) est plus petite que l'esprance de ( 2 y)

Ceci signifie simplement que l'on considre comme meilleur un estimateur dont les valeurs sont moins disperses autour de la valeur de y. Dans l'absolu, le meilleur estimateur d'un paramtre est celui dont pour lequel l'esprance de ( y) est la plus petite possible. Un estimateur sans biais dont la variance est minimale s'appelle un estimateur prcis. Pour un estimateur prcis, l'esprance E ( ) est gale y et la variance est minimale.

IV.3.3. Notion d'intervalle de confiance.


IV.3.3.1. Introduction.
Considrons un chantillon alatoire simple E, de taille n, extrait de la population (tirages au sort quiprobables, sans remise). Dans cet chantillon, le caractre tudi prend les valeurs {x1, ... , xn}. Nous pouvons considrer la valeur prise par le caractre tudi pour l'individu i de l'chantillon comme la valeur prise par une variable alatoire X. L'ensemble des valeurs {x1, ... , xn} apparat alors comme le rsultat de n preuves indpendantes sur la mme variable alatoire. L'estimateur d'un paramtre y apparat alors comme une fonction de n variables alatoires indpendantes Xi, i {1, ... , n}, de mme loi de probabilit, qui est la loi de probabilit de X. X s'appelle la variable parente.

155

La connaissance de la loi de probabilit de X permet de calculer la loi de probabilit de .

La variable alatoire centre rduite correspondant , possde une esprance mathmatique nulle et une variance gale 1.

Exemple 1.
Nous tudions la taille des individus d'une population d'effectif N. Pour cela nous extrayons un chantillon alatoire simple et indpendant d'effectif n. Soit la moyenne de la taille des individus de la population. Soit X la variable alatoire "taille d'un individu" : chaque individu de l'chantillon est associ une variable alatoire indpendante "taille" Xi qui a la mme loi de probabilit que la variable parente X. L'estimateur

Xi

de la taille moyenne dans la population, a, pour valeur dans l'chantillon, la moyenne arithmtique des tailles des individus de l'chantillon. Cet estimateur possde une loi de probabilit qui peut tre calcule en fonction de la loi de probabilit de X.

Exemple 2.
Soit la variance de la taille des individus de la population. Soit X la variable alatoire "taille d'un individu" : chaque individu de l'chantillon est associ une variable alatoire indpendante "taille" Xi qui a la mme loi de probabilit que la variable parente X. L'estimateur

Xi

Xi

de la variance de la taille dans la population, a, pour valeur dans l'chantillon, S (X) o S (X) est la variance des tailles des individus de l'chantillon (variance d'chantillonnage). Cet estimateur possde une loi de probabilit qui peut tre calcule en fonction de la loi de probabilit de X.

IV.3.3.2. Intervalle de confiance pour les grands chantillons.


Si est un estimateur correct et asymptotiquement gaussien (estimateur CAG) d'un paramtre y, avec E ( ) = y, la relation

156

=1

s'crit :
P ( u

+ u ) = 1 .

L'vnement u + u a donc une probabilit 1 de se raliser lorsqu'on choisit au hasard un chantillon de taille n 30. Autrement dit, dans la population, la proportion des chantillons de taille n 30 pour lesquels l'vnement u + u est ralis est 1 . Autrement dit encore, tant donn un chantillon de taille n 30, choisi au hasard, la probabilit de ralisation de l'vnement u sorte que u prend une valeur
y1 = y* u s

+ u est 1 .

Or, pour un chantillon de taille n choisi au hasard, prend la valeur y* et une valeur s , de

et + u prend la valeur
y2 = y* + u s

L'intervalle
[y1 ; y2] = [ y* u s ; y* + u s ]

dans lequel la taille n de l'chantillon est suprieure ou gale 30 et (u) = 1 , s'appelle l'intervalle de confiance de y au risque , ou intervalle de confiance de y au niveau de confiance 1 . C'est un intervalle dans lequel la probabilit de trouver la vraie valeur de y est 1 . Plus est grand, plus l'amplitude de l'intervalle de confiance est petite, puisque est une fonction croissante. Dans la pratique, en l'absence de prcision contraire, nous conviendrons de prendre = 5 %. Plus n est grand, plus la valeur de a des chances d'tre proche de 0, donc plus la valeur de a des chances d'tre proche de y. Nous pourrons ainsi calculer la valeur de n qui permet d'avoir un intervalle de confiance d'amplitude donne. Les valeurs retenir de la fonction de rpartition de la variable alatoire normale centre rduite sont, pour (u) = 1 : (1,645) = 0,950, soit u0,10 = 1,645. (1,960) = 0,975, soit u0,05 = 1,960. (2,575) = 0,995, soit u0,01 = 2,575. Ces valeurs donnent les intervalles de confiance aux niveaux de confiance 90 %, 95 %, 99 %. La valeur utilise par dfaut est u0,05 = 1,960. 157

IV. 4. ETUDE DU SONDAGE ELEMENTAIRE.


Soit une population d'effectif N dont on tudie un caractre X. Si X est un caractre quantitatif, les paramtres qui caractrisent ce caractre sont : la moyenne == xi

xi xi . la variance = Si X est un caractre qualitatif deux modalits A et B, le paramtre qui caractrise X est la proportion p d'individus prsentant la modalit A. Les paramtres sont inconnus. La thorie de l'chantillonnage a pour but de les estimer au mieux.

IV.4.1. Echantillon non exhaustif, tirage probabilits gales.


Un tirage au hasard avec remise induit que chaque individu a une probabilit d'tre tir.

IV.4.1.1. Caractre quantitatif.

a) Loi de probabilit induite par le tirage de l'chantillon.


Le tirage avec remise, d'un individu de W, peut tre reprsent par une variable alatoire parente, note encore X, dont la loi de probabilit est dfinie par :
P (X = xi) =

, i [1, N].

L'esprance mathmatique de X est E (X) = xi = La variance de X est Var (X) = E ((X ) ) = .

xi = .

b) Estimateur de la moyenne de la population.


Constituer un chantillon de taille n par des tirages non exhaustifs quiprobables dans , revient dfinir n variables alatoires indpendantes X1, ... , Xn, qui suivent toutes la mme loi que X. Soit {x1, ... , xn} la ralisation de l'chantillon E. 158

La moyenne arithmtique = alatoire

xi est la ralisation par chantillonnage de la variable

Xi .

L'esprance mathmatique de l'estimateur est E ( ) = La variance de l'estimateur est = Var ( ) =

E (Xi) = Var (Xi) =

n E (X) = . n Var (X) = .

Par consquent, est un estimateur sans biais de (E ( ) = ) mais il n'est pas robuste ( = 0).

c) Estimateur de la variance de la population.


La variance exprimentale de l'chantillon est s = (xi ) . C'est la ralisation par chantillonnage de la variable alaoire "variance d'chantillonnage" :

S=

Xi

Xi

(Xi )

L'esprance mathmatique de S est

E (S ) = E E (S ) = E (S ) = Mais on a :

(Xi ) = E (Xi + ) E (Xi ) +

E (Xi )

E ( ) +

E (Xi ) ( )

E (Xi ) = E ( ) =

E Xi E (Xi)

n Var (X) = . . E ( ) (n n ) = 2 E ((

E ( E( )) = Var ( ) = = . E ( )

E (Xi ) ( ) ) ) = 2 Var ( ) = 2

(Xi ) =

159

Au total :
E (S ) =

La variance d'chantillonnage n'est pas un estimateur sans biais de la variance de la population : c'est un estimateur biais. La linarit de l'esprance mathmatique montre que :
E S

E (S ) = ,

de sorte que l'estimateur :

Xi

Xi

est un estimateur sans biais de la variance de la population : E ( ) = .

IV.4.1.2. Caractre qualitatif.


Le paramtre tudi inconnu est la proportion p d'individus de la population prsentant la modalit A du caractre qualitatif. Pour chaque individu de la population, nous pouvons dfinir une variable alatoire de Bernoulli, prenant la valeur 1, avec la probabilit p, si l'individu est porteur de la modalit A, 0 sinon, avec la probabilit q = 1 p. Choisir un chantillon de taille n, c'est choisir un n-uple de variables alatoires (X1, ... , Xn) de Bernoulli, indpendantes, de mme paramtre p. Soit (x1, ... , xn) une ralisation de l'chantillon E. La moyenne exprimentale p* = alatoire = xi est la ralisation par chantillonnage de la variable

Xi, qui reprsente la frquence de la modalit A dans l'chantillon.

Son esprance mathmatique est E ( ) =

E (Xi) =

n p = p.

Xi

est un estimateur sans biais de la proportion p des individus de la population prsentant la modalit A du caractre tudi.

Sa variance est Var ( ) =

Var (Xi) =

n p (1 p) =

. : l'estimateur de p

Lorsque n tend vers N, cette variance ne tend pas vers 0, mais vers n'est pas un estimateur robuste.

Pour les chantillons de grande taille (n 30), on peut dfinir l'intervalle de confiance de p correspondant au risque , par :

160

[p1, p2] = p* u

; p* + u

avec (u) = 1

IV.4.2. Echantillon exhaustif, tirage probabilits gales.


Un tirage au hasard sans remise induit que chaque chantillon de taille n a une probabilit = d'tre tir.

IV.4.2.1. Caractre quantitatif.

a) Estimation de la moyenne.
Soit xij la ralisation du caractre X pour le je individu de l'chantillon Ei = (Xi1, ... , Xin). La ralisation du ie chantillon est un n-uple (xi1, ... , xin). La moyenne d'chantillonnage nous allons dfinir. Nous pouvons dfinir
i

xij est la ralisation d'une variable alatoire que

chantillons diffrents Ei, i 1 ;

, de taille n, chacun ayant

une probabilit pi =

d'tre tir au hasard.

Considrons la variable alatoire dont la loi de probabilit, uniforme, est dfinie par :
P( =
i)

= pi, i 1 ;

Son esprance mathmatique est :

E( )=

pi

xik

xik .

La somme est une somme tendue tous les chantillons de taille n. Pour un k pris entre 1 et n, notons que xik est la valeur xj du caractre X pour le ke individu de l'chantillon, qui est le je individu de la population. Cette valeur apparat une fois dans tous les chantillons de taille n contenant cet individu de la population, mais pas forcment la mme place, c'est--dire pas forcment avec le mme 161

indice k. Or il y a chantillons de taille n contenant cet individu, de sorte que la valeur xj de X

pour le je individu de la population, apparat fois dans la somme xik . Ce raisonnement est valable, bien sr, pour tous les indices j de 1 N. Lorsque nous faisons la somme pour tous les chantillons de taille n, nous obtenons :

xik

xj =

(x1 + ... + xN)

E( )=

(x1 + ... + xN) =

N=

Moralit : la moyenne d'chantillonnage = moyenne du caractre X.

Xij est un estimateur sans biais de la

b) Variance de la moyenne d'chantillonnage.


La variance de est donne par Var ( ) = E ( ) (E ( )) = E ( ) . Calculons le terme :

E ( ) =

pi

E ( ) =

(xik)

(xik)

xi1 + ... + xin

xij xik

Pour tout individu de numro j de , il y a

chantillons de taille n contenant cet

fois dans la somme individu, de sorte que xj apparat Et ceci est vrai pour les N individus de la population. De sorte que l'on obtient :

xi1 + ... + xin .

162

xi1 + ... + xin

x1 + ... + xN

( + )

Reste calculer la somme Dans chacun des k.

xij xik produits de la forme xij xik, avec j

chantillons de taille n, on forme

Dans l'ensemble des chantillons de taille n, on forme donc de X diffrentes. Comme il existe

produits de deux valeurs

produits de deux valeurs de X diffrentes, chacun intervient

fois dans la somme tendue l'ensemble des chantillons de taille n. On obtient donc :

xij xik

xj xk

Or on peut crire aussi :

xj xk =

xj

xk xj

xj

xk

xj

xj

xj = (N ) N ( + ) = N ((N 1) )

On obtient alors :

xij xik

N ((N 1) ) = 1) )

((N 1) ) = N

((N

E ( ) =

( + ) + N

((N 1) )

E ( ) =

+ (N 1)

163

= (N 1) (n 1)

+ (N 1) =

+ (N 1) (1 + (n 1)) = 1

E ( ) =

Var ( ) = E ( ) = Var ( ) =

Moralit : lorsque n tend vers N, la variance de tend vers 0, l'estimateur de est robuste.

La moyenne d'chantillonnage = correct, de .

Xij est un estimateur sans biais et robuste, donc

On remarquera aussi que la prsence du rapport d'exhaustivit

, infrieur 1, fait que la

variance de est plus faible lorsque l'chantillon est exhaustif que lorsqu'il est non exhaustif : les valeurs de sont moins disperses autour de la moyenne lorsque l'chantillon est exhaustif.

c) Estimation de la variance.
La variance exprimentale de l'chantillon s = variable alatoire :
S=

(xij

) est une ralisation de la

(Xij ) =

Xij

Xij

L'esprance mathmatique de cette variable alatoire est ;

E (S ) = = Mais :

E ((Xij ) ) =

E ((Xij + ) ) E ((Xij ) ( ))

E ((Xij ) ) +

E (( ) )

164

E ((Xij ) ) = E ((Xij E (Xij) ) = Var (Xij) = . E ((Xij ) ) = n = .

E (( ) ) =

Var ( ) =

n Var ( ) = Var ( ) =

E ((Xij ) ( )) = E ( ) = n Var ( ) Il reste alors :


E (S ) = +

(Xij )

= E ( ) n ( ) = n E ( )

n Var ( ) =

On voit donc que S est un estimateur biais de , mais que, par linarit de l'esprance mathmatique :

S=

Xij

Xij

est un estimateur sans biais de la variance .

IV.4.2.2. Caractre qualitatif.


La frquence d'chantillonnage p* = xi de la modalit A du caractre qualitatif tudi est la valeur prise aprs chantillonnage par la variable alatoire
=
Xi .

Mais nous avons vu, prcdemment, que l'esprance mathmatique et la variance de Xi, taient donnes par :
E (Xi) = p Var (Xi) = p (1 p).

L'tude prcdente montre que nous pouvons crire :


E( )=p Var ( ) = Var Xi

Var

= Var ( ) =

p (1 p).

Ainsi, est un estimateur sans biais et robuste de p. Sa ralisation p* = xi dans un chantillon est une estimation ponctuelle sans biais de p.

Pour les grands chantillons, au niveau de confiance 1 , la ralisation de l'intervalle de confiance de p sera donn par [ p1 ; p2 ], avec

165

p1 = p* u p2 = p* + u

o u est dfini par la relation (u) = 1 normale centre rduite.

, tant la fonction de rpartition de la variable

IV.4.2. Echantillon non exhaustif, tirage probabilits ingales.


Soit = {1, 2, ... , N} la population. Nous tudions dans cette population un caractre quantitatif X de valeur xj pour l'individu j. Notons pj la probabilit de tirage de l'individu j lors de la constitution de l'chantillon =1 . Tout tirage avec remise peut tre schmatis par une variable alatoire dont la loi de probabilit est dfinie par :
P ( = xj) = pj, j [1 ; N].

pj

Notons :

= =

xj, la moyenne du caractre X dans la population. xj xj , la variance de X dans la population.

Ces paramtres sont inconnus, nous cherchons les estimer. Nous supposons connues la taille N de la population et les probabilits pj associes aux valeurs xj. Notons, pour simplifier, (x1, ... , xn) la ralisation d'un chantillon.

IV.4.2.1. Estimation de la moyenne.


Considrons la variable alatoire ' dfinie par la loi de probabilit :
P

'=

= pj, j [1 ; N].

et soit :

'=

i'

la variable alatoire de ralisation m'* =

dans l'chantillon. 166

Nous avons :
E ( ') = E ( i') = pj

N=

n=

La relation E ( ') = montre que la variable alatoire ' est un estimateur sans biais de . Sa ralisation m'* = dans l'chantillon est une estimation ponctuelle sans biais de .

IV.4.2.2. Variance de l'estimateur de la moyenne.


Nous avons :
E ( ') = E ( ' ) = Var ( ') = pj pj

=N = N
i

Comme le tirage de l'chantillon est fait avec remise, les variables par consquent :
Var ( ') = Var
i'

' sont indpendantes, et,

Var ( i')

Var ( ') =

Var ( ') =

Var ( ') =

Cette variance s'exprime l'aide de l'ensemble des valeurs xj, inconnues, prises par le caractre X dans la population . Il serait intressant d'en avoir une estimation partir de la ralisation {x1, ... , xn} d'un chantillon.

IV.4.2.3. Estimation de la variance de l'estimateur de la moyenne.


Soit ' la variable alatoire dfinie, comme dans IV.4.2.1. par la loi de probabilit :
P

'=

= pj, j [1 ; N].

Nous avons vu que l'esprance mathmatique de cette variable alatoire tait gale N , qu'on peut estimer par N '. Considrons la variance d'chantillonnage de la variable alatoire ', c'est la variable alatoire :
= ( i' N ')

167

L'esprance mathmatique de

est :

E(

) = E

( i' N ')

= = = = =

E ( i' N ') E ( i' N + N N ') E ( i' N ) Var ( i') + n Var ( ') + + E (N N ') + E ( i' N ) (N N ') ( i' N )

Var (N ') + n N Var ( ') +

E (N N ')

E (N N ') (N n ' N n )

= Var ( ') + N Var ( ')

n N Var ( ')

= Var ( ') N Var ( ') = n N Var ( ') N Var ( ') = (n 1) N Var ( ') La relation E (
1

) = (n 1) N Var ( '), qui s'crit aussi :


E

= Var ( ')

montre que
La variable alatoire est un estimateur sans biais de la variance Var ( ')

et sa ralisation dans l'chantillon :


N m'* =

compte tenu de la relation N m'* = m'* = de la variance de '.


* =

, est une estimation ponctuelle sans biais

Cette estimation de la variance de ' permet de construire, pour les grands chantillons, un intervalle de confiance de la moyenne :
m'* u *.

168