Académique Documents
Professionnel Documents
Culture Documents
Chapitre 2 : Matrices
2.1. Calcul matriciel : somme, produit, multiplication par un rel 2.2. Inversion dune matrice par la mthode de la matrice compagnon 2.3. Calcul du dterminant dune matrice carre 2.3.1. Pour les matrices 1x1, 2x2, 3x3 2.3.2. Pour les matrices quelconques 2.4. Inversion dune matrice par la mthode de la matrice adjointe 2.5. Rsoudre un systme linaire par la mthode de Cramer Solutions des exercices (Chapitre 2) page 14 page 15 page 16 page 16 page 17 page 20 page 23 page 25
Chapitre 5 : Diffrentielles
1. Diffrentier une fonction 2. Equations aux variations diffrentielles 3. Systmes dquations aux variations diffrentielles page 49 page 50 page 55
Chapitre 7 :
Exercice rsolu
Rsoudre le systme en (x,y) :
x + y2 = 6 x+2y=3
Etape 1 : On peut utiliser la seconde quation pour exprimer x en fonction de y :
x = -2 y + 3
Etape 2 : On substitue x trouv ltape 1 dans la premire quation : 2 (-2 y + 3) + y = 6 Cest--dire
y2 2 y 3 = 0
Etape 4 : On substitue les valeurs de y trouves ltape 3 dans lquation de ltape 1 pour trouver les valeurs correspondantes de x : Si y = 3, alors x = -2 . (3) + 3 = -3.
Si y = -1, alors x = -2 . (-1) + 3 = 5. Les solutions du systme dquations sont donc (-3,3) et (5,-1) (on note S = {(-3,3),(5,-1)}).
Exercices
1. Rsoudre le systme en (x,y) :
x.y=0 x+y=1
2. Rsoudre le systme en (x,y) :
y=2 y = -x2 2x
3. Rsoudre le systme en (x,y) :
y 1 = x2 2x y 2x = -3
4. Rsoudre le systme en (p, qd, qp) :
qd = 11 p2 qp = p 1 qp = qd
5. Rsoudre le systme en (p, p*, qd, qp) :
qd = 17 p2 qp = p* 2 p* = p 1 qp = qd
6. Rsoudre le systme en (p, p*, qd, qp) :
qd = 11 p2 qp = p* 2 3 p* = p 4 qp = qd
7. Rsoudre le systme en (, x1, x2) :
3x = 81y 2x = 16y
9. Rsoudre le systme en (x,y) :
xy+z=2 xyz=0 2y + z = 1
12. Rsoudre le systme en (x1,x2) :
5x + 4y + 10z = 20 x + 2y + 2z = 4 4x + 4y + z = 4
16. Rsoudre le systme en (x,z) :
x2y+1=0 z = 3 x + 5 y2
a1,1.x + a1,2 . y + a1,3 .z = b1 1. Ordonner le systme rsoudre a 2,1.x + a 2,2 . y + a 2,3 .z = b2 a .x + a . y + a .z = b 3,2 3,3 3 3,1
en faisant attention faire apparatre un rel non nul la place du terme a 1,1. Il faut parfois permuter deux lignes du systme.
a1,2 a 2, 2 a3,2
3. Faire apparatre 0 la place du terme a 2,1 par une combinaison linaire utilisant uniquement la ligne 2 et la ligne 1. Faire apparatre 0 la place du terme a 3,1 par une combinaison linaire utilisant uniquement la ligne 3 et la ligne 1.
* * * *
On obtient
0 * * * 0 * * *
4. Faire apparatre 0 la place du terme a 3,2 par une combinaison linaire utilisant uniquement la ligne 3 et la ligne 2.
* * **
On obtient
0 * ** 0 0 **
5. Faire apparatre 0 la place du terme a 2,3 par une combinaison linaire utilisant uniquement la ligne 2 et la ligne 3. Faire apparatre 0 la place du terme a 1,3 par une combinaison linaire utilisant uniquement la ligne 1 et la ligne 3.
* * 0 *
On obtient
0 * 0 * . 0 0 * *
6. Faire apparatre 0 la place du terme a 1,2 par une combinaison linaire utilisant uniquement la ligne 1 et la ligne 2.
* 0 0*
On obtient
0 * 0* . 0 0 **
7. Faire apparatre 1 la place du terme a 1,1 par division de la ligne 1. Faire apparatre 1 la place du terme a 2,2 par division de la ligne 2. Faire apparatre 1 la place du terme a 3,3 par division de la ligne 3. . . . ( attention : pas de division par 0 )
1
8. Si le systme admet une solution unique, on obtient
0 1 0
0 0 1
r s , t
x = r y = s z = t
0 0
1.x + 0. y + 0.z = r ce qui est quivalent au systme 0.x + 1. y + 0.z = s 0.x + 0. y + 1.z = t
dont la solution unique vidente est le triple ( r , s , t ).
Attention : Lors de lapplication de la mthode , si on obtient une ligne constitue de 0 alors le systme est indtermin ; une ligne constitue de 0 sauf pour le terme indpendant alors le systme est impossible.
Exercice rsolu
Traiter ce systme en (x,y,z) grce la mthode de Gauss-Jordan :
1 2 3 1 0 0 1 0 0 1 0 0 5 0 0 1 0 0
2 -1 2 -1 1 3 1 -1 2 2 -1 2 -5 3 -1 -5 2 -4 2 -1 2 -5 3 -1 0 -1 -3 2 0 5 -5 0 -10 0 -1 -3 0 0 5 -5 0 -10 0 -1 -3 0 1 0 0 0 1 1 2 3
L2 L2 2 L1 L3 L3 3 L1
L3 L3 L2 L1 L1 L3 L2 L2 + 3 L3 L1 5.L1 + 2 L3
L1 L1 / 5 L2 -L2 / 5 L3 -L3
est quivalent au systme
Le systme admet donc une solution unique : le triple (1,2,3). On note aussi S = { (1,2,3) }.
Exercices
Grce la mthode de GAUSS-JORDAN , trouvez lensemble des solutions des 6 systmes suivants. 17.
18.
10
19.
x+y+2z=3 2x+yz4=0 3x+2y=7z 10 3 z = 3 y + 4 x x+2yz+3t=0 2x+y+zt=0 4x+5yz+5t=0 5x+4y+z+t=0 x y + 2 z t = -2 2x+y+z =4 -3 x z + 2 t = 5 x+y+t=8 x+2yz=4 x+3y=7z 2x4z=53y 2x+1=8zy
20.
21.
22.
2 r + 2 s 2 t + u 2 v = 0 -r+s5t2u+3vw=0 3r+s+3t+uv=0
a) Ce systme permet-il de dfinir les variables r, s, t en fonction des variables u, v, w ? b) Ce systme permet-il de dfinir les variables u, v, w en fonction des variables r, s, t ? 25. Traiter analytiquement puis reprsenter graphiquement l'ensemble des solutions du systme de 3 quations linaires 3 variables x, y, z suivant :
6 x + 10 y + 15 z = 30 4 x + 3 y + 6 z = 12 5y8z=0
11
13 39 7 7 , , , ) , (-4,-3,-5,-5) } 4 4 16 16
7. S = { (-1,1,-1) , (1,7,7) } 8. S = {(4,1)} 9. S = { (5,2) , (2,5) } 10. S = { ( 2 , 1 + log 3 (4) )} 11. S = { (0,-1/3,5/3) , (1,0,1) , (5/2,1/2,0) } 12. S = { (2.997,31/8) ; (-2.997,31/8) } 13. S = { (4,3) , (-4,3) , ( 21 ,-2) , (- 21 ,-2) }
x=2y1 z = 5 y2 + 6 y 3
x = 3z + 1 y = 2 5z
x = 5z 2 y = 3 2z
12
5 x = 8 .y 25. 11 z = .y + 2 12
Graphiquement :
13
Chapitre 2 : Matrices
2.1. Calcul matriciel : somme, produit, multiplication par un rel
Exercices
Exercice 1
2 0 3 8 , C =
7 2 6 3 , D =
2 0 1 1 1 1 .
9. B.C
Exercice 2 Si possible , effectuer les multiplications suivantes. 1.
2 1 0 1 3 4 . 2 1 2 1 1 . 6 0 4
2. 3.
(2
1 0) .
4 0 1
0 2 1
4.
4 2 1 0 . 3 1 0 1 9 6 2 2 4 . 4 3 1 0 2
1)
5.
6. . (3 3
14
telle que 3 4
1 2
. a
c
b 1 0 = d 0 1
Pour inverser la matrice Anxn par la mthode de la matrice compagnon : 1. Ecrire cte cte la matrice A et la matrice identit I : Anxn | Inxn 2. Appliquer la mthode de Gauss Jordan la matrice A jusqu obtenir la matrice I. Appliquer au fur et mesure les mmes modifications la matrice compagnon . 3. On obtient -1 La matrice inverse est A nxn .
Inxn | A-1nxn
Remarque 1 : La matrice Inxn est la matrice identit. Elle comporte des 0 partout sauf sur la diagonale descendante o elle ne comporte que des 1.
1 0 0 Exemple : I 3X 3 = 0 1 0 0 0 1
Remarque 2 : Sil est impossible de faire apparatre la matrice Inxn gauche (par exemple si on obtient une ligne entire de zros), cest que la matrice Anxn nest pas inversible.
Exercices
Exercice 3 Inverser les matrices suivantes par la mthode de la matrice compagnon
3 1 1 1. A = 2 1 2 1 3 2
15
2 4 8 2. B = 1 3 5 3 8 14 1 1 3. C = 1 1 1 1 1 1 0 1 2 3 0 0 0 2
2.3.
2.3.1.
dt (4 ) = 4
3 2 dt 1 5 = 3.5 1.2 = 13
3 1 1 3 1 dt 2 1 2 2 1 1 3 2 1 3
Remarque :
La mthode applique ici (dite de SARRUS) nest valable que pour le calcul dun dterminant dune matrice 3X3 .
Exercices
Exercice 4 : calculer
2 4 8 1. dt 1 3 5 3 8 14
2. dt 3 4
1 2
16
a 3. dt d e
0 b f
0 0 c
0 0 a 4. dt 0 b d c e f
2.3.2.
Exemple :
a 1, 2 a 2, 2 a 3, 2
dt a 2,2 a 3, 2
a 2,3 a3,3
a 2,2 dt a3,2
a 2,3 a3,3
a 2,1 dt a3,1
a 2,3 a3,3
dt a 2,1 a 3,1
a 2, 2 a 2,3
a 2,1 dt a3,1
a 2, 2 a 2,3
17
Le cofacteur associ un lment a i j dune matrice A i+j . est le produit du mineur associ cet lment par (-1)
a 1, 2 a 2, 2 a 3, 2
a 2,3 a3,3
a 2,2 dt a3, 2
a 2,3 a3,3
a 2,3 a3,3
= dt
a 2,1 a3,1
a 2,3 a3,3
a 2,2 a 2,3
= dt a3,1
a 2,1
a 2,2 a 2,3
Exemple :
a 1, 2 a 2, 2 a 3, 2
18
a1,1 . (-1)
1+1
dt a 2,2 a 3, 2
a 2,3 a3,3
+ a1,2 . (-1)
1+2
+ a1,3 . (-1)
1+3
a1,1 . (a2,2 . a3,3 a3,2 . a2,3) a1,2 . (a2,1 . a3,3 a3,1 . a2,3)
+ a1,3 . (a2,1 . a3,2 a3,1 . a2,2)
1) La rgle des cofacteurs est valable pour calculer le dterminant de toute matrice carre nxn. 2) La rgle des cofacteurs est trs simple lorsquelle est applique une range qui comporte beaucoup dlments nuls.
1 7 5 Exemple : calculer dt 2 0 0 3 4 6
La range comportant le plus de zros est la deuxime ligne : La rgle des cofacteurs applique cette ligne donne
a2,1
a2,2
a2,3 = 2 0 0
19
1 7 5 dt 2 0 0 = 2 . cofacteur (a2,1) + 0 . cofacteur (a2,2) + 0 . cofacteur (a2,3) 3 4 6 = 2 . cofacteur (a2,1) 7 5 2+1 = 2 . (-1) . dt 4 6
= -2 . dt 4 = -124
7 5 6
Exercices
Exercice 5 Calculer les dterminants suivants en utilisant la mthode des cofacteurs.
1.
1 2 dt 3 4
3 1 1 2. dt 2 1 2 1 3 2 3 2 4. dt 0 0
2 4 8 3. dt 1 3 5 3 8 14 a dt d e
0 1 0 1 0 4 3 2 0 0 0 1
0 b f
0 0 c
0 0 a 6. dt 0 b d c e f
telle que 3 4
1 2
. a
c
b 1 0 = d 0 1
20
1 . adj(A) dt ( A)
Exercice rsolu
Inverser la matrice A =
1. Calculer le dterminant.
21
1 (-1)2+2 . dt = 1 4 3 2 1
4 3 4 2 2 1 = 3 1 = adj(A)
A-1 =
1 1 4 2 . adj(A) = . 2 3 1 dt ( A) 2 1 1 = 3 2 2
Exercices
Exercice 6 Pour chacune des matrices suivantes, - dterminer si la matrice est inversible - si oui , calculer la matrice inverse.
3 1 1 A = 2 1 2 1 3 2
2 4 8 B = 1 3 5 3 8 14
3 2 C= 0 0
0 1 0 1 0 4 3 2 0 0 0 1
22
a1,1.z1 + a1,2 .z 2 a .z + a .z 2,1 1 2, 2 2 de n quations n variables ... ... an,1.z1 + an,2 .z 2 a1,1 a 2,1 crit sous forme matricielle ... a n,1
ou encore
= b1 = b2 ... = bn
b1 b2 = ... b n
a1,2 ... b1 ... a1, n a 2,2 ... b2 ... a 2, n ... ... ... ... ... a n,2 ... bn ... a n, n
zi =
dt ( A)
La i
me
23
Exercice rsolu
Rsoudre le systme
dt
la premire variable x =
2 11 4 5
=
1 2 dt 3 4
1 dt 3 5 11
2 =1 2
la deuxime variable
y=
=
1 2 dt 3 4
4 =2 2
x=1 y=2
Exercices
Exercice 7 Dterminer si les systmes suivants ont une solution unique. Si oui, utiliser la mthode de Cramer pour rsoudre le systme.
24
1. 3 x + y + z = 0 2x+y+2z=0 x+3y+2z=0 2 4 8 2. 1 3 5 . 3 8 14 x 1 y = 1 z 6
3. 3 x + z = 1 2 x + y + 4 t = -1 3y+2z=0 t=1
Exercice 8 Dterminer si les systmes suivants ont une solution unique. Si oui, utiliser la mthode de Cramer pour rsoudre le systme.
1.
x-4y=2 2x+y=1
2.
3.
4.
25
3. A + D
2 8 4. - A = 3 0 5 1
5.
17 6 2.B 3.C = 12 7
28 64 7. A.B = 6 0 13 8
8. C.B = 21 24 9. B.C = 69 30 Exercice 2 1.
20 16
14
2 1 8 1 2 6
2. 3.
(8
2)
4.
4 2 3 1
6 2 9 3
26
Exercice 3
4 9 2 -1 1. A = 9 5 9
1 9 5 9 8 9
1 9 4 9 1 9
3 8 3 -1 3. C = 16 1 4 3 16
Exercice 4 1. 0 2. -2 3. a.b.c
5 1 8 8 11 1 16 16 1 1 4 4 5 1 16 16
1 8 7 16 1 4 9 16
4. a.b.c
Exercice 5 1. -2 2. -9 3. 0 4. 12 5. a.b.c 6. -a.b.c Exercice 6
4 9 2 -1 1. A = 9 5 9
1 9 5 9 8 9
1 9 4 9 1 9
27
Exercice 7
1.
2.
3.
13 x = 12 17 y = 6 17 z= 4 t =1
Exercice 8
1.
x = 2/3 y = -1/3 x = -1/2 y = -1/2 z = 3/2 x=3 y=4 z=5 x = 1/2 y = -1 z = 1/2
2.
3.
4.
28
Chapitre 3 : Variations
Remarque prliminaire importante ! ! !
Dans tout ce chapitre, nous travaillerons avec des modles mathmatiques pour lesquels il est possible dexprimer explicitement les variables endognes en fonctions des variables exognes. Les autres cas devront tre traits diffremment, comme nous le verrons plus tard dans ce cours.
x* x x*+x
f (x*) y f (x*+x)
comment varie y
(cest--dire comment la fonction f ragit-elle) (cest--dire si lon fait subir x une variation absolue de valeur x ?)
si x* devient x* + x ?
29
La variation absolue dune variable sexprime dans la mme unit que cette variable. Elle peut tre un nombre positif ou ngatif.
Attention : Pour un mme x mais pour deux valeurs diffrentes de la variable x, le y peut tre diffrent !
y y x**,x
f (x** + x ) f (x**) f (x* + x ) f (x*)
y = f (x)
y x*,x
x
x* x* + x
x
x** x** + x
fois de x* et de x. Une notation du type y(x*,x) ou yx*,x serait donc meilleure. Afin de ne pas alourdir la prsentation, nous continuerons cependant crire y (mais il faut veiller garder cette remarque en mmoire).
DONC : Pour tre prcis, il faudrait faire apparatre dans la notation que y dpend la
Exemple
Considrons lexpression suivante :
C = 3.Q3 1800.Q2 + 360000.Q + 1000000 f(Q) Nous allons faire varier Q et voir ce qui se passe.
30
Pour Q* =100,
f(Q*) = 22000000 Pour Q*+Q =101, f(Q*+Q) = 22089103
Quand Q* =200,
f(Q*) = 25000000 Quand Q*+Q =201, f(Q*+Q) = 25000003
a) 2 b) 1.
Quelles sont les variations absolues de la variable y correspondantes ? Calculez aussi les rapports des variations absolues
y correspondants. x
a) 2 b) 1.
Quelles sont les variations absolues de la variable y correspondantes ? Calculez aussi les rapports des variations absolues
y correspondants. x
31
y y
y = a . x
o a est la pente de la droite.
Donc, si x est constant, y est constant aussi : y ne dpend pas de la valeur x* partir de laquelle on considre la variation x. y De plus, on constate que le rapport est constant x et vaut la pente de la droite dquation y = ax + b .
x*
x* + x
Exemple
Soit un modle linaire de type y = a.x + b : C = 150000.Q + 1000000 o C est la variable endogne et Q la variable exogne. Dans ce cas , a = 150000 et b= 1000000. Choisissons une variation en valeur dune unit de la variable Q ( Q = 1) ; quelle que soit la valeur Q* de Q partir de laquelle on travaille, on obtient :
Q*
Q = 1
Q* + 1
ce qui donne
Quel que soit Q*, on constate donc que la variation C correspondant une variation en valeur dune unit de Q est gale 150000. Observons aussi que C = a. Q ( ce qui est caractristique du linaire ).
x . x*
De la mme manire, la variation relative de la variable y (correspondant une variation relative x de la variable x partir du point x*) est le rapport
y . y*
32
Les variations relatives sont des nombres sans units, qui peuvent tre positifs ou ngatifs. Signalons que la tradition est dexprimer les variations relatives en pourcentages. Au lieu de variation relative , on dit parfois (taux de) variation en pourcentage . Il est parfois intressant de calculer le rapport des variations relatives :
Exercice 3
y y* . x x*
a) Augmenter la valeur de x* de 25% revient multiplier x* par ? b) Diminuer la valeur de x* de 10% revient multiplier x* par ?
Exercice 4 a) Quelle variation relative de la variable x correspond une variation absolue x = 0,5 partir de la valeur x* = 2 ? (Exprimez votre rponse en %.) b) Calculez la variation absolue de la variable y correspondant une variation absolue de x de 0,5 partir de la valeur 2. c) Calculez la variation relative de y correspondante. d) Calculez le rapport des variations absolues correspondant. e) Calculez le rapport des variations relatives correspondant. Exercice 5 :
Soit y = 3x + 2.
0,5
x
1
a) Donnez lquation de la droite d, et lexpression de la fonction correspondante (dont le graphe est d). b) On donne, partir de x* = 5, une variation relative la variable x de 20%.
33
Calculez le y correspondant, ainsi que les rapports des variations absolues et relatives. c) Idem partir de x* = 7, avec la mme variation relative de x. d) Peut-on dire quune mme variation relative de la variable x impliquera une mme variation relative de la variable y ? Exercice 7 : 2 Soit f : R R : x x . On donne la variable x une augmentation relative de 25% partir de a) x* = 4 b) x* = 12 c) x* = 20. Calculez les variations relatives de y correspondantes, et les rapports des variations relatives correspondants. Que constate-t-on ? Pouvait-on le prvoir ?
Exercice 8 :
34
Question : comment varie y au voisinage de (x1*,,xn*) [valeurs particulires des variables exognes x1, x2, , xn ] ?
(x1*,
, xn*) xn
On applique f
f(x1*,,xn*) = y
Variation y
x1
Un point voisin de (x1*, , xn*) peut scrire f(x1*+ x1, , xn*+ xn) o chaque xi reprsente une variation en valeur de la variable xi. Aux variations en valeur x1, , xn des variables exognes x1, x2, , xn [au dpart de (x1*, , xn*)] correspond une variation en valeur de la variable y. Elle est note y. Cest cette variation que nous allons nous intresser. Il sagit l dune simple gnralisation au cas de plusieurs variables exognes de ce que nous venons de faire dans le cas o il ny a quune seule variable exogne.
N.B. Pour tre prcis, il faudrait faire apparatre dans la notation que y dpend de x1*,,
xn* et de x1, , xn. Une notation du type y(x1*,,xn*, x1, , xn) serait donc meilleure. Afin de ne pas alourdir la prsentation, nous continuerons cependant crire y mais il faut veiller garder cette remarque en mmoire.
35
Exercice rsolu
Le revenu dune compagnie est donn par lquation : R = 5 . W 2. A 3 Nous avons donc un modle du type y = f (x1, x2) [R correspond y, W correspond x1 et A correspond x2]. W reprsentent les salaires pays (en millions de francs) et A les dpenses en publicit (en millions de francs).
a) Si W* = 30 et A* = 2 , alors R* = R(W*,A*) =.. . b) Que devient le revenu (de combien saccrot-il ?) si W augmente de 5% (au dpart
de W* = 30) sans modifier A ? c) Que devient le revenu si A diminue de 2% (au dpart de A*=2) sans modifier W ? d) Que devient le revenu si la fois W augmente de 5% (au dpart de W* = 30) et A diminue de 2 % (au dpart de A*=2) ?
Rsolution
Quand on envisage une variation des salaires de 5% (au dpart dune valeur donne pour les salaires), on parle de variation relative. W Mathmatiquement, la variation relative en W* est gale . W* 5.W * 150 W 5 = la variation en valeur est : W = = = 1.5 Dans ce cas, W*=30 et 100 100 W * 100
Pour A, nous avons :
2. A * A 2 = la variation en valeur est : A = = -0.04 A* 100 100 a) Notre modle est R = 5 . W 2. A 3 et nous travaillons au dpart de (W* , A* ) = (30, 2) Nous avons R(W*, A*) = 5. (30).(2) = 36000.
b) R ( W* + W, A*) = 5. (30+1,5).(2) = 39690. Donc la variation R de R est gale 39690 36000 = 3690. c) R ( W*, A*+ A) = 5. (30).(2-0,04) = 33882,912. Donc la variation R de R est gale 33882,912 36000 = 2117,088. d) R ( W*+ W, A*+ A) = 5. (30+1,5).(2-0,04) = 37355,91048. Donc la variation R de R est gale 37355,91048 36000 = 1355,91048.
36
y = a1 .x1 + ... + an .x n
o a1, , an sont les coefficients du modle linaire sur lequel on travaille au dpart ( ou encore, o a1, , an sont les coefficients directeurs de l'hyperplan d'quation y = a1 . x1 ++ an . xn + b ). N.B. Cest une gnralisation directe de ce qui se passe pour des modles du type y = a.x + b : on a vu que dans ce cas, y = a. x , o a est la pente de la droite dquation y = a.x + b.
exercice 10
Soit f : R3 R : (x1, x2, x3) y = 3 x1 2x2 + x3 . a) Calculez la variation de y correspondant des variations x1 = 2/3 et x2 = -1, en partant du point (x1*, x2*, x3*) = (1, 2, 3).
b) Partant de (x1*, x2*, x3*) = (1, 2, 3), on a effectu une variation absolue de 1 unit sur
lune des variables x1, x2, x3. La nouvelle valeur de la variable y (induite par cette variation) est de 0. Sur quelle variable a port la variation ?
37
Exercice 2
a) Augmenter la valeur de x* de 25% revient multiplier x* par 1,25. b) Diminuer la valeur de x* de 10% revient multiplier x* par 0,9.
Exercice 4 La variation relative de x est de 25%. a) La variation absolue de y est 1,5. b) La variation relative de y est de 18,75%. c) Le rapport des variations absolues est 3. d) Le rapport des variations relatives est 0,75. Exercice 5 La variation relative de x est de - 4% . La variation absolue de y est- 0,6 . La variation relative de y est de 3,53% . Le rapport des variations absolues est 3 .
a) b) c) d)
Exercice 6
a)
b) Le rapport des variations relatives est 0,714285714 . c) Le rapport des variations relatives est 1,27777 . d) Non .
1 f ( x ) = .x + 1 2
38
Exercice 7 a) Le rapport des variations relatives est 2,25 . b) Le rapport des variations relatives est 2,25 . c) Le rapport des variations relatives est 2,25 .
Conclusion : La variation relative de y est constante pour une mme variation relative de x quelle que soit la valeur de x*.
Exercice 8 a) Le rapport des variations relatives est de 2,05 . b) Le rapport des variations relatives est de 2,05 . c) Le rapport des variations relatives est de 2,05 .
Remarque : On constate dans cet exercice quen partant dune variation de x plus petite qu lexercice 8, le rapport des variations relatives se rapproche de la valeur 2. A la limite, pour des variations de x de plus en plus petite :
cest llasticit de type point (cf. syllabus thorie, page 123-124) , qui, dans le cas dune fonction puissance, est constante (et vaut lexposant de la fonction)
Exercice 10 a) La fonction est linaire : f(x1, x2, x3) = 3 x1 2 x2 + x3 . Les coefficients sont a1 = 3 , a2 = -2 et a3 = 1 . On a donc : y = 3 . 2 2 . (-1) + 1.0 = 4 .
39
f xi
ou
f xi
Exercice
Exercice 1 Calculer les drives partielles du premier ordre de la fonction f : Rn R : (x1, x2, , xn) f(x1, x2, , xn) dans les cas suivants 1. f(x1, x2) = x13 + x23 3 x1 x2 + 5 2. f(x1, x2) = 3. f(x1, x2) =
e ( x1
+ x2 2 )
x1 + x2 ln x1 x2 4. f(x1, x2) = ln (x1 x2) 2 5. f(x1, x2) = sin x1 + x2 cos (x1 ) 3 x .x 2 6. f(x1, x2, x3) = e 1 2 + x1 ln (x2 x3 )
Notation de la drive partielle du second ordre de f par rapport la variable xi puis par rapport la variable xk pour lconomiste : f x'i pour le mathmaticien :
( )
' xk
ou f x'i' x k
xk
f x i
ou
2 f 2 ou f xk xi xk xi
40
NB :
Exercice
Exercice 2 Calculer les drives partielles du second ordre des fonctions n1, 2 et 3 donnes dans lexercice 1.
(x*, f ( x*)) .
au point
Exercice rsolu
Dterminer la fonction approximation linaire flin de la fonction f en x* = 1 si f est f : R R : x f(x) = x2 ln x dfinie par : Rsolution On sait que flin (x*) (x) = f(x*) + f(x*) . (x x*) . Ici,
x* = 1 f(x*) = f(1) = 0 f(x) = 2 x ln x + x f(x*) = f(1) = 1 flin (1) (x) = 0 + 1 . (x 1) flin (1) (x) = x 1
(1,0).
41
(1,0)
F F (x1*, x2*) . (x1 x1*) + (x1*, x2*) . (x2 x2*) est une x1 x 2 quation du plan tangent au graphe de F au point ( x1 *, x 2 *, F ( x1 *, x 2 *) ) .
Notons que y = F(x1*, x2*) + De manire gnrale :
Soit
de lhyperplan tangent au graphe de (x1 *,..., xn *, F ( x1 *,..., xn *)) (plus de reprsentation graphique possible).
au
point
42
Exercice rsolu
Dterminer la fonction approximation linaire Flin de la fonction F en (1,-2), avec
F F F 2 ( 2. x + x ) 2 (x1, x2) = 2 x2 e 1 2 + 3 x1 x2 (x1*, x2*) = (1,-2) = 2 x1 x1 x1 F F F (x1, x2) = 2 x2 e ( 2. x1 + x2 ) + x22 e ( 2. x1 + x2 ) + x13 (x1*, x2*) = (1,-2) = 1 x 2 x 2 x 2
La fonction approximation linaire Flin de la fonction F en (1,-2) est donc donne par Flin(1,-2) (x1, x2) = 2 + 2.(x1 1) + 1.(x2 + 2) Flin(1,-2) (x1, x2) = 2.x1 + x2 + 2 cest--dire Graphiquement, y = 2.x1 + x2 + 2 est une quation du plan tangent au graphe de F au point (1,-2,2).
Exercices
Exercice 3 1. Dterminer la fonction approximation linaire flin de la fonction f en x*=2, o
f : R R : x f(x) =
3.x 2 + 2 2.x + 3
g : R R : x g(x) = ex
3. Dterminer la fonction approximation linaire Glin de la fonction G en (z1*, z2*, z3*) = (2,1,0), o
43
f(x*)=0.
Description de la mthode
La formule de rcurrence de la mthode de Newton est donn par
x n +1 = x n f ( xn ) f ( x n )
Exercice rsolu
En utilisant la mthode de Newton et en partant de x0 = 0, trouver la valeur approche dune solution de lquation suivante :
4 x3 + 8 x2 31 x 35 = 0
Rsolution 2 Posons f(x) = 4 x + 8 x 31 x 35 ; donc, f(x) = 12 x + 16 x 31 . Valeur initiale : x0 = 0 . 35 f ( x0 ) 1re itration : x1 = x0 = 0 f (0) = 0 -1,129032258 31 f ( x 0 ) f (0)
3 2
44
me
itration : x2 = x1
35 f ( x1 ) = 31 f ( x1 )
Vrification : -1 est bien une solution de lquation 4 x3 + 8 x2 31 x 35 = 0 car 4.(-1)3 + 8.(-1)2 31.(-1) 35 = 0 Question subsidiaire : Comment pourrait-on continuer lexercice pour dterminer toutes les solutions de lquation ?
Exercices
Exercice 4 En utilisant la mthode de Newton et en partant de x0 = 0 , trouver la valeur approche dune solution de chacune des quations suivantes, obtenue aprs 3 itrations. a)
1 3 q + 7 q2 + 111 q + 500 = 0 3
f telle que f(2) = 0 et pour laquelle, en prenant comme point de dpart pour lapplication de la mthode de Newton la valeur x0 = 1, vous obtenez pour x1 une solution de lquation f(x) = 0.
Exercice 6 Trouver graphiquement (cf. graphe ci-dessous) vers quelle solution de lquation
x4 + 3 x3 11 x2 3 x + 10 = 0
la mthode de Newton convergerait en prenant comme valeur de dpart x0 = 0. Le graphe ci-dessous prsente une reprsentation de la fonction
f(x) = x4+3x311x23x+10 .
45
46
2.
3.
f 1 1 (x1, x2) = + x2 . x1 x2 x1 f x (x1, x2) = 1 2 + ln x1 (x2 ) x 2 f (x1, x2) = cos x1 2 x1 x2 sin (x12) x1 f (x1, x2) = cos (x12) x 2
4.
5.
6.
Exercice 2
1.
(x1 )
2
2 f
(x1, x2) = 6 x1
2.
(x1 )
2 f
2 2 2 f (x1, x2) = 4 x1 x2 .e ( x1 + x 2 ) x1 .x 2 2 2 2 2 2 f (x1, x2) = 2.e ( x1 + x 2 ) + 4.x 2 2 .e ( x1 + x 2 ) (x2 )2 2 2 2 f (x1, x2) = 4 x1 x2 .e ( x1 + x2 ) x 2 .x1
3.
2 f
2 f
(x2 )
x ( x1 , x 2 ) = 2. 1 x2 3
2 f (x1 , x2 ) = 12 + 1 x 2 .x1 x1 x2
47
Exercice 3 1. flin(2)(x) =
8 2 x 7 7
2. glin(0)(x) = x + 1 3. Glin(2,1,0) (z1, z2, z3) = 4 z1 + 3 z2 + 5 z3 - 6 4. Hlin(3,e,1) (x1, x2, x3) = (54 + e) . x1 + (
54 + 3) . x2 + 9 e x3 162 18 e e
Exercice 4 a) q0 = 0
48
Chapitre 5 : Diffrentielles
5.1. Diffrentier une fonction
5.1.1. Notion de diffrentielle dune fonction de R dans R
Soit f une fonction de R dans R continment diffrentiable sur un sous-ensemble D de son domaine de dfinition et soit x* D. On appelle diffrentielle de f en x* et on note df(x*) lexpression f(x*).x . Remarques 1) df(x*) est une expression linaire en la variation x de la variable x (au dpart de la valeur x*). 2) df(x*) = flin(x*)(x*,x) ( vrifier)
y = f(x) f (x*+x) f lin(x*) (x*+x) f(x*,x) f(x*) = f lin(x*) (x*) flin(x*)(x*,x) = df(x*) y = f lin(x*) (x)
x x* x*+x
3) Pour la fonction identit I : R R : x x, on a I (x*) = 1. Par consquent, dI(x*) = 1. x = x. Comme la diffrentielle dI(x*) est conventionnellement note dx, il vient : dI(x*) dx = x . On substitue gnralement dx x dans lcriture de la diffrentielle dune fonction dune variable x et on obtient alors lexpression : df(x*) = f(x*).dx. On voit mme parfois crit : df(x) = f(x).dx
49
On appelle diffrentielle de F en x* et on note dF(x*) lexpression linaire en les variations x1, x2, , xn : Remarques 1) dF(x*) = Flin(x*)(x*,x) 2) Pour des raisons analogues celles expliques dans le cas dune fonction dune variable, on crit gnralement :
F F F ( x*).dx1 + ( x*).dx 2 + ... + ( x*).dx n x n x1 x 2 o, pour chaque valeur de i, dxi peut tre considr soit comme une variation de la variable xi au dpart de la valeur xi* (dxi = xi xi*) dF ( x*) =
soit comme une diffrentielle (diffrentielle de la fonction identit).
Exercices
Exercice 1 Calculer la diffrentielle de 2
a) f(x) = x . ln(x) b) f(x) = sin (2x) c) F(x1,x2) = x1 x23 3 d) G(z1,z2) = (z1 z2) e) F(x,y,t,v) = x.y + a . t2 v.x + 2 (o a est un paramtre) 2 x.y et v(y) = 2 y f) F(x,y,t,v) = x.y + a . t v.x + 2 o a est un paramtre, et o t(x,y) = e g) H(z) = -5
Exercice 2
F : R2 R : (x1,x2) f(x1,x2) = x12 . x23 Dterminer l approximation de la variation de valeur de F 3 2 correspondant aux variations de valeur x1 = et x2 = au point (x1*,x2*) = (3,1). 10 10 x 2 b) On donne F : R R : (x1,x2) F(x1,x2) = x2 . e 1 Dterminer l approximation de la variation de valeur de F 1 1 correspondant aux variations de valeur x1 = et x2 = au point (x1*,x2*) = (1,4). 10 10
a) On donne
Soit E(x,y) = b, un modle mathmatique qui ne permet pas ncessairement de dfinir y en fonction de x. L quation linaire approche , au voisinage de (x*,y*), du modle E(x,y) = b est
L quation aux variations diffrentielles associe au modle E(x,y) = b en sa solution (x*,y*) est
E E (x*,y*) . dx + (x*,y*) . dy = 0 x y
L quation
E(x,y) = b
son quation linaire approche , en (x*,y*), dfinit (explicitement) la variable y en fonction de la variable x.
si et seulement si
son quation aux variations diffrentielles, en (x*,y*), dfinit (explicitement) la variable dy en fonction de la variable dx.
si et seulement si
Si l quation E(x,y) = b dfinit, au voisinage de (x*,y*), la fonction y = y(x) (mme si on ne possde pas explicitement lexpression de cette fonction) alors, le nombre driv de cette fonction en x* est gal
d dy
dy y (x*) = dx
51
Exercice rsolu
a) Lquation x2 + y2 = 25 dfinit-elle globalement la variable y en fonction de la variable x ? . . . autre formulation : Peut-on exprimer explicitement la variable y en fonction de la variable x
partir de lquation x + y = 25 ?
2 2
b) Lquation dfinit-elle localement, autour de sa solution (x*,y*) = (3,4), la variable y en fonction de la variable x ? Dterminer le nombre driv de la fonction ainsi dfinie en (x*,y*) = (3,4). c) Quelle est lquation de la droite tangente la courbe dquation x + y = 25 en (x*,y*) = (3,4) ?
2 2
d) Lquation dfinit-elle localement, autour de sa solution (x*,y*) = (5,0), la variable y en fonction de la variable x ? Dterminer le nombre driv de la fonction ainsi dfinie en (x*,y*) = (5,0). e) Quelle est lquation de la droite tangente la courbe dquation x + y = 25 en (x*,y*) = (5,0) ?
2 2
25 x 2 ou y = 25 x 2
E E (3,4) . dx + (3,4) . dy = 0 x y
E (x,y) = 2 x x E (x,y) = 2 y y
On obtient
6 dx + 8 dy = 0
E (3,4) = 6 x E (3,4) = 8 y
dy =
3 dx 4 Lquation aux variations diffrentielles en (3,4) dfinit la variable dy en fonction de la variable dx.
Lquation de dpart dfinit donc localement, au voisinage de (3,4), la variable y en fonction de la variable x. En (3,4), y est positif et donc y =
25 x 2
Le nombre driv demand est dy y (3) = dx = 4 c) Lquation de la droite tangente en (3,4), est donne par
dy
6 x + 8 y 50 = 0
Notons que lquation linaire approche en (3,4) dfinit (explicitement), la variable y en fonction de la variable x : y = .x +
3 4
25 4
d) Considrons lquation aux variations diffrentielles en (5,0) associe lquation de dpart : Puisque
E E (5,0) . dx + (5,0) . dy = 0 x y
E E (5,0) = 5 et (5,0) = 0, on obtient 5 dx + 0 dy = 0 x y Lquation aux variations diffrentielles en (5,0) ne dfinit pas la variable dy en fonction de la variable dx. Lquation de dpart ne dfinit donc pas localement, au voisinage de (5,0), la variable y en fonction de la variable x.
e) La droite tangente en (5,0) existe et a pour quation x = 5 (tangente verticale).
Exercices
Exercice 3 a) Lquation x 2 x y + 3 x y 22 = 0 dfinit-elle globalement la variable y en fonction de la variable x ? Peut-on exprimer explicitement la variable y en fonction de la variable x . . . autre formulation : 3 2 2 partir de lquation x 2 x y + 3 x y 22 = 0 ? b) Si non, lquation dfinit-elle localement, autour de sa solution (x*,y*) = (1,3), la variable y en fonction de la variable x ? Dterminer le nombre driv de la fonction ainsi dfinie en (x*,y*) = (1,3).
3 2 2
c)
x3 2 x2 y + 3 x y2 22 = 0 en (x*,y*) = (1,3) ?
Exercice 4 a) Lquation x . y2 2 x.y 1 = 0 dfinit-elle globalement la variable y en fonction de la variable x ? b) Si non, lquation dfinit-elle localement, autour de sa solution (x*,y*) = (1,3), la variable y en fonction de la variable x ? Dterminer le nombre driv de la fonction ainsi dfinie en x* = 1. 2 x.y c) Quelle est lquation de la droite tangente la courbe dquation x . y 2 1 = 0 en (x*,y*) = (1,3) ? d) Quelle est le nombre drive de y par rapport x en x* = 1 ?
53
Exercice 5 : gnralisation pour un modle trois variables a) Lquation x12 .x 2 . y + x1. y 2 2.x 2 . y + 2. y 2 12 = 0 dfinit-elle globalement la variable y en fonction des variables x1 et x2 ? b) Si non , lquation dfinit-elle localement, au voisinage de sa solution (x1*, x2*,y*) = (1,0,2), la variable y en fonction des variables x1 et x2 ? c) Quelle est lquation du plan tangent la courbe dquation
.x 2 . + 2.x1 .x 2 3. y 2 4.x1 .x 2 1 = 0 dfinit-elle localement, autour de (x1*, x2*,y*) = (2,1,0), la variable y en fonction des variables x1 et x2 ?
x1 . y
x 2 . y 2 x3. y + 2. x . y 3 = 0
Comme on le vrifie aisment, cette quation permet dexprimer la variable y en fonction de la variable x localement au voisinage de sa solution (x*,y*) = (2,1).
a) Dterminez le nombre driv de cette fonction en x*
54
exemple thorique
2 variables endognes
y1, y2
: x1, x2, x3
E1 ( y1 , y 2 , x1 , x 2 , x3 ) = c1 E 2 ( y1 , y 2 , x1 , x 2 , x3 ) = c 2
Parfois (comme ctait aussi le cas pour certaines quations), ce systme ne permet pas dexprimer les variables endognes y1 et y2 en fonction des variables exognes x1, x2, x3
(car les quations en jeu sont trop compliques les variables sont trop mlanges , etc. ).
Considrons le systme dquations aux variations diffrentielles (associ au systme de dpart) en un point (y1*, y2*, x1*, x2*, x3*) qui est solution du systme de dpart.
Si on peut exprimer les variations des variables endognes dy1 et dy 2 en fonction des variations des variables exognes dx1 , dx 2 , dx3 alors on dit que les variables endognes y1 et y 2
peuvent sexprimer localement, au voisinage du point (y1*, y2*, x1*, x2*, x3*), en fonction des variables exognes x1 , x 2 , x3 , (. . . mais on nen connat pas la forme explicite pour autant).
55
Exercice rsolu
Le modle
x1 . y1 + x 2 . y 2 = 0
y1 . y 2
y1 + 2 . x1 . x 2 + e
=5
ne dfinit pas globalement les variables y1 et y2 en fonction des variables x1 et x2. Ce modle dfinit-il localement, au voisinage de sa solution (x1*, x2*, y1*, y2*) = (0,1,2,0), les variables y1 et y2 en fonction des variables x1 et x2 ?
(Cest--dire le systme dquations aux variations diffrentielles dfinit-il dy1 et dy2 en fonction de dx1 et dx2 ?)
x1 . y1 + x 2 . y 2 = 0
y1 . y 2 =5 y1 + 2 . x1 . x 2 + e
On peut facilement exprimer dy1 en fonction de dx1, dx2 et dy2 en fonction de dx1, dx2
dy 2 = 2 . dx1 dy = 1 . dx 1 2 1
En consquence, le systme de dpart dfinit localement, au voisinage de sa solution (0,1,2,0), les variables y1 et y2 en fonction des variables x1 et x2.
56
Exercices
Exercice 8
x1 . y1 . y 2 + x1 .x 2 . y 2 = 15 Le modle x1 y1 2 e . y + x 2 . y 2 .(1 x1 ) = 0 2
2 3
ne dfinit pas globalement les variables y1 et y2 en fonction des variables x1 et x2. Ce modle dfinit-il localement, au voisinage de sa solution (x1*, x2*, y1*, y2*) = (1,3,0,5), les variables y1 et y2 en fonction des variables x1 et x2 ?
Exercice 9
2.x1. y1 + x2 .x32 . y2 x1. y1. y2 2 = 2 , o on considre les variables On donne le modle x 3. y 2 + 3.x ..x .x + 4. y1 = 3 1 2 3 1 1 y2 y1 et y2 comme endognes et les variables x1 , x2 et x3 comme exognes.
Ce modle dfinit-il localement, au voisinage de (y1*, y2*, x1*, x2*, x3*) = (3,-2,1,-1,2) les variables y1 et y2 en fonction des variables x1, x2 et x3 ? Si oui, exprimer explicitement dy1 en fonction de dx1, dx2 et dx3 dy2 en fonction de dx1, dx2 et dx3.
e y1 . y 2 . x + 2. y 2 . y 3 e 2. x1 4.x . x 2. y 6 = 0 1 1 2 1 2 2 , o on 2 3 3 x1 . x 2 y1 + x 2 . y 2 + x1. y1. y 2 + 6 = 0 considre les variables y1 et y2 comme endognes et les variables x1 et x2 comme
exognes. Ce modle dfinit-il localement, au voisinage de sa solution (x1*, x2*, y1*, y2*) = (1,0,2,1), les variables y1 et y2 en fonction des variables x1 et x2 ? Si oui, exprimer explicitement dy1 en fonction de dx1 et dx2 dy2 en fonction de dx1 et dx2.
57
Exercice 11
x1.x 2 . y1. y 2 . y3 x 2 2 = 0 2 3 2 Le modle x1. y 2 + x 2 . y1. y3 5. y 2 . y3 = 0 dfinit-il localement, autour de sa x 3 .x . y y 2 . y + 2. y . y = 0 1 2 2 3 1 2 3 solution (x1*, x2*, y1*, y2*, y3*) = (1,2,2,1,1), les variables y1, y2 et y3 en fonction des variables x1 et x2 ? Si oui, exprimer dy1, dy2 et dy3 en fonction de dx1 et dx2.
Exercice 12 Le modle
x 2 . y 3 x . y 2 . y x 2 .x + y 2 10 = 0 2 2 1 1 2 1 2 2 dfinit-il localement, au 3.x12 + 2.x1. y1 + y1. y 2 3 + 5.x 2 3 3. y 2 2 13 = 0 voisinage de sa solution (x1*, x2*, y1*, y2*) = (3,0,1,-2), les variables y1 et y2 en fonction des variables x1 et x2 ? Cest--dire le systme dquations aux variations diffrentielles dfinit-il dy1 et dy2 en fonction de dx1 et dx2 ? Si oui, exprimer explicitement dy1 en fonction de dx1 et dx2 dy2 en fonction de dx1 et dx2.
a est une constante relle f() et h() sont deux fonctions dune variable de classe C1 g(,) est une fonction de deux variables de classe C1 les variables endognes sont y1 , y2 et y3 les variables exognes sont x1 et x2.
Soit dautre part (y1*, y2*, y3*, x1*, x2*) une solution de ce systme. a) Ecrire le systme dquations aux variations diffrentielles associ au systme cidessus en (y1*, y2*, y3*, x1*, x2*). b) Est-il possible dexprimer les variables y1 , y2 et y3 en fonction des variables x1 et x2 localement, autour de la solution (y1*, y2*, y3*, x1*, x2*) ? Justifiez votre rponse.
58
a dsigne une constante relle les variables endognes sont y1 et y2 les variables exognes sont x1, x2 et x3 .
On vrifie aisment que (y1*, y2*, x1*, x2*, x3*) = (1,2,1,2,1) est une solution de ce systme. a) Ecrivez le systme dquations aux variations diffrentielles associ au systme cidessus en ( y1*, y2*, x1*, x2*, x3* ) = (1,2,1,2,1).
b) Pour quelles valeurs de localement au voisinage de
a est-il possible dexprimer les variables endognes en fonction des variables ( y1*, y2*, x1*, x2*, x3* ) = (1,2,1,2,1) ? Justifiez votre rponse.
exognes
c) En donnant la constante relle a la valeur 2 , crivez le systme aux variations diffrentielles de la question a) en compltant les 6 cases ci-dessous :
dy1 + dy1 +
dy2 = dy2=
d) Au dpart du systme de la question c) et en utilisant la mthode de Cramer, exprimez dy1 et dy2 en fonction de dx1, dx2 et dx3 .
e) Lorsque a
= 2, le systme
2 a.y 1 . y 2 + x13 .x 2 .x 3 (a + 1).x 2 = 0 2.y 1 + a.x1 . y 2 x 2 .x 3 2.a.x1 = 0
y1, y2 en fonction des variables x1 x2 et x3 localement au voisinage de ( y1*, y2*, x1*, x2*, x3* ) = (1,2,1,2,1). Notons F et G les deux fonctions ainsi dfinies : y1 = F (x1, x2, x3) et y2 = G (x1, x2, x3). Quelle est la valeur du nombre drive partielle par rapport x1 de la fonction F en (x1*,x2*,x3* ) = (1,2,1) ? Justifiez votre rponse.
permet dexprimer les variables
59
Exercice 2
F F (x1*, x2*) . x1 + (x1*, x2*) . x2 x1 x2 F F (x1*, x2*) = 2 x1 x23 (3,1) = 6 x1 x1 F F (3,1) = 27 (x1*, x2*) = 3 x12 x22 x 2 x 2 3 2 3 2 Finalement, dF ( (3,1),( , ) ) = 6. + 27 . = 7,2 10 10 10 10
a) dF((x1*, x2*),(x1,x2)) = . . . alors que la variation en valeur vaut
F((x1*, x2*),(x1,x2)) = F(x1*+x1, x2*+x2) - F(x1*, x2*) F( (3,1),( 3 2 33 12 , ) ) = F( , ) F(3,1) = 9,817932 10 10 10 10 1 1 e , ) ) = 1,36 10 10 2
b) dF ( (1,4),(
F( (1,4),(
1 1 11 41 , ) ) = F( , ) F(1,4) = 1,444 10 10 10 10
60
9 dy = .dx . 8
Lquation aux variations diffrentielles en (1,3) dfinit la variable dy en fonction de la variable dx . Lquation de dpart dfinit donc localement, au voisinage de (1,3) , la variable y en fonction de la variable x (mais on ne sait pas comment, on na pas une criture explicite de cette fonction).
dy 9 y (1) = = dx 8 c) Lquation de la droite tangente en (1,3) est donne par 18.x + 16. y 66 = 0
Le nombre driv demand est
d dy
(9 24. ln 2) .dx (6 8. ln 2)
Lquation aux variations diffrentielles en (1,3) dfinit la variable dy en fonction de la variable dx . Lquation de dpart dfinit donc localement, autour de sa solution (1,3), la variable y en fonction de la variable x (mais on ne sait pas comment, on na pas une criture explicite de cette fonction). Le nombre driv demand est
d dy
(9 24. ln 2) dy = . y (1) = dx (6 8. ln 2)
Exercice 5 a) non b) Equation aux variations diffrentielles : 4.dx1 2.dx 2 + 12.dy = 0 , qui peut encore scrire dy = .dx1 +
1 3
1 .dx 2 6
Lquation aux variations diffrentielles en (1,0,2) dfinit la variable dy en fonction des variables dx1 et dx 2 . Lquation de dpart dfinit donc localement, autour de sa solution (1,0,2) , la variable
fonction).
y en fonction des variables x1 et x 2 (mais on ne sait pas comment, on na pas une criture explicite de la
61
Exercice 6
a) Equation aux variations diffrentielles : 4. dx1 + 17. dx 2 + 2. dy = 0 , qui peut encore scrire dy = 2 . dx1
17 . dx 2 2
Lquation aux variations diffrentielles dfinit donc localement, autour de sa solution (2,1,0) , la variable dy en fonction des variables dx1 et dx 2 .
y en fonction des variables x1 et x 2 (mais on ne sait pas comment, on na pas une criture explicite de la
4 . x1 + 17 . x 2 + 2 . y 25 = 0
Exercice 7
dy 1 = dx 2
x* =1 y*
Exercice 8
62
dy1 + 4.dy 2 3.dx1 4.dx 2 + 4.dx3 = 0 4.dy1 3.dy 2 + 21.dx1 + 6.dx 2 3.dx3 = 0
4 = 13 , on peut exprimer les variables dy1 , dy 2 en fonction 3 des variables dx1 , dx 2 , dx3 . On peut en dduire que les variables endognes y1 , y 2 du systme non linaire de
Puisque dt 4 dpart sont dfinies localement, autour de (3,2, 1,1, 2) , en fonctions des variables
x1 , x 2 , x3
(mais on ne sait pas comment, on na pas une criture explicite de ce modle). En appliquant par exemple la mthode de Cramer, on trouve
8 + e 2 22 + 2.e 2 = 258 + 24.e 2 , on peut exprimer les variables dt Puisque 11 2 dy1 , dy 2 en fonction des variables dx1 , dx2 .
On peut en dduire que les variables endognes y1 , y 2 du systme de dpart sont dfinies localement, autour de
en
fonctions
des
variables x1 , x2 (mais on ne sait pas comment, on na pas une criture explicite de ce modle).
44 + 6.e 2 30 + 2.e 2 .dx1 + .dx 2 dy1 = 258 + 24.e 2 258 + 24.e 2 . On trouve 2 2 dy = 16 + 9.e .dx + 36 e .dx 2 258 + 24.e 2 1 258 + 24.e 2 2
63
Exercice 13
f a . dy1 + ( y3* ) . dy3 dx1 = 0 y3 g g a) dy 2 ( y3* , x 2* ). dy3 ( y3* , x2* ). dx 2 = 0 x 2 y3 h ( y1* ). dy1 dy 2 = 0 y1
b) Il est possible dexprimer les variables dy1 , dy 2 et dy3 en fonction de dx1 et dx 2 si
Exercice 14 a)
2a dy1 + a dy2 + 6 dx1 + (-a) dx2 + 4 dx3 = 0 2 dy1 + a dy2 + 0 dx1 + (-1) dx2 + (-2) dx3 = 0 2a a 0 a soit 2 a2 2a 0 ce qui est le cas si a 0 ou a 1.
Il faut que det 2
b)
c)
4 2
dy1 + dy1 +
2 2
dy2 = dy2=
d)
e)
65
Chapitre 6 : Optimisation
1. Recherche dextrema de fonctions dune variable
Recherche dun extremum local de la fonction 1. Calculer la drive premire f 2. Rsoudre lquation
f : R R : x f(x)
f(x) = 0
Les solutions x* appartenant au domaine de dfinition de f sont appels les points stationnaires de f. La tangente au graphe de f en x* est horizontale (parallle laxe des abscisses). 3. Calculer la drive seconde f 4. En chaque point stationnaire, calculer la valeur de la drive seconde : f(x*) Si f(x*) est positive alors le point stationnaire x* est un minimum local Si f(x*) est ngative alors le point stationnaire x* est un maximum local Si f(x*) est nulle et change de signe gauche et droite de x* , alors le point stationnaire x* est un point dinflexion .
Exercice rsolu
a) Rechercher les extrema ventuels de f : R R : x f(x) = b) En se basant sur le graphe de f, rechercher les extrema 1. sur le domaine de dfinition de f 2. sur lintervalle R +
+ 3. sur lintervalle R0
x 4 x 3 3. x 2 +2 20 15 5
4. 5. 6. 7. 8.
66
Rsolution : a) f(x) =
1 3 2 (x x 6x) 5
1 x (x2 x 6) 5 f(x) = 0 x = 0 ou =
x = -2
ou
x=3
1 (3x2 2 x 6) 5 en x* = 0 6 f(0) = - < 0 : la concavit est tourne vers le bas ; 5 le point stationnaire x* = 0 est un maximum local de f. en x* = -2 f(-2) = 2 > 0 : la concavit est tourne vers le haut ; le point stationnaire x* = -2 est un minimum local de f. en x* = 3 f(3) = 3 > 0 : la concavit est tourne vers le haut ; le point stationnaire x* = 3 est un minimum local de f.
f(x) =
67
b) 1. 2. 3. 4. 5. 6.
min local en x* = -2, max local en x* = 0 et min global en x* = 3 max local en x* = 0 et min global en x* = 3 min global en x* = 3 min global en x* = -2, max global en x* = 0 pas dextremum min local en x* = 1 et min global en x* = 1 (f(-1) = 91/60 et f(1) = 83/60) = , max global en x* = 0 7. max global en x* = 0 8. max global en x* = 1, min global en x* = 2 9. pas dextremum
Exercices
Exercice 1 La fonction f : R R : x f(x) = (x 1)3 . (x + 1) possde-t-elle un extremum ? a) en x* = 0 ? b) en x* = -
c) en x* = 1 ?
1 ? 2
Exercice 2 3 Rechercher les extrema ventuels de la fonction f : R R : x f(x) = x - 1 Exercice 3 Rechercher les extrema ventuels de la fonction f : R R : x f(x) = x3 + x2 - 1
Exercice 4
Rechercher les extrema ventuels de la fonction f : R0+ R : q f(q) = q2 5q + 8 Exercice 5 Rechercher les extrema ventuels de la fonction g : R0 R : x g(x) = 2x +
+
8 x
h : R R : x h(x) =
1 3 (x 6 x2 + 9 x + 6 ) 6
Exercice 7 Rechercher les extrema ventuels de la fonction i : R R : x i(x) = 5 x2 . ex Exercice 8 x Rechercher les extrema ventuels de la fonction j : R R : x j(x) = (x 1) . e
68
Exercice 9 Soient C(q) le cot total dune firme q la demande de son produit p le prix de vente de ce produit . Si q = 100 - p et C(q) =
1 3 q 7 q2 + 111 q + 50 , 3
quel est le niveau q qui maximise le profit ? Exercice 10 Le revenu R que procure la vente dun article est li au prix de vente unitaire p de cet article par lexpression R(p) = 1500 . p . e
p 100
Dterminer (sil en existe) une valeur de p qui maximise R. Exercice 11 Un fabricant de lecteurs de c.d. produit q exemplaires par semaine un cot total de 4 q2 + 300 q + 10000 . La demande hebdomadaire du produit est q = 100 2.
euros. Si le fabricant rgle sa production sur la demande, quel niveau de production lui procurera un bnfice maximum ? Exercice 12 Une firme fabrique un nouvel alliage. Si elle vend cet alliage p dollars la tonne , elle peut vendre 240 - p tonnes. On sait aussi que le cot de production est
32000 + 30 dollars au total. 240 2. p Combien de tonnes (q) doit-elle produire et quel prix (p) pour maximiser son bnfice ?
Exercice 13 La firme Channel fabrique des tlvisions. La demande journalire q = 100 2 p si elle vend au prix unitaire p et le cot de production de q appareils est de
1 2 q + 35 q + 25 par jour. 4
a) Quel niveau de production maximise le bnfice ? b) Pour quel niveau de production le cot de production unitaire est-il minimum ? Exercice 14 Lentreprise S.E. (sans ennuis) fabrique q machine laver mensuellement. Elle utilise cet effet plus ou moins de main duvre (MO). Sa fonction de production sur courte priode est dfinie par q = o MO dsigne le nombre de travailleurs.
MO 2 MO .( 3 ) 25 12
69
70
a1, 2 a 2, 2 a 3, 2
a1,3 a 2,3 a 3, 3
(3)
Soit A une matrice carre symtrique dordre n. (j) A est dfinie positive ssi j {1, 2, , n} : dt A > 0 Par exemple , pour la matrice carre symtrique A dordre 3 : A est dfinie positive ssi dt (a1,1) > 0
a1,1 dt
a 2,1
A est dfinie ngative ssi les dtA( j) sont successivement ngatifs puis positifs,
71
ssi
dt (a1,1) < 0
a1,1 dt
a 2,1
Exercices
Exercice 15 Les matrices symtriques suivantes sont-elles dfinies positives, dfinies ngatives ?
2 2 2 1. 2 4 0 2 0 8 6 6 0 3. 0 2 0 6 0 12
1 0 0 2. 0 1 0 0 0 1
4.
3 2 2 1
72
Rsoudre le systme
F (x1, x2, , xn) = 0 x n * * * Les solutions (x1 , x2 , , xn ) de ce systme sont les points stationnaires.
2 F 2 F (x1 , x2 ,...,xn ) (x1 , x2 ,...,xn ) 2 x1.x2 ( x1 ) 2 F 2 F (x1 , x2 ,...,xn ) (x , x ,...,x ) HF(x1, x2, , xn) = x .x ( x2 )2 1 2 n 2 1 ..... ..... 2 F 2 F (x , x ,...,xn ) (x1 , x2 ,...,xn ) x .x 1 2 xn .x2 n 1
2 F (x1 , x2 ,...,xn ) x1.xn 2 F ..... (x1 , x2 ,...,xn ) x2 .xn ..... ..... 2 F ..... (x1 , x2 ,...,xn ) ( xn )2 .....
Pour chaque point stationnaire (x1*, x2*, , xn*), crire la matrice hessienne HF(x1*, x2*, , xn*). Si HF(x1 , x2 , , xn ) est dfinie positive * * * le point stationnaire (x1 , x2 , , xn ) est un minimum local.
* * *
Si HF(x1 , x2 , , xn ) est dfinie ngative le point stationnaire (x1*, x2*, , xn*) est un maximum local.
* * *
Sinon, si dt HF(x1*, x2*, , xn*) 0 * * * le point stationnaire (x1 , x2 , , xn ) est un point de selle.
73
Exercice rsolu
Optimiser la fonction f dfinie par f(x1, x2) = 5 x1 + 6x2 - x1x2 .
2 2
x2 = 10 x1
12.(10 x1) x1 = 0
x2 = 10 x1
119.x1 = 0
x2 = 0 x1 = 0
La solution (0,0) de ce systme est le seul point stationnaire de la fonction. Calculer toutes les drives partielles dordre 2.
2 f ( x1 , x 2 ) x1 x 2 f ( x1 , x 2 ) ( x2 )2
dt(10) = 10 > 0 10 1 dt 1 12 = 119 > 0 HF(x1, x2) est dfinie positive ; le point stationnaire (0,0) est donc un minimum local et F (0,0) = 0.
74
Exercices
Trouver les extrema et points de selle ventuels des fonctions suivantes Exercice 16 : f : R R : (x1, x2) f(x1, x2) = x1 + x2
2 2 2
Exercice 17 : f : R2 R : (x1, x2) f(x1, x2) = x12 x22 Exercice 18 : f : R2 R : (x1, x2) f(x1, x2) = x13 x22 + 3x12 + 3x22 9 x1 Exercice 19 : f : R R : (x1, x2) f(x1, x2) = x1 + x1.x2 + x2 + x1 4 x2 + 4
2 2 2
Problme rsolu
Une firme produit deux types de biens A et B. Son cot total de fabrication, not C, et la demande respective des deux biens qA et qB sont donns par
Quels sont les niveaux de production qui maximisent le profit ? Quels sont les prix de A et B qui suscitent une demande correspondant ces niveaux optimaux ? Rsolution : La fonction profit est donne par (qA,qB) = qA . pA + qB . pB C(qA,qB) o ( q A , q B ) ne dpend que des variables de
C = qA2 + 2 qB2 + 10 qA = 40 2 pA pB qA = 35 pA pB
q A et q B
et donc que
75
Calculer toutes les drives partielles dordre 1 de (drives premires), et rsoudre le systme
q (q A , q B ) = 0 A . (q , q ) = 0 q B A B
* *
50 q A = 14 65 q B = 14
2 (q , q ) (q )2 A B A H ( q A , q B ) = 2 (q , q ) A B q q B A 4 2 H (q A , q B ) = 2 8
Pour le point stationnaire (
50 65 , ) 14 14
H (
Le point stationnaire (
76
Pour information : H ( q A , q B ) =
4 2 H (q A , q B ) = 2 8 est semi-dfinie ngative en tout point du domaine. 50 65 Le point stationnaire ( , ) est un maximum global. 14 14
Rponse :
65 maximisent le profit en fonction des niveaux de production. 14 Les prix associs p A et p B sont donns par p A = 5 q A + q B et p B = 30 + q A 2.q B . 85 340 et p B = . Les prix associs ce niveau de production sont p A = 14 14
qA =
50 14
et
qB =
Exercice
Exercice 22
milliers). Elle les vend respectivement 12 et 18 lunit. Le cot de fabrication, not Quel est le niveau de production qui maximise le profit de cette entreprise ?
q A et q B (en
77
f(x,y) = x2 + y2
La reprsentation graphique de cette fonction est un parabolode de rvolution 2 2 (dquation z = x + y ).
Comment reprsenter cet objet dans un espace deux dimensions ? Si lon coupe le parabolode par un plan horizontal dquation z = k (o k est un nombre rel positif), on obtient ce quon appelle une courbe de niveau de la fonction. Equation dans lespace de la courbe de niveau hauteur k :
z = x2 + y 2 z = k
Exemple 1 2 2 Voici une reprsentation trois dimensions dun parabolode de rvolution (z = x + y ) coup par un plan horizontal hauteur 4 :
78
La courbe qui est lintersection du parabolode et du plan a pour quation (dans lespace) :
z = x2 + y 2 z = 4
La projection de cette courbe dans le plan horizontal oxy est une courbe dquation x2 + y2 = 4 . Cest un cercle, de centre (0,0) et de rayon 2 (= 4 ).
De mme, si lon coupe le parabolode hauteur 0, 1, 2, 3, 4, 5, on trouve 6 courbes de niveaux du parabolode (la premire tant rduite au point (0,0) ) :
Mme si on na pas la possibilit davoir une reprsentation graphique en 3D de la surface, on peut quand mme voir, grce aux courbes de niveau, quelle admet un minimum (global) en (0,0).
79
Exemple 2 Voici prsent une reprsentation trois dimensions de ce quon appelle une selle de cheval (z = x.y), vue sous deux angles diffrents.
Ci-dessous, on trouve les courbes de niveau de cette surface (aux hauteurs 4, -2, -1, -0.5, -0.25, -0.1, 0.1, 0.25, 0.5, 1, 2, 4).
y=x
y=x
80
Le point de coordonnes (0,0) est un point trs particulier. En effet, si lon suit un chemin imaginaire situ sur la surface la verticale de la droite dquation y = x, on constate que (0,0) est un minimum ( point le plus bas ) pour ce chemin ; dautre part, en suivant un chemin la verticale de la droite dquation y = x , le point (0,0) est un maximum. Un tel point est appel point de selle (ou encore point col, en rfrence aux cols des montagnes, o un tel phnomne se produit).
81
6.3. Recherche dextrema de fonctions de n variables sous contrainte dgalit Mthode de Lagrange
Mthode : Pour optimiser la fonction
1. Ecrire la fonction L appele fonction Lagrangienne. Cette fonction L dpend de n+1 variables x1 , x 2 et de la variable , et est dfinie comme suit :
L( , x1 , x 2 ) = F ( x1 , x 2 ) .(g ( x1 , x 2 ) C )
3. Rsoudre le systme
L ( , x1 , x 2 ) = 0 L ( , x1 , x 2 ) = 0 x1 L ( , x , x ) = 0 1 2 x 2
*
2L ( , x1 , x 2 ) ( )2 2 L HL( , x1 , x 2 ) = ( , x1 , x 2 ) .x1 2L ( , x1 , x 2 ) .x 2
2L ( , x1 , x 2 ) x1. 2L
(x1 )2
( , x1 , x 2 )
2L ( , x1 , x 2 ) x1.x 2
2L ( , x1 , x 2 ) x 2 . 2L ( , x1 , x 2 ) x 2 .x1 2L ( , x1 , x 2 ) (x 2 )2
5. Ecrire la matrice Hessienne HL(*, x1 *, x 2 *) pour chaque point stationnaire. Si dt HL( , x1 , x 2 ) > 0
* *
(
(
)
)
Si dt HL( , x1 , x 2 ) < 0
* *
82
Exercice rsolu
Optimiser la fonction
soumise la
L( , x1 , x 2 ) = F ( x1 , x 2 ) .(g ( x1 , x 2 ) C )
2 2
L( , x1 , x 2 ) = 5 x1 + 6 x 2 x1 .x 2 .( x1 + 2.x 2 24)
et rsoudre le systme
L ( , x1 , x 2 ) = 0 L ( , x1 , x 2 ) = 0 : x1 L ( , x , x ) = 0 1 2 x 2 x1 + 2.x 2 24 = 0 10.x1 x 2 = x1 6 x2 = 2
x1 + 2.x 2 24 = 0 3 x 2 = .x1 2 x1 6x = 2 2 x1 + 2.x 2 24 = 0 x1 10.x1 x 2 = 6 x 2 2 x1 6 x2 = 2 x1 + 3.x1 24 = 0 3 x 2 = .x1 2 = 9.x x1 1 2
( x1 + 2.x 2 24 ) = 0 10.x1 x 2 = 0 12 x x 2. = 0 2 1
x1 + 2.x 2 24 = 0 21 .x1 7 x 2 = 0 2 6 x x1 = 2 2
x1 = 6 x2 = 9 = 51
= 51 x1 = 6 x = 9 2
La solution (51,6,9) de ce systme est un point stationnaire de L ; (6,9) est un point stationnaire de F.
83
2L ( , x1 , x 2 ) ( )2 2 L ( , x1 , x 2 ) HL( , x1 , x 2 ) = .x1 2L ( , x1 , x 2 ) .x 2
0 1 2 HL( , x1 , x 2 ) = 1 10 1 2 1 12
2L ( , x1 , x 2 ) x1. 2L
(x1 )2
( , x1 , x 2 )
2L ( , x1 , x 2 ) x1.x 2
2L ( , x1 , x 2 ) x 2 . 2L ( , x1 , x 2 ) x 2 .x1 2 L ( , x1 , x 2 ) (x2 )2
0 1 2 dt 1 10 1 = 56 < 0 2 1 12
Le point
= 51 ).
Exercices
Exercice 23 Optimiser la fonction F dfinie par F ( x1 , x 2 ) = x1 .x 2 soumise la contrainte exprime par lgalit x1 + x 2 = 6 . Exercice 24 Optimiser la fonction
soumise la contrainte
soumise la
84
0 x 3 . 0 y 4
c) Reprez graphiquement les extrema de
x 0, y 0 . x + 2 y 4
d) Reprez graphiquement les extrema de F sous la contrainte
x y = 1.
85
Sous les contraintes que x soit compris entre 0 et 3 et que y soit compris entre 0 et 4, F admet un minimum en (1,1), et 4 extrema locaux en (0,0), (3,0), (3,4) et (0,4) ; parmi eux, le plus haut est (3,4) ( hauteur 13 = (3-1)2+(4-1)2 ). Visualisation en 3D du morceau de surface vrifiant les contraintes 0 x 3 et 0 y 4 :
x 0, y 0 . x + 2 y 4
86
Sous les contraintes ci-dessus, F admet un minimum global en (1,1) et trois maxima locaux en (0,0), (4,0) et (0,2) ; le plus haut de ces trois maxima est en (4,0) ( hauteur 10 = (41)2 + (01)2).
x y = 1.
Sous la contrainte que x y = 1, F admet un minimum en (1.5 ; 0.5) (limage de ce point est hauteur 0.5 = F(1.5 ; 0.5) ).
Exercice
Exercice 27 Soit F la fonction de deux variables x1 et x2 dfinie par
1.5 x2 4
87
88
89
2 3
est un maximum.
5 2
Exercice 5
90
Exercice 6
91
Exercice 9 Le profit est donn par q. p C (q ) La fonction profit est donne par P (q ) = .q 3 + 6.q 2 11.q 50
1 3
p * = 100
q * = 24,6 est un maximum de B, et q * = 119,4 est un minimum de B. Une production de 25 CD par semaine procurera un bnfice maximum.
Exercice 12 La fonction bnfice est donne par B ( p ) = p 2 + 240. p
32000 30 240 2. p
3 4
q * = 10 est un maximum de B.
Le niveau de production qui maximise le bnfice est de 10 units.
92
C (q ) q
q * = 10 est un minimum de C.
Le niveau de production qui minimise les cots de production est de 10 units. Exercice 14 La production est donne par
MO 2 MO .( 3 ). 25 12
MO * = 24 est un maximum de P et MO * = 0 est un minimum de P. Leffectif qui maximise la production est donc de 24.
Exercice 15
1.
dt (2 ) = 2 > 0
et
2 2 dt 2 4 = 4 > 0
et
2 2 2 dt 2 4 0 = 16 > 0 2 0 8
1 0 dt 0 1 = 1 > 0
1 0 0 et dt 0 1 0 = 1 > 0 0 0 1
6 0 dt 0 2 = 12 > 0
6 6 0 et dt 0 2 0 = 72 < 0 6 0 12
2 = 1 < 0 1
La matrice 2
93
5. dt (1) = 1 > 0
et
1 0 dt 0 1 = 1 > 0 et
1 0 2 dt 0 1 0 = a 4 2 0 a
2 2 2 2 2 dt 2 5 = 6 > 0 et dt 2 5 1 = 0 2 1 5
La fonction profit est donne par le profit est donn par 12 . q A +18. q B C ( q A , q B ) Le profit est maximis par le niveau de production
q A = 2 et
qB = 4
Exercice 23 (3,3) est un maximum local de la fonction F sous la contrainte x1 + x 2 = 6 avec = 3 . Exercice 24
94
95
Notations.
avec la matrice X =
n lignes et 1
x1 ... xn
1 ligne et n colonnes.
Addition :
+
x1 ... xn
= =
x1 + x'1 ... xn + x'n
96
= =
.
x1 ... xn
x1 ... xn
Dans , les n lments ei, i {1, ... , n}, dont toutes les coordonnes sont nulles, sauf la ie qui vaut 1, forment une base, appele la base canonique de n. Tout lment X = (x1, ... , xn) de
n
I.1.2.1. Dfinition.
On appelle produit scalaire dans proprits suivantes :
n
toute application de
dans
a) Bilinarit.
Linarit par rapport la premire variable : (X + X', Y) = (X, Y) + (X', Y) et ( X, Y) = (X, Y), quels que soient dans , X, X' et Y dans n ; cette proprit s'crit aussi
< X + X' | | Y > = < X | | Y > + < X' | | Y >
Linarit par rapport la deuxime variable : (X, Y + Y') = (X, Y) + (X, Y') et (X, Y) = (X, Y), quels que soient dans , X, Y et Y' dans n ; cette proprit s'crit aussi
< X | | Y + Y' > = < X | | Y > + < X | | Y' >
b) Symtrie.
(X, Y) = (Y, X), quels que soient X et Y dans
n
<X||Y>=<Y||X>
c) Positivit.
(X, X) est un nombre rel suprieur ou gal 0, quel que soit X dans
<X||X>0
n
d) Non dgnrescence.
(X, X) = 0 entrane X = 0 : 97
< X | | X > = 0 X = 0.
On dit aussi qu'un produit scalaire sur n est une forme bilinaire symtrique positive non dgnre. Le mot "forme" fait simplement rfrence au fait que les valeurs sont des scalaires. Lorsqu'il est muni d'un produit scalaire, n est appel un espace vectoriel euclidien.
I.1.2.2. Exemples.
dans
dfinie par :
< X | Y > = tX Y =
x1 ... xj ... xn
xi yi
est un produit scalaire sur qu'on appelle le produit scalaire canonique de n. En effet, les proprits de bilinarit, de symtrie, de positivit et de non dgnrescence sont pratiquement videntes vrifier.
(X, Y)
< X | M | Y > = tX M Y =
n
x1 ... xj ... xn
= ij mij xj yi = i mii xi yi
est un produit scalaire sur . La matrice M est appele la matrice des poids (les "poids" sont les lments de la diagonale). En effet, les proprits de bilinarit, de symtrie, de positivit et de non dgnrescence sont pratiquement videntes vrifier.
Le produit scalaire canonique correspond au cas o la matrice M est la matrice unit In (tous les lments de la diagonale sont gaux 1 et les lments en dehors de la diagonale sont 0) : tous les poids sont gaux 1.
98
Autre exemple : M = D =
I.1.2.3. Proprits.
, on peut crire :
x1 ... xi ... xn M
La matrice M = [ (ei, ej)] s'appelle la matrice du produit scalaire dans la base canonique. Cette matrice est une matrice symtrique : (ei, ej) = (ej, ei). Les lments de sa diagonale sont des nombres rels strictement positifs : (ei, ei) > 0. Remarquons ces proprits ne sont pas suffisantes : une matrice symtrique dont les lments de la diagonale sont des nombres rels strictement positifs ne dfinit pas forcment un produit scalaire. a un dterminant qui vaut 3 < 0, donc elle possde deux Par exemple, la matrice valeurs propres relles de signe oppos (3 et 1) et la forme bilinaire ((x1, x2),(y1, y2)) (x1, x2) qu'elle dfinit n'est pas un produit scalaire car le "produit scalaire" du vecteur propre (1, 1) pour la valeur propre ngative, par lui-mme, est un nombre rel strictement ngatif ((1 1) = 2).
La matrice n'est donc pas la matrice d'un produit scalaire sur 2, bien qu'elle soit symtrique et que les lments de sa diagonale soient strictement positifs. En ralit, pour qu'une matrice carre symtrique relle soit la matrice d'un produit scalaire, il faut et il suffit que toutes ses valeurs propres, qui sont toujours des nombres rels, soient strictement positives. Mais ce rsultat ne sera dmontr, dans sa gnralit, que plus tard, en algbre.
99
(X + Y, X + Y) = || X + Y || 0 (Y, Y) + ( (Y, X) + (X, Y)) + (X, X) 0 (Y, Y) + 2 (X, Y) + (X, X) 0 || Y || + 2 < X | Y > + || X || 0
Comme cette relation est vraie pour tout nombre rel , c'est que le discriminant de ce trinme du deuxime degr est ngatif :
(< X | Y >) || X || || Y || 0 | < X | Y > | || X || || Y ||
Cette ingalit, valable pour tous vecteurs X et Y de n constitue l'ingalit de Schwarz. Si les deux vecteurs X et Y sont diffrents de 0, leur longueur n'est pas nulle, le produit de leurs longueurs n'est pas nul, le rapport est compris entre 1 et 1, et il existe donc un .
angle compris entre 0 et radians dont le cosinus est gal au rapport Par dfinition, cet angle unique compris entre 0 et , vrifiant :
cos =
d) Orthogonalit.
Etant donns deux vecteurs X et Y de n et un produit scalaire sur n, on dit que X et Y sont -orthogonaux (ou simplement "orthogonaux" s'il n'y a pas de confusion craindre) si, et seulement si, leur produit scalaire est nul :
(X, Y) = < X | Y > = 0
L'angle de deux vecteurs non nuls -orthogonaux est . La base canonique de n muni du produit scalaire canonique est forme de vecteurs norms orthogonaux deux deux : on parle alors de base orthonorme.
e) Projet orthogonal.
Soient X et Y deux vecteurs non nuls de n et un produit scalaire sur n. Il existe un unique vecteur Z de n, proportionnel Y et tel que X Z soit orthogonal Y. Dmonstration. Pour tout vecteur Z on peut crire :
< X Z | Y > = < X | Y > < Z | Y >
100
Pour que X Z soit orthogonal Y., soit < X Z | Y > = 0, il faut et il suffit que l'on prenne a = .
Y, proportionnel Y et tel que X Z soit orthogonal Y, s'appelle L'unique vecteur Z = le projet orthogonal de X sur Y.
Comme Z est proportionnel Y et que Z0 est proportionnel Y, la diffrence Z0 Z est proportionnelle Y. Or X Z0 est orthogonal Y, donc X Z0 est orthogonal Z0 Z qui est proportionnel Y. Il est rsulte que l'on a :
|| X Z || = || X Z0 + Z0 Z || = || X Z0 || + || Z0 Z || || X Z0 ||.
Ce vecteur est not encore X = . Les n valeurs Y () de Y pour les n individus de la population peuvent tre considres
101
L'espace E = n apparat alors comme l'espace des variables. Chaque lment de E peut tre considr comme les valeurs d'une variable statistique quantitative relle dfinie sur .
xi y i =
n
<X|Y>
On note n = le vecteur dont toutes les coordonnes sont gales 1. On l'appelle le vecteur unit de n. On remarquera que ce vecteur unit est norm, sa longueur est || 1.
n
||
i 1 1 =
n=
>. = < X |
>
La moyenne de X est le produit scalaire de X par le vecteur unit n. Notons X0 la variable centre correspondant X : pour chaque individu de la population, sa valeur est X () :
X0 = X = X0 +
=
n
= X0 + < X |
n
=X >
n
n.
| X0 > = || X0 ||
102
I.2.5. Covariance.
La covariance de deux variables quantitatives relles X et Y dfinies sur est la moyenne du produit des variables centres :
Cov (X, Y) =
i (xi
)(yi ) = < X0 | D
rXY =
D'aprs ce qui prcde (I.1.2.3.e), b X0 = X0 est le projet orthogonal de Y0 sur X0, Y0 b X0 est orthogonal X0 et b est la valeur qui minimise l'expression
S=
i (Y0i b X0i) = || Y0 b X0 || = s (Y b X) = s (Y a b X) = s (Y Y*) = s (Y0 Y0*) Le prdicteur linaire de la variable centre Y0 est le projet orthogonal de Y0 sur X0 dans n. C'est la variable Y0* qui minimise la variance de Y0 Y0*.
= || Y0 b X0 + b X0 ||
= || Y0 b X0 ||
+ || b X0 ||
s (Y)
Nous retrouvons la variance rsiduelle S min et la variance explique par la rgression rXY s (Y). De faon symtrique, si X est la variable explicative et Y la variable explicative, nous aurons une expression :
103
avec la variance rsiduelle S' min et la variance explique par la rgression rXY s (X).
II - REGRESSION MULTIPLE.
= a X0 + b Y 0
de Z0, tel que le nuage de points (x0i, y0i, 0i = a x0i + b y0i), i [1, n], soit aussi proche possible du nuage de points (x0i, y0i, z0i), i [1, n], au sens des moindres carrs. L'approche euclidienne de ce problme dans que S = || Z0
0 n
consiste trouver un
= a X0 + b Y 0
tel
||
soit minimum.
Le problme est donc de trouver, dans n, un vecteur 0 du plan (= sous-espace vectoriel de dimension 2) dfini par X0 et Y0, tel que le vecteur Z0 0 ait une longueur minimum (au sens du produit scalaire dfini par la matrice des poids D ). La solution sera fournie par le projet orthogonal
0
de Z0 sur .
a) Dfinition.
Si nous connaissons une base orthonorme { u1, u2 } d'un sous-espace vectoriel de dimension 2, dfini dans n par les deux vecteurs X0 et Y0, nous savons calculer le projet
104
u1 = < Z0 | u1 >
u1 et
nous savons calculer aussi le projet orthogonal < Z0 | u2 > sur u2. tel que Z0 On appelle projet orthogonal de Z0 sur . l'unique vecteur soit orthogonal . 0
u2 de Z0 de
Un tel vecteur existe et est unique. Dmonstration. Notons 0 le vecteur < Z0 | u1 > sur les vecteurs u1 et u2. < Z0
0
u1 + < Z0 | u2 >
| u1 >
<
u1 + < Z0 | u2 >
<
u1 + < Z0 | u2 >
Ainsi, Z0 0 est orthogonal u1 et u2, il est donc orthogonal toute combinaison linaire de u1 et u2, c'est--dire tout lment de : on dit qu'il est orthogonal . Le projet orthogonal de
0
sur u1 est
<
0
| u1 >
u1 = < Z0 | u1 >
u 1.
Le projet orthogonal de
sur u2 est
<
0
| u2 >
u2 = < Z0 | u2 >
u 2.
= < Z0 | u1 >
u1 + < Z0 | u2 >
u2 = <
| u1 >
u1 + <
| u2 >
u2.
105
Z = < Z | u1 >
u1 + < Z | u2 >
u2 = < Z0 | u1 >
u1 + < Z0 | u2 >
u2 =
0.
Le vecteur :
0
= < Z0 | u1 >
0
u1 + < Z0 | u2 >
u2
est donc l'unique vecteur de tel que Z0 projet orthogonal de Z0 sur . La relation :
0
=<
0 0
| u1 >
u1 + <
| u2 >
u2
= < Z0 | u1 >
u1 + < Z0 | u2 >
|| Z0 Z ||
Or Z0 0 est orthogonal , donc orthogonal tout lment de , donc Z0 orthogonal 0 et Z, donc aussi 0 Z. Le thorme de Pythagore s'applique :
|| Z0 + Z || = || Z0 || || + || + || Z ||
est
|| Z0 Z ||
= || Z0
Z ||
||
lorsque Z = 0.
Le prdicteur
||
La seule chose qu'il nous reste faire dans la suite, est d'expliciter ce projet orthogonal en fonction des donnes (x0i, y0i, z0i), i [1, n].
u1 =
On a, en effet : s (X) = || X0 ||
X0 et Y0
Y0
X0
= || Y0 ||
|| X0 || = s (Y) (1 rXY) =
.2
< Y0 | X0 >
= s (Y) s (Y)
On peut donc prendre dans le plan , pour vecteur norm u2 orthogonal u1, le vecteur :
u2 = Y0 X0
Y0
X0
Les vecteurs : u1 = u2 = Y0 X0
= < Z0 | u1 >
u1 + < Z0 | u2 >
u2
>
X0
C'est aussi le projet orthogonal de Z0 sur X0. La deuxime composante est le projet orthogonal de Z0 sur u2 :
< Z0 | u2 >
u2 = < Z0 | Y0 X0
Y0
X0 >
107
< Z 0 | Y0 > Y0
< Z0 | X0 > X0
Y0
X0
= =
X0 + Cov (X, Z) Y0
Y0
X0 Cov (X, Y) X0 +
X0 +
Y0
X0 +
Y0
Cette expression est symtrique en X et Y. On sait calculer les quantits qui interviennent dans cette expression en fonction des donnes (x0i, y0i, z0i), i [1, n]. On commence par calculer la matrice des variances-covariances :
A=
Formellement, la relation
=0
108
rXY =
; rXZ =
0
; rYZ =
deviennent :
=
et, en changeant X et Y :
=
En reportant, dans l'expression de 0, les expressions obtenues pour les coefficients, on obtient :
0
= =
X0 +
Y0
et
: || X0 ||
= s (X) et || Y0
= =
+2
rXZ + rXY rYZ 2 rXY rXZ rYZ + rYZ + rXY rXZ 2 rXY rXZ rYZ + 2 rXY (rXZ rYZ rXY
rXZ rXY rYZ + rXY rXZ rYZ) = rXZ + rXY rYZ 2 rXY rXZ rYZ + rYZ + rXY rXZ 2 rXY rXZ rYZ + 2 rXY rXZ rYZ 2 rXY
rXZ 2 rXY rYZ + 2 rXY rXZ rYZ) = rXZ + rXY rXZ 2 rXY rXZ + rYZ + rXY rYZ 2 rXY rYZ 2 rXY rXZ rYZ 2 rXY rXZ
109
= = =
rXZ rXY rXZ + rYZ rXY rYZ 2 rXY rXZ rYZ + 2 rXY rXZ rYZ) rXZ (1 rXY) + rYZ (1 rXY) 2 rXY rXZ rYZ (1 rXY) rXZ + rYZ 2 rXY rXZ rYZ
Le coefficient :
R Z | XY =
s'appelle le coefficient de corrlation linaire multiple de Z en X, Y. La variance du prdicteur de Z est donne par :
s ( ) = ||
||
= R Z | XY s (Z)
a) Validit du prdicteur de Z.
La variance de Z s'crit :
s (Z) = s (Z0) = || Z0 ||
II.2.2. Proprits.
= || Z0
||
= || Z0
||
+ ||
||
Or || Z0 ||
||
pour les : || Z0
On retrouve la mme formule de dcomposition de la variance que pour la rgression linaire : la variance de Z est la somme de la variance explique R Z | XY s (Z) par la rgression linaire multiple, et de la variance rsiduelle S min = (1 R Z | XY ) s (Z). Plus le coefficient R Z | XY est proche de 1, plus la part de variance de Z explique par la rgression linaire multiple en X et Y est grande, donc meilleur est le prdicteur linaire 0. La validit du prdicteur 0 est mesure par le coefficient R Z | XY .
110
C XY =
= tVXY D VXY.
par la formule :
= tVXY D VZ.
= (rXZ rYZ) C
formule que l'on peut crire directement en fonction des donnes centres rduites :
R Z | XY =
t
VXY D VZ
VXY D VXY
VXY D VZ .
VXY D VXY
= VXY 1 D
1 t
VXY 1
puisque la matrice VXY, n lignes et 2 colonnes, n'est pas inversible, alors que la matrice produit C = tVXY D VXY, 2 lignes et 2 colonnes, est inversible.
111
= c X0 = d Y0 0 = a X0 + b Y 0 .
0 0
La thorie de la rgression multiple que nous venons d'exposer dans le cas de deux variables explicatives peut se gnraliser au cas de p variables explicatives, avec p > 2.
112
Le rsultat de l'exprience n'est pas connu a priori : nous disons alors que l'exprience est alatoire. L'ensemble de tous les rsultats possibles pour une exprience alatoire E donne s'appelle le rfrentiel, ou ensemble fondamental, de l'exprience alatoire E. Un lment de l'ensemble fondamental s'appelle un rsultat lmentaire. Nous supposerons, dans un premier temps, que l'ensemble des rsultats lmentaires est un ensemble fini. Dans l'exprience alatoire du jet de d, l'ensemble est l'ensemble {1, 2, 3, 4, 5, 6}. Les rsultats lmentaires sont les nombres entiers 1, 2, 3, 4, 5, 6.
a) Dfinition.
Soit A un ensemble d'vnements. A est une partie de l'ensemble des parties de l'ensemble fondamental de l'exprience alatoire E. Nous dirons que A est une algbre d'vnements de l'exprience alatoire E si A vrifie les proprits suivantes : 1. A. 2. A A A ( dsigne le complmentaire 3. A A et B A A U B A. A de A dans ).
On appelle espace probabilisable tout couple (, A) dans lequel est l'ensemble fondamental d'une exprience alatoire E, A une algbre d'vnements de l'exprience alatoire E.
113
Or le complmentaire de dans est la partie vide . Donc la partie vide est un lment de A. A2. Toute runion finie d'lments de A est un lment de A. C'est vrai dj, d'aprs la proprit prcdente A1, pour la runion de 0 lment de A, qui est vide. Supposons, hypothse de rcurrence, que la runion de toute famille de n lments de A soit un lment de A, pour un entier n 0. Considrons une famille (Ai)i {1, ... , n + 1} de n + 1 lments de A. D'aprs l'hypothse de rcurrence, la runion A1 U ... U An est un lment de A (cette runion est vide si n = 0). D'aprs la proprit 3 de la dfinition, comme An + 1 et A1 U ... U An sont des lments de A, leur runion A1 U ... U An U An + 1 est aussi un lment de A. La proprit se trouve donc vraie pour n + 1 ds qu'elle est vraie pour n. D'aprs le principe de rcurrence, la proprit est vraie pour tout entier n 0. A3. Toute intersection finie d'lments de A est un lment de A.
Ai =
Si les Ai sont des lments de A, les complmentaires sont des lments de A, d'aprs la proprit 2 de la dfinition. est un lment de A, d'aprs la proprit prcdente A2. Le complmentaire = Ai de cet lment proprit 2 de la dfinition. A4. Evnements lmentaires. Dans une algbre finie d'vnements A, les lments minimaux pour l'inclusion, dans l'ensemble A* des vnements non vides, sont appels les vnements lmentaires de A. Proprit.
Les vnements lmentaires contenus dans un vnement non vide forment une partition de cet vnement.
Dmonstration. 1/ Considrons un vnement A A. Soit (Ai)i I la famille des vnements lmentaires de A contenus dans A. Soit B = Ai la runion de cette famille. B est un lment de A (proprit A2), contenu dans A. Soit x un lment de , appartenant A et n'appartenant pas B. La famille des vnements de A contenant x n'est pas vide, elle contient au moins A.
114
Soit X l'intersection de cette famille. X est un lment de A (proprit A3), contenu dans A et non vide, puisqu'il contient x. X est un lment minimal pour l'inclusion dans A*. En effet, si X contenait strictement un autre vnement non vide Y, Y ne contiendrait pas x, puisque X est contenu dans tout vnement contenant x. X I serait alors un lment de A contenant x, donc contenant X, ce qui ne peut pas tre, sinon X serait contenu dans , et serait donc sans point commun avec Y, contredisant le fait que Y est non vide et contenu dans X. Mais si X est un lment minimal, donc un vnement lmentaire, contenu dans A, c'est l'un des Ai. L'lment x qui appartient X appartient ainsi l'un des Ai, donc leur runion B. Ceci contredit notre hypothse de choix de x, lment de , appartenant A et n'appartenant pas B. Il n'existe donc aucun x appartenant A et n'appartenant pas B : c'est que A est gal B. Et A est la runion des vnements lmentaires qu'il contient. 2/ Si A n'est pas vide, il contient au moins un lment x. Comme prcdemment, l'intersection X de la famille des vnements contenant x est un vnement lmentaire contenant x et contenu dans A. Donc la famille des vnements lmentaires contenus dans A n'est pas vide. A chaque lment x de A, on peut ainsi faire correspondre un vnement lmentaire contenant x et contenu dans A. Comme A est fini, la famille F des vnements lmentaires ainsi dfinie est finie. L'intersection de deux vnements lmentaires diffrents est vide, sinon on pourrait trouver un vnement non vide strictement plus petit que les deux autres, ce qui n'est pas possible, s'agissant d'lments minimaux dans A*. On peut alors extraire de la famille F une famille d'vnements lmentaires distincts, et tout vnement lmentaire contenu dans A est un lment de cette famille extraite. D'aprs ce qui prcde, A est runion de cette famille : celle-ci forme donc une partition de A. En particulier, est runion des vnements lmentaires de A, puisque c'est un vnement de A qui contient tous les vnements lmentaires de A.
c) Exemples.
1. Algbre grossire d'vnements. A = {, } est une algbre d'vnements, appele l'algbre grossire des vnements.
En effet, les trois axiomes de la dfinition sont trivialement vrifis, compte tenu des relations :
U = , U = , U = , = , = .
115
116
Exemple :
Etant donns deux vnements A et B, les vnements A I B, A I , I B, I , s'ils ne sont pas vides, forment une partition de et engendrent une algbre d'vnements, forme des runions des 2 4 = 16 familles possibles de ces vnements, et dont les vnements lmentaires sont A I B, A I , I B, I .
Ai
P(Ai)
117
On appelle espace probabilis tout triplet (, A, P) dans lequel (, A) est un espace probabilisable et P une probabilit sur cet espace probabilisable.
III.2.2. Proprits.
III.2.2.1. Evnements contraires.
Deux vnements sont dits contraires s'ils sont complmentaires l'un de l'autre. Pour tout vnement A, A et sont des vnements contraires. A I = P (A U ) = P (A) + P ( ) A U = P () = P (A) + P ( ) P () = 1 P (A) + P ( ) = 1
P (A) + P ( ) = 1
III.2.2.3. Croissance.
Si l'vnement A est contenu dans l'vnement B, alors P (A) est infrieure ou gale P (B).
A B P (A) P (B)
En effet : ABAIB=A A I B = A B = (B I A) U (B I ) = A U (B I ), A I (B I ) = P (B) = P (A I (B I )) = P (A) + P (B I ) P (B I ) [0, 1] et P (B) = P (A) + P (B I ) P (B) P (A) En dfinitive, on obtient bien : A B P (A) P (B). Toute probabilit est une application croissante.
118
Ai
P(Ai)
( i)(i [1, N ] N pi [ 0, 1 ] R) [les pi sont des nombres rels compris entre 0 et 1].
pi =
P ({i}) = P (
Comme chaque vnement est runion des vnements lmentaires qu'il contient, la probabilit d'un vnement A est donne par :
P (A) = P (
{ }) =
P ({ })
Un cas particulier important est celui o tous les vnements lmentaires ont la mme probabilit p. La relation pi = 1 s'crit N p = 1, soit p = . La probabilit d'un vnement A qui est ralis dans n vnements lmentaires est alors donne par :
P (A) = P ({ }) = Card (A)
La probabilit d'un vnement A est le rapport entre le nombre de cas favorables n et le nombre de cas possibles N.
P (A) =
119
L'application A En effet :
a) Comme P est une probabilit, ses valeurs sont positives et comprises entre 0 et 1, donc, pour tout A A, P (A | B) est positif. b) Comme A I B est contenu dans B et que l'application P est croissante, P (A I B) est infrieur ou gal P (B), donc le rapport c) P ( | B) = = = 1. est infrieur ou gal 1.
III.3.2. Indpendance.
III.3.2.1. Dfinition.
La relation P (A | B) = peut tre crite :
P (A I B) = P (A | B) P (B)
Deux vnements A et B sont dits indpendants en probabilit, ou, simplement, indpendants, s'ils vrifient la relation :
120
P (A I B) = P (A) P (B)
Pour des vnements de probabilit non nulle, les proprits suivantes sont quivalentes : A et B sont indpendants. P (A I B) = P (A) P (B). P (A | B) = P (A). P (B | A) = P (B). L'information donne par la ralisation de A sur la ralisation de B est nulle et l'information donne par la ralisation de B sur la ralisation de A est nulle.
P (A | B) =
Remarque.
Il convient de ne pas confondre indpendance et incompatibilit. L'indpendance est une question de probabilit : si on change la probabilit, deux vnements prcdemment indpendants peuvent ne plus tre indpendants. L'incompatibilit ne fait pas intervenir la probabilit : une intersection vide reste vide quelque soit la probabilit.
III.3.2.2. Gnralisation.
La formule
P (A I B) = P (A) P (B | A)
Nous dirons que les trois vnements A, B, C sont indpendants dans leur ensemble si, et seulement si, les quatre relations suivantes sont vrifies :
121
P (A I B I C) = P (A) P (B) P (C) P (A I B) = P (A) P (B) P (B I C) = P (B) P (C) P (C I A) = P (C) P (A) Plus gnralement, nous dirons que n vnements (Ai)i {1, ... , n} sont indpendants dans leur ensemble si, et seulement si, pour toute partie I de l'ensemble {1, ... , n}, la relation suivante est vrifie :
Ai
P (Ai)
Dans le cas o I est vide, l'intersection d'une famille vide est vide, et il faut prendre 0 pour produit d'une famille vide.
Bi et :
= (A I Bi)
Comme les Bi sont deux deux incompatibles, les A I Bi, qui sont contenus dans les Bi d'indices correspondants, sont eux aussi, deux deux incompatibles. La probabilit de leur runion est donc la somme de leurs probabilits :
P (A) = P (A I Bi) = P (A | Bi) P (Bi) = P (A | B1) P (B1) + ... + P (A | Bn) P (Bn)
et si la probabilit de A n'est pas nulle, c'est--dire si l'un au moins des P (A | Bj) P (Bj) n'est pas nul, la formule de Bayes s'en dduit.
122
P (B | A) =
III.3.3.3. Exemple.
On prend un d au hasard parmi un lot de 100 ds dont on sait que 25 d'entre eux sont pips. Pour un d pip, la probabilit d'obtenir un 6 est 0,5. On lance le d choisi, on obtient 6 : quelle est la probabilit pour que le d choisi soit pip ? Appelons T l'vnement "le d est pip", S l'vnement "on obtient un 6". T et forment un systme complet d'vnements. La formule de Bayes donne :
P (T | S) =
Remarque.
La formule de Bayes s'applique dans le cas d'une exprience alatoire o le hasard intervient deux reprises : une premire fois dans le choix du d, une deuxime fois dans le rsultat du lancer. Un rsultat li au premier niveau de hasard est appel une "cause". Un rsultat li au deuxime niveau de hasard est appel une "consquence". Dans le cas prsent, on a calcul la probabilit que le d soit pip (la cause), sachant que nous avons obtenu les 6 (la consquence). C'est pourquoi la formule de Bayes est aussi appele la formule de probabilit des causes. Les donnes du problme peuvent tre prsentes sous forme d'un tableau des probabilits, compte tenu de la formule P (A I B) = P (B) P (A | B) :
D pip = T 6=S non 6 =
Total P (S I T) = P (T) P (S | T) = P ( I T) P (T) =
D non pip =
P (S I ) = P ( ) P( I ) P( )
Total P (S) P( ) P ()
= 1
S T
= = =
Total
+ 1 1
= =
Total
Total
123
Ce tableau de probabilits conjointes remplace la formule de Bayes et permet de rpondre toutes les questions qu'on se pose sur les probabilits conditionnelles : pour calculer P (T | S), on regarde dans la ligne de S, combien il y a de T I S .
P (T | S) =
(B') X 1 (B U B') La relation X 1 (B U B') = X 1 (B) U X 1 (B) entrane A U A' A. Comme l'application B X 1 (B) est croissante, les vnements lmentaires de cette algbre d'vnements sont les images rciproques des valeurs xk de X. Toute application X dfinie sur et valeurs dans R permet donc de dfinir un espace probabilisable (, A), sur lequel X est une variable alatoire relle.
III.4.2. Exemple.
Soit l'ensemble fondamental associ une preuve alatoire E. Soit A une partie de . On appelle variable indicatrice de Bernoulli de A, la variable alatoire 1A dfinie, pour tout lment de , par :
1A () =
Cette variable alatoire n'a que deux valeurs : 0 et 1. Les vnements lmentaires de l'algbre d'vnements qu'elle dfinit sont : 1A 1 (1) = A 1A 1 (0) = L'algbre d'vnements dfinie par la variable indicatrice de Bernoulli de A est donc l'algbre de Bernoulli A forme des lments {, A, , } de P () et l'espace probabilisable associ est (, A).
Comme les valeurs de X sont les (xk)k I, X 1 ({x}) est vide lorsque x n'est pas l'un des (xk)k I et sa probabilit est nulle. Lorsque x = xk, pour un k I, on obtient :
PX (xk) = P (X 1 ({xk})) = P (Ak) = P () = P ()
Le nombre pk = PX (xk) = P () est souvent not, par abus d'criture, P (X = xk), ou P (xk). On dit que pk est la probabilit de la valeur xk de X. 125
L'ensemble des couples (xk, pk)k I est appel la loi de probabilit de la variable alatoire X.
III.4.3.2. Proprits.
a) Pour tout k I, pk [0, 1]. En effet, pk = P (X = xk) = P (Ak), et les valeurs de P sont des nombres rels compris entre 0 et 1.
b)
pk = 1.
En effet, les Ak, k I, sont les vnements lmentaires de l'algbre d'vnements A, donc ils sont incompatibles deux deux et leur runion est :
Ak = X 1 ({xk}) = X 1 (
{xk}) = X 1 (X ()) =
= P () = 1.
III.4.3.3.3. Exemple.
Considrons la variable indicatrice de Bernoulli 1A d'un vnement A. Notons p la probabilit de ralisation de l'vnement A, et q = 1 p. Nous avons, par dfinition :
1A () =
donc : p = P (A) = P (1A 1 (1)) = P (1A = 1) = P (1) = P (1). q = 1 P (A) = P( ) = P (1A 1 (0)) = P (1A = 0) = P (0) = P (0). La loi de probabilit de la variable indicatrice 1A est donc donne par le tableau :
xk pk
0 q
1 p
avec p + q = 1.
F (x) = P (X x) =
P (X = xk) =
pk.
126
III.4.4.2. Proprit.
Comme les pk sont des nombres positifs, la fonction de rpartition est une application croissante, dont toutes les valeurs sont positives. pk des pk est gale 1, F (x) crot de 0 1 lorsque x varie de +. Comme la somme Lorsque x atteint une valeur xk par valeurs infrieures, F (x) augmente brusquement de pk et reste constante sur l'intervalle [xk, xk + 1[. C'est une fonction en escalier, continue droite :
III.4.4.3. Exemple.
La variable indicatrice de Bernoulli d'un vnement A a pour fonction de rpartition :
F (x) =
E (X) =
p k xk
127
III.4.5.1. Proprits.
b) Linarit.
Soient X une variable alatoire relle discrte, a et b des constantes. La variable alatoire Z = a X + b prend les valeurs zk = a xk + b avec les probabilits :
P (Z = zk) = P (X = xk)
E (Z) =
Plus gnralement, nous admettrons que, pour deux variables alatoires X et Y, et deux constantes a et b, nous avons :
E (a X + b Y) = a E (X) + b E (Y)
III.4.5.2. Gnralisation.
Si est une application de R dans R, o X est une variable alatoire qu'on note (X). L'esprance mathmatique, ou moyenne, de (X) est (rsultat admis) :
E ( (X)) = pk (xk)
III.4.5.3. Moments.
Pour tout entier n, l'esprance mathmatique E (X n) s'appelle le moment d'ordre n de X, on le note mn.
mn = E (X n) =
p k xk n
128
m0 = m1 = m2 =
pk = 1 pk xk = E (X) pk xk 2 = E (X 2)
n = E ((X E (X)) n) =
pk (xk E (X)) n
0 = 1 = 2 =
III.4.6. Variance.
Le moment centr d'ordre 2 s'appelle la variance. On note Var (X) la variance de X.
pk (xk E (X)) 2
Var (X) =
Var (X) = = =
pk xk 2 +
pk xk 2 (E (X)) 2
Var (X) = E (X 2) (E (X)) 2 = m2 m1 2
La formule Var (X) = E (X 2) (E (X)) 2 est connue sous le nom de formule de la variance, ou formule de Koenig. Elle indique que la variance est la moyenne du carr, moins le carr de la moyenne. La racine carre de la variance s'appelle l'cart-type. On (X) ou X l'cart-type de X.
X =
129
Proprit.
Var (a X + b) = a Var (X)
En effet
Var (a X + b) = E ((a X + b E (a X + b)) ) = E ((a X + b a E (X) b)) ) = E (a (X E (X)) ) = a E ((X E (X)) ) = a Var (X)
Exemple.
Le moment d'ordre 2 de la variable indicatrice de Bernoulli d'un vnement A de probabilit p est :
m2 = E (X 2) = q 0 + p 1 = p
La variance est :
Var (X) = m2 m1 = p p = p (1 p) = p q.
gX (u) = E (u X) =
pk u k = p0 + p1 u + p2 u 2 + ...
III.4.7.2. Proprits.
130
k (k 1) pk u k 2 =
k (k 1) pk u k =
E (X (X 1) u X)
On en dduit :
E (X ) =
+ E ( X) = + = g"X (1) + g'X (1) Var (X) = E (X ) (E (X)) = g"X (1) + g'X (1) (g'X (1)) Var (X) = g"X (1) + g'X (1) (g'X (1)) Var (X) = E (X (X 1)) + E (X) (E (X))
c) Probabilits.
P (X = k) = pk est le coefficient de u k dans le dveloppement de gX (u) au voisinage de 0. D'aprs la formule de Taylor, ce coefficient est gal
P (X = k) = pk =
III.4.7.3. Exemple.
La fonction gnratrice de la variable indicatrice de Bernoulli d'un vnement A de probabilit p est :
gX (u) = E (u X) = q + p u
On a bien gX (1) = q + p = 1. L'esprance mathmatique est E (X) = g'X (1) = p. La variance est Var (X) = g"X (1) + g'X (1) (g'X (1)) = 0 + p p = p (1 p) = p q.
131
0 q
1 p
III.5.1.2. Proprits.
Si X B (1 ; p) : E (X) = p Var (X) = p q gX (u) = q + p u
... xn ...
III.5.2.2. Proprits.
Si X suit une loi uniforme sur {x1, ... , xn} :
E ( X) = Var (X) =
xk xk xk
et
k=
entranent : 132
(1 + u + ... + u n 1) =
avec p + q = 1, et o
III.5.3.2. Proprits.
gX (u) = pk qnk uk = (p u) k q n k = (p u + q) n (formule du binme) = n p car q + p = 1. n (n 1) p (q + p u) n 2 + n p n p = n p ((n
E (X) = g'X (1) = n p (q + p u) n 1 Var (X) = g"X (1) + g'X (1) (g'X (1)) = 1) p + 1 n p) = n p q.
III.5.3.3. Interprtation.
Pour n = 1, B (1 ; p) est la loi de Bernoulli. Soit E l'preuve alatoire consistant en n rptitions indpendantes d'une preuve de Bernoulli, E1, ... , En, de mme paramtre p. Soit X le nombre de succs obtenus. Les valeurs de X vont de 0 n. La loi de probabilit de X est une loi binomiale de paramtres n et p. En effet, une preuve de Bernoulli admet deux rsultats possibles : l'chec, not 0, de probabilit q, et le succs, not 1, de probabilit p, avec p + q = 1. Si E est l'preuve alatoire consistant en n rptitions indpendantes E1, ... , En, d'une preuve de Bernoulli de paramtre p, un rsultat possible de E est une suite de n nombres 0 ou 1, indiquant le rsultat de chaque preuve de Bernoulli. Comme les preuves sont indpendantes, les probabilits se multiplient et la probabilit d'un rsultat particulier comportant k succs et (n k) checs est p k q n k. Le nombre de rsultats possibles comportant k succs et (n k) checs est gal au nombre de choix possibles de la position des k succs, reprsents par des 1, dans la suite des n rsultats :
133
. p k q n k.
La probabilit d'avoir k succs, dans aussi (n k) checs, est donc donne par
En pratique, toute variable binomiale de paramtre n et p, peut toujours s'interprter comme le nombre de succs dans une rptition indpendante n fois d'une preuve de Bernoulli de paramtre p. Remarquons aussi que si l'on note X1, ... , Xn, les variables de Bernoulli associes aux preuves de Bernoulli indpendantes successives E1, ... , En, le nombre de succs X est la somme X1 + ... + Xn. Une variable binomiale de paramtres n et p est somme de n variables de Bernoulli indpendantes de paramtre p. Chaque variable de Bernoulli a, pour fonction gnratrice, (q + p u). On a alors le rsultat :
(q + p u) n = g (u) = g (u) ... g (u)
Cette proprit caractrise les variables alatoires dites indpendantes : deux variables alatoires valeurs entires sont indpendantes si, et seulement si, la fonction gnratrice de leur somme est le produit de leurs fonctions gnratrices.
Si elle est noire, c'est l'chec, not 0, de probabilit q = . On effectue ainsi n tirages successifs avec remise. Au bout de n tirages, la probabilit d'avoir tir k fois une boule blanche est donne par la loi binomiale :
P (X = k) = p k q n k,
o p est la proportion de boules blanches et q la proportion de boules noires. Le modle de l'urne avec tirages non exhaustifs peut tre utilis chaque fois que le paramtre p de la loi binomiale est un nombre rationnel.
= =
n p = p. npq=
134
n (n 1) ... (n k) est quivalent n k. n (n 1) ... (n k) pn k est quivalent (n pn) k, qui tend vers k. (1 pn) n k a pour logarithme (n k) ln (1 pn) (n k) pn n pn = . Donc (1 pn) n k tend vers e . Finalement, P (Xn = k) tend vers e .
Une variable alatoire prenant des valeurs entires k avec les probabilits P (X = k) = e , s'appelle une variable de Poisson de paramtre . Sa loi de probabilit s'appelle loi de Poisson de paramtre . X P. La loi de Poisson est aussi appele la loi des phnomnes rares. On l'obtient toujours comme approximation d'une loi binomiale lorsque p devient trs petit avec une esprance n p qui tend vers une constante strictement positive .
. H (N, n, p).
135
boule blanche si n est infrieur au nombre N2 de boules noires, sinon on tire au minimum n N2 boules blanches lorsque le nombre de boules tires n est suprieur au nombre de boules noires N2.
X () = [ Max (0, n N2) ; Min (n, N1) ].
Le nombre de tirages possibles de n boules parmi N est le coefficient binomial quiprobables. Pour un entier k appartenant X (), il y a
: ils sont
N1 boules blanches et, pour chaque choix de k boules blanches parmi les N1, il y a de choisir les n k boules noires compltant le tirage. Le nombre de tirages de n boules contenant k boules noires est donc d'avoir X = k est donne par le rapport :
et la probabilit
P (X = k) =
puisqu'en dehors de l'intervalle X (), l'un des coefficients binomiaux probabilit correspondante est nulle. On peut donc crire :
P (X = k) = 1
soit :
136
III.5.4.3. Proprits.
a) Moyenne.
E (X) = k= k k=
Dans la somme, le terme correspondant k = 0 est nul. D'autre part, pour k diffrent de 0,
k
= N1
k
= N1 = N1 .
= N1
D'o :
E (X) = N1
N1 E (X) = n p.
= n p.
b) Variance.
La variance peut se calculer par la formule :
Var (X) = E (X (X 1)) + E (X) (E (X)) .
E (X (X 1)) =
k (k 1) =
k (k 1).
Or on a, pour k > 0 :
k
= N1
137
(k 1)
k (k 1)
= (N1 1) = N1 (N1 1)
= N1 (k 1)
k (k 1), sont
N1 (N1 1)
E (X (X 1)) =
N1 (N1 1)
N1 (N1 1)
= n (n 1)
+n
n 1n
(N1 + N2)((n 1) (N1 1) + N1 + N2 1 n N1) + n N1 (N1 + N2)(n N1 n N1 + 1 + N1 + N2 1 n N1) + n N1 (N1 + N2)(N2 n) + n N1 (N2(N2 n) + N1 (N2 n) + n N1 (N2(N1 + N2 n) =npq et N = N1 + N2.
Var (X) = n p q
138
est quivalent :
=
pk qnk
On voit donc que la loi hypergomtrique tend vers la loi binomiale, lorsque le nombre de boules augmente indfiniment dans l'urne en gardant une proportion constante de boules blanches.
139
La fonction de rpartition x
a) Dfinition.
On appelle densit de probabilit sur R, toute application f : R R vrifiant : 1/ f est positive : f (x) 0, pour tout x R. 2/ f est continue sur R sauf, ventuellement en un nombre fini de points. 3/ L'intgrale f (t) dt est convergente et vaut 1.
b) Exemples.
Exemple 1.
Soient a et b deux nombres rels, avec a < b. L'application f dfinie par :
f (x) =
Exemple 2.
Soit un nombre rel strictement positif. L'application f dfinie par :
f (x) =
140
L'application f est alors une densit de probabilit, appele la densit de probabilit de X. En effet, l'application f est, par dfinition, positive et continue sauf ventuellement en un nombre fini de points. D'autre part, comme F est une fonction de rpartition, sa limite, lorsque x tend vers + , est 1, de sorte que l'intgrale f (t) dt = f (t) dt, est convergente et vaut 1.
Le fait de changer la valeur de f en un nombre fini de points, ne change pas la valeur de l'intgrale et ne change donc pas la fonction de rpartition de X. On exprime cette proprit en disant que la densit de probabilit d'une variable alatoire absolument continue est dfinie un nombre fini de points prs.
En effet :
P (a < X b) = P (X b) P (X a) = F (b) F (a) = f (t) dt.
En particulier, pour a = x, et b = x + h :
P (x < X x + h) = F (x + h) F (x) = f (t) dt.
= f (x)
141
et l'on crit, avec un abus d'criture usuel en notation diffrentielle, pour un intervalle infiniment petit [ x ; x + dx ], de longueur dx :
P (x X x + dx) = P (x < X x + dx) = f ( x) dx,
L'esprance mathmatique de X est, par dfinition, le nombre dfini, lorsqu'il existe, par l'intgrale :
E (X) = m1 = t f (t) dt.
La variance de X est, par dfinition, le nombre dfini, lorsqu'il existe, par l'intgrale :
Var (X) =
f (x) =
Remarquons que la surface comprise entre la courbe reprsentative des variations de f et l'axe des abscisses est toujours gale 1 puisque f (t) dt = 1.
142
III.7.1.2. Proprits.
a) Fonction de rpartition.
F (x) = f (t) dt =
b) Esprance mathmatique.
E (X) = t f (t) dt = t f (t) dt = E (X) = dt =
L'esprance mathmatique d'une variable uniforme sur un intervalle est la valeur centrale.
c) Variance.
Var (X) = E (X ) (E (X)) = t f (t) dt
= + b )
dt
(a + 2 a b
(b + a b + a )
(a + 2 a b + b ) =
(4 b + 4 a b + 4 a 3 a 6 a b 3 b ) =
a ) = Var (X) =
(b 2 a b +
La variance d'une variable uniforme sur un intervalle est la douzime partie du carr de la longueur de l'intervalle.
143
De mme, tant donns deux nombres rels et , avec > 0, l'application f : x e de R dans R est continue et positive. Le changement de variable x = + u dans l'intgrale montre que l'on a :
f (x) dx =
f (x) =
(u) du = 1
de sorte que f est aussi une densit de probabilit. Remarquons que f concide avec lorsque = 0 et = 1. La courbe reprsentative de f a l'allure suivante :
Elle est symtrique par rapport et possde deux points d'inflexion, pour x = + et x = . On appelle variable normale de paramtres et , toute variable alatoire relle absolument continue dont la densit de probabilit est donne par :
144
f (x) =
La relation "X est une variable normale de paramtres et " est note X lit "X suit la loi normale de paramtres et ".
N ( ; ), qui se
On appelle variable normale centre rduite, toute variable alatoire relle absolument continue dont la densit de probabilit est donne par :
(x) =
e
La relation "X est une variable normale centre rduite" est la relation X "X suit la loi normale de paramtres 0 et 1".
La loi normale est aussi appele "loi de Gauss", ou "loi de Laplace-Gauss une dimension". Elle a t dcouverte et tudie en 1780 par Pierre Simon, marquis de Laplace.
III.7.2.2. Proprits.
b) Fonction de rpartition.
Soit F la fonction de rpartition de la variable normale de paramtres et , la fonction de rpartition de la variable normale de paramtres 0 et 1.
F (x) =
que la relation X
N ( ; ) est quivalente
N ( ; ) U =
N (0 ; 1)
Autrement dit, X est une variable normale de paramtres et si, et seulement si, U = est une variable normale centre rduite.
145
permet aussi de calculer les probabilits lies la variable La relation F (x) = normale X de paramtres et , grce la table de la fonction de rpartition de la variable normale centre rduite.
)=
p k q n k, k = 0, ... , n.
avec p + q = 1, et o
Lorsque n augmente indfiniment, la variance tend vers 0, les valeurs de Fn sont de moins en moins disperses autour de la moyenne p et, intuitivement, la probabilit que Fn ne s'loigne pas trop de p augmente. La loi faible des grands nombres de Bernoulli nonce que, pour tout > 0, fix l'avance, la limite de la probabilit P ( | Fn p | < ) lorsque n augmente indfiniment, est 1. Ce rsultat s'nonce aussi sous la forme :
La frquence de l'vnement A converge en probabilit vers la probabilit de l'vnement A lorsque le nombre d'preuves augmente indfiniment.
Nous admettrons ce rsultat, dont la dmonstration prcise sera donne en deuxime anne de DEUG. La "loi forte des grands nombres", ou thorme central limite, fait, quant elle, rfrence la convergence "presque sre", qui est la convergence uniforme de la fonction de rpartition de la frquence vers une loi normale.
146
L'chantillon doit tre reprsentatif de la population : c'est la thorie de l'chantillonnage. Les techniques numriques utilises sur les observations exprimentales doivent conduire des rsultats fiables, c'est--dire donnant une bonne reprsentation des paramtres inconnus de la population : c'est la thorie de l'estimation et des tests.
Les deux problmes sont lis : la mthode d'chantillonnage utilise a une influence sur les estimations obtenues. En rsum, nous pouvons dire que la thorie des sondages est un outil mathmatique permettant, partir d'observations exprimentales partielles, de tenter d'atteindre une ralit inaccessible.
Dresser une liste claire des objectifs de l'enqute. Etablir avec prcision la population chantillonner. Etablir une liste prcise et courte des donnes collecter.
147
Dfinir le choix des mthodes de mesure : tlphone, convocations, visites domicile, ... Etablir, lorsque c'est possible, le degr de prcision dsir afin d'analyser le rapport des cots et des avantages. Dterminer l'unit de l'chantillonnage : personne physique, collectivit, ... Etablir le plan de l'chantillonnage ou la mthode de slection. Faire parfois une pr-enqute courte. Organiser le travail sur le terrain. Rcolter les donnes, les prsenter, les synthtiser par traitement statistique. Conserver les donnes pour pouvoir les rutiliser.
Exemple.
L'INSEE dcomposa en 1942 la France en 600 rgions agricoles et, dans chaque rgion, dsigna un canton-ype. Comme il y a en France environ 3000 cantons, la dsignation de 600 cantons-types permettait de rduire d'un facteur 5 l'ampleur d'une tude des cantons.
148
Panel d'audience la tlvision (mdiamtrie, centres d'tudes d'opinion, ...). Panel de consommateurs (SECODIF : 4 500 mnages). Panel de dtaillants (SOFRES).
Exemples.
Ces panels sont utiliss en marketing (lancement d'un produit, transfert de marques, etc.).
Exemples.
1. Liste d'immatriculation des vhicules automobiles en France. C'est une trs bonne base car elle est mise jour rgulirement (cartes grises neuves, cartes grises dtruire). Rpertoire des entreprises (SIREN). Chaque entreprise possde un numro d'immatriculation neuf chiffres, un nom ou raison sociale, une adresse exacte. L'annuaire tlphonique est une mauvaise base de sondage car d'une part, tout individu ne possde pas obligatoirement un tlphone et, d'autre part, un individu peut possder un tlphone et ne pas figurer sur l'annuaire (la liste rouge reprsente environ 8 % des abonns et l'annuaire ne recense pas les tlphones portables, soit environ 40 % des tlphones).
2.
3.
Les bases de sondages sont en gnral tablies partir des rsultats d'un recensement et elles sont corriges priodiquement entre deux recensements. Le tirage de l'chantillon est effectu dans la base de sondage selon des critres spcifiques chaque mthode (plan de sondage). Cette mthode de travail ne laisse aucune initiative aux enquteurs : il est trs simple de contrler leur travail.
149
Si le tirage s'effectue avec remise, l'chantillon alatoire simple est dit indpendant (EASI = Echantillon Alatoire Simple et Indpendant). La mthode permet de calculer des intervalles de confiance, comme nous le verrons plus loin. Le rapport f = s'appelle le taux de sondage. pour les enqutes sur les
Par exemple, l'INSEE utilise des taux de sondage de l'ordre de conditions de vie des mnages.
Exemple.
Nous voulons extraire un chantillon de 8 individus dans une population forme de 437 individus. Nous numrotons les individus de la population de 1 437. Nous considrons trois colonnes conscutives d'une page de nombres au hasard : ils forment des nombres au hasard trois chiffres. Nous lisons ces nombres de trois chiffres en ne retenant que ceux qui sont compris entre 001 et 437. Lorsque nous avons retenus 8 nombres, notre chantillon est constitu des 8 individus dsigns dans la population par ces huit nombres. Selon que nous effectuons un tirage avec ou sans remise, nous garderons ou carterons un individu dj tir. L'inconvnient majeur de la mthode lmentaire est son cot : les individus tirs peuvent tre trs loigns gographiquement.
Exemple.
= {1, 2, 3, 4, 5}, 1 = {1, 2}, 2 = {3, 4, 5}. Nous slectionnons trois individus, dont un dans 1 et deux dans 2. Nous obtenons l'un des six chantillons possibles. Cette mthode se justifie par deux raisons essentielles : 1. L'existence d'une stratification de fait, soit pour des raisons gographiques, soit pour des raisons administratives.
Exemple 1 : enqute sur les conditions de vie pnitentiaire en France.
La population est celle des dtenus en France Les strates sont les populations de dtenus dans les divers tablissements pnitentiaires.
Exemple 2 : enqute sur la consommation par un organisme disposant de bureaux dpartementaux.
150
La population est celle des consommateurs franais. Les strates sont les consommateurs de chaque dpartement. 2. Un caractre tudi dans la population peut varier sous l'influence d'un certain nombre de facteurs. Pour liminer au mieux les risques de biais, nous crons des strates homognes et, dans chacune d'elles, nous extrayons un chantillon alatoire simple.
Exemple.
Pour tudier la consommation de tabac, si nous estimons que l'ge et le sexe sont des facteurs trs influents, nous partageons la population en strates du type : Hommes de moins de 20 ans, Hommes de 20 30 ans, etc. Femmes de moins de 20 ans, Femmes de 20 30 ans, etc. De chaque strate, nous extrayons un chantillon alatoire simple.
Exemple.
= {1, ... , 20}, k = 4. Les chantillons possibles sont : {1, 5, 9, 13, 17}, {2, 6, 10, 14, 18}, {3, 7, 11, 15, 19}, {4, 8, 12, 16, 20}. Cette mthode est bien adapte la slection de cartes dans un fichier, ou au prlvement de pices dans une fabrication pour un contrle de qualit. Elle prsente une certaine analogie avec la mthode prcdente d'chantillonnage stratifi.
Exemple.
L'INSEE effectue des chantillonnages quatre niveaux : dpartements, cantons, communes, mnages.
151
Cette mthode permet une excution rapide. Elle est conomique, car elle focalise les tirages. La mthode de tirage au hasard chaque niveau peut varier suivant le cas, par exemple tirage proportionnel aux units qu'il contient, ou tirage quiprobable. Nous disons alors que nous pouvons avoir des tirages avec probabilits ingales.
IV.2.2.5. Conclusion.
En pratique, les diverses mthodes alatoires peuvent tre mles pour amliorer le rendement. Pour chacune d'elle, nous pourrons varier les critres de tirage au hasard de chaque individu : avec remise, sans remise, avec des probabilits gales ou ingales.
Les paramtres propres la population-mre : moyenne, variance, etc. Les paramtres propres la loi de rfrence : paramtre d'une loi de Poisson, paramtres d'une loi normale, etc.
152
Exemple.
Si y est la moyenne = de X, nous obtiendrons une estimation ponctuelle * de la moyenne en prenant la moyenne arithmtique de l'chantillon :
* =
xi.
La valeur observe y* n'est que l'une des valeurs possibles que l'on peut obtenir avec les divers chantillons possibles de taille n. En ralit, avec une population de N individus, il y a un certain nombre, mettons k, d'chantillons possibles Ej de taille n, j {1, ..., k} (k dpend de la mthode d'chantillonnage). Chaque chantillon possible Ej de taille n possde une certaine probabilit pj d'tre tir. A chaque chantillon possible Ej de taille n est associe une estimation ponctuelle yj* de y. A chaque estimation ponctuelle yj* de y est donc associe la probabilit pj d'tre observe. Nous pouvons alors dfinir une variable alatoire prenant, pour chaque chantillon possible Ej de taille n, la valeur yj* avec la probabilit pj. Cette variable alatoire est appele un estimateur du paramtre y. Les valeurs de sont les estimations ponctuelles de y. La loi de probabilit de s'appelle la distribution d'chantillonnage de . On appelle fluctuation d'chantillonnage, la variation des estimations ponctuelles de y et alas d'chantillonnage les causes de ces variations.
153
Cette proprit traduit le fait qu'en moyenne, sur tous les chantillons possibles, nous retrouvons la valeur du paramtre que nous voulons estimer.
b) Estimateur robuste.
L'estimateur d'un paramtre y possde une variance qui traduit la dispersion des valeurs de autour de son esprance mathmatique. Cette variance dpend de la taille n de l'chantillon. Nous dirons que est un estimateur robuste, ou convergent, de y si la limite, lorsque n tend vers N de est nulle.
robuste
=0
Cette proprit traduit le fait suivant : si nous connaissons la valeur prise par le caractre pour tous les individus de la population, la valeur de est la valeur exacte y du paramtre. Un estimateur correct est un estimateur sans biais et robuste.
Lorsque n augmente indfiniment, la fonction de rpartition de rpartition d'une variable normale centre rduite.
En pratique, ds que n est suprieur ou gal 30, nous admettrons que la fonction de
Lorsque n est suffisamment grand (en pratique n 30), pour tout [0, 1], le nombre rel positif u donn par :
(u) = 1
154
vrifie :
= 1 .
En effet, comme la fonction de rpartition de peut tre remplace par la fonction de rpartition de la variable normale centre rduite, ds que n est suprieur ou gal 30, la symtrie de la loi normale donne :
Les valeurs de la fonction de rpartition sont donnes par des tables. Un estimateur CAG est un estimateur correct et asymptotiquement gaussien.
et
est
Ceci signifie simplement que l'on considre comme meilleur un estimateur dont les valeurs sont moins disperses autour de la valeur de y. Dans l'absolu, le meilleur estimateur d'un paramtre est celui dont pour lequel l'esprance de ( y) est la plus petite possible. Un estimateur sans biais dont la variance est minimale s'appelle un estimateur prcis. Pour un estimateur prcis, l'esprance E ( ) est gale y et la variance est minimale.
155
La variable alatoire centre rduite correspondant , possde une esprance mathmatique nulle et une variance gale 1.
Exemple 1.
Nous tudions la taille des individus d'une population d'effectif N. Pour cela nous extrayons un chantillon alatoire simple et indpendant d'effectif n. Soit la moyenne de la taille des individus de la population. Soit X la variable alatoire "taille d'un individu" : chaque individu de l'chantillon est associ une variable alatoire indpendante "taille" Xi qui a la mme loi de probabilit que la variable parente X. L'estimateur
Xi
de la taille moyenne dans la population, a, pour valeur dans l'chantillon, la moyenne arithmtique des tailles des individus de l'chantillon. Cet estimateur possde une loi de probabilit qui peut tre calcule en fonction de la loi de probabilit de X.
Exemple 2.
Soit la variance de la taille des individus de la population. Soit X la variable alatoire "taille d'un individu" : chaque individu de l'chantillon est associ une variable alatoire indpendante "taille" Xi qui a la mme loi de probabilit que la variable parente X. L'estimateur
Xi
Xi
de la variance de la taille dans la population, a, pour valeur dans l'chantillon, S (X) o S (X) est la variance des tailles des individus de l'chantillon (variance d'chantillonnage). Cet estimateur possde une loi de probabilit qui peut tre calcule en fonction de la loi de probabilit de X.
156
=1
s'crit :
P ( u
+ u ) = 1 .
L'vnement u + u a donc une probabilit 1 de se raliser lorsqu'on choisit au hasard un chantillon de taille n 30. Autrement dit, dans la population, la proportion des chantillons de taille n 30 pour lesquels l'vnement u + u est ralis est 1 . Autrement dit encore, tant donn un chantillon de taille n 30, choisi au hasard, la probabilit de ralisation de l'vnement u sorte que u prend une valeur
y1 = y* u s
+ u est 1 .
Or, pour un chantillon de taille n choisi au hasard, prend la valeur y* et une valeur s , de
et + u prend la valeur
y2 = y* + u s
L'intervalle
[y1 ; y2] = [ y* u s ; y* + u s ]
dans lequel la taille n de l'chantillon est suprieure ou gale 30 et (u) = 1 , s'appelle l'intervalle de confiance de y au risque , ou intervalle de confiance de y au niveau de confiance 1 . C'est un intervalle dans lequel la probabilit de trouver la vraie valeur de y est 1 . Plus est grand, plus l'amplitude de l'intervalle de confiance est petite, puisque est une fonction croissante. Dans la pratique, en l'absence de prcision contraire, nous conviendrons de prendre = 5 %. Plus n est grand, plus la valeur de a des chances d'tre proche de 0, donc plus la valeur de a des chances d'tre proche de y. Nous pourrons ainsi calculer la valeur de n qui permet d'avoir un intervalle de confiance d'amplitude donne. Les valeurs retenir de la fonction de rpartition de la variable alatoire normale centre rduite sont, pour (u) = 1 : (1,645) = 0,950, soit u0,10 = 1,645. (1,960) = 0,975, soit u0,05 = 1,960. (2,575) = 0,995, soit u0,01 = 2,575. Ces valeurs donnent les intervalles de confiance aux niveaux de confiance 90 %, 95 %, 99 %. La valeur utilise par dfaut est u0,05 = 1,960. 157
xi xi . la variance = Si X est un caractre qualitatif deux modalits A et B, le paramtre qui caractrise X est la proportion p d'individus prsentant la modalit A. Les paramtres sont inconnus. La thorie de l'chantillonnage a pour but de les estimer au mieux.
, i [1, N].
xi = .
Xi .
Par consquent, est un estimateur sans biais de (E ( ) = ) mais il n'est pas robuste ( = 0).
S=
Xi
Xi
(Xi )
E (S ) = E E (S ) = E (S ) = Mais on a :
E (Xi )
E ( ) +
E (Xi ) ( )
E (Xi ) = E ( ) =
E Xi E (Xi)
n Var (X) = . . E ( ) (n n ) = 2 E ((
E ( E( )) = Var ( ) = = . E ( )
E (Xi ) ( ) ) ) = 2 Var ( ) = 2
(Xi ) =
159
Au total :
E (S ) =
La variance d'chantillonnage n'est pas un estimateur sans biais de la variance de la population : c'est un estimateur biais. La linarit de l'esprance mathmatique montre que :
E S
E (S ) = ,
Xi
Xi
E (Xi) =
n p = p.
Xi
est un estimateur sans biais de la proportion p des individus de la population prsentant la modalit A du caractre tudi.
Var (Xi) =
n p (1 p) =
. : l'estimateur de p
Lorsque n tend vers N, cette variance ne tend pas vers 0, mais vers n'est pas un estimateur robuste.
Pour les chantillons de grande taille (n 30), on peut dfinir l'intervalle de confiance de p correspondant au risque , par :
160
[p1, p2] = p* u
; p* + u
avec (u) = 1
a) Estimation de la moyenne.
Soit xij la ralisation du caractre X pour le je individu de l'chantillon Ei = (Xi1, ... , Xin). La ralisation du ie chantillon est un n-uple (xi1, ... , xin). La moyenne d'chantillonnage nous allons dfinir. Nous pouvons dfinir
i
une probabilit pi =
Considrons la variable alatoire dont la loi de probabilit, uniforme, est dfinie par :
P( =
i)
= pi, i 1 ;
E( )=
pi
xik
xik .
La somme est une somme tendue tous les chantillons de taille n. Pour un k pris entre 1 et n, notons que xik est la valeur xj du caractre X pour le ke individu de l'chantillon, qui est le je individu de la population. Cette valeur apparat une fois dans tous les chantillons de taille n contenant cet individu de la population, mais pas forcment la mme place, c'est--dire pas forcment avec le mme 161
pour le je individu de la population, apparat fois dans la somme xik . Ce raisonnement est valable, bien sr, pour tous les indices j de 1 N. Lorsque nous faisons la somme pour tous les chantillons de taille n, nous obtenons :
xik
xj =
E( )=
N=
E ( ) =
pi
E ( ) =
(xik)
(xik)
xij xik
fois dans la somme individu, de sorte que xj apparat Et ceci est vrai pour les N individus de la population. De sorte que l'on obtient :
162
x1 + ... + xN
( + )
Dans l'ensemble des chantillons de taille n, on forme donc de X diffrentes. Comme il existe
fois dans la somme tendue l'ensemble des chantillons de taille n. On obtient donc :
xij xik
xj xk
xj xk =
xj
xk xj
xj
xk
xj
xj
xj = (N ) N ( + ) = N ((N 1) )
On obtient alors :
xij xik
N ((N 1) ) = 1) )
((N 1) ) = N
((N
E ( ) =
( + ) + N
((N 1) )
E ( ) =
+ (N 1)
163
= (N 1) (n 1)
+ (N 1) =
+ (N 1) (1 + (n 1)) = 1
E ( ) =
Var ( ) = E ( ) = Var ( ) =
Moralit : lorsque n tend vers N, la variance de tend vers 0, l'estimateur de est robuste.
variance de est plus faible lorsque l'chantillon est exhaustif que lorsqu'il est non exhaustif : les valeurs de sont moins disperses autour de la moyenne lorsque l'chantillon est exhaustif.
c) Estimation de la variance.
La variance exprimentale de l'chantillon s = variable alatoire :
S=
(xij
(Xij ) =
Xij
Xij
E (S ) = = Mais :
E ((Xij ) ) =
E ((Xij + ) ) E ((Xij ) ( ))
E ((Xij ) ) +
E (( ) )
164
E (( ) ) =
Var ( ) =
n Var ( ) = Var ( ) =
(Xij )
= E ( ) n ( ) = n E ( )
n Var ( ) =
On voit donc que S est un estimateur biais de , mais que, par linarit de l'esprance mathmatique :
S=
Xij
Xij
Mais nous avons vu, prcdemment, que l'esprance mathmatique et la variance de Xi, taient donnes par :
E (Xi) = p Var (Xi) = p (1 p).
Var
= Var ( ) =
p (1 p).
Ainsi, est un estimateur sans biais et robuste de p. Sa ralisation p* = xi dans un chantillon est une estimation ponctuelle sans biais de p.
Pour les grands chantillons, au niveau de confiance 1 , la ralisation de l'intervalle de confiance de p sera donn par [ p1 ; p2 ], avec
165
p1 = p* u p2 = p* + u
pj
Notons :
= =
Ces paramtres sont inconnus, nous cherchons les estimer. Nous supposons connues la taille N de la population et les probabilits pj associes aux valeurs xj. Notons, pour simplifier, (x1, ... , xn) la ralisation d'un chantillon.
'=
= pj, j [1 ; N].
et soit :
'=
i'
Nous avons :
E ( ') = E ( i') = pj
N=
n=
La relation E ( ') = montre que la variable alatoire ' est un estimateur sans biais de . Sa ralisation m'* = dans l'chantillon est une estimation ponctuelle sans biais de .
=N = N
i
Comme le tirage de l'chantillon est fait avec remise, les variables par consquent :
Var ( ') = Var
i'
Var ( i')
Var ( ') =
Var ( ') =
Var ( ') =
Cette variance s'exprime l'aide de l'ensemble des valeurs xj, inconnues, prises par le caractre X dans la population . Il serait intressant d'en avoir une estimation partir de la ralisation {x1, ... , xn} d'un chantillon.
'=
= pj, j [1 ; N].
Nous avons vu que l'esprance mathmatique de cette variable alatoire tait gale N , qu'on peut estimer par N '. Considrons la variance d'chantillonnage de la variable alatoire ', c'est la variable alatoire :
= ( i' N ')
167
L'esprance mathmatique de
est :
E(
) = E
( i' N ')
= = = = =
E ( i' N ') E ( i' N + N N ') E ( i' N ) Var ( i') + n Var ( ') + + E (N N ') + E ( i' N ) (N N ') ( i' N )
E (N N ')
E (N N ') (N n ' N n )
n N Var ( ')
= Var ( ') N Var ( ') = n N Var ( ') N Var ( ') = (n 1) N Var ( ') La relation E (
1
= Var ( ')
montre que
La variable alatoire est un estimateur sans biais de la variance Var ( ')
Cette estimation de la variance de ' permet de construire, pour les grands chantillons, un intervalle de confiance de la moyenne :
m'* u *.
168