MÉTHODES NUMÉRIQUES
(version 2.3 Révision 4 du 17.10.2010)
Sciences.ch Méthodes numériques
EXERCICE 1.
Niveau : Gymnase (Lycée)
Auteur : isozv@hotmail.com
Mots-clés : Régression linéaire (méthode des moindres carrés)
Énoncé:
Solution:
Nous avons:
n n
n n n n xk yk
n xk yk xk yk xk yk k 1 k 1
cov( X , Y ) k 1 k 1 k 1 k 1 n
ˆ1 a 2
2
V ( x) n n n
n xk2 xk xk
n
k 1 k 1 n xk2 k 1
k 1 n
81 126
1256
9 1.22
812
829
9
et:
y 1.22 x 3.02
=PENTE(C2:C10;B2:B10)=1.22
=ORDONNEE.ORIGINE(C2:C10;B2:B10)=3.02
=DROITEREG(C2:C10;B2:B10)
=PREVISION(8;C2:C10;B2:B10)
cov( X , Y )
xk yk n xk yk
k 1 k 1 k 1
RX ,Y
( X ) (Y ) 2 2
n
1 n n
1 n
xi2 n xi yi2 n yi
k 1 k 1 k 1 k 1
81 126 81 126
1256 1256
9 9
2 2 829 729 1948 1764
n
1 n n
1 n
i n i i n i
x 2
x y 2
y
k 1 k 1 k 1 k 1
122
0.8994
135.64
avec MS Excel:
=COVAR(B2:B10;C2:C10)/(ECARTYPEP(B2:B10)* ECARTYPEP(C2:C10))=0.8994
=COEFFICIENT.CORRELATION(B2:B10;C2:C10)=0.8994
ou encore autrement:
=PEARSON(B2:B10;C2:C10)=0.8994
avec le graphique:
Nous y voyons:
R 2 0.8089 0.89942
EXERCICE 2.
Niveau : Gymnase (Lycée)
Auteur : isozv@hotmail.com
Mots-clés : Analyse de la variance de la régression
Énoncé:
En utilisant la méthode des moindres carrés et MS Excel faites une analyse de la régression
est détaillez tous les calculs donnés par MS Excel selon la théorie vue en cours.
Solution:
Allez dans le menu Tools/Data Analysis… et choisissez l'outil Regression avec les paramètres
suivants:
Notre cahier des charges est de détailler les calculs dans les cellules:
B4;B5;B7;B8;B17;B18;C17;C18;C25:C33.
On laisse donc tomber le tableau de l'ANOVA de l'analyse de la régression qui est pour moi
une supercherie ainsi que les autres valeurs qui ont, je pense, peu d'intérêt.
Commençons par B4. Nous l'avons déjà calcul dans l'exercice précédent:
R=PEARSON(B2:B10;C2:C10)=0.8994
R 2 =COEFFICIENT.DETERMINATION(B2:B10;C2:C10)=0.8089
=NB(B2:B10)=9
La cellule B7 est un peu plus longue. Nous avons vu dans la théorique que:
ei2 Y 'k yk
SSE k
n2 n2
où la colonne Residual C25:C33 est simplement la différence entre les valeurs mesurées de la
variables expliquée et la valeur théorique. Effectivement:
Ensuite mettons tous ces résidus aux carrés, et effectuons la somme et enfin divisions par le
nombre de données – 2 et on prend la racine:
ce qui donne:
=PENTE(C2:C10;B2:B10)=1.22
=ORDONNEE.ORIGINE(C2:C10;B2:B10)=3.02
2
SEE 2 xk2
SEE
A V ( A) et B V ( B ) k
n V ( x) n V ( x)
2
Le terme SEE et n a déjà été calcul plus haut nous n'y reviendrons pas. Le calcul de V ( x) est
lui aisé:
=VARP(B2:B10)=11.111
=SQRT(B7^2/(COUNT(B2:B10)*VARP(B2:B10)))=0.2241
Nous procédons de manière similaire pour l'écart-type non biaisé de l'ordonnée à l'origine
mais d'abord nous calculons la somme:
xk2
k
à l'aide de la fonction:
SUMPRODUCT(B3:B11;B3:B11)=829
=SQRT(B7^2*
SUMPRODUCT(B3:B11;B3:B11)/(COUNT(B2:B10)^2*VARP(B2:B10)))=2.1509
EXERCICE 3.
Niveau : Fac (Lycée)
Auteur : isozv@hotmail.com
Mots-clés : Régression linéaire multiple
Énoncé:
qui donnent en fonction du prix net de la matière brute de trois composants d'un produit, le
prix net du produit fini observé sur le marché. Sous l'hypothèse d'une dépendance linéaire,
déterminez avec les relations étables dans le chapitre de Méthodes numériques les coefficients
de régression et ensuite avec l'Utilitaire d'analyse de MS Excel.
Solutions:
D'abord nous allons construire la matrice X que j'aime bien représenter sous la forme suivante
dans un tableau (choix tout à fait discutable):
Ensuite, nous nous occupons de X T X . Pour cela on sélectionne bien évidemment dans le
cas présente une plage de cellules de 4 4 de I43 à L46 (par exemple…) après quoi nous
écrivons la formule Excel permettant de faire une multiplication matricielle dans la version
anglophone (la formule doit s'écrire dans I43!):
=MMULT(I36:AA39;J14:M32)
1
Ensuite, nous sélectionnons pour le calcul de l'inverse X T X une plage aussi de 4 4
de I50 à L53 (par exemple…) après quoi nous écrivons la formule Excel permettant de faire
une inversion matricielle dans la version anglophone (la formule doit s'écrire dans I50!):
=MINVERSE(I43:L46)
1
Après, il nous faut donc calculer X T X X T . Pour cela, nous sélectionnons une plage de
4 19 de I57 à AA60 (par exemple…) après quoi nous écrivons la formule Excel permettant
de faire une multiplication matricielle dans la version anglophone (la formule doit s'écrire
dans I57!):
=MMULT(I50:L53;I36:AA39)
1
Dernière étape, il faut calculer X T X X T y . Pour cela, nous sélectionnons une plage de
4 1 de I64 à I67 (par exemple…) après quoi nous écrivons la formule Excel permettant de
faire une multiplication matricielle dans la version anglophone (la formule doit s'écrire dans
I64!):
=MMULT(I57:AA60;I14:I32)
yˆk y
2
SCE
R2 k
yk y
SCT 2
Ce qui donne:
Maintenant nous allons voir si nous retrouvons les mêmes coefficients de la droite de
régressions avec l'Utilitaire d'Analyse:
et nous y retrouvons donc les mêmes coefficients que ceux calculés manuellement (en plus de
plein d'autres déjà vus dans l'exercice précédent).
EXERCICE 4.
Niveau : Fac (Lycée)
Auteur : isozv@hotmail.com
Mots-clés : Régression linéaire multiple à variables qualitatives
Énoncé:
E1. Les données des ventes (colonne C) et leur numéro de série (colonne A) uniquement
(comme le font beaucoup de débutants)
E2. Les données des ventes (colonne C) et en discrétisant les trimestres de la colonne B en
trois colonnes séparées (comme le font beaucoup d'amateurs éclairés).
Solutions:
S1. Nous procédons comme dans l'exercice précédent en lançant l'utilitaire d'analyse:
Avec le graphique suivant (modifié un peu au préalable pour des raisons esthétiques
évidentes):
Afin de voir que le résultat n'est vraiment pas probant! Au niveau de:
Nous avons donc 4 chances sur 1000 que la colonne A soit inutile pour faire de la prédiction
sur les ventes.
avec:
où nous avons avec les trois colonnes Q1, Q2, Q3, Q4 la description des 4 trimestres car:
Q1=1,0,0
Q2=0,1,0
Q3=0,0,1
Q4=0,0,0
il faut supprimer les graphiques créés qui ne servent à rien et en recréer un à partir de zéro en
utilisant les données qui sont à la ligne 26 pour obtenir:
Visuellement cela à l'air d'être déjà mieux qu'avant. Chose particulièrement intéressant: la
discrétisation d'une des variables permet de ne plus avoir une simple droite!
Mais le résultat est moins bon qu'avant mathématiquement comme nous le montre les valeurs
précédentes.
Afin de voir que le résultat n'est vraiment pas probant! Au niveau de:
Nous avons donc 4 chances sur 10 que les colonnes E, F, G soient inutiles pour faire de la
prédiction sur les ventes.
il faut supprimer les graphiques créés qui ne servent à rien et en recréer un à partir de zéro en
utilisant les données qui sont à la ligne 34 pour obtenir:
Au niveau de:
EXERCICE 5.
Niveau : Fac (Lycée)
Auteur : isozv@hotmail.com
Mots-clés : Analyse en composantes principales
Énoncé:
Fleur n°
1 5.1 3.5 1.4
2 4.9 3.0 1.4
3 4.7 3.2 1.3
4 4.6 3.1 1.5
5 5.0 3.6 1.4
6 7.0 3.2 4.7
7 6.4 3.2 4.5
8 6.9 3.1 4.9
9 5.5 2.3 4.0
10 6.5 2.8 4.6
11 6.3 3.3 6.0
12 5.8 2.7 5.1
13 7.1 3.0 5.9
14 6.3 2.9 5.6
15 6.5 3.0 5.8
Effectuez une A.C.P. avec Minitab 15.1 (car Microsoft Excel 2003/2007 n'a aucun outil
intégré pour par défaut) afin d'identifier des regroupements possibles et déterminez avec une
approche de corrélation les valeurs propres aussi des différentes composantes
Solution:
et en ce qui concerne les valeurs propres Minitab nous donne dans la fenêtre d'exécution: