Académique Documents
Professionnel Documents
Culture Documents
MATHEMATIQUES
ECOLE NATIONALE SUPERIEURE DE GENIE MATHEMATIQUE ET MODELISATION
(ENSGMM UNSTIM )
(1) (p)
Yi = θ0 + θ1 Xi + ... + θp Xi+ εi , i = 1, ..., n, (1)
1 X11 X1p
. . .
(j)
avec une famille connue de réels (Xi )1≤i≤n,1≤j≤p telle que X = . . .
soit une matrice
. . .
1 Xn Xnp1
0 0
de rang p + 1, θ = (θj )0≤j≤p un vecteur de nombres réels inconnus et ε = (εi )1≤i≤n où les εi sont
des v.a.i.i.d. centrées non observées, avec var(ε1 ) = σ 2 > 0, inconnue.
Notations: Pour m ∈ N*, Im est la matrice identité de taille m. Pour M une matrice réelle
0
quelconque, M est la transposée de M . Pour u un vecteur colonne quelconque dans Rm , kuk2 =
0
u u.
L’exercice propose la méthode de Andrey Tikhonov (ou régression ridge) pour estimer θ , en
déterminant pour λ ≥ 0 fixé:
p
X
b = arg min kY − Xθ)k2 + λ
θ(λ) θi2 (2)
p+1 θ∈R
i=0
1. Déterminer θ(0)
b en fonction de X et de Y .
3. Montrer que (X 0 X) est une matrice définie positive (on pourra considérer une forme quadra-
tique). En déduire que pour tout λ ≥ 0, X 0 X + λIp+1 est inversible.
1
2 Exercice 1. Modèles linéarisables et ANCOVA.
1. Après avoir rappelé la formule de la transformation de Box-Cox, donner son expression pour
λ → 0.
lnb
y = 4.912 + 0.362x1 + 1.7lnx2 + 0.442x3
Ecrire le modèle sous sa forme initiale (non linéarisée) et interpréter les coefficients.
4. Soit le modèle:
yb = 4200.9 + 0.185x + 0.126xz + 5970.5z
Les statistiques de Student sont respectivement 3.80; 4.50; 2.45 et 2.75.
y- impôts des microentreprises (millions de f.u.); x- production (millions de f.u.); z- dummy
variable prenant la valeur 1 si l’entreprise est située à Bohicon et 0 sinon.
On notera n = 48.
Interpréter les coefficients du modèle.
2. Une régression multiple à base des données des 39 pays a été réalisée avec R. Les résultats
numériques sont les suivants:
2
> summary(MLModel)
Call:
lm(formula = HDI ~ Health + Services, data = MR)
Residuals:
Min 1Q Median 3Q Max
-5.2868 -1.9177 0.5024 1.7812 4.4184
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 64.3123 ? ? 5.94e-16 ***
Health 0.6300 ? ? 0.000678 ***
Services 0.2538 ? 3.739 0.000641 ***
---
Signif. codes:
0 *** 0.001 ** 0.01 * 0.05 . 0.1 1
Residual standard error: 2.625 on 36 degrees of freedom
Multiple R-squared: 0.5194,Adjusted R-squared: 0.4927
F-statistic: ? on 2 and 36 DF, p-value: 1.873e-06
Retrouver toutes les données manquantes sachant que la matrice (X 0 X)−1 est donnée par: