Académique Documents
Professionnel Documents
Culture Documents
On veut étudier la liaison éventuelle entre la vitesse de formation d’une protéine (variable Y) et la
concentration du substrat (variable X). En n = 12 expériences indépendantes, on observe les
valeurs (xi , yi)i∈{1,...,n} de (X, Y ) suivantes :
Travail demandé
1. Créer (en logiciel R) les deux vecteurs de données X et Y.
> x = c(0.02, 0.02, 0.06, 0.06, 0.11, 0.11, 0.22, 0.22, 0.56, 0.56, 1.10,
1.10)
> y = c(76, 47, 97, 107, 123, 139, 159, 152, 191, 201, 207, 200)
[1] 0.8310362
4. Est-ce qu’on peut adapter Une liaison linéaire entre Y et X. expliquer pourquoi.
Modèle logarithmique
Le model logarithmique consiste à transformer la variable X à ln(X), puis on considère le modèle de
régression linéaire suivant :
log_model : Y = β0 + β1 ln(X) + ε
Avec : ε ~ 𝒩 (0, σ 2) ; Les paramètres β0 , β1 et σ ∈ ℝ
5. Calculer le coefficient de corrélation linéaire de Y et ln(X)
> cor(log(x),y)
[1] 0.9824308
6. En utilisant la fonction lm() créer votre modèle de régression log_model, déduire les
valeurs de β0 et β1.
> log_model = lm(y ~ log(x))
> log_model
Call:
lm(formula = y ~ log(x))
Coefficients:
(Intercept) log(x)
209.19 37.11
7. Utiliser la fonction summary() pour afficher plus de détail sur votre model de régression
> summary(log_model)
Call:
lm(formula = y ~ log(x))
Residuals:
Min 1Q Median 3Q Max
-17.0176 -6.2455 0.6039 7.4262 13.3228
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 209.194 5.045 41.47 1.59e-12 ***
log(x) 37.110 2.229 16.65 1.28e-08 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Formula: y ~ v * x/(k + x)
Parameters:
Estimate Std. Error t value Pr(>|t|)
v 2.127e+02 6.947e+00 30.615 3.24e-11 ***
k 6.412e-02 8.281e-03 7.743 1.57e-05 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Représenter les 3 courbes de régression obtenues sur le même nuage de points. Quelle est celle
qui ajuste le mieux le nuage de points de cette distribution statistique ?