Vous êtes sur la page 1sur 6

Coefficient de détermination R 2

C’est le coefficient qui fournit une mesure de l’adéquation (taux


d’approximation et de correspondance) de l’équation estimée de
la régression aux données observées.

Ce coefficient est défini par :

En effet, cette formule est basée sur l’un des plus importants résultats
en statistique.

1
Si nous continuons avec notre exemple, on trouve :

SCres = 1530,
SCT = 15730,
SCreg = 14200 et
r2 = 0.9027
Ce qui peut être transformé en pourcentage 90.27 % pour exprimer la somme
des carrés totale expliquée par l’équation estimée de la régression.

Remarques:
- Pour le cas de la régression linéaire, le coefficient de détermination
correspond au carré du coefficient de corrélation.
- Il faut être prudent lors de la prévision de Y pour des valeurs de X qui sortent
de l’intervalle étudié, car il n’est pas certain que la relation reste valable entre
les deux variables.

La régression non linéaire ?


La question qui se pose est : La droite est-elle la meilleure
modèle pour représenter la relation entre ces points ?
Bien sûr que NON.
Autrement dit,
À l'inverse de la régression linéaire classique, qui se limite aux
modèles linéaires de prévision, la régression non linéaire peut élaborer
des modèles avec des relations arbitraires entre variables dépendantes
et indépendantes.

Qu'est-ce que la régression non linéaire ?


La régression non linéaire est une méthode permettant de détermin
er (une équation) un modèle non linéaire de relation entre la variable
dépendante (continue) et un groupe de variables indépendantes afin
de prévoir de nouvelles observations.

2
Quand est ce qu’on doit utiliser la régression non linéaire ?
Utilisez la régression non linéaire plutôt que la régression
sur les moindres carrés lorsque vous ne pouvez pas
modéliser de manière adéquate la relation avec des
paramètres linéaires (c-à-d, R2 faible).

Régression courbe (non linéaire) simple


Il existe plusieurs courbes de tendance utilisées lors de la régression
non linéaire, mais on se limite ici sur celles les plus utilisées dans
la pratique. En effet, on va faire la linéarisation de quelques équations
afin de faciliter l’opération de recherche de ses paramètres.
Cette dernière opération se base sur le changement de variable.

1. Exponentielle :
Cas 1 : y = b eax b>0
En appliquant le logarithme, Ln(y) = ln(b) + ax
On aura donc, Y = ax + B
tel que : Y = Ln(y),
B = ln(b)
La représentation graphique d’une telle équation sera comme suit :

B > 0 B < 0

• b est la valeur de l'ordonnée à l'origine.


• a.b est la pente de la tangente à la courbe en x = 0. (-a.b ,B<0)
Cette droite coupe l'axe X en x = -1/a. (1/a ,B<0)
• Pour un même b, a indique donc la rapidité de la croissance de
la fonction.

3
1. Exponentielle :
Cas 2 : y = eax+b
En appliquant le logarithme, Ln(y) = ax + b
On aura donc, Y = ax + B
tel que : Y = Ln(y),

Cas 3 : y = a.bx
En appliquant le logarithme, Ln(y) = Ln(a) + x Ln(b)
Ln(y) = Ln(b). x + Ln(a)
On aura donc, Y = Ax + B
tel que : Y = Ln(y), A= Ln(b), B=Ln(a)

2. Puissance :
Cas 1 : y = a xb
En appliquant le logarithme, Ln(y) = Ln(a) + b.Ln(x)
En appliquant le logarithme, Ln(y) = b.Ln(x) + Ln(a)
On aura donc, Y = Ax + B
tel que : Y = Ln(y),
A = b,
B = ln(a)

3. Logarithmique :
Cas 1 : y = a Ln(x) + b
On aura donc, Y=aX+b
tel que : X = Ln(x)

4
Autres Cas
1. Polynomiale de degré 2 :
y = a x 2 + b x +c
Sa représentation graphique est comme suit:

Tel que S = (-b/2a, -∆/2a)

Exemple :
Supposant que l’on sait que nos données suivent le modèle
de variation inverse y = a (1 / x) + b

X 0.5 1 1.5 2 2.5 3

Y 54 42 38 36 34.8 34

Changement de variable suivant : X’ = 1 / x


On aura une équation Y = a X’ + b qui est une équation d’une droite.
Par conséquent on doit calculer X’
X 0.5 1 1.5 2 2.5 3
Y 54 42 38 36 34.8 34

X’ 2 1 0.667 0.5 0.4 0.333

5
Puis, on dessine le nuage de points (X’, y) et on calcule
les paramètres a et b suivant le méthode de moindre carrés.
Ensuite, on calcule le coefficient de détermination pour
savoir la proportion des écarts à la moyenne qui sont
expliqués par le modèle choisi.
Enfin, on remplace les paramètres a et b dans le modèle original.

Problème de choix de courbe le plus proche de nos données


Le choix de la fonction de prévision dépend souvent de vos
connaissances préalables sur la forme de la courbe de données ou
du comportement des propriétés du système étudié.