Académique Documents
Professionnel Documents
Culture Documents
I. Introduction :
La régression linéaire est l’un des algorithmes les plus
populaires en apprentissage automatique. Cela est dû à sa simplicité
relative et à ses propriétés bien connues. La régression linéaire est
une méthode utilisée pour définir une relation entre une variable
dépendante (Y) et une variable indépendante (X). Qui est simplement
écrit comme:
b le coefficient de biais
et X la variable indépendante.
II. Manipulation
Mais comment trouver ces coefficients? On peut les trouver en
utilisant différentes approches. L'une est l'approche de la méthode
des moindres carrés ordinaires ou l'approche de la descente de
gradient.
Lors de cette manipulation, nous allons mettre en œuvre la méthode
des moindres carrés ordinaires.
numpy
pandas
matplotlib
import numpy as np
import pandas as pd
dataset =
pd.read_csv('C:/Users/hp/Desktop/ML/HOUSE/datasetFR.csv')
print(dataset)
Output :
Output :
3. Maintenant on va visualiser nos résultats :
Output :
Nous devons pouvoir mesurer la qualité de notre modèle (précision).
Il existe de nombreuses méthodes pour le faire, mais nous
appliquerions l'erreur quadratique moyenne et le coefficient de
détermination (score R²). Lorsqu’on compare deux estimateurs, on
considère que le meilleur est celui qui présente l’erreur quadratique
moyenne la plus faible.
rmse = 0
for i in range(n):
y_pred= b0 + b1* X[i]
rmse += (Y[i] - y_pred) ** 2
rmse = np.sqrt(rmse/n)
print(rmse)
Output : 72.1206213783709
4- le score R²
Mathématiquement :
Où :
for i in range(n) :
y_pred = b0 + b1 * X[i]
sumofsquares += (Y[i] - y_mean) ** 2
sumofresiduals += (Y[i] - y_pred) **2
score = 1 - (sumofresiduals/sumofsquares)
print(score)
Output : 0.6393117199570003
-etc…
IV. Conclusion
La régression linéaire est la base de tous les algorithmes du Machine
Learning et la plus facile à maîtriser. Nous avons mis en œuvre la
méthode des moindres carrés ordinaires pour prédire les poids du
cerveau à partir de la taille de la tête. Nous avons également mesuré
la précision avec l’erreur quadratique moyenne et le coefficient de
détermination (score R²).
BIBLIO :
https://towardsdatascience.com/linear-regression-from-
scratch-cd0dee067f72
Wikipédia