Vous êtes sur la page 1sur 4

Comment fonctionnent les modèles

Introduction

Nous commencerons par un aperçu du fonctionnement des modèles de machine learning et de leur
utilisation. Cela peut sembler basique si vous avez déjà fait de la modélisation statistique ou de
l'apprentissage automatique. Ne vous inquiétez pas, nous allons bientôt progresser vers la construction
de modèles puissants.

Ce micro-cours vous permettra de créer des modèles au fil du scénario suivant:

Votre cousin a fait des millions de dollars en spéculant sur l'immobilier. Il a proposé de devenir
partenaire commercial avec vous en raison de votre intérêt pour la science des données. Il fournira de
l'argent et vous fournirez des modèles qui prédisent la valeur de différentes maisons.

Vous demandez à votre cousin comment il a prédit les valeurs immobilières dans le passé. et il dit que ce
n'est que l'intuition. Mais plus de questions révèlent qu'il a identifié les modèles de prix des maisons qu'il
a vues dans le passé, et il utilise ces modèles pour faire des prédictions pour les nouvelles maisons qu'il
envisage.

L'apprentissage automatique fonctionne de la même manière. Nous allons commencer avec un modèle
appelé Arbre de décision. Il existe des modèles plus sophistiqués qui donnent des prévisions plus
précises. Mais les arbres de décision sont faciles à comprendre et constituent la base de certains des
meilleurs modèles de la science des données.

Pour plus de simplicité, nous allons commencer par l'arbre de décision le plus simple possible.
Il divise les maisons en seulement deux catégories. Le prix prévu pour toute maison considérée est le prix
moyen historique des maisons de la même catégorie.

Nous utilisons les données pour décider comment diviser les maisons en deux groupes, puis à nouveau
pour déterminer le prix prévu dans chaque groupe. Cette étape de capture de modèles à partir de
données est appelée ajustement ou apprentissage du modèle. Les données utilisées pour ajuster le
modèle sont appelées les données d'entraînement.

Les détails de l'ajustement du modèle (par exemple, comment diviser les données) sont suffisamment
complexes pour que nous les conservions pour plus tard. Une fois le modèle ajusté, vous pouvez
l'appliquer à de nouvelles données pour prévoir les prix des maisons supplémentaires.

Amélioration de l'arbre de décision

Lequel des deux arbres de décision suivants est le plus susceptible de résulter de l'ajustement des
données de formation immobilière?
L'arbre de décision sur la gauche (Arbre de décision 1) a probablement plus de sens, car il rend compte
du fait que les maisons avec plus de chambres ont tendance à se vendre à des prix plus élevés que les
maisons avec moins de chambres. Le plus gros inconvénient de ce modèle est qu'il ne prend pas en
compte la plupart des facteurs affectant le prix de la maison, comme le nombre de salles de bain, la taille
du terrain, l'emplacement, etc.

Vous pouvez capturer plus de facteurs en utilisant un arbre qui a plus de «divisions». On les appelle des
arbres "plus profonds". Un arbre de décision prenant également en compte la taille totale du terrain de
chaque maison pourrait ressembler à ceci:

Vous prédisez le prix de n'importe quelle maison en traçant à travers l'arbre de décision, en choisissant
toujours le chemin correspondant aux caractéristiques de cette maison. Le prix prévu pour la maison est
au bas de l'arbre. Le point en bas où nous faisons une prédiction s'appelle une feuille.

Les fractionnements et les valeurs aux feuilles seront déterminés par les données, il est donc temps pour
vous de vérifier les données avec lesquelles vous travaillerez.

Continuer
Soyons plus précis. Il est temps d'examiner vos données.

Vous souhaitez approfondir le contenu du cours d'introduction au ML? Rejoignez le spécialiste des
données de Kaggle, Jesse Mostipak, dans une série de 8 vidéos supplémentaires courtes et engageantes,
où chaque vidéo correspond à une leçon sur Kaggle. Pour commencer à regarder, cliquez ici.

Vous avez des questions ou des commentaires ? Visitez le forum de discussion Learn pour discuter avec
d'autres apprenants.

Vous aimerez peut-être aussi