Académique Documents
Professionnel Documents
Culture Documents
Un autre frein est que les données ne sont pas toujours utilisables
d’un point de vue éthique ou pour des raisons de sécurité. Pensez à
vous assurer que vous pouvez bien exploiter les données pour votre
travail.
La valeur d'un data scientist réside aussi dans sa capacité à trouver
des manières innovantes de récupérer des données auxquelles on ne
penserait pas au premier abord. Faites appel à votre esprit de hacker
et essayez de bien réfléchir à la façon de récupérer des données
utiles, même s'il ne semble pas y en avoir à première vue.
Le quartet d'Anscombe illustre bien le fait que si l'on n'examine pas assez les données, et qu'on ne
mesure pas de la bonne manière l'erreur de son modèle, on peut facilement arriver à des aberrations
de modélisation.
Imaginez qu'un appartement a une surface de 30 mètres carrés (point en rouge), une estimation
légitime du loyer se situerait aux alentours de 1300 euros selon notre modèle.
Pour des modèles plus complexes, le fonctionnement reste le même.
Si vous voulez appliquer votre travail à de nouvelles données, il vous
suffit de passer les nouvelles entrées dans votre modèle (qui est en
principe un ensemble de transformation des valeurs d’entrées) afin
d’obtenir une sortie