Académique Documents
Professionnel Documents
Culture Documents
détection des incendies de forêt. Voici quelques-uns des plus couramment utilisés :
Apprentissage supervisé
Les modèles d'apprentissage supervisé exigent un travail préparatoire important de la part des
scientifiques de données. Les jeux de données en entrée doivent être étiquetés et les paramètres de
sortie doivent être indiqués, afin de préciser les résultats attendus. De plus, il est nécessaire de régler
avec soin la précision pendant le processus d'apprentissage.
1. Régression linéaire
Les équipes de data science utilisent couramment les algorithmes de régression
linéaire.
Ces algorithmes permettent de mettre en évidence des corrélations simples
entre deux variables dans un jeu de données en examinant un ensemble
d'entrées et les sorties correspondantes, et en quantifiant la relation entre elles.
Ils permettent notamment d'analyser comment le changement d'une variable
affecte une autre.
Les régressions linéaires sont souvent représentées graphiquement sous forme
de lignes.
1. Apriori
L'algorithme Apriori est largement utilisé dans les bases de données
transactionnelles pour identifier des ensembles d'articles fréquemment
achetés ensemble, puis générer des règles d'association.
Dans le domaine de l'analyse des paniers d'achat, cet algorithme est
particulièrement utile pour identifier des combinaisons de produits qui se
trouvent souvent ensemble dans la base de données.
Les règles d'association sont généralement écrites sous la forme "Si l'article
X est acheté, alors l'article Y est également acheté", ce qui se représente
comme X -> Y.
2. K-means
Ytj=f(∑iWjixti)
Par exemple, l'Institut national de recherche spatiale au Brésil (INPE) détecte les sources de chaleur
via le satellite AQUA. Ce satellite utilise le capteur Modis avec une résolution de 1 Km2.