Vous êtes sur la page 1sur 22

Choisir des algorithmes - Azure Machine Learni... https://docs.microsoft.com/fr-fr/azure/machine-l...

Guide pratique pour choisir


des algorithmes pour Azure
Machine Learning Studio
04/03/2019 • 32 minutes de lecture • Contributeurs
Dans cet article
Aide-mémoire d’algorithme Machine Learning
Types d'apprentissage automatique
Considérations lors du choix d'un algorithme
Notes de l'algorithme
Étapes suivantes

La réponse à la question « Quel algorithme d’apprentissage automatique


dois-je utiliser ? » est toujours « Cela dépend. ». Cela dépend de la taille, de la
qualité et de la nature des données. Cela dépend de ce que vous voulez faire
avec la réponse. Cela dépend de la conversion des calculs de l'algorithme en
instructions pour l'ordinateur que vous utilisez. Et cela dépend du temps que
vous avez. Même les scientifiques de données les plus expérimentés ne
peuvent pas savoir quel algorithme fonctionnera le mieux avant d’en essayer.

Machine Learning Studio fournit des algorithmes de pointe tels que les arbres
de décision optimisés évolutifs, les systèmes de recommandation bayésiens,
les réseaux neuronaux profonds et les jungles de décision développés chez
Microsoft Research. Des modules d’apprentissage automatique open source
évolutifs tels que Vowpal Wabbit sont également inclus. Machine
Learning Studio prend en charge les algorithmes d’apprentissage
automatique pour la classification, la régression et le clustering multiclasses et
binaires. Consultez la liste complète des Modules de Machine Learning. La
documentation fournit des informations sur chaque algorithme et sur la
manière de régler les paramètres afin d’optimiser votre utilisation de
l’algorithme choisi.

1 sur 22 26/03/2019 à 16:53


Choisir des algorithmes - Azure Machine Learni... https://docs.microsoft.com/fr-fr/azure/machine-l...

Aide-mémoire d’algorithme
Machine Learning
Le Microsoft Azure Machine Learning Studio aide-mémoire d’algorithme
vous permet de choisir le droit de l’ordinateur algorithme d’apprentissage
pour vos solutions d’analytique prédictive à partir d’Azure Machine Learning
Bibliothèque d’algorithmes de Studio. Cet article vous guide tout au long de
l’utilisation de cet aide-mémoire.

7 Notes

Pour télécharger l’aide-mémoire et suivre cet article, accédez à Aide-


mémoire d'algorithme Machine Learning pour Microsoft
Azure Machine Learning Studio.

Cet aide-mémoire est pensé pour un public très spécifique : un scientifique


des données débutant, avec une formation de premier cycle en apprentissage
automatique, qui tente de choisir un algorithme pour prendre en main
Azure Machine Learning Studio. Cela signifie qu’il comprend certaines
généralisations et simplifie trop, mais vous guide en toute sécurité. Cela
signifie également qu'il existe un grand nombre d'algorithmes non répertoriés
ici.

Ces recommandations sont des commentaires et des conseils compilés d’un


grand nombre de scientifiques de données et d’experts en apprentissage
automatique. Nous n’avez pas accepté sur tous les éléments, mais nous avons
essayé d’harmoniser les avis en un consensus. Notre désaccord est
généralement introduit par « Cela dépend... »

Utilisation de l’aide-mémoire

Lisez les chemins et les étiquettes d’algorithme sur l’aide-mémoire comme


« Pour <étiquette de chemin> utilisez <algorithm>  ». Par exemple, « Pour
Vitesse, utilisez la régression logistique à deux classes ». Parfois, plusieurs
branches sont utiles. Parfois, aucune n’est parfaite. Ce sont des
recommandations générales, donc ne vous inquiétez pas de leur exactitude.

2 sur 22 26/03/2019 à 16:53


Choisir des algorithmes - Azure Machine Learni... https://docs.microsoft.com/fr-fr/azure/machine-l...

Plusieurs scientifiques de données que nous avons avec lesdites que la seule
façon de trouver le meilleur algorithme consiste à tous les essayer.

Voici un exemple tiré de Azure AI Gallery. Cette expérience teste plusieurs


algorithmes sur les mêmes données et compare les résultats : Compare Multi-
class Classifiers: Letter recognition (Comparer des classifieurs multiclasses :
reconnaissance de lettres).

 Conseil

Pour télécharger une vue d'ensemble infographique présentant de


manière simple les concepts de base du Machine Learning afin de vous
familiariser avec les algorithmes populaires utilisés pour répondre aux
questions les plus courantes concernant le Machine Learning, consultez
Principes de base du Machine Learning avec exemples d'algorithmes.

Types d'apprentissage automatique

Supervisé

Les algorithmes d'apprentissage supervisés font des prédictions basées sur un


ensemble d'exemples. Par exemple, historiques des cours peuvent être utilisés
pour faire des estimations sur les prix futurs. Chaque exemple utilisé pour
l'apprentissage est étiqueté avec la valeur d'intérêt : dans ce cas, le prix des
actions. Un algorithme d'apprentissage supervisé recherche des modèles dans
ces étiquettes de valeur. Il peut utiliser toutes les informations qui peuvent
être pertinentes (le jour de la semaine, la saison, les données financières de
l’entreprise, le type de secteur, l’existence d’événements géopolitiques
perturbateurs), et chaque algorithme recherche différents types de modèles.
Une fois que l'algorithme a trouvé le meilleur modèle possible, il l’utilise pour
élaborer des prédictions pour les données de test sans étiquette : les prix
futurs.

Il s’agit d’un type d’apprentissage automatique utile et apprécié. À une


exception près, tous les modules d’Azure Machine Learning Studio sont
supervisés. Plusieurs types spécifiques d'apprentissage supervisé sont

3 sur 22 26/03/2019 à 16:53


Choisir des algorithmes - Azure Machine Learni... https://docs.microsoft.com/fr-fr/azure/machine-l...

représentés dans Azure Machine Learning Studio : la classification, la


régression et la détection d’anomalies.

Classification. Lorsque les données sont utilisées pour prédire une


catégorie, l’apprentissage supervisé est également appelé classification.
C'est le cas lors de l'affectation d'une image en tant que photo d'un
« chat » ou d’un « chien ». Quand il n’y a que deux choix, on appelle cela
la classification à deux classes ou binomiale. Lorsqu'il existe plusieurs
catégories, comme lors de la prévision du gagnant du
championnat NCAA, ce problème est connu sous le nom de
classification à classes multiples.
Régression. Lorsque l’on prédit une valeur, comme le cours de la Bourse,
l’apprentissage surveillé est appelé régression.
Détection des anomalies. Parfois, l'objectif est d'identifier les points de
données qui sont simplement inhabituels. Dans le cas de la détection
des fraudes par exemple, toute dépense très étrange par carte de crédit
est suspecte. Les variations possibles sont si nombreuses et les exemples
de formation si rares, qu'il n'est pas possible de savoir à quoi ressemble
une activité frauduleuse. L’approche de détection des anomalies consiste
à simplement en savoir quelle activité normale ressemble (à l’aide de
l’historique des transactions non-frauduleuses) et identifier tout ce qui
est très différent.

Non supervisé

Dans l’apprentissage non supervisé, les points de données n’ont aucune


étiquette associée. En effet, l’objectif d’un algorithme d’apprentissage non
supervisé est d’organiser les données d’une certaine façon ou de décrire sa
structure. Cela peut signifier un regroupement en clusters ou la recherche de
différentes manières de visualisation des données complexes afin d’en
simplifier l’affichage ou de l’organiser plus efficacement.

Apprentissage par renforcement

Dans l’apprentissage par renforcement, l’algorithme choisit une action en


réponse à chaque point de données. L’algorithme d’apprentissage reçoit
également un signal de récompense quelques instants plus tard, qui indique

4 sur 22 26/03/2019 à 16:53


Choisir des algorithmes - Azure Machine Learni... https://docs.microsoft.com/fr-fr/azure/machine-l...

la qualité de la décision. En fonction de ce signal, l’algorithme modifie sa


stratégie pour atteindre la récompense la plus élevée. Il n'existe actuellement
aucun module d'apprentissage de renforcement dans
Azure Machine Learning Studio. L’apprentissage par renforcement est une
approche courante en robotique, où le jeu des lectures des capteurs à un
moment donné est un point de données et où l’algorithme doit choisir l’action
suivante du robot. Il est également adapté aux applications
d’Internet des objets.

Considérations lors du choix d'un


algorithme

Précision

L’obtention de la réponse la plus précise possible n'est pas toujours


nécessaire. Parfois, en fonction de votre utilisation, une approximation suffit.
Si tel est le cas, vous pourrez peut-être réduire le temps de traitement
considérablement en utilisant des méthodes plus approximatives. Un autre
avantage des méthodes plus approximatives est qu’ils ont naturellement
tendance à éviter le surajustement.

Durée d’apprentissage

Le nombre de minutes ou d'heures nécessaires pour l'apprentissage d'un


modèle varie beaucoup selon les algorithmes. La durée d’apprentissage est
souvent étroitement liée à la précision : l’une accompagne généralement
l'autre. En outre, certains algorithmes sont plus sensibles au nombre de points
de données que d'autres. Un temps limité peut guider le choix de
l'algorithme, en particulier lorsque le jeu de données est vaste.

Linéarité

Un grand nombre d'algorithmes d'apprentissage automatique utilisent la


linéarité. Les algorithmes de classification linéaire supposent que les classes
peuvent être séparées par une ligne droite (ou son analogie de dimension
supérieure). Ceux-ci incluent la régression logistique et les machines à

5 sur 22 26/03/2019 à 16:53


Choisir des algorithmes - Azure Machine Learni... https://docs.microsoft.com/fr-fr/azure/machine-l...

vecteurs de support (comme implémentées dans Azure Machine Learning


Studio). Les algorithmes de régression linéaire supposent que les tendances
des données suivent une ligne droite. Ces hypothèses ne sont pas erronées
pour certains problèmes, mais réduisent la précision pour d’autres.

Limite de classe non linéaire : utiliser un algorithme de classification linéaire


entraînerait une faible précision

Données avec une tendance non linéaire : une méthode de régression


linéaire entraînerait plus d’erreurs

Malgré leurs limitations, les algorithmes linéaires sont très populaires comme
première ligne d'attaque. Ils ont tendance à être des algorithmes simples et à

6 sur 22 26/03/2019 à 16:53


Choisir des algorithmes - Azure Machine Learni... https://docs.microsoft.com/fr-fr/azure/machine-l...

apprentissage rapide.

Nombre de paramètres

Les paramètres sont les boutons que les scientifiques des données règlent
lorsqu’ils configurent un algorithme. Ce sont des nombres qui affectent le
comportement de l'algorithme, comme la tolérance aux erreurs ou le nombre
d'itérations ou les variantes du comportement de l'algorithme. La durée
d’apprentissage et la précision de l'algorithme peuvent parfois dépendre
grandement du choix de paramètres appropriés. En règle générale, les
algorithmes avec un grand nombre de paramètres requièrent le plus d’essais
pour trouver la bonne combinaison.

Il existe également un bloc module de balayage de paramètre dans


Azure Machine Learning Studio qui essaie automatiquement toutes les
combinaisons de paramètres à la granularité que vous choisissez. Même si
c'est un excellent moyen de vous assurer que vous avez examiné l'espace de
paramétrage, le temps nécessaire pour former un modèle augmente de façon
exponentielle avec le nombre de paramètres.

Avoir de nombreux paramètres indique généralement qu'un algorithme a une


plus grande flexibilité. Il peut souvent obtenir une excellente précision, autant
vous pouvez trouver la bonne combinaison de valeurs de paramètre.

Nombre de fonctionnalités

Pour certains types de données, le nombre de fonctionnalités peut être très


important par rapport au nombre de points de données. C'est souvent le cas
avec les données génétiques ou textuelles. Le grand nombre de
fonctionnalités risque de ralentir certains algorithmes d'apprentissage et
atteindre une durée d’apprentissage inutilisable. Les machines à vecteurs de
support sont particulièrement bien adaptées à ce cas (voir ci-dessous).

Cas particuliers

Certains algorithmes d'apprentissage effectuent des hypothèses particulières


sur la structure des données ou les résultats souhaités. Si vous pouvez en
trouver un qui répond à vos besoins, il peut vous donner des résultats plus

7 sur 22 26/03/2019 à 16:53


Choisir des algorithmes - Azure Machine Learni... https://docs.microsoft.com/fr-fr/azure/machine-l...

pertinents, des prévisions plus précises ou des durées d'apprentissage plus


courtes.

Durée
Algorithme Précision d’apprentissage Linéarité Paramètres Remarques

Classification
double
classe.

régression ● ● 5.
logique

forêt de ● ○ 6.
décision

jungle de ● ○ 6. Faible
décision encombrement
de mémoire

arbre de ● ○ 6. Encombrement
décision de mémoire
optimisé important

réseau ● 9 Personnalisation
neuronal supplémentaire
possible

perceptron ○ ○ ● 4
moyenné

machines à ○ ● 5. Idéal pour les


vecteurs de ensembles de
support fonctionnalités
de grande taille

Machine à ○ 8 Idéal pour les


vecteurs de ensembles de
support fonctionnalités
localement de grande taille
profonde

8 sur 22 26/03/2019 à 16:53


Choisir des algorithmes - Azure Machine Learni... https://docs.microsoft.com/fr-fr/azure/machine-l...

Durée
Algorithme Précision d’apprentissage Linéarité Paramètres Remarques

Machine de ○ ● 3
point de
Bayes

Classification
multiclasse.

régression ● ● 5.
logique

forêt de ● ○ 6.
décision

jungle de ● ○ 6. Faible
décision encombrement
de mémoire

réseau ● 9 Personnalisation
neuronal supplémentaire
possible

un contre - - - - Consultez les


tous propriétés de la
méthode à deux
classes
sélectionnée

Régression

linéaire ● ● 4

linéaire ○ ● 2
bayésienne

forêt de ● ○ 6.
décision

arbre de ● ○ 5. Encombrement

9 sur 22 26/03/2019 à 16:53


Choisir des algorithmes - Azure Machine Learni... https://docs.microsoft.com/fr-fr/azure/machine-l...

Durée
Algorithme Précision d’apprentissage Linéarité Paramètres Remarques

décision de mémoire
optimisé important

quantile de ● ○ 9 Distributions
forêt rapide plutôt que
prédictions de
points

réseau ● 9 Personnalisation
neuronal supplémentaire
possible

Poisson ● 5. Techniquement
journal linéaire.
Pour les
décomptes
prévisionnels

ordinal 0 Pour la
prédiction de
rang

Détection
des
anomalies

machines à ○ ○ 2 Particulièrement
vecteurs de adapté aux
support ensembles de
caractéristiques
de grande taille

Détection ○ ● 3
des
anomalies
reposant sur
le PCA

10 sur 22 26/03/2019 à 16:53


Choisir des algorithmes - Azure Machine Learni... https://docs.microsoft.com/fr-fr/azure/machine-l...

Durée
Algorithme Précision d’apprentissage Linéarité Paramètres Remarques

K-moyennes ○ ● 4 Un algorithme
de clustering

Propriétés de l'algorithme :

● : excellente précision, durée d'apprentissage courte et utilisation de la


linéarité

○ : bonne précision et durée d’apprentissage modérée

Notes de l'algorithme

Régression linéaire

Comme mentionné précédemment, la régression linéaire fait correspondre


une ligne (ou plan ou hyperplan) au jeu de données. Elle est très efficace,
simple et rapide, mais peut être trop simpliste pour certains problèmes.

11 sur 22 26/03/2019 à 16:53


Choisir des algorithmes - Azure Machine Learni... https://docs.microsoft.com/fr-fr/azure/machine-l...

Données avec une tendance linéaire

Régression logique

Bien qu’il inclue « régression » dans le nom, la régression logistique est en fait
un outil puissant pour deux classes et multiclass classification. Elle est rapide
et simple. Le fait qu'elle utilise une courbe en forme de S, et non une ligne
droite, en fait une solution de choix pour diviser les données en groupes. La
régression logique crée des limites de classes linéaires : vérifiez donc qu'une
approximation linéaire vous convient.

12 sur 22 26/03/2019 à 16:53


Choisir des algorithmes - Azure Machine Learni... https://docs.microsoft.com/fr-fr/azure/machine-l...

Une régression logique pour les données à deux classes avec une seule
caractéristique : la limite de classe est le point auquel la courbe logistique est
aussi proche des deux classes

Arbres, forêts et jungles

Les forêts de décision (régression, deux classes et classes multiples), les


jungles de décision (deux classes et classes multiples) et les arbres de décision
renforcés (régression et deux classes) sont tous basés sur les arbres de
décision, un concept fondamental pour l’apprentissage automatique. Il existe
de nombreuses variantes d'arbres de décision, mais tous font la même chose :
subdiviser l'espace de la fonctionnalité en régions avec la même étiquette. Il
peut s'agir des régions de catégorie ou de valeur constante, si vous effectuez
une classification ou une régression.

13 sur 22 26/03/2019 à 16:53


Choisir des algorithmes - Azure Machine Learni... https://docs.microsoft.com/fr-fr/azure/machine-l...

Un arbre de décision divise un espace de caractéristique en régions de


valeurs à peu près uniformes

Étant donné qu’un espace de fonctionnalité peut être subdivisé en petites


régions de taille arbitraire, il est facile de concevoir que la division atteigne un

14 sur 22 26/03/2019 à 16:53


Choisir des algorithmes - Azure Machine Learni... https://docs.microsoft.com/fr-fr/azure/machine-l...

point de données par région. Il s’agit d’un exemple extrême de dépassement.


Pour éviter ce problème, un grand ensemble d’arbres sont construits avec un
soin mathématique pour garantir les arborescences ne sont pas corrélées. La
moyenne de cette « forêt de décision » est un arbre qui permet d'éviter un
surajustement. Les forêts de décision peuvent utiliser beaucoup de mémoire.
Les jungles de décision sont une variante qui consomme moins de mémoire,
mais avec une durée d’apprentissage légèrement plus longue.

Les arbres de décision améliorée évitent le surajustement en limitant le


nombre de subdivisions et le nombre minimum de points de données
autorisés dans chaque région. L'algorithme construit une séquence d'arbres,
chacun d'entre eux apprenant à compenser l'erreur de l'arbre précédent. Cela
fournit un apprenant très précis qui a tendance à utiliser beaucoup de
mémoire. Pour une description complète, consultez le livre d'origine de
Friedman.

La régression quantile de forêt rapide est une variante d'arbres de décision


pour les cas où vous souhaitez savoir non seulement la valeur standard
(médiane) des données au sein d'une région, mais également sa distribution
sous la forme de quantiles.

Perceptrons et réseaux neuronaux

Les réseaux neuronaux sont des algorithmes d’apprentissage inspirés du


cerveau couvrant les problèmes de classes multiples, à deux classes et de
régression. Il existe de nombreux réseaux neuronaux d’apprentissage, mais
ceux d’Azure Machine Learning Studio sont tous des graphiques acycliques
dirigés. Cela signifie que les fonctionnalités d'entrée sont transmises vers
l'avant (jamais vers l'arrière) via une séquence de couches, avant d'être
transformées en sorties. Dans chaque couche, les entrées sont pondérées
dans diverses combinaisons, additionnées et transmises à la couche suivante.
Cette combinaison de calculs simples permet d'apprendre les tendances de
données et les limites de classe sophistiquées, en toute simplicité. Les réseaux
à plusieurs couches de ce type effectuent « l’apprentissage approfondi » qui
alimente tant d’articles technologiques et de science-fiction.

Ces performances élevées ont toutefois un prix. L’apprentissage des réseaux


neuronaux peut prendre beaucoup de temps, en particulier pour les grands

15 sur 22 26/03/2019 à 16:53


Choisir des algorithmes - Azure Machine Learni... https://docs.microsoft.com/fr-fr/azure/machine-l...

jeux de données avec un grand nombre de fonctionnalités. Ils ont également


plus de paramètres que la plupart des algorithmes, ce qui signifie que le
balayage de paramètres allonge grandement la durée d’apprentissage. Et
pour les perfectionnistes qui souhaitent spécifier leur propre structure de
réseau, les possibilités sont infinies.

16 sur 22 26/03/2019 à 16:53


Choisir des algorithmes - Azure Machine Learni... https://docs.microsoft.com/fr-fr/azure/machine-l...

Les limites apprises par les réseaux neuronaux peuvent être complexes et
irrégulières

Le perceptron moyenné à deux classes est le réseau neuronal idéal pour


répondre à l’explosion des durées d'apprentissage. Il utilise une structure de
réseau qui fournit des limites de la classe linéaire. Il est presque primitif au vu
des normes actuelles, mais il a un long historique d'utilisation fiable et est
suffisamment petit pour apprendre rapidement.

Machines à vecteurs de support (SVM)

Les machines à vecteurs de support (SVM) recherchent la limite qui sépare les


classes par une marge aussi grande que possible. Lorsque les deux classes ne
peuvent pas être clairement séparées, les algorithmes trouvent la meilleure
limite possible. Comme écrites dans Azure Machine Learning Studio, le SVM à
deux classes avec uniquement une ligne droite (dans le jargon SVM, elle utilise
un noyau linéaire). Étant donné qu’elle utilise cette approximation linéaire, elle
est capable de s'exécuter assez rapidement. Elle est particulièrement est avec
des données qui consomment beaucoup de fonctionnalités, telles que le texte
ou des données. Dans ces cas, les SVM sont en mesure de séparer les classes
plus rapidement et avec moins de surajustement que la plupart des autres
algorithmes, tout en utilisant une petite quantité de mémoire.

17 sur 22 26/03/2019 à 16:53


Choisir des algorithmes - Azure Machine Learni... https://docs.microsoft.com/fr-fr/azure/machine-l...

Une frontière de classe de machine à vecteurs de support standard optimise


la marge séparant deux classes

Un autre produit de Microsoft Research, la SVM localement approfondi


à deux classes est une variante non linéaire de SVM qui conserve la plupart de
l'efficacité de la mémoire et de la vitesse de la version linéaire. Elle est idéale
pour les cas où l'approche linéaire ne donne pas de réponses suffisamment
précises. Les développeurs conservé sa rapidité en décomposant le problème
en un nombre de petits problèmes SVM linéaires. Lisez la description
complète pour plus d'informations sur la méthode utilisée.

À l'aide d'une extension intelligente de SVM non linéaires, la SVM à une classe


dessine une limite qui encadre étroitement l'ensemble de données. Elle est
utile pour la détection des anomalies. Les nouveaux points de données qui se
situent bien à l'extérieur de cette limite sont assez inhabituels pour être
remarqués.

Méthodes bayésiennes

Les méthodes bayésiennes ont une qualité très intéressante : elles évitent le

18 sur 22 26/03/2019 à 16:53


Choisir des algorithmes - Azure Machine Learni... https://docs.microsoft.com/fr-fr/azure/machine-l...

surajustement. Pour cela, elles émettent quelques hypothèses préalables sur la


distribution probable de la réponse. Un autre avantage de cette approche est
qu'elle a très peu de paramètres. Azure Machine Learning Studio comporte
des algorithmes bayésiens pour la classification (machine de point Two-class
Bayes) et de régression (régression linéaire bayésienne). Notez qu’ils
supposent que les données peuvent être fractionnées ou ajustées avec une
ligne droite.

Anecdote historique, les machines de point de Bayes ont été développées par
Microsoft Research. Elles reposent sur un travail théorique exceptionnel. Pour
plus d’informations, consultez l’article d’origine dans JMLR et le blog de Chris
Bishop.

Algorithmes spécialisés

Avoir un objectif très spécifique peut être bénéfique. La collection Azure


Machine Learning Studio comprend des algorithmes spécialisés dans les
domaines suivants :

Prédiction de classement (régression ordinale)


Prédiction de nombres (régression Poisson)
Détection des anomalies (un basé sur l’analyse des principaux
composants et un autre basé sur les machines à vecteurs de support)
Clustering (K-moyennes)

19 sur 22 26/03/2019 à 16:53


Choisir des algorithmes - Azure Machine Learni... https://docs.microsoft.com/fr-fr/azure/machine-l...

Détection des anomalies reposant sur le PCA : la grande majorité des


données correspond à une distribution typique ; les points déviant
considérablement de cette distribution sont suspects

20 sur 22 26/03/2019 à 16:53


Choisir des algorithmes - Azure Machine Learni... https://docs.microsoft.com/fr-fr/azure/machine-l...

Un jeu de données est regroupé dans cinq clusters à l’aide de K-moyennes.

Il existe également un ensemble de classifieur à classes multiples one-v-all,


qui subdivise le problème de classification de classe N en problèmes de
classification à deux classes N-1. La précision, la durée d’apprentissage et les
propriétés de linéarité sont déterminées par les classifieurs à deux classes
utilisés.

Deux classifieurs à deux classes combinés pour former un classifieur à trois

21 sur 22 26/03/2019 à 16:53


Choisir des algorithmes - Azure Machine Learni... https://docs.microsoft.com/fr-fr/azure/machine-l...

classes

Azure Machine Learning Studio inclut également l'accès à une puissante


infrastructure d'apprentissage automatique appelée Vowpal Wabbit. VW défie
la catégorisation ici, puisqu'elle peut apprendre des problèmes de
classification et de régression et même utiliser des données partiellement sans
étiquette. Vous pouvez la configurer pour utiliser l'un des nombreux
algorithmes d’apprentissage, les fonctions de perte et les algorithmes
d'optimisation. Elle a été conçue dès le départ pour être efficace, parallèle et
extrêmement rapide. Elle gère d’immenses ensembles de fonctionnalités avec
peu d'effort. Lancée et dirigée par John Langford de Microsoft Research, VW
est une Formule 1 dans la course des algorithmes. VW ne convient pas à tous
les problèmes, mais si c’est le cas pour le vôtre, il est avantageux de l’utiliser.
Elle est également disponible en tant que code open source autonome dans
plusieurs langues.

Étapes suivantes
Pour télécharger une vue d'ensemble infographique présentant de
manière simple les concepts de base du Machine Learning afin de vous
familiariser avec les algorithmes populaires utilisés pour répondre aux
questions les plus courantes concernant le Machine Learning, consultez
Principes de base du Machine Learning avec exemples d'algorithmes.

Pour obtenir la liste par catégorie de tous les algorithmes


d’apprentissage automatique disponibles dans Machine Learning Studio,
consultez Initialiser le modèle dans Machine Learning Studio : aide sur
les algorithmes et les modules.

Pour obtenir la liste alphabétique complète des algorithmes et des


modules de Machine Learning Studio, consultez Liste alphabétique des
modules de Machine Learning Studio dans Machine Learning Studio :
aide sur les algorithmes et les modules.

22 sur 22 26/03/2019 à 16:53

Vous aimerez peut-être aussi