0310572018 9 Algorithmes de Machine Learning que chaque Data Scientist doit connalie| Mr. Mint: Apprendre
Machine Leaming de A 82
9 Algorithmes de Machine Learning que chaque Data Scientist
doit connaitre
By Younes Benzaki | 30 juin 2017
0
FLARES
D0 8
°
{Le domaine du Machine Learning regorge d'algorithmes pour répondre a différents besoins. Chacun a ses spécificités
mathématiques et algorithmiques. Pour quelqu'un qui débute dans le domaine, cela peut ne pas étre évident a appréhender. J'ai
‘compilé cette liste regroupant 9 algorithmes de Machine Learning les plus basiques mais redoutables pour mieux vous
retrouver dans cette folre aux algos !
Note : J'ai préféré garder le nom anglais de ces algorithmes pour ne pas vous embrouiller avec des traductions *hasardeuses” ®
1. Linear Regres:
htpssimnint./9-algrithes-de-machine-learing-que-chaque-data-scinlist-dol-cannaite
430310512018 9 Algorithmes de Machine Learning que chaque Data Scientist doit connate | Mr. Mint: Apprendre le Machine Learning de A & Z
30
20
15
10
Les algorithmes de régression linéaire modélisent la relation entre des variables prédictives et une varlable clble, La relation
‘est modélisée par une fonction mathématique de prédiction. Le cas le plus simple est la régression linéaire univariée. Elle va
trouver une fonction sous forme de droite pour estimer la relation. La régression linéaire mulivariée intervient quand plusieurs
variables oxplicativesintorviennent dans la fonction de prédiction. Et finalement, la régression polynomialepermet de modéliser
des relations complexes qui ne sont pas forcément linéaires,
2. Logistic Regression
La régression logistique est une méthode statistique pour effectuer des classifications binaires. Elle prend en entrée des variables
prédiclives qualitalives et/ou ordinates et mesure fa probablié de la valeur de sortie en utilisant la fonction sigmoid (représentée
dans la photo).
htpssimnint./9-algrithes-de-machine-learing-que-chaque-data-scinlist-dol-cannaite02108'2018 9 Algrithmes de Machine Learning que chaque Data Scientist doit connalre | Mr. Mint; Apprendre le Machine Leeming de A & Z
‘On peut effectuer ta classification mult-classes (par exemple classifier une photo en trois possibltés comme moto, voiture,
tramway). En utilisant ia régression logistique et la méthode un-contra-tous (One-Versus-All classification).
La régression logistique permettra de répondre & des problémes comme
+ Est-ce que le client est solvable pour lui accorder un erédit 2
+ Est-ce que la tumeur diagnostiquée est bénigne ou maline ?
3. Support Vector Machine (SVM)
Machine a Vectours de Support (SVM) est lui aussi un algorithme de classification binaire, Tout comme la régression logistique.
fon prend l'image ci-dessus, nous avons deux classes (Imaginons quil s'agit de e-mails, et que les mails Spam sont en rouge et les
non spam sont en bleu). La régression Logistique pourra séparer ces deux classes en définissant le trait en rouge. le SVM va opter
8 séparer les deux cla
8 par le trait vert
‘Sans entrer dans les détails, et pour des considérations mathématiques, le SVM choisira la séparation la plus nette possible entre
les deux classes (comme le tralt vert), C'est pour cela qu'on le nomme auss! Large Margins classifier (classifieur aux marges
larges).
4. Naive Bayes
Naive Bayes est un classifieur assez intuitif 4 comprendre. II se base sur le théoréme de Bayes des probabilités
conditionnelles. image c-dessus est Ie formule du théoréme de Bayes.
a3
fata-scientistdl-connal
htpssimmint./9-algrithes-de-machine-learing-que-chaqu