Vous êtes sur la page 1sur 3
0310572018 9 Algorithmes de Machine Learning que chaque Data Scientist doit connalie| Mr. Mint: Apprendre Machine Leaming de A 82 9 Algorithmes de Machine Learning que chaque Data Scientist doit connaitre By Younes Benzaki | 30 juin 2017 0 FLARES D0 8 ° {Le domaine du Machine Learning regorge d'algorithmes pour répondre a différents besoins. Chacun a ses spécificités mathématiques et algorithmiques. Pour quelqu'un qui débute dans le domaine, cela peut ne pas étre évident a appréhender. J'ai ‘compilé cette liste regroupant 9 algorithmes de Machine Learning les plus basiques mais redoutables pour mieux vous retrouver dans cette folre aux algos ! Note : J'ai préféré garder le nom anglais de ces algorithmes pour ne pas vous embrouiller avec des traductions *hasardeuses” ® 1. Linear Regres: htpssimnint./9-algrithes-de-machine-learing-que-chaque-data-scinlist-dol-cannaite 43 0310512018 9 Algorithmes de Machine Learning que chaque Data Scientist doit connate | Mr. Mint: Apprendre le Machine Learning de A & Z 30 20 15 10 Les algorithmes de régression linéaire modélisent la relation entre des variables prédictives et une varlable clble, La relation ‘est modélisée par une fonction mathématique de prédiction. Le cas le plus simple est la régression linéaire univariée. Elle va trouver une fonction sous forme de droite pour estimer la relation. La régression linéaire mulivariée intervient quand plusieurs variables oxplicativesintorviennent dans la fonction de prédiction. Et finalement, la régression polynomialepermet de modéliser des relations complexes qui ne sont pas forcément linéaires, 2. Logistic Regression La régression logistique est une méthode statistique pour effectuer des classifications binaires. Elle prend en entrée des variables prédiclives qualitalives et/ou ordinates et mesure fa probablié de la valeur de sortie en utilisant la fonction sigmoid (représentée dans la photo). htpssimnint./9-algrithes-de-machine-learing-que-chaque-data-scinlist-dol-cannaite 02108'2018 9 Algrithmes de Machine Learning que chaque Data Scientist doit connalre | Mr. Mint; Apprendre le Machine Leeming de A & Z ‘On peut effectuer ta classification mult-classes (par exemple classifier une photo en trois possibltés comme moto, voiture, tramway). En utilisant ia régression logistique et la méthode un-contra-tous (One-Versus-All classification). La régression logistique permettra de répondre & des problémes comme + Est-ce que le client est solvable pour lui accorder un erédit 2 + Est-ce que la tumeur diagnostiquée est bénigne ou maline ? 3. Support Vector Machine (SVM) Machine a Vectours de Support (SVM) est lui aussi un algorithme de classification binaire, Tout comme la régression logistique. fon prend l'image ci-dessus, nous avons deux classes (Imaginons quil s'agit de e-mails, et que les mails Spam sont en rouge et les non spam sont en bleu). La régression Logistique pourra séparer ces deux classes en définissant le trait en rouge. le SVM va opter 8 séparer les deux cla 8 par le trait vert ‘Sans entrer dans les détails, et pour des considérations mathématiques, le SVM choisira la séparation la plus nette possible entre les deux classes (comme le tralt vert), C'est pour cela qu'on le nomme auss! Large Margins classifier (classifieur aux marges larges). 4. Naive Bayes Naive Bayes est un classifieur assez intuitif 4 comprendre. II se base sur le théoréme de Bayes des probabilités conditionnelles. image c-dessus est Ie formule du théoréme de Bayes. a3 fata-scientistdl-connal htpssimmint./9-algrithes-de-machine-learing-que-chaqu