Vous êtes sur la page 1sur 362

Les usages de lintelligence artificielle

Octobre 2017
Olivier Ezratty

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 1 / 362
A propos de lauteur

Olivier Ezratty olivier (at) oezratty.net , http://www.oezratty.net , @olivez


consultant et auteur +33 6 67 37 92 41
Olivier Ezratty conseille les entreprises dans llaboration de leurs business plans, stratgies produits et marketing,
avec une focalisation sur les projets fort contenu technique et scientifique (objets connects, intelligence artifi-
cielle, medtechs, biotechs, ). Il leur apporte un triple regard : technologique, marketing et management ainsi que
la connaissance des cosystmes dans les industries numriques.
Il a ralis depuis 2005 des missions diverses daccompagnement stratgique et de confrences ou formations
dans diffrents secteurs tels que la tlvision (TF1, RTS-SSR, SES Astra, TDF, Euro Media Group, Netgem), les
tlcoms (Bouygues Tlcom, Orange, SFR, Alcatel-Lucent), les produits grand public (LG Electronics, groupe
Seb, LOral, Alt Group), la finance et lassurance (BPCE, Crdit Agricole, Crdit Mutuel-CIC, Socit Gn-
rale, Natixis, Groupama). Ces missions couvrent lassistance la cration de roadmap produit, lanalyse de posi-
tionnement et de la concurrence, la dfinition technologique et marketing de stratgies dcosystmes et
dinnovation ouverte , lassistance la ralisation de business plans, lanimation de sminaires de brainstor-
ming, ainsi que lintervention dans des confrences et sminaires sur les tendances du march dans le numrique.
Ses contributions sappuient sur un fort investissement dans lcosystme de linnovation et sous diffrentes cas-
quettes, notamment dans lunivers des startups :
Expert, membre et lun des prsidents du comit dagrment de Scientiple Initiative (Wiplo), une associa-
tion membre dInitiative France qui acclre les startups franciliennes.
Membre depuis fin 2015 du Comit de Prospective de lARCEP.
Advisor du fonds dinvestissement INVST I/O spcialis dans les objets connects.
Expert auprs du ple de comptitivit Cap Digital ainsi que de la Caisse des Dpts et du CNC.
Membre du jury de divers concours entrepreneuriaux comme le Grand Prix de lInnovation de la Ville de
Paris ou la Startup Academy, mentor dans de nombreux Startups Weekends.
Il est guest speaker dans divers tablissements d'enseignement suprieur tels que HEC, SciencePo, Neoma Rouen,
CentraleSupelec, lEcole des Mines de Paris, Tlcom Paristech et lECE o il intervient sur le marketing de
l'innovation dans les industries numriques, sur l'entrepreunariat et le product management, en franais comme en
anglais selon les besoins.
Olivier Ezratty est lauteur du Rapport du CES de Las Vegas, publi la fin janvier de chaque anne depuis
2006, et du Guide des Startups qui est devenu une rfrence en France avec plus de 200 000 tlchargements
date. Le tout tant publi sur le blog Opinions Libres (http://www.oezratty.net) qui traite de lentrepreneuriat
et des mdias numriques. Comme photographe, il est aussi le co-auteur de linitiative Quelques Femmes du
Numrique ! (http://www.qfdn.net), devenue une association en 2016, et qui vise augmenter la place des
femmes dans les mtiers du numrique, en sensibilisant les jeunes ces mtiers.
Olivier Ezratty dbute en 1985 chez Sogitec, une filiale du groupe Dassault, o il est successivement Ingnieur
Logiciel, puis Responsable du Service Etudes dans la Division Communication. Il initialise des dveloppements
sous Windows 1.0 dans le domaine de l'informatique ditoriale ainsi que sur SGML, lanctre de HTML et XML.
Entrant chez Microsoft France en 1990, il y acquiert une exprience dans de nombreux domaines du mix marke-
ting : produits, canaux, marchs et communication. Il lance la premire version de Visual Basic en 1991 ainsi que
Windows NT en 1993. En 1998, il devient Directeur Marketing et Communication de Microsoft France et en
2001, de la Division Dveloppeurs dont il assure la cration en France pour y lancer notamment la plate-
forme .NET et promouvoir la plate-forme de lditeur auprs des dveloppeurs, dans l'enseignement suprieur et
la recherche ainsi quauprs des startups. Olivier Ezratty est ingnieur de lEcole Centrale Paris (1985).
Ce document vous est fourni titre gracieux et est sous licence Creative Commons
dans la variante Paternit-Pas d'Utilisation Commerciale-Pas de Modification 2.0 France
Voir http://creativecommons.org/licenses/by-nc-nd/2.0/fr/

Photo de couverture : schma trouv ici et modifi.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 2 / 362
Table des matires

Objectifs et contenu ................................................................................................. 5


Grands courants de lIA .......................................................................................... 9
Hauts et bas de lIA .............................................................................................. 10
Connexionisme et symbolisme ............................................................................. 19
Dfinitions et segmentations de lintelligence artificielle .................................... 20
Briques fondamentales de lIA ............................................................................. 25
Force brute et arbres de dcision .......................................................................... 26
Mthodes statistiques............................................................................................ 28
Systmes experts .................................................................................................. 29
Machine learning .................................................................................................. 34
Rseaux de neurones ............................................................................................ 39
Deep learning........................................................................................................ 43
Agents ................................................................................................................... 71
Artificial General Intelligence .............................................................................. 75
IA et infrastructure informatique ........................................................................ 92
Processeurs ........................................................................................................... 92
Mmoire.............................................................................................................. 116
Stockage.............................................................................................................. 119
Capteurs et objets connects ............................................................................... 122
Big data ............................................................................................................... 126
Cloud .................................................................................................................. 127
Energie ................................................................................................................ 128
Applications gnriques de lIA.......................................................................... 130
Vision.................................................................................................................. 130
Langage .............................................................................................................. 143
Robotique............................................................................................................ 161
Marketing et vente .............................................................................................. 170
Ressources humaines .......................................................................................... 175
Cyberscurit ...................................................................................................... 176
Applications mtiers de lIA ............................................................................... 180
Transports ........................................................................................................... 180
Sant ................................................................................................................... 187
Industrie .............................................................................................................. 202
Agriculture .......................................................................................................... 204
Finance................................................................................................................ 210
Assurance............................................................................................................ 217
Distribution ......................................................................................................... 218
Mdias ................................................................................................................ 224
Tourisme ............................................................................................................. 230
Juridique ............................................................................................................. 233

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 3 / 362
Services publics .................................................................................................. 238
Renseignement et dfense .................................................................................. 239
Acteurs de lintelligence artificielle .................................................................... 240
Grandes entreprises du numrique ..................................................................... 240
Startups ............................................................................................................... 271
Ecosystme franais de lIA ............................................................................... 282
LIA dans la socit .............................................................................................. 293
Craintes sur lIA ................................................................................................. 293
Transformation des mtiers par lIA .................................................................. 304
Politique par lIA ................................................................................................ 324
Politiques de lIA ................................................................................................ 328
LIA dans lentreprise ......................................................................................... 340
Discours .............................................................................................................. 340
Mthodes ............................................................................................................ 343
Projets ................................................................................................................. 346
Benchmarks ........................................................................................................ 347
Outils .................................................................................................................. 348
Comptences....................................................................................................... 349
Organisation........................................................................................................ 351
Epilogue................................................................................................................. 353
Mdias spcialiss................................................................................................. 355
Dictionnaire anglais/franais de lIA ................................................................. 356
Glossaire ................................................................................................................ 358
Historique des rvisions du document ............................................................... 361

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 4 / 362
Objectifs et contenu

Par la force des choses, lIA est devenue le sujet le plus en vue du numrique. Il est
mme difficile dy chapper ! Cest la fois un sujet de socit, un objet politique et
un outil de la comptitivit des entreprises. Elle gnre son lot de questions sur le fu-
tur du travail, de la rpartition des richesses, sur la souverainet conomique et mme
sur le devenir de lespce humaine.
Cette vague technologique est atypique par rapport aux prcdentes. Les techniques
de lIA sont mconnues, y compris par la majorit des professionnels du numrique,
do la propagation de nombreux mythes son sujet, un peu trop directement inspirs
par la science-fiction1. Nombre de ses vanglistes la vulgarisent au point de saupou-
drer leurs propos damalgames, dapproximations, de revue de presse non vrifie et
dexagrations exasprantes pour ceux qui cherchent comprendre les technologies
de prs et prendre une certaine distance vis--vis des effets dannonces2.
Les prophtes de mauvais augure voient arriver grand pas lintelligence artificielle
gnralise qui rendrait lHomme caduque, la connexion directe des IA aux cerveaux
pour mieux la contrler ou se faire hacker par elle et autres dlires singularistes et
transhumanistes invrifiables.
Cela pour consquence une saturation de lespace mdiatique par des contenus qui se
focalisent sur le pour et le contre de lIA plutt que sur ses aspects tangibles allant
des techniques de lIA ses applications. Or lIA est aussi devenue un sujet central
pour les entreprises , dans la ligne des autres grandes vagues technologiques du
numrique telles que lInternet ou la mobilit.
Lambition de ce document est de revenir au prsent et au futur proche pour com-
prendre les usages et techniques de lIA dans les entreprises et les aider en tirer le
meilleur parti. Il sagit de mettre les fantasmes de ct et de rentrer dans le concret,
ce qui nempche pas de faire preuve de crativit et de rsoudre de nouveaux pro-
blmes de manire originale.
Cet opus fait suite une compilation de neuf articles sur les Avances de
lIntelligence Artificielle publis entre mars et mai 2016 sur Opinions Libres. Depuis,
pas mal deau a coul sous les ponts. Le march de lIA se structure rapidement. Les
briques technologiques de lIA prennent forme et sont assembles par les uns et les
autres, diteurs de logiciels, fournisseurs de solutions en cloud, startups et socits de
services. Le march des composants spcialiss dans lIA prend aussi forme, des data
centers aux objets connects en passant par les smartphones.

1
Mythes que jai eu loccasion de dcrire en septembre 2017 dans Douze mythes de lintelligence artificielle.
2
Ils utilisent des techniques de prise de parole qui consistent forcer le trait au point de travestir la ralit, comme prtendre quune
solution qui relve de la prospective est dj disponible et oprationnelle, sans dailleurs forcment sen rendre compte eux-mmes !

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 5 / 362
Cette dition me permet dailleurs de corriger un bon nombre derreurs techniques ou
dapprciations qui maillaient la premire dition de ce texte ainsi que des lacunes
importantes pour ce qui concernait les techniques du deep learning. En apprhender
le fonctionnement pour pouvoir en saisir le potentiel mais aussi les limites demande
un peu deffort. Est-ce que le deep learning est si miraculeux et universel que le mar-
keting le laisse penser ? Et bien non ! Son approche est essentiellement probabiliste
et na rien dun raisonnement formel.
Qui plus est, lintelligence artificielle nest pas un produit. Elle ne se prsente pas
sous la forme de logiciels packags traditionnellement comme un traitement de texte,
une application mobile ou un systme dexploitation. Il ny a pas de logiciels
dintelligence artificielle mais des solutions dintelligence artificielle trs varies qui
sappuient sur plusieurs dizaines de briques logicielles diffrentes qui vont de la cap-
tation des sens, notamment audio et visuel, linterprtation des informations, au trai-
tement du langage et lexploitation de grandes bases de donnes et de connaissances
structures ou non structures. Leur cration et intgration est encore une affaire de
bricolage et de ttonnements.
Nous en sommes toujours lge de pierre, avec seulement une soixantaine dannes
de recul sur la question et une dizaine dannes pour ce qui est du deep learning. Mais
les chercheurs font rapidement avancer le domaine et le passage de la recherche la
production est de plus en plus rapide, les outils de dveloppement de lIA permettant
de les mettre en pratique assez facilement pour peu que les bons jeux de donnes
soient disponibles. Or il existe de nombreux jeux de donnes en open data pour en-
trainer ses modles !
LIA est un grand tonneau des Danades. On n'arrive jamais tout comprendre et
tout apprhender des techniques et domaines d'applications de l'IA. Chercher un "ex-
pert en IA"3 revient maintenant demander "un expert en logiciels" ou un "expert en
informatique" sans compter le top avec "lexpert en transformation digitale". Et con-
trairement un lieu commun rpandu, les techniques et mthodes de l'IA voluent
sans cesse. Ce n'est pas qu'une question de puissance de machine ou de volume de
donnes.
LIA rassemble un grand nombre de spcialits. Selon certains, il faudrait un PhD en
IA pour pouvoir dvelopper une solution dIA. Cest peut-tre vrai aujourdhui mais
de nombreux outils dintgration arrivent sur le march qui permettent des dvelop-
peurs moins qualifis, voire mme des cadres, de crer eux-mmes des solutions
intgrant des briques dIA.
Jai bien conscience de lescroquerie intellectuelle consistant faire croire que jai
tout compris. Rassurez-vous : ce nest pas le cas et pas mal de domaines de lIA
mchappent encore et ma besace est pleine dinterrogations diverses, en particulier
autour des techniques de traitement du langage4 !

3
Cf Confession of a so-called AI expert de Chip Huyen, juillet 2017.
4
Comme comprendre et expliquer dans le dtail le fonctionnement des rseaux de neurones mmoire de type LSTM.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 6 / 362
Contrairement sa premire version, ce document adopte un dcoupage en parties
qui est plus adapt la comprhension la fois des techniques de lIA, de ses outils
de dveloppement et, surtout, de ses usages dans les entreprises.
Voici la synthse et la structure de ce document qui est organis en huit grandes par-
ties :
Grands courants de lIA : quest-ce que lIA ? Do vient cette appellation ?
Pourquoi personne nest daccord sur le sens quil faut lui donner ? Comment lIA
est-elle segmente ? Quels sont ses grands courants intellectuels ? Comment cette
discipline nouvelle a-t-elle progress depuis les annes 1950 ? Pourquoi a-t-elle
connu deux grands hivers et quest-ce qui explique la dynamique actuelle ? Est-
elle durable ?
Briques fondamentales de lIA : quelles sont les principales briques mathma-
tiques et algorithmiques de lIA ? Les progrs rcents viennent-ils du logiciel, du
matriel ou des donnes ? Quest-ce que le machine learning et comment le met-
on en uvre dun point de vue pratique ? Quid du deep learning et de ses nom-
breuses variantes ? Et les systmes experts, pourquoi en parle-t-on moins que pen-
dant les annes 1980 ? Comment les briques dintelligence artificielle progressent-
elles ? Quels sont les outils de cration dapplications dIA et pourquoi la majorit
sont-ils open source ? Comment fait-on de la programmation en IA ? Quid de
lintelligence artificielle gnralise ? Est-ce un fantasme ? Peut-on facilement re-
produire le fonctionnement du cerveau humain ?
IA et infrastructure informatique : quelles sont les ressources matrielles qui
font avancer lIA ? Comment volue lapplication de la loi de Moore ? Pourquoi
fait-on maintenant appel des GPU et des processeurs neuromorphiques pour
les applications de lIA ? Comment se distinguent-ils ? Quels sont les nouveaux
acteurs de ce march ? Pourquoi il y-a-t-il une grande diffrence entre
lentrainement dune IA et son excution ? Est-ce que linformatique quantique
aura un impact sur lIA ? Quel est le rle des capteurs et des objets connects ?
Comment sont gres les ressources en cloud de lIA ainsi que du ct des sys-
tmes embarqus ?
Applications gnriques de lIA : quelles sont les applications gnriques et ho-
rizontales de lIA, dans le traitement de limage, du langage et de la parole, dans
la robotique, dans le marketing, les RH ainsi que dans la cyberscurit ?
Applications mtiers de lIA : quelles sont les grandes applications et tudes de
cas de lIA selon les marchs verticaux comme les transports, la sant, la finance,
lassurance, lindustrie, la distribution, les mdias, le tourisme, lagriculture, les
mtiers juridiques, les services publics, la dfense et le renseignement ? Pourquoi
certains de ces marchs sont plus dynamiques que dautres ? Comment les startups
permettent aux entreprises dinnover dans ces diffrents marchs5 ?

5
Je cite un trs grand nombre de startups dans ce document. Il se peut que telle ou telle startup soit en dclin ou nexiste plus. Cest
la vie habituelle des startups. Je corrige le document au fil de leau lorsque ncessaire.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 7 / 362
Acteurs de lIA : quelle est la stratgie et quelles sont les offres en IA des
GAFAMI tendus, dont IBM, Google, Microsoft, Facebook, SalesForce, Oracle et
plein dautres encore ? Comment certains de ces acteurs se dploient-ils de ma-
nire verticale ? Comment se dveloppent les startups en gnral et puis celles de
lcosystme franais en particulier ? Comment valuer la valeur ajoute en IA
des startups et autres acteurs de lcosystme ? Comment les solutions dIA sont-
elles commercialises ? Quelle est la part qui relve de produits et celle qui d-
pend des services et des donnes ?
LIA dans la socit : pourquoi les points de vue sur limpact potentiel de lIA
sur les mtiers et sur la socit en gnral sont-ils si varis et contradictoires ?
Comment lIA et la robotique vont transformer les mtiers dans le futur ? Est-ce
un tsunami qui se prpare ? Que disent les experts sur le sujet ? Quelles sont les
limites des prdictions ? Comment viter de se faire robotiser ? Comment se pr-
parer au niveau des comptences ? Quelles sont les grandes lignes de limpact de
lIA sur la politique et les politiques de lIA en France et ailleurs dans le monde ?
LIA et lentreprise : comment les entreprises peuvent-elles intgrer lIA dans
leur stratgie ? Quelles sont les bonnes pratiques ? Comment grer les comp-
tences ? Peut-on benchmarker lIA ? Comment sorganiser ? Comment intgrer
lIA dans les autres dynamiques dinnovations lies au numrique ? Comment va
voluer le mtier de dveloppeur ?
Voil le programme !
Je mappuie en grande partie sur une recherche bibliographique extensive. La littra-
ture disponible sur le sujet est abondante, notamment les excellents cours de nom-
breuses universits comme ceux de Stanford ou Berkeley mais aussi ceux du Collge
de France, avec et au-del de Yann LeCun.
Cest la magie dInternet quand on prend le temps de creuser !
Bonne lecture !

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 8 / 362
Grands courants de lIA

Lintelligence artificielle gnre toutes sortes de fantasmes pour les uns et de craintes
pour les autres. Les dfinitions de lIA vont dailleurs bon train. La notion
dintelligence est elle-mme source dune interminable bataille smantique6.
Pour certains, seul lapprentissage profond ou deep learning est digne de faire partie
de lIA et le machine learning, pas du tout. Comme si seules les technologies un peu
magiques dans leur apparence pouvaient faire partie de lIA. Pour les spcialistes du
secteur, toutes les technologies de lhistoire de lIA en font partie. Seules leurs capa-
cits voluent dans le temps. Ces diffrents viennent aussi de ce quune partie impor-
tante de la valeur ajoute des applications de lIA est issue du volume et de la qualit
des donnes qui les alimentent. Mais les mthodes importent tout autant et elles vo-
luent constamment.
Lintelligence artificielle reprsente un pan entier de linformatique avec sa diversit,
ses briques technologiques, ses mthodes, ses assemblages et solutions en tout genre.
Elle est aussi intimement lie dautres sciences : les mathmatiques et les statis-
tiques qui lui servent de base thorique, les sciences humaines (sciences cognitives,
psychologie, philosophie, ) et la neurobiologie qui aident reproduire des compo-
santes de lintelligence humaine par biomimtisme, et enfin, les technologies mat-
rielles qui servent de support physique lexcution des logiciels dIA.

6
La querelle smantique atteint notamment lunivers des startups. Celles-ci feraient de lIA washing, peignant aux couleurs de lIA
des solutions qui nen contiennent pas forcment. Rflexion faite, cette notion d'IA washing est exagre. Ce n'est pas parce que
certaines utilisent des briques technologiques prtes l'emploi qu'elles ne font pas d'IA ou que leur solution n'intgre pas d'IA. C'est
un peu comme si on disait qu'un site web ralis en Wordpress avec un thme standard au lieu d'tre dvelopp avec son propre
framework en Ruby on Rails avec un front-end custom en React ou Angular n'tait pas "de l'internet". Reste dfinir "une IA", qui
est toujours un assemblage de plusieurs composantes (data, algos, hard, savoir faire mtier) et ausculter les startups en examinant le
CV de leurs quipes techniques. Ce qui permet de faire un premier tri.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 9 / 362
Cest un vritable cosystme htroclite. La grande majorit des solutions commer-
ciales dIA sont faites de bric et de broc, en fonction de besoins spcifiques. On est
loin davoir sous la main des solutions dIA gnriques.
Seules les briques technologiques de base sont gnriques, mais utilises par les d-
veloppeurs, comme TensorFlow, PyTorch ou Theano.

Hauts et bas de lIA


LIA a pris forme conceptuellement avec le concept de calculus ratiocinator de Leib-
nitz (circa 1671), la machine et le fameux test de Turing que lon ne prsente plus
(1950), les neurones formels de McCulloch et Pitts (1943), larchitecture de Von
Neuman (1945) ou encore le thorme de Shannon (1949).
Son histoire moderne a cependant vritablement dmarr au moment du Summer
Camp de Darmouth de 1956. Il sagissait dune sorte de hackathon intellectuel de
prs de deux mois runissant une dizaine de scientifiques.

LIA, un voyage ternel ou un aboutissement ?


Lexpression intelligence artificielle fut propose en 1955 par lun des initiateurs
de ce summer camp, John McCarthy7. Elle recouvre les sciences et technologies qui
permettent dimiter, dtendre et/ou daugmenter lintelligence humaine avec des ma-
chines. Une autre dfinition courante dfinit lIA comme le champ acadmique de
cration de logiciels et matriels dot de certaines formes dintelligence.

7
Pour la petite histoire, 1955 est aussi lanne de la naissance de Steve Jobs et Bill Gates.Tout un symbole ! A lpoque, les ordina-
teurs taient des plus rares et fonctionnaient avec des lampes en lieu et place des transistors qui ont fait leur apparition pendant les
annes 1960 dans les ordinateurs, notamment dans la srie 360 dIBM.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 10 / 362
LIA est en fait une appellation cre par un chercheur afin de faire parler de son do-
maine et lui permettant dviter dtre assimil des disciplines voisines comme les
mathmatiques, les statistiques ou linformatique. Cest une forme de dclaration
dindpendance dune nouvelle discipline scientifique.
Lappellation est lorigine de dbats pistmiologiques sans fin sur ce quest lIA et
sur la manire de la comparer lintelligence humaine. LIA dcrit aussi bien le
champ du possible daujourdhui dans ces domaines que la qute permanente et insa-
tisfaite de lintgration de lintelligence humaine dans les machines.
Lappellation la plus approprie serait peut-tre celle dintelligence humaine augmen-
te, lIA tant principalement destine permettre lhomme de faire plus de choses,
comme tous les outils numriques jusqu prsent, mme si dans certains cas, lIA
peut effectivement se substituer aux travaux de lHomme pour quelques tches l-
mentaires comme, relativement moyen terme, la conduite de vhicules. Dans le
domaine du raisonnement automatis, lIA est cense apporter une rationnalit dont
lHomme ne fait pas toujours preuve. L encore, nous somme dans lordre de la com-
plmentarit.
LIA fait partie de ce que lon appelle aussi les sciences cognitives. Elles compren-
nent dabord les sens et la capacit des ordinateurs lire, voir et entendre, puis
structurer leur mmoire, apprendre, raisonner, puis prendre des dcisions ou
aider prendre des dcisions.
Le groupe de travail du summer camp de Darmouth comprenait Marvin Minsky,
Claude Shannon, lpoque au MIT, Allan Newell et Herbert Simon de Carnegie
Tech, et Arthur Samuel et Nathanial Rochester, tous deux dIBM. Le groupe vou-
lait plancher sur la conjecture selon laquelle tous les processus de lintelligence hu-
maine pouvaient thoriquement tre mis en uvre par des machines. Les discussions
taient surtout conceptuelles. Ces chercheurs pensaient aboutir rapidement un rsul-
tat probant. Plus de 60 ans aprs, nous y sommes encore !
LIA est finalement la conqute dun Graal distant, ayant t lorigine, sur son
chemin, dun tas davances technologiques relativement distinctes et plutt com-
plmentaires de lintelligence humaine8. Celle-ci est encore unique dans la capacit
ragir avec discernement face des situations nouvelles, tirer profit de circons-
tances fortuites, discerner le sens de messages ambigus ou contradictoires, juger
de l'importance relative de diffrents lments d'une situation, trouver des simili-
tudes entre des situations malgr leurs diffrences, tablir des distinctions entre des
situations malgr leurs similitudes, synthtiser de nouveaux concepts malgr leurs
diffrences ou trouver de nouvelles ides9.

8
On pourrait dire quil en va de mme des cancrologues dont le mtier est de gurir le cancer et qui ny arrivent pas forcment.
9
Source de cette numration : cours dintelligence artificielle dOlivier Boisard.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 11 / 362
Les bases conceptuelles de lIA daujourdhui datent des annes 1950 !
Deux ans aprs le summer camp de Darmouth avait lieu le Congrs de Middlesex
(1958) au Royaume Uni avec des contributions des principaux artisans du Congrs de
Darmouth, Marvin Minsky et John MacCarthy ainsi quOliver Selfridge, lui aussi
prsent Darmouth.
Lobjet des publications associes tait la modlisation et la mcanisation des mca-
nismes de la pense en particulier avec des logiques heuristiques.
Sen suivirent des publications cls comme Some Methods of Artificial Intelligence
and Heuristic Programming de Marvin Minsky qui jettait les bases thoriques de la
programmation heuristique approfondie peu aprs dans Steps Toward Artificial Intel-
ligence de Marvin Minksy.

La mme anne, Pandemonium : a paradigm for learning dOliver Selfridge, jettait


les bases des rseaux de neurones pour la reconnaissance des formes, puis Program-
ming with common sense de John McCarthy, celle des systmes experts. McCarthy
est aussi connu pour tre le crateur la mme poque du langage LISP qui servit
pendant plusieurs dcennies dvelopper des solutions logicielles dIA travaillant en
logique formelle et base de rgles.
Les annes 1960 furent une priode de recherche fondamentale importante, notam-
ment au MIT AI Lab. Ces recherches taient principalement finances par lARPA,
lagence de recherche du Pentagone cre en 1958, devenue la DARPA en 1972,
lquivalent de la DGA franaise, mais videmment bien mieux finance avec un peu
plus de $3B de budget annuel actuellement.
La recherche sur lIA tait finance par les deniers publics, notamment aux USA et
au Royaume-Uni. Encore aujourdhui, une trs grande partie des recherches les plus
avances sur lIA aux USA le sont par lomniprsente DARPA ainsi que par les
agences lies au renseignement comme la CIA et la NSA. Ce qui peut alimenter au

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 12 / 362
passage les craintes sur les applications futures de lIA, notamment au moment hypo-
thtique o elle atteindrait le stade de lAGI (IA gnraliste).

Les prouesses de dmonstrations de thormes


Les premiers travaux autour de lIA portrent sur la logique formelle et sur la d-
monstration automatique de thormes, surtout en gomtrie.
Il y eu le Geometry Theorem Prover dHerbert Gelernter en 1959, un logiciel de
dmonstration de thormes de gomtrie fonctionnant en chainage arrire - de la so-
lution jusquau problme - sur un IBM 704 lampes et partir dune base de 1000
rgles. Cela relevait dune combinatoire plutt simple. Ctait plutt prometteur.

Suivirent le General Problem Solver dAllen Newell et Herbert Simon en 1959,


lIntegration Problems Solver de James Slagles en 1963, le Geometric Analogy
Problems de Tom Evans en 1968, qui traitait les problmes de gomtrie qui sont
intgrs dans les tests de quotient intellectuel (ci-dessus) et puis lAlgebra Problems
Solver de Daniel Bobrow en 1967. Tout cela bien avant les dbuts de la micro-
informatique !
Les mthodes cres pour ces prouesses servirent plus tard de base aux techniques de
moteurs de rgles et de systmes qui connurent leur heure de gloire pendant les an-
nes 1980.

Les premiers chatbots datent des annes 1960 !


On vit aussi apparaitre les anctres de catgories de solutions dIA courantes au-
jourdhui avec lun des premiers chatbots, simulant un dialogue avec un psy, ELIZA
entre 1964 et 1966, puis SHRDLU, de Terry Winograd du MIT, lun des premiers
comprendre le langage naturel en 1968.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 13 / 362
Ces premiers chatbots tenaient le coup pendant des conversations avec quelques
changes mais ne passaient pas le test de Turing. Malgr tout, ils nont pas rougir
vis--vis de nombreux chatbots contemporains.

Les surpromesses et le premier hiver de lIA


LIA connu son premier hiver avec une rduction dune bonne part de ses budgets
de recherche partir de 1973, tant au Royaume-Uni quaux USA.
Ctait notamment la consquence de la publication du Rapport Lighthill destin
lorganisme public britannique Science Research Council quivalent de notre
Agence Nationale de la Recherche franaise daujourdhui qui remettait en cause le
bien fond des recherches de lpoque en robotique et en traitement du langage.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 14 / 362
Une approche bien curieuse quand on sait que les technologies informatiques mat-
rielles sous-jacentes ntaient pas encore bien dveloppes cette poque10. Cest un
bel exemple de manque de vision long terme des auteurs de ce rapport.
En cause dans le rapport Lighthill, des promesses trop optimistes des experts du sec-
teur. Comme souvent, les prvisions peuvent tre justes sur tout ou partie du fond
mais ct de la plaque sur leur timing.
Cette histoire de lIA 11 en fait un inventaire intressant. Herbert Simon et Allen
Newell prvoyaient en 1958 quen dix ans, un ordinateur deviendrait champion du
monde dchecs et quun autre serait capable de prouver un nouveau et important
thorme mathmatique. Trente ans derreur de timing pour la premire prvision et
autant pour la seconde sachant quelle est toujours largement en devenir pour tre
gnrique !

On attend toujours la dmonstration par une IA volue du thorme dincompltude


de Godel qui dit que dans nimporte quelle thorie rcursivement axiomatisable,
cohrente et capable de formaliser larithmtique, on peut construire un nonc
arithmtique qui ne peut tre ni prouv ni rfut dans cette thorie ou encore du
dernier thorme de Fermat (x^n + y^n = z^n est impossible pour un entier n>2).
Le thorme de Fermat a t dmontr au milieu des annes 1990 et aprs des annes
defforts de plusieurs mathmaticiens dont Andrew Wiles. Sa dmonstration publie
dans les annales de mathmatiques fait 109 pages et fait appel de nombreux con-
cepts incomprhensibles au commun des mortels, y compris pour votre serviteur pas-
s par les classes prparatoires scientifiques au 20e sicle.
Un dfi a t lanc en 2005 par un certain Jan Bergstra pour dmontrer le thorme
de Fermat avec un ordinateur et il reste toujours relever. A vous de jouer si cela
vous tente ! Le jour o une IA dmontrera le thorme de Fermat sans apprentissage
supervis, il y aura vraiment avoir de quoi tre bluff !

10
1973 est lanne de lapparition du premier micro-ordinateur de lhistoire, le franais Micral de Franois Gernel et Andr Truong.
11
http://kuliah-sore-malam-unkris.ggkarir.co.id/IT/en/2185-2061/history-of-artificial-intelligence_9498_kuliah-sore-malam-unkris-
ggkarir.html

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 15 / 362
Herbert Simon prvoyait toujours en 1958 quen 1978, les machines seraient ca-
pables de raliser toutes les activits intellectuelles humaines. Et la loi de Moore
nexistait pas encore puisquelle a t nonce bien aprs cette prvision, en 1965 et
observe dans la pratique entre les annes 1970 et 2010.
En 1967, Marvin Minsky pensait quen une gnration, tous les problmes lis
lIA seraient rsolus. Deux gnrations plus tard, on en discute encore. Il prvoyait
aussi quau milieu des annes 1970, les ordinateurs auraient lintelligence dun
homme moyen. Reste savoir ce quest un homme moyen. Moyen vraiment moyen,
ou juste moyen moyen ? Et combien de robots peuvent courir un marathon ?
Les retards taient manifestes dans la traduction automatique et dans la reconnais-
sance de la parole. Notons quHerbert Simon a t rcompens en 1978 par le Prix
Nobel dconomie, pour ses travaux sur les rationalits de la prise de dcision, aprs
avoir gagn la fameuse mdaille de Turing en 1975. Il nexiste pas encore de prix
Nobel de la prvision ! Il faudrait dailleurs plutt les attribuer des personnes dj
dcdes pour valider leurs prvisions au long cours !
Ces prvisions trop ambitieuses ont exist de tous les temps..Leurs versions actuali-
ses tournent autour de la singularit et du transhumanisme : lordinateur plus intelli-
gent que lhomme entre 2030 ou 2045 et limmortalit ou une vie de 1000 ans pour
les enfants qui viennent de naitre !
Le premier hiver de lIA a dur jusquen 1980. Il correspond dailleurs au premier
ge de lindustrie de la micro-informatique, avec la cration de Microsoft (1975),
dApple II (1977), dOracle (1977) puis les prparatifs du lancement de lIBM PC
(1980-1981).

La premire renaissance avec les systmes experts et un nouvel hiver


Ce premier hiver a t suivi dune priode denthousiasme au dbut des annes 1980
alimente notamment par la vague des systmes experts.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 16 / 362
Cr par les franais Alain Colmerauer 12 et Philippe Roussel en 1972, le lan-
gage Prolog a particip cette vague.
Cet enthousiame a dur moins dune dcennie. Une nouvelle vague de dsillusions
sen est suivie autour des annes 1990. Notamment du fait de lessouflement de la
vague des systmes experts et leffondrement associ du march des ordinateurs d-
dis au langage LISP.
Lautre raison tait que le matriel narrivait pas suivre les besoins de lIA, notam-
ment pour traiter deux besoins cls : la reconnaissance de la parole et celle des
images, trs gourmandes en puissance de calcul.
Lors des annes 1980 avaient t lancs divers gosplans dordinateurs de cinquime
gnration ddis aux applications de lIA. Cela a commenc avec celui du MITI
Japonais, lanc en 1981 avec des dpenses dun milliard de dollars, puis avec le pro-
jet anglais Alvey dot de 350 million et enfin, avec le Strategic Computing Initia-
tive de la DARPA. Tous ces projets ont capot et ont t clturs discrtement.
Le projet du MITI visait faire avancer ltat de lart ct matriel et logiciel. Les
japonais cherchaient traiter le langage naturel, dmontrer des thormes et mme
gagner au jeu de Go. Le projet a probablement pti dune organisation trop tradi-
tionnelle, hirarchique et centralise.
Pendant les annes 1990 et 2000 ont merg de nombreux projets de HPC (high-
performance computers), assez loigns de lIA et focaliss sur la puissance brute et
les calculs en lments finis. Ils taient et sont encore utiliss pour de la simulation,
notamment darmes nuclaires, dcoulements dair sur les ailes davion ou pour faire
des prvisions mtorologiques. Les HPC de Cray Computers avaient t crs pour
cela ! Cette socit existe toujours. Cest lune des rares survivantes des annes 1970.

La dernire renaissance de lIA


Depuis le dbut des annes 2000, et surtout depuis 2012, lIA a t relance grce
diverses volutions majeures :
Les progrs thoriques et pratiques constants dans le machine learning, les r-
seaux de neurones et le deep learning. Nous aurons loccasion de les voquer dans
la seconde partie ddie aux techniques de lIA.
Laugmentation de la puissance du matriel qui a permis de diversifier la mise en
uvre de nombreuses mthodes jusqualors inaccessibles. Et en particulier,
lusage de mthodes statistiques pouvant exploiter la puissance des machines au-
tant ct calcul que stockage et puis, plus rcemment, les rseaux neuronaux et le
deep learning. Cette augmentation de puissance se poursuit inexorablement, mal-
gr les limites actuelles de lintgration des transistors dans les circuits intgrs.
Latteinte de diverses tapes symboliques marquantes comme la victoire dIBM
Deep Blue contre Kasparov en 1997 puis dIBM Watson dans Jeopardy en 2011.

12
Alain Colmerauer est dcd en mai 2017.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 17 / 362
Enfin, dbut 2016, la victoire de Google DeepMind AlphaGo au jeu de Go contre
son champion du monde. Les premiers jeux de socit gagns via lIA taient le
jeu de dames (Checkers) et le tic-tac-toe dans les annes 1950-1960. Il y avait eu
prs de 30 ans de calme plat dans le domaine des jeux de socit. Depuis, deux IA
ont aussi gagn au jeu de poker13, Libratus et DeepStack ! Par rapport aux checs
ou au jeu de Go o le jeu est entirement visible, la performance de ces IA tient au
fait quelles agissent dans un environnement dinformation incomplet et aussi, au
fait quelles peuvent moduler laggressivit du jeu.

LInternet grand public qui a cr de nouveaux besoins comme les moteurs de


recherche et aussi permis le dploiement darchitectures massivement distribues.
LInternet a aussi permi lmergence de mthodes de travail collaboratives dans la
recherche et les dveloppements de logiciels, en particulier dans lopen source. Il
a aussi fait merger les fameux GAFA, ces acteurs dominants du Web grand pu-
blic qui sont aussi trs actifs dans lIA.
La disponibilit de trs gros volumes de donnes, via les usages de lInternet et
des mobiles, des objets connects ou de la gnomique, exploitables par diffrentes
mthodes de machine learning et de deep learning. Le travail des chercheurs et
dveloppeurs est facilit par la publication de jeux de donnes ouverts (open data)
pour le deep learning avec de nombreuses bases dimages et de textes disponibles
pour raliser des benchmarks. Cest le cas de la base dImageNet, de la base dcri-
ture manuscrite MNIST et de la base linguistique WordNet (en anglais). Ces bases
sont gnralement dorigine amricaine. Elles proviennent le plus souvent de
grandes Universits.

13
Cf Artificial intelligence goes deep to beat humans at poker, mars 2017. La description technique de DeepStack, cr par des cher-
cheurs canadiens et tchques, est dans DeepStack: Expert-Level Artificial Intelligence in No-Limit Poker. Celle de Libratus, cr par
Tuomas Sandholm et NoamBrown, de lUniversit Carnegie Mellon de Pittsburgh est dans Libratus: The Superhuman AI for No-
Limit Poker et pour la vulgarisation, dans cet rticle de Wired, Inside Libratus : the poker AI that out-bluffed the best humans. Dans
les deux cas, il sagissait de parties 1 contre 1. DeepStack et Libratus sont bien dcrits dans cette prsentation technique : Poker AI:
Equilibrium, Online Resolving, Deep Learning and Reinforcement Learning de Nikolai Yakovenko (Nvidia), avril 2017. La pro-
chaine tape sera dintgrer ces IA des capteurs sensoriels permettant de dtecter les motions des joueurs humains. A distance et
avec une camra, on peut dtecter de fines variations dans les expressions et mme la variation du pouls !

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 18 / 362
La culture de lopen source qui domine les outils de dveloppement de solutions
dIA. Les chercheurs publient de plus en plus des exemples de codes sources pour
illustrer leurs mthodes, sur Github. Ils sont alors reproduits et vrifis par la
communaut des dveloppeurs. Ce processus permet une diffusion rapide des
nouveauts algorithmiques, particulirement autour des rseaux de neurones et du
deep learning.
Lappel dair gnr par la robotique, la conqute spatiale (Curiosity, Philae),
les vhicules conduite assiste ou autonome, la scurit informatique, ainsi que
la lutte contre la fraude et les scams. Sans compter lobjectif des japonais de
soccuper de leurs seniors avec des robots.
Les nombreuses applications commerciales de lIA croisant le machine learning,
les objets connects, la mobilit et le big data. Avec des attentes fortes dans le
marketing, le e-commerce et la finance.
Comme les usages de lIA sont bien concrets et quils touchent presque toutes les in-
dustries, on peut affirmer sans trop risquer de se tromper que la tendance est solide.

Connexionisme et symbolisme
Comme tout domaine scientifique complexe, lIA na jamais t un terrain
dunanimit et cela risque de perdurer. Diverses coles de pense se disputent sur les
approches adopter.
On a vu au dpart sopposer les partisans du connexionnisme utilisant le principe
du biomimtisme, des rseaux de neurones et de lauto-apprentissage qui est pour
linstant surtout utilis pour les sens artificiels face ceux de lintelligence artifi-
cielle symbolique qui prfrent utiliser des concepts de plus haut niveau sans cher-
cher les rsoudre via des procds de biomimtisme. LIA symbolique modlise le
raisonnement logique et reprsente les connaissances avec des objets et des symboles
formels les associant entre eux (appartient , fait partie de, est quivalent , ).

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 19 / 362
Cette dichotomie tait incarne par la joute intellectuelle entre neats et scruf-
fies, les premiers, notamment John McCarthy (Stanford), considrant que les solu-
tions aux problmes devraient tre lgantes et carres, et les seconds, notamment
Marvin Minsky (MIT) que lintelligence fonctionne de manire plus empirique et pas
seulement par le biais de la logique. Comme si il y avait un cart entre la ct Est et
la cte Ouest !
Ces dbats ont leur quivalent dans les sciences cognitives, dans lidentification de
linn et de lacquis pour lapprentissage des langues. Burrhus Frederic Skinner est
lorigine du comportementalisme linguistique qui dcrit le conditionnement oprant
dans lapprentissage des langues. Noam Chomsky avait remis en cause cette ap-
proche en mettant en avant linn, une sorte de pr-conditionnement du cerveau des
enfants avant leur naissance qui leur permet dapprendre facilement les langues. En
gros, le fonctionnement de lintelligence humaine est toujours lobjet de dsaccords
scientifiques ! On continue dailleurs, comme nous le verrons dans le dernier article
de cette srie, en dcouvrir sur la neurobiologie et le fonctionnement du cerveau.
Dautres dbats ont cours entre les langages de programmation dclaratifs et les mo-
teurs dinfrences utilisant des bases de rgles. Sont arrives ensuite les mthodes
statistiques sappuyant notamment sur les rseaux baysiens, les modles de Markov
et les techniques doptimisation.
Aprs une dominance des mthodes mathmatiques et procdurales, ce sont les r-
seaux de neurones et lapprentissage profond les utilisant qui ont pris le dessus pen-
dant depuis le milieu des annes 2000-2010, en particulier pour la vision artificielle et
la reconnaissance et le traitement du langage. La technique la plus remarquable tant
celle des rseaux de neurones convolutionnels, cre par le franais Yann LeCun.

Selon Pedro Domingos, lauteur de The Master algorithm , il existe en fait cinq
grands courants dans lIA en plus du symbolisme et du connexionnisme (ci-dessus).
Il faut ajouter celui des volutionnistes avec les algorithmes gnriques (dont nous
reparlerons), celui des baysiens avec une vision probabiliste des choses et celui des
analogistes et leurs algorithmes de clustering. Et dans de nombreux cas, ces ap-
proches sont combines pour gnrer des solutions optimales.

Dfinitions et segmentations de lintelligence artificielle


LIA est un ensemble de techniques permettant dimiter le comportement humain,
agissant de manire rationnelle en fonction de faits, donnes et expriences, et ca-
pables datteindre un ou plusieurs objectifs donns de manire optimale.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 20 / 362
La rationalit nest pas lomniscience mais la capacit agir en fonction des informa-
tions disponibles, y compris celles qui sont ambiges. Cette rationalit est habituel-
lement limite par notre volont, le poids motionnel de notre cerveau limbique et
notre capacit doptimisation.
Dans mes recherches bibliographiques sur lIA dmarrant dbut 2016, jai cherch
segmenter le vaste champ de lIA.
A haut niveau et scientifiquement parlant, on peut le dcouper en trois grands do-
maines :
Le symbolisme qui se focalise sur la pense abstraite et la gestion des symboles.
Cest dans cette catgorie que se trouvent les systmes experts et dans une certaine
mesure, le web smantique. Le symbolisme modlise notamment les concepts
sous la forme dobjets relis entre eux par des prdicats logiques (appartient , etc).
Cest une approche macro de rsolution de problmes. Cest dans cette catgo-
rie que lon peut ranger les systmes experts et moteurs de rgles qui les font fonc-
tionner.
Le connexionisme qui se focalise sur la perception, dont la vision, la reconnais-
sance des formes et sappuie notamment sur les rseaux neuronaux artificiels qui
reproduisent petite chelle et de manire approximative le fonctionnement gn-
rique du cerveau. Cest une vision micro de rsolution des problmes. Cest ici
que lon peut ranger le deep learning utilis dans la vision artificielle ou la recon-
naissance de la parole.
Le comportementalisme qui sintresse aux penses subjectives de la perception.
Cest dans ce dernier domaine que lon peut intgrer linformatique affective (ou
affective computing) qui tudie les moyens de reconnaitre, exprimer, synthtiser
et modliser les motions humaines. Cest une capacit quIBM Watson est cens
apporter au robot Pepper de/ Softbank Robotics (ex Aldebaran).
Reprenant plus ou moins ce dcoupage, cet autre dcoupage sous forme darbre com-
prend trois grandes branches : lune pour les tches dexpertise, la seconde pour
les tches courantes (perception, sens commun, raisonnement, langage) et la troi-
sime pour les tches formelles (mathmatiques, jeux).

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 21 / 362
Cette autre segmentation trs utilise comprend le machine learning, le deep learning,
le traitement du langage, les systmes experts, la robotique et la vision. Il met curieu-
sement au mme niveau des outils gnriques comme le machine learning et le deep
learning et ses propres applications comme la vision artificielle ou le traitement du
langage. La robotique intgre de son ct tous les autres champs du schma plus
quelques autres qui lui sont spcifiques comme les capteurs, les matriaux, la mca-
nique, les moteurs lectriques et autres batteries.

Le rapport France IA publi en mars 201714 par le gouvernement propose pour sa


part une segmentation plus fouille, compilant les principaux travaux de recherche du
domaine en France.

14
Ici : http://www.enseignementsup-recherche.gouv.fr/cid114739/rapport-strategie-france-i.a.-pour-le-developpement-des-
technologies-d-intelligence-artificielle.html.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 22 / 362
Enfin, voici ma propre proposition de segmentation qui relie entre eux quatre do-
maines de manire plus hirarchique :
Les solutions : que lon va directement utiliser dans les entreprises ou chez les
particuliers avec les chatbot, les vhicule autonomes, les robots, les systmes de
recommandation, les outils de segmentation client, le marketing prdictif ou les
solutions de cyberscurit.
Les outils : qui aident crer ces solutions, comme la vision artificielle, la recon-
naissance de la parole, la traduction automatique, les systmes experts, les outils
de prdiction ou de segmentation automatiques.
Les techniques : sur lesquelles sont construits ces outils, avec les mthodes de
machine learning, les rseaux de neurones, les nombreuses mthodes de deep
learning et les moteurs de rgles.
Les donnes : les sources de donnes correspondantes et les capteurs associs.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 23 / 362
Cela rappelle que les solutions base dIA sont des assemblages de diverses briques
logicielles et matrielles selon les besoins. Ces briques sont des plus nombreuses. A
tel point que leur intgration est un enjeu technique et mtier de taille, peut-tre le
plus complexe relever15.
Quand une startup indique quelle a cr une IA pour faire ceci ou cela, cela si-
gnifie quelle a assembl des techniques, paramtr des outils, en gnral assez stan-
dards, pour exploiter des donnes, et les a appliqus pour crer une solution.
Loriginalit est rarement technique, mais plutt dans la verticalit de lassemblage !

15
Aymeric Poulain Maybant ma transmis sa thse de doctorat sur lhybridation en sciences cognitives qui date de 2005 et dcrit
trs bien cet enjeu. LIA intgrative est un des principaux facteurs de dveloppement du secteur. On le retrouve dans lassociation de
nombreuses techniques dans les solutions dIA comme le couplage de rseaux neuronaux et dapproches statistiques plus simples,
notamment dans la reconnaissance de la parole.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 24 / 362
Briques fondamentales de lIA

Reprenant mon schma hirarchique de la partie prcdente, je vais maintenant partir


des couches dabstraction les plus basses (systmes experts, rseaux neuronaux, ma-
chine learning, mthodes statistiques, ) pour remonter dans les parties suivantes
dans les couches plus hautes qui font gnralement appel aux couches basses, comme
dans la reconnaissance de la parole ou des images dans la partie suivante.
Pour chacune de ces briques fondamentales, je vais voquer si besoin est leur ancien-
net, les progrs les plus rcents, les applications phares ainsi que quelques acteurs
des marchs correspondants, notamment au niveau des outils de dveloppement.

Il me semble ce stade utile de dpartager quatre grandes briques couramment utili-


ses dans les solutions dIA :
Les moteurs de rgles qui permettent de construire des systmes experts base
de rgles formelles avec des logiques dites symboliques. Cette technique fait
beaucoup moins parler delle car elle a connu des hauts et des bas et le deep lear-
ning a submerg lespace mdiatique de lIA. Mais elle reste fondamentale pour
un grand nombre de systmes. Les moteurs de rgles sappellent maintenant les
BRMS pour Business Rules Management Systems et sont souvent intgrs dans
des DMS, pour Decision Management Systems.
Le machine learning qui permet de faire des prdictions, de la classification et de
la segmentation automatiques en exploitant des donnes en gnral multidimen-
tionnelles, comme une base de donnes clients. Le machine learning relve dune
approche probabiliste. Les outils du machine learning servent exploiter le big
data . Le machine learning peut sappuyer sur des rseaux de neurones simples
pour les tches complexes portant sur des donnes multidimentionnelles.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 25 / 362
Le deep learning ou apprentissage profond, qui permet de grer un niveau
dabstraction plus lev que le machine learning afin de reconnaitre des objets
complexes comme les images, lcriture manuscrite ou la parole. Le deep learning
sappuie sur des rseaux de neurones multicouches, sachant quil en existe de trs
nombreuses variantes. Ce nest cependant pas la solution tous les problmes que
lIA cherche traiter16. Le deep learning permet aussi de gnrer des contenus ou
damliorer des contenus existants, comme pour coloriser automatiquement des
images en noir et blanc.
Les rseaux dagents, un domaine mconnu qui couvre la science de
lorchestration des briques techniques de lIA pour crer des solutions. Un chatbot
comme un robot est toujours un assemblage htroclite des briques du dessous
avec des moteurs de rgles, du machine learning et plusieurs techniques de deep
learning. Les rseaux dagents sont la fois des objets conceptuels et des logiciels
dassemblages de briques logicielles.
Dans le schma ci-dessus, je relie le deep learning avec les systmes experts. Pour-
quoi donc ? Parce quhistoriquement, il tait difficile dalimenter la main les sys-
tmes experts avec des rgles. Le deep learning permet dexaminer de gros volumes
de textes et donnes et den dduire des rgles qui, leur tour, peuvent alimenter des
moteurs de rgles et des systmes experts.

Force brute et arbres de dcision


La force brute est linverse mtaphorique de lintelligence. Cest un moyen courant
de simuler lintelligence humaine ou de la dpasser. Pour un jeu comme les checs,
elle vise tester toutes les possibilits et identifier les chemins les plus optimums
parmi des zillions de combinaisons. Cela peut fonctionner si cest la porte de la
puissance de calcul des machines.
Ces mcanismes rudimentaires sont optimiss avec des algorithmes dlagage qui
vacuent les branches mortes de la combinatoire ne pouvant aboutir aucune solu-
tion. Cest dailleurs plus facile raliser aux checs quau jeu de Go car la combina-
toire du premier est plus faible que celle du second !
La force brute a t notamment utilise pour gagner aux checs avec
lordinateur Deeper Blue dIBM en 1997, calculant 200 millions de positions par se-
conde.

16
Cf Deep learning is not AI future, de Fabio Ciucci publi en aot 2017.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 26 / 362
La force brute nest oprationnelle que si la combinatoire tester reste dans
lenveloppe de puissance de lordinateur. Si elle est trop leve, des mthodes de
simplification des problmes et de rduction de la combinatoire sont ncessaires.
Des rseaux neuronaux ont t exploits pour gagner au Go avec la solution AlphaGo
de DeepMind, la filiale dIA de Google. AlphaGo exploite ainsi un mlange de force
brute et de deep learning permettant de faire des conomies de combinatoires tester
pour identifier les meilleurs coups. La combinatoire du jeu de Go est en effet de plu-
sieurs ordres de grandeur suprieure celle des checs. AlphaGo bnficie aussi dun
aprentissage supervis par lexploitation de parties de Go existantes, et dun appren-
tissage par renforcement, le systme apprenant en jouant contre lui-mme17.

La force brute est utilise dans de nombreux domaines comme dans les moteurs de
recherche ou la dcouverte de mots de passe. On peut considrer que de nombreux
pans de lIA lutilisent, mme lorsquils sappuient sur des techniques modernes de
deep learning ou de machine learning que nous traiterons plus loin.

(source de limage)

La force brute sest aussi gnralise parce que la puissance des ordinateurs le per-
met : ils tournent plus vite, sont distribuables, le stockage cote de moins en moins
cher, les tlcommunications sont abordables et les capteurs de plus en plus nom-

17
En octobre 2017, une nouvelle version dAlphaGo dite Zero gagnait contre la version de dbut 2017 sans avoir tre entraine
avec des parties joues par des humains et avec comme seule information de dpart les rgle du jeu de Go et la position initiale des
jetons. La mthode relve toujours de llagage darbre de dcisions dans les options de jeu avec un rseau de neurones qui
samliorer par renforcement en jouant contre lui-mme. Cf Intelligence artificielle : toujours plus puissant, AlphaGo apprend d-
sormais sans donnes humaines et larticle technique de 42 pages qui documente la prouesse et AlphaGo Zero: Learning from scratch,
de DeepMind, qui vulgarise la performance.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 27 / 362
breux, des appareils photo/vido des smartphones aux capteurs dobjets connects
divers.

Mthodes statistiques
Les mthodes statistiques et notamment baysiennes permettent de prvoir la proba-
bilit dvnements en fonction de lanalyse dvnements passs.
Les rseaux baysiens utilisent des modles base de graphes pour dcrire des rela-
tions dinterdpendances statistiques et de causalit entre facteurs (exemple ci-
dessous).

Les applications sont nombreuses comme la dtection de potentiel de fraudes dans les
transactions de cartes bancaires ou lanalyse de risques dincidents pour des assurs.
Elles sont aussi trs utilises dans les moteurs de recherche au dtriment de mthodes
plus formelles, comme le rappelle Brian Bannon en 2009 dans Unreasonable Effec-
tiveness of Data.
La plupart des tudes scientifiques dans le domaine de la biologie et de la sant gn-
rent des corpus sous forme de rsultats statistiques comme des gaussiennes
defficacit de nouveaux mdicaments. Lexploitation de la masse de ces rsultats
relve aussi dapproches baysiennes.
Le cerveau met dailleurs en uvre une logique baysienne pour ses propres prises de
dcision, notamment motrices, les centres associs tant dailleurs situs dans le cer-
velet tandis que dans le cortex crbral gre la mmoire et les actions explicites 18.
Dans la pratique, les mthodes statistiques se sont fondues avec le temps dans les
techniques du machine learning et de deep learning. Ces dernires reposent en effet
tous sur des modles probabilistes pour identifier des objets ou prdire le futur. Seule
lIA symbolique qui sappuie sur de la logique formelle ne relve pas des probabilits.

18
Source : Stanislas Dehaene.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 28 / 362
Systmes experts
Les systmes experts font partie du vaste champ de lIA symbolique appliquant de la
logique formelle.
Elle soppose lapproche connexionniste qui exploite le biomimtisme et les r-
seaux de neurones dans une approche probabiliste. Lapproche symbolique applique
au raisonnement automatique est plus rigoureuse mais difficile mettre en uvre et
gnraliser.
La formalisation du raisonnement humain remonte Aristote et lidentification de
rgle formelles utilises dans largumentation philosophique, base de sillogisme
associant deux prmisses et une dduction (si A et B sont vrais alors C est vrai).
Suivirent les travaux de Georges Boole au 19e sicle et son algbre formalisant
lusage de rgles de raisonnement, puis de nombreux dveloppements thoriques, no-
tamment autour de la logique formelle, des calculs de prdicats, de la logique du
premier et du second ordre19.

Les dmonstrations de thormes


Les dbuts des moteurs de rgles la base des systmes experts remontent 1957
quand Alan Newell et Herbert Simon dveloppaient le General Problem Solver
(GPS), un logiciel de rsolution de problmes mathmatiques utilisant des rgles mo-
dlisant les infrences possibles dun domaine et rsolvant un problme en partant de
la solution attendue et en remontant vers les hypothses.
En 1958, John McCarthy crait le langage de programmation LISP adapt la cra-
tion de moteurs de rgles. Il a aboutit la cration dune petite industrie dans les an-
nes 1980 avec les ordinateurs spcialiss de Lisp Machines et Symbolics (1979-
2005) et les logiciels dIntellicorp20.
En 1959, Herbert Gelernter crait le Geometry Theorem Prover21, capable de d-
montrer des thormes de gomtrie et tournant sur un IBM 704. Le mme Gelernter
est lorigine du SYNCHEM (SYNthetic CHEMistry), un systme expert cr dans
les annes 1970 capable de dterminer des ractions chimiques de synthse de mol-
cules organiques.
Dans les annes 1970, Robert Kowalski de lUniversit dEdinbourg fit avancer les
travaux dans la programmation logique. Puis les franais Alain Colmerauer et Phi-
lippe Roussel crrent le langage de programmation Prolog qui connut ses heures de
gloire dans les annes 1980.

19
Cf Intelligence Artificielle Symbolique de Guillaume Piolle, 2015.
20
Cr en 1980 et maintenant spcialis dans les logiciels de gestion dapplications pour SAP, un mtier plus terre terre
21
Cf https://pdfs.semanticscholar.org/2edc/8083073837564306943aab77d6dcc19d0cdc.pdf.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 29 / 362
Les premiers systmes experts
Quelques exprimentations ont marqu les dbuts des systmes experts comme MY-
CIN, un systme permettant de dterminer les bactries responsables dinfections en
fonction des symptomes (ci-dessous) avec une base de 450 rgles.
Les systmes experts ont t thoriss dans le cadre du Stanford Heuristic Pro-
gramming Project en 1980. Ils rpondent des questions dans des domaines spci-
fiques dont on a codifi la connaissance. Cela permit lIA de se rendre utile dans
des domaines spcifiques, comme dans la sant ou la maintenance dans lindustrie.

Les moteurs de rgles et les solveurs sont couramment employs dans les systmes
experts depuis les annes 1980. Et ils ont connu de nombreux progrs (ci-dessous)
malgr lhiver de lIA de la fin des annes 1980 et dbuts 1990. Ctait surtout un
hiver des systmes experts et du LISP !

Les moteurs de rgles sappuient sur la notion de raisonnement contraint par des
rgles et exploitant des bases de faits. On fournit au moteur un ensemble de rgles et
de faits pouvant par exemple reprsenter le savoir des experts dans un domaine donn.
Avec des rgles proches de la programmation logique du genre si X et Y sont vrais,
alors Z est vrai ou X entraine Y.
On peut alors interroger le systme en lui posant des questions genre est-ce que W
est vrai ? et il va se dbrouiller pour exploiter les rgles enregistres pour rpondre
la question. Les moteurs de rgles utilisent la thorie des graphes et la gestion de con-
traintes.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 30 / 362
Un systme expert sappuie sur deux composantes cls : une base de connaissance,
gnre souvent manuellement ou ventuellement par exploitation de bases de con-
naissances existantes, et un moteur de rgles, plus ou moins gnrique, qui va utili-
ser la base de connaissance pour rpondre des questions prcises. Les systmes ex-
perts peuvent expliquer le rationnel de leur rponse. La traabilit est possible
jusquau savoir codifi dans la base de connaissances, un avantage que les rseaux de
neurones du deep learning nont pas encore.

Les systmes experts daujourdhui


On compte encore des outils et langages dans ce domaine et notamment loffre du
franais ILOG, acquis en 2009 par IBM et dont les laboratoires de R&D sont tou-
jours Gentilly prs de Paris, au sud du boulevard Priphrique. Le moteur
dinfrence ILOG JRules est devenu IBM Decision Optimization Manager. De son
ct, ILOG Solver est une bibliothque C++ de programmation par contraintes, de-
venue IBM ILOG CPLEX CP Optimizer. Une stratgie de branding moins efficace
que celle dIBM Watson, comme nous le verrons bien plus loin.
La mise en place de systmes experts se heurtait la difficult de capter la connais-
sance des experts. Les temps de calcul pour les faire fonctionner taient galement
longs avec les ordinateurs de lpoque.
Il existe dautres types de systmes experts qui mettent en uvre la notion de pro-
grammation par contrainte, permettant datteindre un objectif en fonction dune base
de rgles, dobjectifs et de contraintes oprationnelles.
Dans de nombreux domaines, la force brute et le deep learning se sont ensuite impo-
ss en lieu et place de la logique formelle et de la captation manuelle de connais-
sances.
Les logiciels de moteurs de rgles du march sont appel BRMS pour Business
Rules Management Systems. Loffre est assez abondante mais plus ancienne et
moins connue que celle qui concerne le machine learning et le deep learning (ci-
dessous).
Cette offre de BRMS est maintenant intgre dans le concept plus large de Decision
Management Systems qui associent des moteurs de rgles et des outils danalytics.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 31 / 362
Lun des systmes experts les plus ambitieux des annes 1980 tait Cyc. Il devait
comprendre une norme base de connaissances de centaines de milliers de rgles. Ce
projet tait pilot par Doug Lenat du consorsium de recherche priv MCC qui ferma
ses portes en 2000. Doug Lenat la transform en projet entrepreneurial avec Cycorp,
lance en 1994. Cette dernire propose une base de connaissance intgrant 630 000
concepts, 7 millions de faits et rgles et 38 000 relations, le tout tant exploitable par
ces moteurs de rgles (ci-dessous droite). La base est notamment alimente par
lanalyse de documents disponibles sur Internet. Mais ce projet est considr comme
un chec.
Le systme expert OpenCyc 4.0 qui exploitait la base de Cycorp nest plus disponible
en open source depuis 2017. Il est depuis commercialis sous forme de licences d-
dies la recherche ou de licences commerciales.

Linitiative open source Schema.org propose de son ct des millions de descriptions


de faits exploitables par les moteurs de recherche et les moteurs de rgles.
Les outils dots de capacits de raisonnement continuent dvoluer pour faire avancer
le champ de la reprsentation des connaissances et du raisonnement. Les techniques
associes sont moins connues que celles du machine learning et du deep learning, ce
dautant plus quelles sont de plus en plus hybrides. Ainsi, un moteur de rgles peut-il
exploiter des rgles elles-mmes gnres par analyse du langage dans des rseaux de
neurones rcurrents.
Le deep learning et les rseaux de neurones rcurrents que nous verrons plus loin
alimentent maintenant couramment les bases de connaissances et les moteurs de
rgles quils ont contribu indirectement faire dcliner !
Les systmes experts peuvent aussi tre aliments par lexploitation de donnes op-
rationnelles (big data). Cest lapproche de Cosmotech (2010, $8,2M), une startup
spin-off de lENS Lyon et du CNRS base Lyon et aux USA qui a dvelopp une
plateforme logicielle de modlisation et de simulation de systmes complexes. Elle
sappuie sur une sorte de moteur de rgles et un modle dagents aliment par des
rgles mtier et par des rgles extraites de donnes de production via des techniques
de machine learning (schma ci-dessous). La solution est dcline dans diverses in-
dustries comme avec leur application Asset Investment Optimization (AIO) ddie
aux nergticiens, Crisis Management qui permet la gestion de crise et Smart Territo-
ries qui permet de modliser des systmes complexes pour la ville intelligente.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 32 / 362
Cest un excellent exemple dhybridation technologique illustrant la manire dont les
systmes experts dintgrent dans les solutions dIA.

La logique floue
La logique floue est un concept de logique invent par lamricain Lofti Zadeh
(Fuzzy Logic) en 196522. Elle permet de manipuler des informations floues qui ne
sont ni vraie ni fausses, en complment de la logique boolenne, mais pouvoir faire
des oprations dessus comme linversion, le minimum ou le maximum de deux va-
leurs. On peut aussi faire des OU et des ET sur des valeurs floues.

Quid des applications ? On les trouve dans le contrle industriel, dans des boites de
vitesse chez Volkswagen (pour tenir compte de lintention floue du conducteur),
pour grer des feux de circulation et maximiser le dbit, dans la reconnaissance de la
parole et dimages, le plus souvent, en complment du baysien. Des dizaines de
milliers de brevets auraient t dposs pour protger des procds techniques utili-
sant la thorie de la logique floue.
Les moteurs de rgles de systmes experts peuvent dailleurs intgrer les principes de
la logique floue (ci-dessous).

22
Javais eu loccasion de lentendre la prsenter lors dune confrence lEcole Centrale en 1984, lorsque jtais en option informa-
tique en troisime anne. Ca ne nous rajeunit pas !

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 33 / 362
Ceci dit, la logique floue nest pas utilise de manire trs courante, notamment du
fait que les systmes experts ne sont plus la mode depuis une quinzaine danne.

Machine learning
Le vaste domaine du machine learning, ou apprentissage automatique, vise notam-
ment reconnaitre des objets et faire des prdictions partir de donnes existantes.
Il sert aussi grer des tches de classification et de segmentation qui servent dtec-
ter des corrlations entre paramtres et vnements. Comme pour dterminer si un
logiciel est un virus, si un client risque de quitter un service sur abonnement ou au
contraire, sil sera intress par telle ou telle offre ou quun tableau clinique dun pa-
tient est symptomatique de lmergence dune pathologie de longue dure.
En thorie, et selon son pre fondateur Arthur Samuel, le machine learning donne
aux machines la capacit dapprendre sans tre explicitement programmes. Dans la
pratique, le machine learning requiert presque toujours de faire des choix de m-
thodes et des arbitrages manuels pour les data scientists et les dveloppeurs de solu-
tions.
Qui plus est, lapprentissage automatique sappuie sur des donnes existantes. Elles
lui permettent de produire des prdictions partir de la gnralisation dobservations.
La qualit et la distribution des donnes dentrainement doit permettre de faire des
prvisions de bon niveau.
Un bon systme de machine learning doit pouvoir sadapter diffrentes contraintes :
une volution permanente des donnes dentrainement, ainsi que leur incompltude et
leur imperfection.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 34 / 362
On distingue en gnral quatre grandes catgories de mcanismes de machine lear-
ning : la classification et la rgression pour lapprentissage supervis et le clustering
et la rduction de dimensions pour lapprentissage non supervis (ci-dessus).

Classification
Il sagit de pouvoir associer une donne complexe comme une image ou un profil
dutilisateur une classe dobjet. La classification utilise un jeu de donnes associes
des descriptifs (les classes) pour la dtermination dun modle. Cela gnre un mo-
dle qui permet de prdire la classe dune donne fournie en entre. Exemples clas-
siques : la reconnaissance dun simple chiffre, lappartenance dun client un seg-
ment de clients o pouvant faire partie dune typologie particulire de clients
(mcontents, pouvant se dsabonner un service, etc) ou la dtection dun virus en
fonction du comportement dun logiciel.

Il existe plusieurs mthodes de classification : les arbres de dcision qui suivent une
logique formelle, comme dans un moteur de rgles, la rgression linaire ou non
linaire, les support vector machines qui cherchent identifier une droite qui
permettra de distinguer les classes dobjets les unes des autres ainsi que des mthodes
statistiques baysiennes diverses. Un systme de machine learning est entrain avec
un jeu de tests (schma de droite).

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 35 / 362
Le modle entrain est ensuite aliment avec de nouveaux objets pour prdire leur
appartenance une classe dj identifie. Dans la pratique, les spcialistes du
machine learning testent diffrentes mthodes de classification pour identifier celle
qui est la plus efficace. La plus efficace gnre un maximum de bonnes rponses pour
un test ralis avec un jeu de donnes en entres qui sont dj classes mais nont pas
servi la dtermination du modle.

Rgression
La rgression permet de prdire une valeur y en fonction dune valeur x partir dun
jeu dentrainement constitu de paires (x, y). On peut ainsi prdire la valeur dune
maison ou dune socit en fonction de divers critres. Les schmas qui illustrent ce
concept utilisent uniquement une donne en entre et une en sortie.

Dans la pratique, les jeux de donne en entre comprennent plusieurs variables (x, y,
z, ). Il existe diffrentes formes de rgression, notamment linaire et non linaire.
Sy ajoute aussi la notion doverfitting et dunderfitting, qui dcrit les mthodes de
rgression qui suivent plus ou moins de prs les variations observes.

Rduction de la dimensionalit
Il sagit de dterminer dans un apprentissage non supervis quels sont les paramtres
discriminants qui ont une corrlation avec une donne cible dans une base
dentrainement.
La principale mthode utilise est la PCA, ou Principal Components Analysis.
Cette mthode mathmatique permet de rduire le nombre de variables utilises pour
prdire une valeur y en fonction dun vecteur multidimentionnel en entre. Par
exemple, en identifiant les paramtres dune segmentation client qui sont les plus per-
tinents pour prdire un comportement donn (churn, achat, ).
La rduction du nombre de valeurs utilise va rduire la consommation de ressources
machines. Mais attention, les facteurs de corrlation ne sont pas forcment des fac-
teurs de causalit. Ces derniers peuvent tre externes aux variables analyses !
La PCA est trs largement utilise dans le machine learning et le deep learning.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 36 / 362
Clustering
Le clustering ou la segmentation automatique est une mthode dapprentissage non
supervis qui permet partir dun jeu de donnes non labellis didentifier des
groupes de valeurs proches les unes des autres. Ce sont des clusters de valeurs.

Les mthodes de clustering permettent didentifier les paramtres discriminants de


ces diffrents segments. Elles servent ensuite prvoir lappartenance un segment
dune nouvelle valeur entre dans le systme. L encore, si le clustering peut tre
automatis, en mode non supervis, le choix du modle de clustering ne lest pas n-
cessairement pour autant sauf dans des outils avancs comme ceux de DataRobot et
Prevision.io.
Le machine learning base de rseaux de neurones permet de son ct de clusteriser
des donnes avec une rpartition quasi-arbitraire alors que les mthodes lmentaires
ci-dessus sont limites de ce point de vue-l,

Outils du machine learning


Le machine learning ncessite dabord de bien dterminer la typologie du problme
rsoudre et des donnes disponibles. Le schma ci-dessous originaire de lditeur de
logiciels SAS est un exemple darbre de dcision permetant de dterminer la mthode
utiliser en fonction du problme.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 37 / 362
Dans la pratique, il existe un trs grand nombre doutils de machine learning. Ils
combinent plusieurs types de logiciels :
Des langages de programmation comme Python, Java, C++ ou autres qui sont
utiliss conjointement avec des bibliothques de calcul spcialises dans le ma-
chine learning.
Des bibliothques associes, comme Scikit-learn, dorigine franaise, qui permet-
tent de tester les modles dapprentissage ou dautoapprentissage et de les mettre
ensuite en production.

Des environnements de travail, ou IDE pour Integrated Development Environ-


ment, qui permettent de paramtrer ses systmes et de visualiser les rsultats, sou-
vent de manire graphique. Ils servent tester diffrentes mthodes de classifica-
tion, rgression et clustering pour dfinir les modles appliquer. Ils peuvent aus-
si servir piloter la mise en production des solutions retenues. Parmi eux, les solu-
tions dIBM, de SAS, du Suisse Knime (2008, $20M), de RapidMiner (2007,
$36M), les solutions de Cognitive Scale (2013, $40M23) et CrowdFlower (2007,
$58M), le Data Science Workbench de Cloudera (2008, $1B) et le Data Studio du
Franais Dataiku (2013, $43M).

23
Le marketing produit de Cognitive Scale est caricatural : il nest franchement pas videment de comprendre ce que ralise le pro-
duit. Celui de DataRobot est bien mieux ralis et clair.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 38 / 362
Des outils dautomatisation de la recherche de mthodes dapprentissage comme
DataRobot (2012, $125M, vido) ou le franais Prevision.io (2016, vido et d-
monstration). Ces outils rcuprent les donnes du client et testent diverses m-
thodes dapprentissage relevant du machine learning pour trouver celles qui sont
les plus pertinentes par rapport un objectif atteindre. Ils paralllisent les tests
de modles en parallle pour prdire les valeurs dune variable dans un tableau
partir dun tableau dentrainement24.
Les comptences ncessaire pour crer des solutions de machine learning sont mul-
tiples. En amont, elles relvent de la collecte et de lorganisation des donnes. Cest
le big data. En son cur, elle relve de la data science et des data scientists, qui ex-
ploitent ces donnes avec les outils mathmatiques et les logiciels du machine lear-
ning. Enfin, en aval subsistent des dveloppeurs qui crent des solutions logicielles
exploitables par les utilisateurs des entreprises ou le grand public.
Dans la pratique, une bonne solution de machine learning doit tre alimente par des
sources de donnes adaptes au problme rsoudre. Ces donnes doivent contenir
suffisamment dinformations valeur statistiques permettant de faire des rgressions,
segmentations ou prvisions. Leur bonne distribution spatiale dans lunivers du pos-
sible qui est tudi est encore plus importante que leur prcision lchelle unitaire.

Rseaux de neurones
Les rseaux de neurones visent reproduire approximativement par bio-mimtisme le
fonctionnement des neurones biologiques avec des sous-ensembles matriels et logi-
ciels capables de faire des calculs partir de quelques donnes en entres et de gn-
rer un rsultat en sortie.
Cest une technique utilise dans le machine learning et dans sa variante avance du
deep learning.

Les neurones artificiels


Le principe dun neurone artificiel est de rcuprer diffrentes valeurs numriques en
entre (wn) associes un poids (xn). Le neurone artificiel moderne fait la somme des
entres multiplies par leur poids, additionne un biais (b) et lui applique ensuite une
fonction qui est en gnral une fonction non linaire comme une sigmoide qui gnre
une valeur comprise entre 0 et 1, gnrant une valeur % statistique facile exploiter
dans le reste du rseau de neurones. Le procd imite vaguement le fonctionnement
dun neurone biologique qui est dans la pratique bien plus complexe25.

24
Les deux outils permettent de se passer de programmation. Prevision.io cr un modle prt lemploi sans programmation et qui
sera aussi exploitable par du code dans une application spcifique via une API en cloud. Cf un descriptif prcis du mode opratoire
de prevision.io : Building a production-ready machine learning system with Prevision.io de Gerome Pistre, octobre 2017.
25
Un neurone du cortex est gnralement reli via des axones des milliers dautres neurones. La liaison sappelle une synapse et
associe un axone et une dendrite, une sorte dexcroissance de neurone. Il y a huit neurotransmetteurs diffrents qui font fonctionner
les synapses. Et lensemble est rgul par lexpression de 6000 gnes diffrents dans les neurones et par des cellules gliales qui ali-
mentent les neurones en nergie et qui rgulent la la production de neurotransmetteurs et la conductivit des axones via la myline
qui les entoure. Bref, cest trs compliqu !

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 39 / 362
Un neurone isol ne sert pas grand-chose. Ils sont assembls dans des rseaux de
neurones. Un rseau de neurones de machine learning assemble gnralement
plusieurs couches de neurones. Les neurones dune mme couche ne sont
gnralement pas connects entre eux contrairement aux neurones du cortex, histoire
de crer des systmes plus simples. Ils sont connects aux neurones de la couche
suivante. On vite gnralement des connexions circulaires entre neurones pour viter
de faire fonctionner le rseau en boucle lors de son apprentissage.
Une couche cache permet de grer une mthode de classification non linaire
complexe. On parle de deep learning lorsque le rseau de neurones comprend plus
dune couche cache. Cest pour cela que le deep learning est considr comme tant
un sous-ensemble du machine learning26.
La connaissance du rseau de neurones est acquise via un processus
dapprentissage permettant dajuster le poids des interconnexions entre neurones pour
que les objets en entre du rseau de neurones soient reconnus en sortie, en gnral
avec un tag descriptif ou une valeur, comme le descriptif dun objet pour une image
en entre. Il sagit dune connaissance purement probabiliste. La connaissance dun
rseau de neurones nest pas symbolique. Il ne sait pas donner de sens aux objets
quil dtecte ou aux calculs quil ralise.

Les perceptrons
Le concept des rseaux de neurones a vu le jour en 1943 dans les travaux de Warren
McCullochs et Walter Pitts. En 1949, Donald Hebb ajouta le principe de modula-
tion des connexions entre neurones, permettant aux neurones de mmoriser de
lexprience.
Le premier rseau de neurones matriel fut cr par Marvin Minsky et Dean Ed-
mons en 1950 alors quils taient tudiants Harvard. Le SNARC simulait 40 neu-
rones basiques avec 3000 lampes tubes !
Frank Rosenblatt, un collgue de Marvin Minsky, cra ensuite le concept
du perceptron en 1957 qui tait un neurone assez simple dans son principe avec une
fonction de transfert binaire, gnrant un zro ou un un en sortie.

26
Le deep learning est dnomm apprentissage profond en franais mais jutilise lappellation anglaise dans ce document.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 40 / 362
Le premier perceptron tait un rseau de neurones artificiels une seule couche tour-
nant sous forme de logiciel dans un IBM 704, le premier ordinateur du constructeur
dot de mmoires tores magntiques. Ctait un outil de classification linaire utili-
sant un seul extracteur de caractristique.

En 1969, Marvin Minsky publia avec Seymour Papert le livre Perceptrons qui cri-
tiquait les travaux de Frank Rosenblatt et sur un point trs spcifique portant sur
limpossibilit de coder une porte logique XOR avec un perceptron. Une porte XOR
inverse une valeur : 0 devient 1 et 1 devient 0. Tout en proposant une solution de con-
tournement associant deux couches de neurones pour mettre en uvre la porte XOR !
Le livre ntait donc pas si destructif que cela !
Il contribua cependant mettre un coup darrt ces dveloppements, le coup de
grce arrivant avec le rapport Lighthill publi au Royaume Uni en 1972. Cela fit
perdre un temps considrable lensemble des recherches en IA, ce dautant plus que
les rseaux neuronaux sont devenus, depuis, un pan fondamental des progrs dans
tous les tages de lIA. Marvin Minsky reconnu toutefois son erreur dapprciation
dans les annes 1980, aprs le dcs de Frank Rosenblatt.

Du machine learning au deep learning


Les rseaux neuronaux ont connu ensuite un fort dveloppement partir des annes
2000 et dans leur mise en uvre dabord dans le machine learning puis avec le deep
learning, qui exploite des rseaux de neurones avec un grand nombre de couches.
Dans le machine learning, les rseaux de neurones quelques couches permettent de
crer des mthodes de classification dobjets plus sophistiques.
De nombreuses mthodes dorganisation de rseaux de neurones sophistiqus sont
apparues pour permettre la reconnaissance de la parole et dimages. Elles sont vo-
ques dans la partie sur le deep learning.
Enfin, citons les rseaux de neurones multi-modes qui exploitent des sources
dinformations complmentaires, classiquement, de laudio et de la vido, pour am-
liorer la qualit de la captation. Laudio dune vido permet par exemple damliorer
la capacit tagger le contenu de la vido.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 41 / 362
Limagerie 2D complte par des informations de profondeur amliorera la capacit
de dtection dobjets complexes. La vido dun visage permettra damliorer la cap-
tation de la parole par lquivalent numrique de la lecture sur les lvres.

Programmation de rseaux de neurones


Dun point de vue pratique, la programmation de rseaux de neurones sappuie sur
des bibliothques logicielles spcialises comme cuDNN, MKL ou OpenNN. On
peu aussi citer Synaptic qui est une bibliothque utilisable avec node.js dans un na-
vigateur en JavaScript.
Ces bibliothques de rseaux de neurones sont souvent exploites elles-mmes par
des bibliothques de machine learning ou de deep learning, comme TensorFlow, qui
masquent la complexit du pilotage de rseaux de neurones bas niveau et permet-
tent par exemple de dfinir les modles de rseaux de neurones convolutionnels de
reconnaissance dimages et de les entrainer.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 42 / 362
Cest illustr dans le schma ci-dessus qui empile les couches utilises dans le dve-
loppement de solutions dIA avec un dveloppement comprenant un framework
dasbtraction lev utilisant un framework, comme le framework Keras qui se situe
au-dessus de TensorFlow, puis une bibliothque de rseau de neurones, suivie dune
bibliothque de pilotage de GPU comme CUDA chez Nvidia ou OpenCL pour AMD,
et enfin, un GPU ou un CPU au niveau matriel.

Deep learning
Le deep learning est un sous-ensemble des techniques de machine learning base de
rseaux de neurones qui sappuient sur des rseaux de neurones plusieurs couches
dites caches.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 43 / 362
Celles-ci permettent de dcomposer de manire hirarchique le contenu dune donne
complexe comme de la voix ou une image pour la classifier ensuite : identifier des
mots pour la voix ou associer des tags descriptifs des images.
Le deep learning sert le plus souvent reconnatre le langage, lcriture et les images
mais il peut aussi avoir dautres usages dans les outils daide la dcision, dans les
jeux tels que le Go avec AlphaGo et mme dans lexploitation de donnes structures.

Le deep learning a dautres usages, notamment pour gnrer des contenus artificiels,
extrapols partir de contenus rels, notamment des images, que nous verrons aussi,
et qui sappuient sur des modles gnratifs.

Evolutions du deep learning


Les outils de deep learning sappuient sur diffrentes variantes de rseaux de neu-
rones pour leur mise en uvre pratique. Leur histoire remonte aux perceptrons de
Franck Rosenblatt de 1957.

Lhistoire du deep learning a cependant vritablement dmarr prs de 20 ans plus


tard, dans les annes 1970. Il a cependant fallu attendre les annes 2000 pour que lon
puisse les mettre en uvre en pratique. Cest sans doute d aux progrs matriels, la

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 44 / 362
loi de Moore mais aussi aux progrs conceptuels, notamment aux travaux de Yann
LeCun en 1988 et 1998 et Geoff Hinton, particulirement en 2006.
Il est de bon ton de dclarer que les chercheurs nont pas produit grand chose depuis
et que le deep learning doit surtout aux progrs du matriel et labondance de don-
nes pour entrainer les systmes. Quand on y regarde de plus prs, on se rend compte
quau contraire, les chercheurs nont pas cess de faire avancer le domaine. Et
danne en anne, des progrs conceptuels et pratiques font avancer les rseaux de
neurones et le deep learning, ne serait-ce quavec les rseaux gnratifs.
Cest ce que nous allons vois dans ce qui suit. Ces avances du deep learning sont
tales sur plusieurs dcennies et sont continues !
Rtropropagation derreurs (1969)
Elle permet lentrainement dun rseau de neurones couche par couche en partant du
rsultat et en ajustant le poids des neurones pour permettre au rseau didentifier les
objets fournis en entre. Cette rtropropagation fonctionne en ajustant un par un les
poids des neurones de chaque couche et en scannant un par un les objets du jeu de
test pour optimiser le taux de reconnaissance.
Lapprentissage des rseaux de neurones est gnralement supervis et automatique !
Supervis car il utilise des tags descriptifs des objets dune base de rfrence et
automatique car les poids synaptiques des neurones sont ajusts automatiquement.

Les volutions des mthodes de rtropropagation cres par la suite visaient surtout
conomiser du temps machine car lopration est trs fastidieuse puisquelle doit tre
rpte pour chaque neurone du rseau et pour chaque objet de la base de rfrence.
Cela donne une combinatoire trs leve !
La mthode est perfectionne en 1986 par David Rumelhart, Geoff Hinton et Ronald
Williams dans Learning representations by back-propagating errors. La plus cou-
ramment utilise aujourdhui est la descente stochastique de gradient, vue un peu plus
loin, et qui permet damliorer la vitesse de converge des rseaux lors de leur entrai-
nement.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 45 / 362
Rseaux de neurones rcurrents et mmoire (1982 puis 1993)
Ces RNN (Recurrent Neural Networks) permettent danalyser des informations s-
quentielles comme la voix au niveau des phonmes et le langage au niveau de
lassemblage des mots. Ils sont en effet trs utiliss dans les systmes de reconnais-
sance de la parole, pour la traduction automatique et la reconnaissance de lcriture
manuscrite.
Ils peuvent aussi analyser des signaux comme le bruit de machines pour y dtecter
des anomalies, dans le cadre de maintenance prventive, aux prvisions de cours
daction, lanalyse dlectro-cardiogrammes27 et mme la dtection des exopla-
ntes par la mthode des transits28.

Les rseaux de neurones mmoire ont de nombreuses dclinaisons avec notam-


ment :
BPTT (1987), BackProp Through Time, une mthode dentrainement de rseaux
de neurones rcurrents.) et
RTRL (1989), Real Time Recurrent Learning, une variante de rseaux de neu-
rones rcurrents.
LSTM (1997), Long Short Term Memory, qui savent grer le contexte dans le-
quel les contenus apparaissent29 et sont trs utiliss pour le traitement du langage
et la traduction automatique.

27
Concommitamment avec dautres mthodes comme les CNN, rseaux convolutionnels.
28
Que jai eu loccasion dexpliquer ici : http://www.oezratty.net/wordpress/2017/astronomie-entrepreneuriat-exoplanetes/.
29
Les LSTM ont t conceptualiss par Sepp Hochreiter et Jrgen Schmidhuber dans Long short-term memory, en 1997.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 46 / 362
GRU (2014), Gated Recurrent Units30, des variantes plus simples des LSTM.
BLSTM (2015), Bidirectionnal Long Short Term Memory, des LSTM bidirec-
tionnels.
Stacked RNN (2015), qui sont des RNN empils.
MANN (2015), Memory-Augmented Neural Networks.
Je vous en pargne les dtails, ce dautant plus que je nai pas encore trs bien com-
pris leur fonctionnement dans le dtail et que ces rseaux de neurones sont assez dif-
ficiles vulgariser. Ils sont souvent combins entre eux.
Ces rseaux transforment gnralement les mots et phrases en vecteurs, des objets
mathmatiques triturs pour tre compars les uns aux autres, classifis, modifis et
transforms.
Tous ces rseaux permettent surtout de tenir compte du contexte dans lequel les ob-
jets comme des mots sont dtects pour analyser le sens dune phrase. Lun des
points cls de ces rseaux est leur capacit mmoriser des contextes31.
Cest un domaine damlioration encore plus intense que dans les rseaux de neu-
rones convolutionnels. Avec la cl des solutions de plus en plus perfomantes pour la
reconnaissance de la parole, la traduction automatique et les agents conversationnels
rellement intelligents.
Machines restrictives de Boltzmann (1986)
Les DBN utilisent une seule couche de neurones source et cible et il ny a pas de
connexions entre les neurones dune mme couche.

30
Les GRU ont t crs par Junyoung Chung en 2014. Cf ce papier de Junyoung Chung, Caglar Gulcehre, KyungHyun Cho et
Yoshua Bengio Empirical evaluation of gated recurrent neural networks on sequence modeling qui compare les GRU aux LSTM.
31
Cf la confrence de Rob Fergus au Collge de France en avril 2016 dans le cadre de la chaire de Yann LeCun.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 47 / 362
Cest le modle le plus simple de rseau de neurones qui est ensuite exploit dans
dautres assemblages, comme les Deep Belief Networks (DBN) crs en 2006.
Rseaux de neurones convolutionnels (1989 puis 1998)
Les rseaux de neurones convolutionnels ont t invents par le franais Yann
LeCun32 et servent en premier lieu la reconnaissance de caractres puis la recon-
naissance dimages33. Ce sont des outils qui servent principalement raliser de la
classification dobjets, comme pour associer une image une classe dobjet (chat,
bateau, avion, ).
Les premiers ConvNets de production ont t dploys en 1995 pour la reconnais-
sance des chques, via une solution de NCR. Les CNN, appels aussi ConvNets
(convolutional neuron networks), utilisent plusieurs techniques enchaines les unes
avec les autres avec notamment des filtres et des feature maps qui consistent identi-
fier des formes dans les images.

Une feature map est une cartographie de lapparition dun filtre dans limage analy-
se. Un ConvNet utilise un jeu de plusieurs filtres initialis alatoirement. Les filtres
sont des matrices de quelques pixels de ct, en gnral 3x3 ou 4x4 34. Les filtres sont
ensuite affins par rtropropagation derreurs de lensemble du rseau, un mcanisme

32
Yann LeCun stait inspir des travaux de Kunihiko Fukushima, un chercheur de la NHK, et de ses rseaux de neurones multi-
couches Neocognitron. Voir Neocognitron: A Hierarchical Neural Network Capable of Visual Pattern Recognition, 1987.
33
Voir cette bonne explication en trois parties : A Beginner's Guide To Understanding Convolutional Neural Networks de Adit
Deshpande (un tudiant aux USA), partie 1, partie 2 et partie 3, 2016.
34
On retrouve cette taille de matrices dans les processeurs neuromorphiques et dans les derniers GPU de Nvidia Volta.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 48 / 362
qui est appliqu pour toutes les images dun jeu dentrainement qui peut comprendre
des millions dimages.
Cest trs consommateur de ressources machine mais bien plus efficace quun simple
rseau de neurones multicouches. Cela vient du fait que le rseau comprend moins de
paramtres. Ce nombre de paramtres est approximativement gal la somme de
linformation des filtres de chaque convolution et des poids des synapses des couches
terminales du rseau.
Chaque feature map gnre par lapplication des filtres sur limage de dpart se voit
applique une rduction de rsolution (pooling) puis une suppression des valeurs n-
gatives (ReLU pour Rectified Linear Units) pour rduire la quantit de travail ap-
pliquer aux couches suivantes. Le processus est rpt sur plusieurs niveaux ou
couches, chaque feature map issue dun niveau devenant une image qui subit un trai-
tement quivalent dans le niveau suivant.
A la fin de lhistoire, la dernire couche de feature maps est relie une liste de tags
avec une probabilit de correspondance via quelques couches de neurones dites ful-
ly connected , savoir que tous les neurones dune couche sont lies celles de la
couche suivante. Cest l quun chat ou un bateau sont reconnus dans limage et que
plusieurs objets peuvent tre reconnus dans une mme image. La dernire couche de
cet empilement est un ensemble de neurones dont le nombre est gal au nombre
dobjets diffrents reconnaitre. Il peut tre trs grand mais doit rester raisonnable
pour tenir compte des capacits du matriel. Ainsi, les moteurs de reconnaissance
dimages nont-ils pour linstant au grand maximum que quelques dizaines de mil-
liers de classes dobjets dans cette dernire couche de rseaux de neurones35.

35
Dailleurs, certaines dmonstrations tonnantes de reconnaissance dobjets oublient de prciser le nombre dobjets que le systme
peut reconnaitre !

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 49 / 362
Voici un autre exemple illustr du processus des ConvNet de reconnaissance de ca-
ractres. En 1), on peut identifier la prsence des diagonales et croix dans les feature
maps droite. Puis le pooling en 2) pour divise par deux la rsolution des feature
maps, la couche ReLU qui fait un max(0, x) sur toutes les valeurs (avant ou aprs le
pooling), puis en 5), les couches de neurones qui aboutissent au rsultat final indi-
quant la valeur de la lettre. Selon les modles, des variantes diverses sont introduite
dans ces couches qui visent en gnral augmenter le contraste de limage traite.
A chaque niveau dun rseau convolutionnel, le nombre de feature maps augmente et
leur taille diminue. Les feature maps tant optimises automatiquement, leur forme
nest pas forcment interprtable par le cerveau humain.
Cest la magie des ConvNets : ils crent des niveaux de reprsentations hirar-
chiques intermdiaires des images qui optimisent leur reconnaissance, sans que lon
puisse comprendre comment ils fonctionnent pas pas et dans le dtail.
Do la fameuse non explicabilit des algorithmes qui inquite nombre
dobservateurs36, ce dautant plus quelle se produit aussi dans les rseaux rcurrents
et mmoire qui servent principalement au traitement du langage. Mais ce qui
compte avant tout est la fiabilit des rsultats plus que leur explicabilit. En cas de
dfaillance dun rseau de neurones, lerreur proviendra probablement dune base
dentrainement ne couvrant pas bien lespace des possibilits que le rseau peut ren-
contrer dans sa mise en production. Nous en reparlerons plus loin au sujet du biais
des donnes dentrainement.
Les ConvNets sinspirent fortement du mode de fonctionnement du cortex visuel des
mammifres qui est structur, de prs, dans des colonnes corticales faites de cinq
couches de neurones et qui, de loin, comprend des aires spcialises qui lvent pro-
gressivement le niveau dabstraction des objets reconnus.
Par contre, contrairement au cortex humain, les ConvNets qui font de la reconnais-
sance dimages utilisent des reprsentations trs basse rsolution. La majorit des
ConvNets se contentent dimages comprimes une rsolution de 224x224 pixels.
Limagerie mdicale qui est plus exigeante ny chappe pas, avec des modles de r-
seaux de neurones spcialiss qui dtectent dabord les parties de limage analyser37
puis les analysent avec un rseau convolutionnel une rsolution de dpart de
224x224 pixels38.

36
Cf Le talon d'Achille de l'intelligence artificielle de Benoit Georges, mai 2017.
37
Avec notamment les rseaux de neurons pyramidaux. Cf par exemple Feature Pyramid Networks for Object Detection, 2016
38
Pourquoi 224 et pas 256 ? Cest li larchitecture en couche des rseaux convolutionnels et la taille des filtres et des feature
maps des convolutions, sachant quentre chaque convolution, la rsolution des feature maps est divise par deux. Je vous passe les
dtails du calcul arithmtique ! 224x224 est aussi la taille des images de la base dentrainement ImageNet.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 50 / 362
Les algorithmes utiliss sont cependant si puissants quils permettent de gnrer des
taux de reconnaissance dimages meilleurs que ceux de lHomme ! Quest-ce que ce-
la serait si la rsolution utilise tait la mme que dans lil et le cortex humains,
lil tant dot de 90 millions de btonnets pour dtecter la luminance et de 6,5 mil-
lions de cones pour la couleur, le tout tant connect au cortex visuel par un nerf op-
tique comprenant un million daxones !
On peut distinguer les ConvNets selon le nombre de dimensions des donnes recon-
nues : 1D (une dimension) pour le texte, la reconnaissance de genre de musique, des
prdictions temporelles sur une seule variable, 2D (deux dimensions) pour les images,
pour la reconnaissance de la parole qui associe frquence audio et temps, puis 3D
(trois dimensions) pour le traitement de vidos et dimagerie mdicale 3D.
Descente stockastique de gradient (2003)
Il sune technique dapprentissage par rtro-propagation des erreurs qui sappuie sur
loptimisation du gradient. Pour faire simple, il sagit didentifier dans quelle direc-
tion faire voluer les poids synaptiques des neurones pour atteindre leur niveau opti-
mal dans la reconnaissance des objets en minimisant les oprations de calcul nces-
saires. Le tout tant utilis dans lentrainement du rseau de neurone par rtropropa-
gation derreurs.
Il est important de trouver le niveau optimum global, savoir le taux derreur le plus
bas, et pas seulement le niveau optimum local, qui est le taux derreur le plus bas
dans les environs du poids de dpart que le rseau de neurones cherche optimiser
(cf le schma ci-dessous qui lexplique de manire image).
La technique sapplique aussi bien aux rseaux de neurones une seule couche ca-
che qui font partie du domaine du marchine learning quaux rseaux de neurones
complexes du deep learning.
Dans lentrainement par rtropropagation derreurs, les poids synaptiques des neu-
rones sont initialiss alatoirement. On fait passer des objets dune base de test au
travers du rseau et on compare le rsultat de classification en sortie avec le bon r-
sultat dont on dispose dans la base de tests (en amont, des photos et en aval, des des-
cripteurs des objets dans les photos).

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 51 / 362
La descente de gradient value dans quelle direction faire voluer les poids des sy-
napses pour sapprocher du bon rsultat. Le calcul est ralis pour toutes les synapses
et pour tous les objets du jeu dentrainement, ce qui gnre beaucoup de calculs.
La descente stockastique de gradient est une variante de la descente de gradient qui
consiste valuer le poids des synapses objet par objet ou groupe dobjet par groupe
dobjets dentrainement au lieu de scanner entirement la base dentrainement. Cela
permet de rduire la quantit de calculs effectuer et permet de converger plus rapi-
dement vers un rseau bien entrain.
Cette technique dentrainement est trs efficace pour gnrer un rseau de neurones
capable de gnrer des rsultats avec un faible taux derreurs. Elle est cependant trs
consommatrice de ressources machines et de temps. Do lintrt de loptimiser et
de sappuyer sur des ressources matrielles de plus en plus puissantes, comme les or-
dinateurs base de GPU ou de processeurs neuromorphiques que nous tudions plus
loin dans ce document.
Deep beliefs networks (2006)
Les DBN sont issus des travaux des canadiens Geoffrey Hinton et Simon Osindero et
du singapourien Yee-Whye Teh publis dans A Fast Learning Algorithm For Deep
Belief Nets. Ils optimisent le fonctionnement des rseaux neuronaux multicouches en
grant leur apprentissage couche par couche, indpendamment les unes des autres. Ce
sont en quelque sorte des machines restrictives de Boltzmann empiles les unes sur
les autres, tape par tape pour ce qui est de lentrainement.
Le concept gnral du deep learning a t ensuite formalis par ce mme Geoffrey
Hinton en 2007 dans Learning multiple layers of representation.
Notons que Geoff Hinton sappuyait sur les travaux du franais Yann LeCun (en
1989) qui dirige maintenant le laboratoire de recherche en IA de Facebook et de
lallemand Jrgen Schmidhuber (1992) dont deux des anciens tudiants ont cr la
start-up DeepMind, maintenant filiale de Google. Sachant que Yann LeCun tait lui-
mme un ancien doctorant dans le laboratoire Geoff Hinton. Un bien petit monde !

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 52 / 362
Geoffrey Hinton 39 travaille pour Google depuis 2013, pas loin du lgendaire Jeff
Dean40, arriv en 1999 et qui planche maintenant aussi sur le deep learning. On peut
aussi citer le franais Stphane Mallat qui a aussi contribu au dveloppement des
rseaux convolutionnels et lexplication de leurs sous-jacents mathmatiques41.
Autoencodeurs empils (2007)
Les stacked autoencoders sont couramment associs aux deep belief networks. Il
sagit dutiliser des couches caches de neurones qui encodent les donnes dans un
espace dimentionnel rduit et de couches de neurones qui permettent ensuite de re-
constituer les variables en entres, en sortie de cette couche.

39
Cf Is AI Riding a One-Trick Pony? de James Somers, septembre 2017, MIT Technology Review, qui montre quel point Geoff
Hinton est central dans lhistoire rcente de lIA.
40
Co-crateur entre autres de choses de deux outils cls des traitements distribus MapReduce et BigTable, ainsi que du crawler de
Google Search et dAdSense.
41
Sa confrence dlivre dans la Chaire du Collge de France de Yann LeCun fournit des claircissements sur le fonctionnement des
rseaux convolutionnels. Mais il faut saccrocher pour suivre ! Cf Les Mystres mathmatiques des rseaux de neurones convolu-
tionnels, 19 fvrier 2016.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 53 / 362
Cette technique est utilise dans lapprentissage non supervis des rseaux de neu-
rones pour identifier des variables ou fonctions caches. Elle peut notamment servir
dbruiter des images.
La mthode mathmatique employe peut-tre la PCA (Principal Components Analy-
sis) que nous avons rapidement vu dans la partie sur le machine learning.
Autres mthodes de deep learning
Sen suivirent plus rcemment de nombreuses variantes de rseaux de neurones, sur-
tout base de rseaux convolutionnels (ci-dessous droite), destines optimiser les
performances, en particulier, celles de lentrainement des rseaux. En effet, cest la
partie qui est la plus consommatrice de ressources machines dans les rseaux de neu-
rones. Une fois un rseau entrain, il excute ses prdictions bien plus rapidement.

On voit aussi merger des rseaux de deep learning volutifs dont larchitecture peut
voluer de manire itrative42.
Le schma ci-dessous illustre cette longue chaine de progrs, qui ne sest dailleurs
pas arrte en 2012 et poursuit encore son chemin aujourdhui.
2012 est tout de mme une date intressante, celle de la cration du rseau de neu-
rones convolutionnel AlexNet par lquipe de Geoff Hinton de lUniversit de Toron-
to. Il tait entrain sur 1,3 millions dimages de la base de rfrence ImageNet avec
1000 classes dimages diffrentes et gnrait des taux derreurs bas pour lpoque
(18,9% pour le top 5).
Le rseau de neurones exploitait 60 millions de paramtres et 500 000 neurones r-
partis dans cinq couches de convolution. Le tout exploitait des cartes GPU Nvidia
pour acclrer les traitements, surtout pendant la phase dentrainement qui durait des
semaines43.

42
Cf https://www.oreilly.com/ideas/neuroevolution-a-different-kind-of-deep-learning.
43
Cf ImageNet Classification with Deep Convolutional Neural Networks, 2012.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 54 / 362
Le deep learning et les rseaux de neurones convolutionnels ont continu de progres-
ser pas pas, avec la cration dinnombrables variantes conceptuelles pour amliorer
leurs capacits dapprentissage, de mmorisation et leur performance dentrainement.
LIA progresse dailleurs rgulirement et de manire plutt dcentralise, avec des
dizaines de chercheurs contribuant faire avancer ltat de lart. Le tout, pendant que
les GPU et processeurs neuromorphiques progressent tout autant de leur ct.
Nous avons ainsi par exemple vu apparaitre quelques avances conceptuelles cls
depuis 2015 :
ResNet 44 , un rseau de neurones profonds, cest--dire avec de nombreuses
couches, mais qui en optimise lentrainement, en 2015. Il sert rduire la perte de
gradients dans le processus dentrainement. Il permettait datteindre un taux
derreur de 5,7% sur la base de tests ImageNet.
Stockastic Residual Net45 (2016), qui optimise les rseaux de neurones en court-
circuitant certaines couches pendant lentrainement pour le rendre plus rapide.
FractalNet46 (2016), qui utilise le concept des fractales pour densifier un rseau
de neurones convolutionnel en rpliquant certaines couches et en utilisant plu-
sieurs circuits diffrents pour loptimisation de chaque convolution.
DenseNet47 (2016), une variante des ConvNets o chaque feature map est injecte
en entre de toutes les couches convolutionnelles suivantes et pas seulement de la
suivante, vitant le syndrome de la perte de gradient qui affecte les ConvNets lors
de leur entrainement.
RoR48 (2016), une variante itrative de ResNets.

44
Cf Deep Residual Learning for Image Recognition, de Kaiming He, Xiangyu Zhang, Shaoqing Ren et Jian Sun, 2015.
45
Cf Deep Networks with Stochastic Depth de Gao Huang, Yu Sun, Zhuang Liuy, Daniel Sedra, et Kilian Q. Weinberger, 2016.
46
Cf FractalNet : Ultra-deep neural networks without residuals, de Gustav Larsson, Michael Maire et Gregory Shakhnarovitch, 2016.
47
Cf Densely Connected Convolutional Networks de Gao Huang, Zhuang Liu et Laurens van der Maaten, 2016, rvis en 2017.
48
Cf Residual Networks of Residual Networks: Multilevel Residual Networks, Ke Zhang, Miao Sun, Tony X. Han, Member, Xing-
fang Yuan, Liru Guo et Tao Liu, 2016.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 55 / 362
PathNet49 (2016), un rseau de neurones, chaque neurone tant un rseau convo-
lutionnel, dont lusage est optimis automatiquement.
Mixture of Expert Layer50 (2017), un nouveau modle de rseau de neurones
multicouches cr par une quipe de Google Brain pilote par Geoff Hinton. Cest
un rseau neuronal gant dont chaque neurone est en fait un sous-rseau neuronal.
Le modle, diffrent de Pathnet, sert surtout amliorer les outils de traitement du
langage comme la traduction.

A chaque fois, ces diffrents rseaux ont t entrains avec les mmes sources de
donnes comme la base ImageNet, pour dtecter avec le taux derreurs le plus faible
les images de test et aussi en conomisant au mieux les ressources machine. Lautre
point commun de ces avances rcentes est quelles proviennent souvent de cher-
cheurs et tudiants chinois installs surtout aux USA.
Aujourdhui, les taux derreurs sont infrieurs ceux de lhomme ce qui explique
pourquoi il est souvent dit quen matire dimagerie mdicale, les mdecins spcia-
listes sont dpasss.
A ceci prs que ces rseaux de neurones ont t entrains avec des bases dimages
tagges refltant le savoir existant des spcialistes. La connaissance de lIA ne tombe
pas du ciel !

49
Cf PathNet: Evolution Channels Gradient Descent in Super Neural Networks, de Chrisantha Fernando, Dylan Banarse, Charles
Blundell, Yori Zwols, David Ha, Andrei A. Rusu, Alexander Pritzel et Daan Wierstra, janvier 2017.
50
Cf Outrageously large neural networks : the sparsely-gated mixture-of-experts layer de Geoffrey Hinton, Noam Shazeer, Azalia
Mirhoseini, Krzysztof Maziarz, Andy Davis, Quoc Le et Jeff Dean, janvier 2017.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 56 / 362
La cartographie ci-dessus du zoo des rseaux de neurones51 illustre bien leur di-
versit sachant que leur assemblage peut donner ensuite lieu beaucoup de crativit
en fonction des besoins.
Modles gnratifs
Ce sont des rseaux de neurones convolutionnels ou rcurrents gnrant du contenu
partir de contenu existant. Ils font des prdictions, dimages vido suivantes dune
vido donne, qui colorient des images en noir et blanc52. Ils peuvent aussi servir
amliorer les dialogues issus de chatbots.

51
Il provient de The Neural Network Zoo de lInstitut Asimov, septembre 2016.
52
Les exemples du slide ci-dessous viennent de : Generative Models de Fei-Fei Li & Justin Johnson & Serena Yeung, 2017.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 57 / 362
Les principales techniques utilises sont les Generative Adversarial Networks ou
GANs, apparus en 2014 et perfectionns en particulier en 2016, des rseaux de neu-
rones non superviss capables de gnrer des contenus en sappuyant sur des gnra-
teurs base de rseaux de convolution inverss. Ce sont des innovations toutes r-
centes ! Qui a dit que les algorithmes dataient tous des annes 1980 ?
Je traite de cela dans la rubrique sur les modles gnratifs dans la partie vi-
sion/imagerie car cest le principal domaine dapplication des GANs.

Modes dapprentissage
Comme pour le machine learning, lapprentissage de solutions de deep learning suit
lune des approches suivantes :
Lapprentissage supervis qui repose sur lentrainement dun rseau avec un jeu
de donnes dentrainement qui est associ la donne de rsultat. Pour la recon-
naissance dimages, il sagit des descriptifs dobjets contenus par les images. Pour
de la traduction automatique, ce sont des couples de phrases traduites dune
langue lautre.
Lapprentissage non supervis qui est utilis dans certains types de rseaux de
neurones de deep learning ou certaines parties de rseaux, comme les stacked
autoencoders qui permettent didentifier automatiquement des patterns dans des
objets et de raliser du clustering automatique dobjets. Cet apprentissage ne va
pas pour autant identifier automatiquement le nom des classes identifies. On va
alors utiliser un apprentissage supervis. Lapprentissage totalement non supervis
est plus que rare.
Lapprentissage par renforcement qui consiste faire voluer un modle en
fonction de retours externes, en gnral avec le monde physique. Cest une tech-
nique qui est par exemple utilise pour optimiser le ralisme des dialogues de
chatbots. Elle lest galement dans les robots qui apprennent viter les obstacles
ou raliser des tches mcaniques en ttonnant. Lagent entrainer par renfor-
cement cherche maximiser par itrations successives une rcompense qui est in-
carne par sa performance, telle que le temps pour raliser une tche donne.

Applications du deep learning


Depuis une vingtaine dannes, le deep learning est mis toutes les sauces, la plus
symbolique tant la victoire de DeepMind contre le champion du monde de Go la
mi-mars 2016. Le deep learning est surtout utilis aujourdhui pour la reconnaissance
des formes dans les images et celle de la parole, donc dans les sens artificiels.
Il peut aussi servir exploiter des donnes textuelles non structures et alimenter
des bases de connaissances qui elles-mmes seront exploites par des moteurs de
rgles dans des systmes experts utilisant une logique formelle ! IBM liste quelques-
unes de ces applications dans son marketing.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 58 / 362
On y retrouve des tudes de cas dans lducation pour crer des MOOC auto-
adaptatifs, dans le retail avec un assistant dachats, dans la sant avec la personnalisa-
tion de traitements contre certains cancers ou encore dans lanalyse de diverses don-
nes dans la smart city.
Pour comprendre le fonctionnement du deep learning dans le dtail, il faut avoir
beaucoup du temps et un bon bagage mathmatique et logique ! On peut commencer
par parcourir Deep Learning in Neural Networks de ce Jrgen Schmidhuber, publi
en 2014 qui fait 88 pages dont 53 de bibliographie ou bien Neural Networks and
Deep Learning, un livre gratuit en ligne qui expose les principes du deep learning. Il
explique notamment pourquoi lauto-apprentissage est difficile. Cela fait tout de
mme plus de 200 pages en corps 11 et on est largu la cinquime page, mme avec
un bon background de dveloppeur !

Il y a aussi Deep Learning Methods and Applications publi par Microsoft


Research (197 pages) qui dmarre en vulgarisant assez bien le sujet. Et puisArtificial
Intelligence A Modern Approach, de Stuart Russel et Peter Norvig, une somme de
rfrence sur lIA qui fait la bagatelle de 1152 pages et qui serait lun des B-A-BA
pour les tudiants en informatique de premier cycle53. Mais elle commence dater, la
troisime et dernire dition tant de 2009. Il y a aussi la masse Deep Learning de
Ian Goodfellow and Yoshua Bengio et Aaron Courville, de 802 pages54.
Vous pouvez aussi visionner la confrence inaugurale de Yann LeCun au Collge
de France en fvrier 2016 o il excelle dans la vulgarisation mme si lon peut avoir
du mal suivre jusqu la fin la premire fois.
Du ct de la mise en uvre pratique, le deep learning ralise des progrs continus
lis au matriel et aux mthodes.

53
Tlchargeable gratuitement ici : https://dcs.abu.edu.ng/staff/abdulrahim-
abdulrazaq/courses/cosc208/Artificial%20Intelligence%20A%20Modern%20Approach%20(3rd%20Edition).pdf
54
Tlchargeable ici : http://www.iro.umontreal.ca/~bengioy/talks/lisbon-mlss-19juillet2015.pdf.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 59 / 362
Le deep learning est trs couteux en ressources marchines, surtout pendant les phases
dentrainement. Nous avons vu que celui-ci passe par loptimisation des poids de cen-
taines de millions de neurones qui doit tre ralise en testant chaque objet de rf-
rence en entre et il peut y en avoir plusieurs millions. Chaque traitement dune
image de rfrence peut ncessiter des milliards doprations. Les processeurs tradi-
tionnels ne sont pas bien adapts ces traitements. En effet, ils vont tester et adapter
squentiellement le poids des synapses de chaque neurone et la construction des
feature maps des couches convolutionnelles.
Du ct du livre des records :
En 2011, Google Deep Brain reconnaissait des chats dans des vidos YouTube
avec un rseau comprenant 1,7 milliards de connexions, 10 millions d'images de
200x200 pixels, 1000 machines et 16000 curs, 170 serveurs, 20 000 catgories
d'objets et 3 jours de travail55.
En 2013, une quipe de Stanford sous la direction dAndrew Ng crait un rseau
de neurones de reconnaissance dimages de 11,2 milliards de paramtres tournant
sur 16 serveurs base de GPU Nvidia56.
En 2015, le Lawrence Livermore Lab crait un systme grant 15 milliards de
paramtres57 pour reconnaitre des objets dans une base de 100 millions dimages
issue de Flickr.
Toujours en 2015, la startup Digital Reasoning de Nashville exploitait un rseau
de neurones de traitement du langage cherchant des analogies parmi 20 000 mots
et avec 160 milliards de paramtres, entrain sur trois serveurs en une journe58.
Avec un taux derreur de moins de 15%, un record lpoque.
Encore en 2015, on passait la reconnaissance de visages avec Nvidia, toujours
sur 100 millions d'images, avec 10 niveaux de neurones, un milliard de paramtres,
30 exaflops et 30 GPU-jours de calculs pour lentrainement59.
Mais ce sont des cas extrmes, les rseaux de neurones en production courante ayant
gnralement un nombre plus raisonnable de paramtres, compris entre des milliers et
des dizaines de millions.
Toutes ces performances vertigineuses sexpliquent notamment par la vague de
lusage de GPU et de processeurs neuromorphiques dont la structure interne est plus
proche des rseaux de neurones que les CPU traditionnels. Ces processeurs savent
parallliser les calculs et multiplier des matrices entre elles, ce qui est utile pour les
rseaux de neurones convolutionnels. Nous verrons dans une partie suivante com-

55
Cf Googles artificial brain learns to find cat videos, Wired, 2012.
56
Cf GPU-Accelerated Machine Learning and Data Mining Poised to Dramatically Improve Object, Speech, Audio, Image and
Video Recognition Capabilities, Nvidia, 2013.
57
Cf Large-scaled deep learning ont the YFCC100M dataset, 2015.
58
Cf Biggest Neural Network Ever Pushes AI Deep Learning, et Modeling Order in Neural Word Embeddings at Scale, 2015.
59
Cf Deep learning image classification, Nvidia, 2016.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 60 / 362
ment progressent ces GPU, surtout issus de Nvidia, et les processeurs neuromor-
phiques. Il est aussi fort probable que les ordinateurs quantiques, toujours en devenir,
joueront un rle important pour augmenter la puissance de certains types de rseaux
de neurones, mais pas forcment les RNN et les ConvNets.
Jusqu prsent, nous avons voqu les applications du deep learning dans la recon-
naissance des formes. Le deep learning a-t-il dautres usages, notamment dans le co-
gnitif et dans lintelligence symbolique, jusquici lapanage des systmes experts ?
Oui, dans une certaine mesure. Dans la pratique, ces techniques dites cognitives sont
des techniques avances de traitement du langage avec une vision plus statistique que
logique.

Outils du deep learning


Poursuivons cette partie sur le deep learning en voquant loffre des outils de cration
des solutions les mettant en uvre. Il sagit doutils de dveloppement exploitant des
langages dclaratifs comme Python. Ils permettent de crer des modles de rseaux
de neurones avec leurs diffrentes couches.
La programmation consiste surtout dfinir la structure du rseau de neurones : le
nombre de couches caches, la taille des filtres et des feature maps pour les rseaux
de neurones convolutionnels, les fonctions de pooling (rduction de rsolution), puis
dclencher son entrainement avec une boucle de programme qui va scanner un jeu
de test tagg et faire de la rtropropagation de gradient dans le rseau de neurones60.
Les outils disponibles pour crer des solutions de deep learning sont le plus souvent
disponibles en open source, installables sur les machines et serveurs des utilisateurs
ou accessibles via des ressources serveur en cloud.
Les grands acteurs du numrique proposent tous leurs frameworks et outils open
source de cration de rseaux de neurones : TensorFlow chez Google, Torch chez
Facebook, Cortana NTK chez Microsoft, la plateforme Watson chez IBM ou encore
DSSTNE chez Amazon. Mais les startups ne sont pas en reste, comme Theano ou
H2O.

60
Cet article dcrit la prise en main avec quelques vidos bien choisies ainsi que les cours de Stanford associs :
http://blog.cremedelacreme.io/2017/06/01/digital-ressources-deep-learning/.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 61 / 362
Les modles de rseaux de neurones se dfinissent soit avec des fichiers de configu-
ration (Caffe, CNTK) soit par langage de programmation et notamment Python
(Torch, Theano, TensorFlow) ou encore Lea (pour Torch). Python est le langage le
plus utilis dans ce domaine. Ca tombe bien car il sert aussi dvelopper la partie
back-end de nombreux sites web.
Lun des frameworks sort du lot, tout du moins ct usage chez les startups : Ten-
sorFlow dont le dveloppement a t initialis par Google. Il fonctionne en embarqu
aussi bien que sur serveurs et dans le cloud. Cest le framework avec le spectre fonc-
tionnel qui semble le plus large, et qui se dploie facilement sur des architectures pa-
rallles, et notamment celles qui sont base de GPU comme ceux de Nvidia, ce qui
explique quil ressorte du lot dans la petit comparaison ci-dessous droite (source).
Le nom TensorFlow vient de Tensor qui dcrit les matrices multidimentionnelles g-
res par le systme. Google a annonc au Gogle I/O de juin 2017 la sortie de Tensor-
Flow Lite, une version allge ddie aux smartphones tournant sous Android. On
peut imaginer quelle sera utilisable dans dautres objets voir sur dautres systmes
dexploitation.

Une autre solution populaire est PyTorch, un surensemble de Torch exploitable en


Python. Alors que les donnes sont dfinies de manire statique dans Tensorflow,
elles le sont de manire dynamique dans PyTorch, apportant une plus grande sou-
plesse dans le dveloppement.
Dun point de vue pratique, haut niveau, la programmation dun rseau de neurones
de deep learning revient dfinir le modle du rseau lui-mme en dcrivant de ma-

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 62 / 362
nire quasiment littrale une une toutes ses couches (ci-dessous, un exemple en
Tensorflow et Python).

Il faut ensuite puis programmer son entrainement, ce qui peut requrir de


loptimisation programmatique, puis son excution en mode run-time (ci-dessous,
toujours en Tensorflow).

Loptimisation dun rseau de neurones peut dpendre des capacits de larchitecture


matrielle exploite. Ainsi, la taille des filtres dans les rseaux convolutionnels pour-
ra tre lie celle des multiplicateurs de matrices des GPU ou processeurs neuromor-
phiques utiliss dans les serveurs dentrainement.
De son ct, Theano est un projet acadmique lanc par lUniversit de Montral. Il
est trs bien support et apprci pour sa rapidit de fonctionnement. Il est aussi assez
couramment utilis dans les startups. Mais TensorFlow a pris le dessus depuis 2016.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 63 / 362
Certains outils sont exploits de manire combine. Ainsi, la bibliothque de prototy-
page de deep learning Keras peut-elle sappuyer sur TensorFlow ou Theano.
Ces diffrents outils sont aussi disponibles dans des offres en cloud, notamment chez
Google, Amazon, Microsoft, IBM et mme chez OVH.

Voici quelques-unes des solutions de deep learning les plus courantes pour les dve-
loppeurs de solutions extraites de ldition 2017 du Guide des Startups.

Outil Usage

IBM Watson est la solution dintelligence artificielle dIBM. Cest en fait un ensemble de
briques logicielles assez complet permettant de btir diffrentes formes dapplications
dintelligence artificielle, avec ce qui concerne la reconnaissance des images, de la parole ou de
textes ainsi que lautomatisation du raisonnement avec des moteurs de rgles et des solveurs. La
solution a des usages multiples : cration de robots conversationnels, aide au diagnostic et la
prescription dans limagerie mdicale, prdictions dans la finance, aide juridique automatise,
cyberscurit, etc. Watson est notamment fourni en cloud. Il est ssez couramment utilis par les
startups, IBM tant trs actif dans leur recrutement.

Scikit-Learn est un kit de dveloppement dapplications de machine learning et de deep learning


mettant en uvre les mthodes de classification, de rgression (prdiction) et de clustering. Il
sexploite en Python. La solution est en open source sous license BSD et est issue de lINRIA et
de Telecom Paritech. Sa communaut internationale comprend 1135 contributeurs depuis sa
cration avec environ 70 actifs par version.

TensorFlow est une bibiothque open source de dveloppement dapplications de machine lear-
ning dployable dans le cloud de manire rpartie ainsi que dans lembarqu. Elle est propose
sous forme de service en cloud par Google. Elle sert notamment dtecter des patterns, faire
de la classification automatique et des prdictions. Les Tensor Processing Units sont des pro-
cesseurs ddis au traitement avec TensorFlow qui ont t dvelopps par Google pour son
offre en cloud. Ils ont t notamment utiliss pour faire gagner DeepMind au jeu de Go en 2016.
En 2017, les TPU en taient dj leur seconde gnration.

Theano est un projet issu de lUniversit de Montral. Cest une bibliothque pour Python qui
peut sexcuter sur CPU ou GPU et sert exploiter des matrices pour faire du deep learning. Le
systme peut convertir des formules mathmatiques complexes en langage C pour optimiser le
temps de calcul.

Keras est une bibliothque open source crite en Python qui sappuie sur Deeplearning4j, Ten-
sorflow ou Theano. Elle permet de crer des solutions de deep learning base de rseaux de
neurones. Elle est issue du projet ONEIROS (Open-ended Neuro-Electronic Intelligent Robot
Operating System), et son principal auteur et contributeur est un franais, Franois Chollet, qui
travaille chez Google.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 64 / 362
CNTK est un framework open source de Deep Learning de Microsoft qui fait partie de leur
Cognitive Toolkit qui permet notamment de crer des agents conversationnels (chatbots). Mi-
crosoft propose une gamme dAPI complte pour presque toutes ls applications de machine
learning et de deep learning.

Amazon propose DSSTNE, une bibliothque en cloud pour la cration de solutions de recom-
mandation. Amazon propose aussi un grand nombre de bibliothques pour le traitement du
langage, la gnration de parole synthtique et la reconnaissance dimages.

Wit.ai est un framework de traitement du langage originaire de Facebook, ou plus prcisment,


dune acquisition de Facebook qui date de 2015. La startup avait t cre San Francisco par
un trio de franais, Alexandre Lebrun, Willy Blandin et Laurent Landowski.

Clarifai est une solution de deep learning en cloud qui sert notamment la reconnaissance
dimages, en particulier dans la sant et pour la cration de moteurs de recherche dimages.

PyBrain est une bibliothque de rseau de neurones btie en Python.

Vowpal Wabbit est une bibliothque open source provenant de Yahoo! Research et gre par
Microsoft Research. Elle permet de crer des solutions de machine learning en ligne. Comme la
grande majorit des bibliothques de machine learning, elle sert faire de la classification
automatique, de la prdiction, de la segmentation. Elle exploiter des CPU multicoeur et est
compile partir de C++.

Caffe est un framework open source de deep learning de Berkeley qui a t dvelopp avec
laide financire de Nvidia et Amazon. Il repose sur lutilisation ct serveurs de GPU Nvidia.
Un seul GPU nVidia permettrait de traiter 60 millions dimages par jour pour lentrainement
dun rseau convolutionnel.

Torch est un framework de deep learning utilis notamment dans la vision artificielle. Il est
utilis chez Facebook, Google et Twitter et provient de lUniversit de New York. On lexploite
notamment avec le langage Lua qui est une sorte de Python simplifi. Cest le framework prf-
r de Yann LeCun !

H2O.ai est un framework open source de machine et deep learning couramment utilis par les
data scientists. La startup qui en est lorigine a lev $33,6m. Elle est associe un backend de
distribution de traitements (Map/Reduce). Elle est exploitable partir de nombreux langages
comme R, Python, Java et Scala et via des API REST. Au passage, au printemps 2017, H2O,
Continuum Analytics et MapD Technologies lancaient linitiative GPU Open Analytics Initia-
tive (GOAI) pour crer un framework ouvert commun destin lexploitation en mmoire
danalytics sur GPU. Le tout avec la bndiction de Nvidia.

spaCy est une bibliothque open source de traitementr du langage pour Python. Elle permet
danalyser rapidement le contenu de textes en anglais, franais, allemand et espagnol. Elle
sinterface avec TensorFlow. Keras et SciKit-Learn.

Originaire de la fondation Apache, Mahout est un framework qui permet de dvelopper des
applications dIA scalable, en particulier dans des applications de classification automatique et
de filtrage collaboratif. Il est utilis chez Amazon.

Algorithmia est une place de march dalgorithmes et de briques logicielles dIA qui sont posi-
tionnes comme des micro services , et disponibles en cloud, faciles tester, intgrer et
mettre en production. Les services proposs sont assez classiques comme la dtection de visage
dans des photos ou lanalyse de sentiments dans les flux de rseaux sociaux.

Vous pouvez aussi simuler des rseaux de neurones simples avec cet outil exploitant
TensorFlow (exemple ci-dessous). TensorFlow peut en effet servir aussi bien grer
un rseau de neurones multicouches de deep learning tout comme des solutions plus
simples de machine learning, base ou pas de rseaux de neurones simples.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 65 / 362
Donnes
Reste voquer un autre point important pour le machine learning et le deep lear-
ning : lorigine et la qualit des donnes !
On distingue gnralement trois types de donnes pour entrainer un systme de ma-
chine learning et de deep learning : les donnes dentrainement, les donnes de test et
les donnes de production.

Les donnes dentrainement et de tests contiennent leur descriptif, savoir,


linformation qui doit tre gnre par le systme entrainer. Cest un jeu de test dot
dune bonne reprsentation spatiale de lespace du possible de lapplication.
On le dcoupe arbitrairement en deux sous-ensembles, lun pour lentrainement et
lautre pour les tests derreurs du rseau de neurones entrain. En gnral la part de la
base tagge ddie lentrainement est plus grande que celle qui est ddie aux tests.
Les donnes dentrainement et de tests sont indispensables pour la grande majorit
des systmes dIA dits superviss. Dailleurs, les systmes dits non superviss ont
aussi besoin au dpart de donnes tagges, mme si certaines tapes de
lentrainement sont non supervises, comme pour segmenter une base.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 66 / 362
On pourrait y ajouter les donnes de renforcement qui servent aux apprentissages par
renforcement. On peut considrer quil sagit de nouveaux jeux de donnes
dentrainement qui permettent dajuster celui dun rseau de neurones dj entrain.
Donnes dentrainement
Ce sont les jeux de donnes qui vont servir entrainer un modle de machine lear-
ning ou de deep learning pour en ajuster les paramtres. Dans le cas de la reconnais-
sance dimages, il sagira dune base dimages avec leurs tags corrrespondants qui
dcrivent leur contenu.
Plus la base est grande, meilleur sera lentrainement du systme, mais plus il sera
long. Si vous navez pas de donnes dj tagges pour entrainer un modle de ma-
chine learning ou deep learning, vous nirez pas bien loin !

Les bases dentrainement dimages ont une taille qui dpend de la diversit des objets
dtecter. Dans limagerie mdicale, des bases dentrainement de pathologies spcia-
lises peuvent se contenter de quelques centaines de milliers dimages pour dtecter
quelques centaines de pathologies. A lautre extrmit de la complexit, la base
dentrainement dimages de Google Search sappuie sur plus de cent millions
dimages et permet la dtection de plus de 20000 objets diffrents.
Lentrainement dun systme de 50 000 images dure au minimum un quart dheures
dans des ressources en cloud. Lorsque lon passe des centaines de millions
dimages, il faudra des milliers de serveurs et jusqu plusieurs semaines pour
lentrainement !
Dans la pratique, les jeux dentrainement de solutions de deep learning sont limits
en taille par la puissance de calcul ncessaire. Je ne sais pas dire si cet entrainement
peut fonctionner de manire incrmentale au gr de lajout de donnes o si il faut
relancer un batch de calcul complet. Les techniques de machine learning tradition-
nelles doivent pouvoir priori exploiter de plus gros volumes de donnes.
Il est videmment ncessaire de disposer de donnes dentrainement de qualit, ce qui
ncessite souvent un gros travail de filtrage et de nettoyage pralable.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 67 / 362
Donnes de test
Ce sont les donnes, galement tagges, qui serviront vrifier la qualit de
lentrainement dun systme. Ces donnes doivent avoir une distribution voisine des
donnes dentrainement, au sens o elles doivent tre bien reprsentatives de la diver-
sit des donnes que lon trouve dans la base dentrainement et que lon aura dans la
base de production.
Dans la pratique, les donnes de tests sont un sous-ensemble dun jeu de dpart dont
une partie sert lentrainement et une autre partie, plus limite, sert aux tests. Elles
seront injectes dans le systme entrain et on en comparera les tags rsultants avec
les tags de la base. Cela permettra didentifier le taux derreur du systme. On passera
ltape suivante lorsque le taux derreur sera considr comme acceptable pour la
mise en production de la solution.
Donnes de production
Il sagit des donnes non tagges qui alimenteront le systme lors de son utilisation
en production pour faire une prdiction des tags manquants.
Alors que les donnes dentrainement sont normalement anonymises pour
lentrainement du systme, les donnes de production peuvent tre nominatives ainsi
que les prdictions associes gnres par la solution.
La nouvelle rglementation GDPR de lUnion Europenne exige que les entreprises
conservent les donnes personnelles des utilisateurs ainsi que les donnes gnres.
Cela concerne donc priori les donnes gnres par les systmes base dIA. Une
donne personnelle gnre artificiellement reste une donne personnelle ! Et son
origine artificielle doit tre connue et traable en cas daudit.
Donnes de renforcement
Jutilise cette expression pour dcrire les donnes qui servent lapprentissage par
renforcement. Dans un chatbot, cela sera par exemple les donnes de ractivit des
utilisateurs aux rponses des chatbots permettant didentifier celles qui sont les plus
appropries.
En quelque sorte, sont sont des rsultats dA/B testing raliss sur les comportements
dagents base dIA. Tout ce qui pourra tre capt sur la raction du monde rel aux
agissements dun agent base dIA permettra potentiellement den ajuster le compor-
tement par rentrainement.
Origine des donnes
Les donnes alimentant les systmes dIA proviennent de lintrieur et/ou de
lextrieur de lentreprise.
Elles sont issues toutes sortes de capteurs divers : des objets connects, du plus
simple (thermomtre connect) aux plus sophistiqus (machine outil, smartphone,
ordinateur personnel). Comme pour les applications de big data habituelles, les
sources de donnes doivent tre fiables et les donnes bien extraites et prpares
avant dtre injectes dans les systmes base de machine comme de deep learning.
Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 68 / 362
Les solutions les plus avances exploitent conjointement des donnes ouvertes ex-
ternes et les croisent aux donnes que lentreprise est seule maitriser. Cest un bon
moyen de crer des solutions diffrencies.
Les donnes ouvertes sont issues de lopen data gouvernementale, des rseaux so-
ciaux et de diffrents sites spcialiss dans la fourniture de donnes, soit ouvertes,
soit payantes, comme des bases de prospects dentreprises ou de particuliers, selon
les pays et lgislations en vigueur.
Les donnes dentrainement des systmes dIA doivent tre bien tagges, soit auto-
matiquement, soit manuellement. De nombreuses bases de rfrence dimages tag-
ges lont t via de la main duvre recrute en ligne via des services du type
dAmazon Mechanical Turk61.
L encore, les entreprises et les startups devront prendre en compte le rglement eu-
ropen GDPR dans la collecte et le traitement des donnes personnelles. Leur porta-
bilit dun service lautre sera lune des obligations les plus complexes grer. Le
droit loubli galement62 !
Certaines tudes portant sur un seul type de rseau de neurones montrent quune IA
avec plus de donnes est plus efficace quune IA avec un meilleur algorithme.
La performance des algorithmes joue cependant un rle cl dans la qualit des rsul-
tats dans le deep learning, et surtout dans leur performance, notamment la rapidit de
la phase dentrainement des modles.
Pour ce qui est de la reconnaissance des images, il faut distinguer le temps
dentrainement et le pourcentage de bonnes reconnaissances.
Les progrs des algorithmes visent amliorer lune comme lautre. La taille des jeux
de donnes est en effet critique pour bien entrainer un modle. Si lalgorithme utilis
nest meilleur que dans la vitesse dentrainement, ce qui est souvent le cas dans des
variantes de rseaux de neurones convolutionnels, alors, la performance de la recon-
naissance ne changera pas lors de lexcution du modle entrain. Par contre, avec
plus de donnes dentrainement, celui-ci sera plus long.

61
Cf Inside Amazon's clickworker platform: How half a million people are being paid pennies to train AI, de Hope Reese et Nick
Heath, 2016.
62
Lorsquun rseau de neurones aura t entrain avec des donnes personnelles de millions dutilisateurs, la suppression des don-
nes personnelles dune base de donnes ne signifiera pas automatiquement quelles ont disparu du rseau de neurones entrain avec.
Mais les donnes utilises dans lentrainement sont normalement anonymises puisquelles servent dteminer des caractristiques
des utilisateurs partir de paramtres divers (localisation, comportement, usages). Les donnes ont beau tre anonymises, elles
figurent sous la forme dinfluence probabiliste du rseau de neurones entrain. Influence qui est normalement ngligeable lchelle
dun seul utilisateur. A lenvers, un rseau de neurones bien entrain peut deviner des caractristiques caches dun client via son
approche probabiliste. Ces informations dduites doivent donc probablement tre aussi bien protges que les informations dorigine
sur lutilisateur.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 69 / 362
Donc, comme illustr dans mon petit schma ci-dessous, il faut la fois de meilleurs
jeux de donnes et de meilleurs algorithmes pour que lentrainement soit aussi rapide
que possible. Cest notamment utile pour rduire la consommation nergtique de
lIA. Bref, pour faire de lIA verte63 !

O ces donnes sont-elles stockes ? Elles peuvent ltre sur les serveurs de
lentreprise ou dans le cloud et si possible dans un cloud bien priv de lentreprise.
Contrairement une ide rpandue, les services de cloud issus des GAFAMI
nexploitent pas les donnes des entreprises qui y sont stockes. Seules celles qui
proviennent des services grand public (moteurs de recherche, rseaux sociaux, email
personnels) peuvent ltre.
Par contre, les donnes qui circulent sur Internet peuvent tre interceptes par certains
services de renseignement qui ont install des sondes sur les points daccs des
grandes liaisons intercontinentales. La DGSE le fait pour les fibres qui arrivent en
France et la NSA pour celles qui arrivent aux USA, en gnral des fins de rensei-
gnement sur le terrorisme mais cela peut dborder sur dautres besoins !
Biais des algorithmes et des donnes
Le biais des algorithmes est souvent voqu car il peut affecter les rsultats des trai-
tements de machine learning et de deep learning. Mais le biais le plus fort est celui
des donnes qui les alimentent.

63
Cest un des objectifs du chercheur Stphane Canu de lINSA Rouen qui planche sur loptimisation de gros modles de vision
artificiel et de traitement du langage. Do le projet de recherch collaborative Deep in France lanc par diffrents laboratoires et
financ par lANR.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 70 / 362
Deux annecdotes lillustrent parfaitement : chez Facebook, les femmes ingnieures de
couleur se sont rendu compte que les dtecteurs de main dans les distributeurs de sa-
von dans les WC ne fonctionnaient pas avec elles. Pour ces mmes personnes, cer-
tains systmes de reconnaissance de visages ne fonctionnent pas mieux. Pourquoi
donc ?
Dans le premier cas, cela peut-tre li au capteur utilis. Dans le second, cest une
histoire de donnes dentrainement qui ont aliment le systme de reconnaissance de
visage. Le point commun : les crateurs de ces systmes navaient pas de personnes
de couleur dans leurs quipes techniques. Do un biais dans le matriel, dans les lo-
giciels et les donnes.

Une IA doit donc tre alimente par des jeux de donnes dentrainement qui sont les
plus reprsentatives des usages couvrir, et notamment en termes de diversit
dutilisateurs. Cela demande de lempathie, cela exige pour les crateurs de ces solu-
tions de sortir de leur cadre de vie habituel64.
En termes statistiques, cela veut dire que les donnes doivent avoir un fort cart type
et une distribution similaire celle du march vis.Les donnes dentrainement dIA
qui portent sur le fonctionnement de machines doivent rpondre aux mmes exi-
gences.
Ainsi, si on entraine une IA reconnaitre le bruit de moteurs en panne, il faut dispo-
ser dune base dentrainement de bruits de moteurs reprsentative des divers types de
pannes qui peuvent affecter les-dits moteurs. Sinon, certaines pannes ne seront pas
dtectes en amont de leur apparition.

Agents
Dans ce concept apparu dans les annes 1990, les agents intelligents permettent de
rsoudre des problmes dans des architectures distribues. Conceptuellement, un
agent est un logiciel ou un matriel qui capte de linformation, dcide dagir ration-

64
Cf Forget Killer RobotsBias Is the Real AI Danger de John Giannandrea (Google), octobre 2017,

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 71 / 362
nellement en fonction des donnes rcupres et dclenche une action pour optimiser
ses chances de succs.
Si cest du matriel, il comprendra des capteurs et des actuateurs. Mais il peut ntre
que du logiciel et obtenir des donnes brutes en entres et gnrer des donnes en sor-
tie.
Un agent ragit donc en fonction de lenvironnement et de prfrence en temps rel.
Les agents intelligents sont intgrs dans des systmes distribus dnomms systmes
multi-agents avec des agents autonomes, mais relis et collaborant entre eux.
Les agents sont autonomes, ils appliquent des rgles et vont jusqu apprendre les
modifier en fonction de lenvironnement, ils peuvent tre proactifs et pas seulement
ractifs lenvironnement, ils communiquent et cooprent avec dautres agents et
systmes.
Dans la pratique, les solutions dintelligence artificielle sont des agents ou des r-
seaux dagents ! Les rseaux dagents fonctionnent de manire coordonne et collec-
tive. La coordination de rseaux dagents est un domaine scientifique part entire.
On compte notamment les Distributed Problem Solving (DPS) qui dcoupent un
problme en sous-problmes qui sont rsolus de manire cooprative entre plusieurs
agents relis les uns aux autres. Ces systmes sont conus pour rsoudre des pro-
blmes bien spcifiques.

Les types dagents


Les agents sont classifis par Russell & Norvig dans Artificial Intelligence A Mo-
dern Approach (2003-2009) en types distincts selon leur niveau dautonomie et leur
mode de prise de dcision :
Les simple reflex agents qui comprennent des capteurs, des rgles indiquant
quelle action mener et des actuateurs pour les dclencher. Ils travaillent en temps
rel.
Les model based reflex agents qui ajoutent un moteur dtat capable de mmori-
ser dans quel tat se trouve lobjet et qui valuent limpact des actions pour chan-
ger dtat.
Les goal-based agents qui prennent leur dcision en fonction dun objectif et d-
terminent une action pour latteindre.
Les utility-based agents qui prennent leur dcision en fonction dun but at-
teindre qui est plus gnral.
Les learning agents qui contiennent une fonction dauto-apprentissage.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 72 / 362
Vu de haut, les rseaux dagents ressemblent aux rseaux de neurones mais leur
mode de fonctionnement est diffrent. Un agent peut trs bien tre lui-mme indivi-
duellement construit avec un rseau de neurones pour raliser une tche spcifique
comme la reconnaissance de la parole ou dimages.

Les solutions dIA sont des rseaux dagents


Un autre agent va utiliser le texte gnr par la reconnaissance puis appliquer un pro-
cessus de reconnaissance smantique, puis un autre va traiter la question, fouiller
dans une base de donnes ou de connaissance, rcuprer des rsultats, un autre va
formuler une rponse et la renvoyer lutilisateur. Idem pour un systme de traduc-
tion automatique qui va dabord analyser la parole avec un premier agent, puis rali-
ser la traduction avec un second, puis utiliser un troisime agent de text to speech
pour transformer le rsultat de manire audible.
Un robot conversationnel est aussi un rseau dagents, surtout si on interagit avec la
voix avec lui. Les agents sont notamment utiliss dans les systmes de call centers.
Une start-up franaise stait lance - parmi dautres - sur ce crneau : Virtuoz. Elle a
t acquise en 2013 par lamricain Nuance. Il existe mme un concours du meilleur
agent de service client en ligne, lanc en 2016 en France avec une trentaine de can-
didats !
Un robot autonome est aussi un condens de nombreux agents qui grent diffrents
niveaux dabstraction avec de nombreux capteurs, de la mcanique, des systmes
permettant au robot de savoir o il est, avec quoi il interagit, et qui a des missions
accomplir (aider une personne, conduire un vhicule, etc).
Un robot est particulirement complexe mettre au point car il cumule des dfis au
niveau des capteurs, de lintgration de ses sens, de la mcanique pour se mouvoir, de
la batterie pour son autonomie, et dans lintelligence artificielle pour piloter
lensemble et ventuellement interagir la fois mcaniquement, visuellement et ora-
lement avec son environnement, notamment sil sagit de personnes.
Cest dans le domaine de lintelligence artificielle intgrative que des progrs signi-
ficatifs peuvent tre raliss. Elle consiste associer diffrentes mthodes et tech-
niques pour rsoudre des problmes complexes voire mme rsoudre des problmes
gnriques. On la retrouve mise en uvre dans les agents conversationnels tels que
ceux que permet de crer IBM Watson ou ses concurrents.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 73 / 362
Dans le jargon de linnovation, on appelle cela de linnovation par lintgration. Cest
dailleurs la forme la plus courante dinnovation et lIA ne devrait pas y chapper.
Cette innovation par lintgration est dautant plus pertinente que les solutions dIA
relvent encore souvent de lartisanat et ncessitent beaucoup dexprimentation et
dajustements.
Cette intgration est un savoir nouveau forte valeur ajoute, au-del de lintgration
traditionnelle de logiciels via des APIs classiques. Cette intelligence artificielle int-
grative est luvre dans un grand nombre de startups du secteur et en particulier
dans celles de la robotique.
Le mlange des genres nest pas vident dcrypter pour le profane : machine lear-
ning, deep learning, support vector machines, modles de Markov, rseaux baysiens,
rseaux neuronaux, mthodes dapprentissage supervises ou non supervises, etc.
Do un discipline qui est difficile benchmarker dun point de vue strictement tech-
nique et dgal gal. Ce dautant plus que le march tant trs fragment, il y a peu
de points de comparaison possibles entre solutions. Soit il sagit de produits finis du
grand public comme la reconnaissance dimages ou vocale, et dagents conversation-
nels trs la mode en ce moment, soit il sagit de solutions dentreprises exploitant
des jeux de donnes non publics.
Quid des outils de dveloppement associs la cration de rseaux dagents ? Il y en
a plein, et notamment en open source.

La programmation gntique
La vie artificielle et la programmation gntique sont dautres pans de recherche
important connexe aux recherches sur lIA. Il sagit de crer des modles permettant
de simuler la vie avec un niveau dabstraction plus ou moins lev. On peut ainsi si-
muler des comportements complexes intgrant des systmes qui sauto-organisent,
sauto-rparent, sauto-rpliquent et voluent deux-mmes en fonction de contraintes
environnementales. Et les lments les moins efficaces de ces systmes sont limins,
comme dans le processus de slection naturelle dcrit par Darwin.

Ces systmes exploitent des algorithmes volutifs qui sont la croise des chemins
du deep learning et des rseaux dagents. Ils consistent tester diffrentes combinai-
sons de rseaux de neurones voire de rseaux dagents les intgrant pour comparer
leur efficacit et conserver les variantes les plus efficaces.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 74 / 362
Cest une reproduction informatique du principe de la slection darwinienne. Reste
sassurer quils sont efficaces, ce qui est loin dtre vident vue la combinatoire de
scnarios quils peuvent tre amens simuler !

Artificial General Intelligence


Au plus haut niveau conceptuel, on segmente lIA en IA forte qui imiterait le cerveau
humain avec une conscience et IA faible, qui voluerait de manire incrmentale
partir doutils plus lmentaires.
La distinction entre IA forte et IA faible se retrouve dans cette classification de la
porte de lIA avec trois niveaux dIA : lANI, lAGI et lASI.

LArtificial Narrow Intelligence (ANI) correspond la capacit de traitement de


problmes dans un domaine prcis. Cest ltat de lart actuel, exploitant aussi bien le
machine learning que le deep learning ou les systmes experts. On peut y mettre en
vrac les moteurs de recherche courants, la dtection de fraudes bancaires, le credit
rating de particuliers, la conduite automatique ou assiste, Apple SIRI, Amazon
Alexa, Microsoft Cortana et Google Now.
Si lIA nimite pour linstant pas encore lintelligence humaine, la force brute et
lusage dlments techniques dont lhomme ne dispose pas comme la vitesse de trai-
tement et le stockage de gros volumes de donnes permettent dj la machine de
dpasser lhomme dans tout un tas de domaines ! Et ce nest pas nouveau ! Un ta-
bleur est dj des millions de fois plus puissant que le lhomme dou des meilleurs
capacits de calcul mental ! La mmoire brute dun Homme est trs limite. Certains
estiment quelle ne comprendrait quun Go de donnes !

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 75 / 362
LArtificial General Intelligence (AGI) correspond conceptuellement au niveau
dintelligence quivalent celui de lHomme, avec un ct polyvalent, avec la capa-
cit raisonner, analyser des donnes et rsoudre des problmes varis.
LAGI est en fait dans la continuit des travaux des pioniers de lIA qui cherchaient
crer des systmes dIA capables de rsoudre de manire gnrique toutes sortes de
problmes et en avaient mme relanc lide au milieu des annes 2000 dans
linitiative HLAI (Human Level AI).
On peut intgrer dans ce niveau un grand nombre des capacits humaines : lusage du
langage la fois comme metteur et rcepteur, lapprentissage par la lecture ou
lexprience, la mmoire et en particulier la mmoire associative, lusage de la vue et
les autres sens, le jugement et la prise de dcisions, la rsolution de problmes multi-
facettes, la cration de concepts, la perception du monde et de soi-mme, linvention
et la crativit, la capacit ragir limprvu dans un environnement complexe
physique comme intellectuel ou encore la capacit danticipation 65. Et plus haut ni-
veau, il faut intgrer la conscience, les sentiments, la sagesse et la connaissance de soi.
On pourrait y ajouter la capacit ressentir des motions personnelles ou sentir celle
des autres (lempathie), avoir des envies et des dsirs et aussi savoir grer ses pul-
sions et agir avec plus ou moins de rationalit. Cette liste est trs longue ! Pour
linstant, on est encore trs trs loin de lAGI, mme si certaines de ces capacits no-
tamment linguistiques et de raisonnement gnral sont en train de voir le jour.
Jusqu prsent, les solutions dIA fonctionnaient un niveau de raisonnement relati-
vement bas. Il reste crer des machines capables de grer le sens commun, une
forme dintelligence gntique capable la fois de brasser le vaste univers des con-
naissances au-del de nos capacits et dy appliquer un raisonnement permettant
didentifier non pas des solutions mais des problmes rsoudre. Il reste apprendre
aux solutions dIA davoir envie de faire quelque chose. On ne sait pas non plus aider
une solution dIA prendre du recul, changer de mode de raisonnement dynami-
quement, mettre plusieurs informations en contexte, trouver des patterns de res-
semblance entre corpus dides dunivers diffrents permettant de rsoudre des pro-
blmes par analogie. Il reste aussi dvelopper des solutions dIA capables de crer
des thories et de les vrifier ensuite par lexprimentation.
Pour ce qui est de lajout de ce qui fait de nous des tres humains, comme la sensa-
tion de faim, de peur ou denvie, dempathie, de besoin de relations sociales, lIA ne
lintgre pas. Ce nest dailleurs pas ncessaire pour rsoudre des problmes courants
auxquels sattaquent les solutions base dIA. Comme lindique si bien Yuval Noah
Harari, lauteur du best-seller Sapiens66, Lconomie a besoin dintelligence, pas
de conscience ! Laissons donc une partie de notre intelligence voire une intelligence
plus dveloppe aux machines et conservons la conscience, les motions et la crati-
vit !

65
On continue den dcouvrir tous les jours sur les principes biologiques de base de lintelligence humaine, comme dans Brain Com-
putation Is Organized via Power-of-Two-Based Permutation Logic publi fin 2016..
66
Intervenant en juin 2016 dans la confrence USI organise par Octo Technology Paris.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 76 / 362
Lavnement ventuel dune AGI dpend la fois des progrs matriels et de notre
comprhension toujours en devenir du fonctionnement du cerveau humain qui fait
partie du vaste champ de la neurophysiologie, coiffant des domaines allant de la neu-
robiologie (pour les couches basses) la neuropsychologie (pour les couches
hautes). Le fonctionnement du cerveau apparait au gr des dcouvertes comme
tant bien plus complexe et riche quimagin. Les neurones seraient capables de
stocker des informations analogiques et non pas binaires, ce qui en multiplierait la
capacit de stockage de plusieurs ordres de grandeur par rapport ce que lon croyait
jusqu il y a peu de temps.
On sait par contre que le cerveau est la fois ultra-massivement parallle avec ses
trillions de synapses reliant les neurones entre elles mais trs lent (clock de 100 Hz
maximum).
Cest aussi un engin trs efficace du point de vue nergtique, ne consommant que
20W, soit lquivalent dun laptop quip dun processeur Intel Core i7.
Quelques cas pratiques dusage de lAGI ont t dfinis par le pass, comme le test
de Turing (agent conversationnel que lon ne peut pas distinguer dun humain), le test
de la machine caf de Steve Wozniak (un robot peut entrer dans un logement, trou-
ver la machine caf, leau, le caf et la tasse, faire le caf et le servir), le test de
ltudiant robot capable de suivre de cours et passer avec succs les examens, celui
du chercheur capable de mener des travaux de recherche et enfin, celui du salari de
tel ou tel mtier.

Les prdictions sur lavnement de lAGI sont souvent associes un usage quelque
peu abusif et prospectif de la loi de Moore. Elles sappuient aussi sur une vision sim-
pliste et unidimentionnelle de lintelligence.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 77 / 362
LArtificial Super Intelligence (ASI) serait une intelligence largement suprieure
lHomme. Cest la continuit logique de ltape prcdente, lie la puissance des
machines qui se dmultiplierait et se distribuerait plus facilement que celle dun cer-
veau humain avec ses entres-sorties et ses capacits de stockages et de traitement
limites et locales. Cette intelligence pourrait disposer de capteurs globaux : sur
lenvironnement, sur lactivit des gens, leurs dplacements, leurs loisirs, leurs tats
dme. Superintelligence va avec superinformation et super big data !
A vrai dire, une AGI serait demble largement suprieure lHomme car elle acc-
derait facilement tout le savoir humain dj numris67.
A ce niveau, lintelligence de la machine dpasserait celle de lhomme dans tous les
domaines y compris dans la crativit et mme dans lagilit sociale. Le point de d-
passement est une singularit. Il est voqu dans de nombreux ouvrages comme
The Singularity is Near de Ray Kurzweil.
Pour de nombreux prospectivistes, lASI apparaitrait trs peu de temps aprs lAGI,
lordinateur faisant preuve de capacits se reproduire lui-mme, y compris
lchelle matrielle. Cest videmment une vue de lesprit, tout du moins, lorsque
lon observe la manire donc fonctionnent les data-centers. Mais si ceux-ci taient
entirement robotiss et aliments en serveurs et systmes de stockage par des ca-
mions autonomes eux-mmes aliments par des usines entirement autonomes, pour-
quoi pas. Do le besoin de prserver un minimum de contrle humain dans ces pro-
cessus.
Dans lessai The Singularity A philosophical analysis, le philosophe australien
David J. Chalmers propose de tester dabord lASI dans un environnement entire-
ment virtuel entirement dconnect du monde rel pour tester ses aptitudes. Si cela
peut rassurer 68!
Dans la plupart des prdictions sur lavnement de lASI, il est fait tat de la difficul-
t la contrler. Une majeure partie des prdictions envisagent quelle soit mme n-
faste pour lhomme malgr son origine humaine. Elles voquent une course contre la
montre entre startups et grandes entreprises pour tre les premiers crer cette ASI.
Voir une course face lun des plus gros financeurs de lIA : la DARPA.

67
Dans The inevitable , publi en 2016, Kevin Kelly estime la production de contenu humaine depuis les sumriens 310 millions
de livres, 1,4 milliards darticles et essais, 180 millions de chansons, 330 000 films de long mtrage, 3,5 trillions dimages, un mil-
liard dheures de vido, tlvision et courts mtrages, et 60 trillions de pages web publiques. Et chaque anne, le stock sagrandirait
avec 2 millions de livres, 16 000 films (dont nous ne voyons qu peine 1%), 8 millions de chansons et 30 milliards darticles de
blogs. Cela ne comprend pas les donnes brutes issues dusages numriques (tlcoms, rseaux sociaux, objets connects). Cela
reprsenterait 50 pta-octets de donnes. Avec les dernires technologies de stockage SSD, tout cela tiendrait dans un simple rack de
data center. Cf le dernier SSD dIntel. Lintgration de toute cette connaissance dans un rseau de neurones de deep learning se heur-
terait cependant des limites techniques pas videntes surmonter. Mais avec un bon moteur de recherche, une AGI aurait toutefois
une bonne capacit exploiter cette base de connaissances en fonction des besoins.
68
On peut aussi se rassurer avec ce trs bon papier Ruper Goodwins paru en dcembre 2015 dans Ars Technica UK : Demystifying
artificial intelligence: No, the Singularity is not just around the corner.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 78 / 362
Toutes ces conjectures semblent bien thoriques. Elles partent du principe quune
ASI contrlerait sans restriction toutes les ressources humaines. Elles sappuient aussi
sur la possibilit que toutes les scurits informatiques dorigine humaine pourront
tre casses par une ASI. Cest une vision dystopique et anthropomorphique du rle
des machines.
Dans la pratique, lIA daujourdhui va dj bien au-del des capacits humaines, no-
tamment lorsque la mmoire est en jeu. La capacit des systmes experts, et notam-
ment dIBM Watson, brasser dnormes volumes dinformation fournit des capaci-
ts dj largement inaccessibles nimporte quel humain, mme surdou. LASI cor-
respond donc un mlange des genres entre les domaines o lhomme est dj dpas-
s et ceux o il ne lest pas encore et le deviendrait ventuellement.
Le sujet de lAGI est en tout cas un thme de recherche trs actif. Il intgre de la re-
cherche haut niveau conceptuel pour btir des systmes intgrant les mcanismes de
lintelligence et un niveau pratique avec des startups qui ambitionnent de rvolu-
tionner le secteur, souvent en associant les notions de deep learning et de systmes
experts.
Les travaux de startup dans lAGI sont maintenant courants. Il y a Numenta qui
planche sur la simulation du cortex depuis plus dune dcennie avec ses rseaux de
neurones HTM (Hiearchical Temporal Memory). Et puis Kernel qui souhaite crer
une prothse neuronale pour lHomme69 ! Google DeepMind a fait parler de lui en
prsentant PathNet, une sorte de rseau dagents intgrant des rseaux de neurones et
capable didentifier par lui-mme la meilleure combinaison de rseaux de neurones
pour atteindre un objectif donn.

LAGI a aussi eu son camp de dtracteurs et dans toutes les dcennies rcentes (liste
ci-dessous). En France, nous avons le chercheur Jean-Gabriel Ganacia70 auteur du
Mythe de la singularit .

69
Cf https://medium.com/@bryan_johnson/kernels-quest-to-enhance-human-intelligence-7da5e16fa16c#.i0pveroe9.
70
Cf http://internetactu.blog.lemonde.fr/2017/06/25/la-singularite-ca-ne-tient-pas-la-route/

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 79 / 362
Enfin, il reste lhumour. Pour russir le test de turing, il existe une solution trs
simple : rendre les gens moins intelligents ! Cest dailleurs limpact quont souvent
les outils numriques, avec les diffrentes formes daddiction quils gnrent. Cest la
thse ironique de Piero Scaruffi71 et aussi celle de Nicholas Carr72.

Je vais maintenant mintresser au fonctionnement du cerveau pour en valuer la


complexit et la difficult en modliser le comportement dans de lIA.

Imiter ou sinspirer du cerveau humain


Le concept mme dIA ne fait pas lunanimit dans sa dfinition. Pour les puristes, un
simple rseau de neurones ou un systme de reconnaissance dimages ne relve pas
proprement parler de lIA. Tout dpend de la dfinition que lon se donne de lIA, et
notamment si la dfinition est anthropocentre ou pas.
Cest un peu comme la magie. Tant que lon ne connait pas le truc, cest de la magie
voire de lart. Une fois quon le connait, cest une technique, souvent trs simple, si
ce nest vidente. Lintelligence humaine est un peu du mme ressort quand on nen

71
Dans Artificial Intelligence and the Singularity, octobre 2014.
72
Dans Is Google making us stupid, dans The Atlantic, juillet 2008.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 80 / 362
connait pas le fonctionnement exact. Elle prserve ce ct mystrieux et inimitable,
presque immatriel, comme une me qui naurait pas dexistence physique.
Au gr des dcouvertes en neurobiologie et en sciences cognitives, cette magie perd
petit petit de son lustre. Lhomme nest aprs tout quune machine biologique trs
sophistique issue de lvolution. Certes, une machine complexe, une machine dont
le fonctionnement dpend dun trs grand nombre de paramtres environnementaux
et de laccumulation dexpriences, mais une machine tout de mme. Cest la pre-
mire dentre elles qui soit dailleurs capable den comprendre son fonctionnement
interne !

.
Doit-on absolument chercher copier ou imiter le cerveau humain pour crer des so-
lutions numriques ? Dans quel cas limitation est-elle utile et dans quels cas
linspiration seulement ncessaire ? Doit-on chercher crer des machines plus intel-
ligentes que lhomme dans toutes ses dimensions ?
Lexemple de laviation peut servir de bonne base de rflexion. Lavion sinspire de
loiseau mais ne limite pas pour autant. Les points communs sont davoir des ailes et
dutiliser la vitesse et la portance des ailes pour voler.
Le concept diverge alors rapidement : les avions nont pas dailes mobiles faites de
plumes ! En lieu et place, leurs ailes sont gnralement fixes et les moteurs sont h-
lice ou sont des racteurs. Lavion dpasse largement loiseau dans la vitesse (super-
sonique pour les avions militaires), la taille (B747, A380, Galaxy C5, Antonov 124),
la capacit demport (qui se mesure en dizaines de tonnes), laltitude (10 km pour un
avion de ligne) et la rsistance du froid (il y fait environ -50C, ce quun organisme
biologique dvelopp peu difficilement supporter longtemps, mme avec un bon
plumage). Les avions sont par contre trs infrieurs aux oiseaux ct efficacit ner-
gtique et flexibilit, mme si la densit nergtique de la graisse animale est voisine
de celle du krosne (37 vs 43 Mga Joules/Kg).
Le bio-mimtisme a t utile au dbut pour conceptualiser lavion, que ce soit dans
les schmas de Lonard de Vinci ou de lavion de Clment Ader qui taient trs
proches de loiseau. Si la motorisation dun avion est trs diffrente de celle des oi-
seaux qui battent de laile, les plumes se dployant au moment de latterrissage et du
dcollage sont cependant rapparues sous la forme des volets hypersustentateurs, in-
vents par Boeing pour ses 707 lancs la fin des les annes 1950 (description) et
dont la forme la plus labore a t intgre aux Boeing 747 (ci-dessous), dont les
premiers vols ont eu lieu en 1969.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 81 / 362
Laigle est lun des oiseaux les plus rapides au monde, atteignant 120 Km/h. Un
avion de ligne classique atteint 1000 Km/h et il touche le sol, volets hypersustenta-
teurs dploys, environ 200 Km/h. Un A380 dcolle en 2700 m et atterri sur 1500
m. Un aigle se pose en quelques secondes et presque nimporte o ! Cest la puis-
sance contre la flexibilit. Il faut se pencher du ct des drones de poche pour retrou-
ver une part de la flexibilit des oiseaux mais leur autonomie est gnralement bien
plus limite que celles des oiseaux, surtout les oiseaux migrateurs qui peuvent voler
plusieurs heures daffile avant de se reposer au sol.
LIA suit un chemin voisin dans le biomimtisme : certaines caractristiques du cer-
veau des mammifres sont imites dans les rseaux de neurones, le machine et le
deep learning. Mais des diffrences fondamentales font diverger intelligence humaine
et de la machine : la fois ses entres et sorties tout comme la structure de sa m-
moire et du raisonnement. La machine se distingue pour linstant par la capacit de
stockage et danalyse dimmenses volumes dinformation et par sa puissance de cal-
cul brute.
Lhomme dispose de capteurs sensoriels en quantit astronomique quaucun objet
connect ngale ce stade, ce qui, associs au cortex, lui procure une mmoire sen-
sorielle qui accumule les souvenirs pendant toute son existence, provenant des en-
tres/sorties que sont les nerfs optiques, auditifs et olfactifs, ainsi que ceux qui grent
le toucher, faits de millions de neurones irrigant en parallle notre mmoire senso-
rielle. Cest une force et une faiblesse. Nos motions lies cette mmoire sensorielle
gnrent la peur de certains risques et des prises de dcisions pouvant tre irration-
nelles. Ensuite, le niveau de complexit du cerveau dpasse lentendement.
Il nempche que, par la force brute, lIA dpasse dj lHomme dans tout un tas de
domaines, notamment lorsquil faut cruncher de gros volumes de donnes qui nous
chappent compltement. Quand elle a accs de gros volumes de donnes comme
dans loncologie ou en exploitant les donnes issues dobjets connects, lIA peut
faire des merveilles.
Elle est dailleurs plutt inoprante sans donnes. Elle ne sait pas encore quoi cher-
cher ni prendre dinitiatives. Et les algorithmes sont encore trs limits car les don-
nes de notre vie ne sont, heureusement, pas encore consolides. Cela explique les
limites de ces algorithmes de recommandation qui ne savent pas ce que jai dj vu
ou fait et ne sont pas prts de le savoir. Ils ne peuvent donc pas faire de recommanda-
tion totalement pertinente. Le jour o toute notre vie sera suivie par des objets con-
nects depuis la naissance, il en sera peut-tre autrement.
Quen est-il du raisonnement humain ? Celui-ci ne semble pas hors de porte des ma-
chines. On arrive petit petit le modliser pour des tches trs spcialises. Mais
lIA manque encore de souplesse et de capacit dadaptation une grande varit de
situations. Bref, de jugeote ! Mais il nest pas inconcevable darriver fournir une
intelligence gnrique une machine. On y arrivera pas ttonnements, par intgration
de briques algorithmiques et logicielles disparates, et pas seulement via la force brute
de la machine.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 82 / 362
Dcoder le cerveau
Comprendre le cerveau en modlisant son fonctionnement reste cependant un objectif
de nombreux chercheurs. Lide nest pas forcment de le copier, mais au moins de
mieux connaitre son fonctionnement pour dcouvrir des traitements de certaines pa-
thologies neurodgnratives.
De nombreuses initiatives de recherche nationales et internationales ont t lances
dans ce sens. Inventories ici, elles sont issues dEurope, des USA, mais aussi du
Japon, dAustralie, dIsral, de Core et dInde.
Le projet europen Human Brain Project vise simuler numriquement le fonc-
tionnement dun cerveau. Lanc aprs la rponse un appel doffre par Henry
Markram de lEPFL de Lausanne, un chercheur lorigine du Blue Brain Pro-
ject lanc en 2005, qui vise crer un cerveau synthtique de mammifre. Construit
partir dun supercalculateur Blue Gene dIBM et faisant tourner le logiciel de rseau
de neurones de Michael Hines, le projet vise simuler de manire aussi raliste que
possible des neurones73.
Disposant dun budget communautaire de 1Md tal sur cinq ans, le Human Brain
Project ambitionne de manire aussi large que possible damliorer la comprhension
du fonctionnement du cerveau, avec en ligne de mire le traitement de pathologies
neuro-crbrales et la cration davances technologiques dans lIA. Il est criti-
qu ici et l. Il fait penser un peu Quaero par son aspect dissmin. Les laboratoires
franais ont rcolt 78m de financement, notamment au CEA, tandis que ceux
dAllemagne et la Suisse se sont taills la part du lion avec respectivement 266m et
176m. On se demande qui fera lintgration !

Dans la pratique, cest plutt un projet de big data qui sloigne du cerveau. En effet,
les modles de simulation ne sappuient plus du tout sur la connaissance biologique
actualise que lon du fonctionnement des neurones dans le cerveau.

73
Jai eu loccasion de rentrer un peu plus en dtails dans ce projet dans http://www.oezratty.net/wordpress/2017/startups-bidouille-
cerveau-autres/ publi en juin 2017.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 83 / 362
Les USA ne sont pas en reste avec la BRAIN Initiative annonce par Barack Obama
en 2013. Elle vise mieux comprendre le fonctionnement du cerveau. Lobjectif an-
nonc semble plus oprationnel que celui des europens : mieux comprendre les ma-
ladies dAlzheimer et de Parkinson ainsi que divers troubles neuronaux.
Le budget annuel est de lordre de $100m, donc, in fine, du mme ordre de grandeur
que le Human Brain Projet. Parmi les projets, on trouve des initiatives en nano-
technologies pour mesurer lactivit individuelle de cellules nerveuses, commencer
par celles des mouches drosophiles.
On peut aussi citer le Human Connectome Project, lanc en 2009, un autre projet
amricain, financ par le NIH comme la BRAIN Initiative, et qui vise cartographier
avec prcision les diffrentes rgions du cerveau (exemple ci-dessus avec les princi-
pales liaisons nerveuses internes au cerveau).
De son ct, le projet Allen Brain Atlas planche sur la cartographie du cerveau de
diffrentes espces dont lhomme et la souris, au niveau de lexpression des gnes de
ses diffrentes cellules nerveuses. La plateforme et les donnes associes sont ou-
vertes. Des chercheurs de lUniversit de Berkeley ont mme russi crer une car-
tographie prcise de la smantique du cortex.
Reste aussi, ct neurobiologie, comprendre le processus dapprentissage des en-
fants en bas ge et jusqu 20 ans. Comment le cerveau se cble-t-il pendant les
phases dapprentissage ? Comment sparer linn de lacquis dans les processus
dapprentissage ? On dissque les souris, mais bien videmment pas les enfants en
bas ge. Donc, on ne sait pas trop. Et lIRM est insuffisante. Les chinois et les japo-
nais planchent sur une voie intermdiaire en cartographiant le cerveau de singes qui
sont plus proches de lhomme que les rongeurs.
Pour rsumer, un bon nombre de recherches portent sur le fonctionnement du cerveau,
avec une intersection avec les recherches en intelligence artificielle.

Copie du cerveau
Dans The Singularity is Near74, Ray Kurweil fantasme sur la capacit venir de
transplanter un cerveau dans une machine et datteindre ainsi limmortalit, incarna-
tion ultime du solutionnisme technologique qui cherche trouver une solution tech-
nologique tous les problmes ou fantasmes humains.
Le dump du contenu dun cerveau dans un ordinateur fait cependant face quelques
obstacles technologiques de taille. Heureusement dailleurs !

74
Tlchargeable librement ici : http://stargate.inf.elte.hu/~seci/fun/Kurzweil,%20Ray%20-
%20Singularity%20Is%20Near,%20The%20(hardback%20ed)%20%5Bv1.3%5D.pdf.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 84 / 362
Quels sont-ils ? Tout dabord, on ne sait pas encore prcisment dcrire le mode de
stockage de linformation dans le cerveau. Se situe-t-il dans les neurones ou dans les
synapses qui relient les neurones aux axones dautres neurones ? Dans Memories
may not live in neurons synapses paru dans Scientific American en 2015, il est fait
tat que linformation serait stocke dans les neurones et pas au niveau des synapses75.
Ce stockage est-il du mme ordre dans le cortex et dans le cervelet ? Quen est-il du
cerveau limbique qui gre les motions, le bonheur et la peur, en interagissant la
fois avec le cortex et avec les organes producteurs dhormones ? On cherche encore !
Quoi quil en soit, linformation est stocke sous forme de gradients chimiques et io-
niques. Probablement pas sous forme binaire (on ou off) mais avec des niveaux
intermdiaires. En langage informatique, on dirait que les neurones stockent peut-tre
des nombres entiers voire flottants au lieu de bits individuels. Il nest pas exclu non
plus que les neurones puissent stocker plusieurs informations diffrents endroits
(dendrites, synapses, axones). Et il ny a que quelques nanomtres entre les dendrites
et les terminaisons des axones !
La communication entre les deux est chimique, via un potentiel dions calcium, so-
dium et potassium, et rgule par des hormones de rgulation de la transmission ner-
veuse telles que lactylcholine, la dopamine, ladrnaline ou des acides amins
comme le glutamate ou le GABA (acide -aminobutyrique) qui bloquent ou favori-
sent la transmission dinflux nerveux.
A cette complexit, il faut ajouter ltat des cellules gliales qui rgulent lensemble et
conditionnent notamment la performance des axones via la myline qui lentoure. La
quantit de myline autour des axones est variable dun endroit lautre du cerveau
et module la fois lintensit et la rapidit des transmissions nerveuses. Cela fait une
complexit de plus dans le fonctionnement du cerveau !
Et si la mmoire ntait constitue que de rgles et mthodes de rapprochement ? Et
si le savoir tait en fait encod la fois dans les neurones et dans les liaisons entre les
neurones ? En tout cas, le cerveau est un gigantesque puzzle chimique qui se reconfi-
gure en permanence. Les neurones ne se reproduisent pas mais leurs connexions et la
soupe biologique dans laquelle elles baignent voluent sans cesse.
Comment dtecter ces potentiels chimiques qui se trouvent des trillions dendroits
dans le cerveau, soit au sein des neurones, soit dans les liaisons interneuronales ?
Comment le faire avec un systme danalyse non destructif et non invasif ?
Il ny a pas 36 solutions : il faut passer par des ondes lectromagntiques, et avec une
prcision de lchelle du nanomtre. Aujourdhui les scanners utilisent gnralement
trois technologiques : la tomodensitographie qui mesure la densit de la matire par
rayons X, les PET scanners qui dtectent des traceurs biologiques radioactifs par
mission de photons et lIRM qui dtecte les corps mous par rsonnance magntique
nuclaire, qui nirradie pas le cerveau mais doit le plonger dans un bain magntique

75
Dcouverte confirme par des chercheurs du MIT dbut 2016. Cf http://www.extremetech.com/extreme/123485-mit-discovers-the-
location-of-memories-individual-neurons.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 85 / 362
intense. Ces scanners ont une rsolution qui ne dpasse pas lordre du millimtre et
elle ne progresse pas du tout en suivant une loi exponentielle de Moore !
Le dernier systme en cours de mise en place dans le laboratoire NeuroSpin du CEA
Saclay fait en tout cas bien avancer ltat de lart. Il sagit du systme franco-
allemand Iseult, le scanner dIRM corporel le plus puissant du monde, quip dun
aimant record de 11,7 Telsas et 132 tonnes, et dont le bobinage supraconducteur en
niobium-titane refroidi par cryognisation lhlium pse 45 tonnes (ci-
dessous, source). Il compltera lIRM dote dun aimant de 7 tonnes qui est opra-
tionnelle chez Neurospin depuis 2008. Plus laimant est puissant, plus on augmente la
rsolution de lIRM76.
Ce systme va servir gnrer des images 3D de plus haute rsolution, descendant
en-dessous du mm3 de lIRM traditionnelle. Elle descendrait au niveau du dixime de
mm (100 microns). Il est pour linstant difficile daller en-de avec des techniques
non invasives. Iseult permettra didentifier plusieurs types de molcules au-del de
leau, comme le glucose ou divers neurotransmetteurs, notamment via linjection de
marqueurs base de molcules magntises. La mise en service est prvue pour 2018,
en retard de plusieurs annes sur le calendrier initial. A terme, on pourra aller jusqu
observer le fonctionnement des neurones lchelle individuelle.

Ce projet rappelle quune autre exponentielle a court : plus on veut observer


linfiniment petit, plus linstrument est grand et cher. Comme pour les acclrateurs
de particule et le LHC pour la dcouverte du boson de Higgs ! Plus on augmente la
rsolution de lIRM fonctionnelle, plus il faut augmenter la frquence de scan et la
puissance de laimant, donc sa taille. Do lintrt de la solution lgre et, en appa-
rence, trs lgante, de OpnWatr voque dans un autre post, mais qui na pas encore

76
Laimant a t conu avec le concours du CEA-Irfu, lInstitut de Recherche sur les lois Fondamentales de lUnivers, qui a rutilis
ses acquis issus de la cration des aimants supraconducteurs du Large Hadrons Collider du CERN de Genve. Il est fabriqu par
Alstom-GE Belfort, lintgration du scanner tant ralise par lallemand Siemens, lun des leaders mondiaux de lIRM mdicale.
Y contribue galement la socit franaise Guerbet, spcialise dans la production dagents de contraste utiliss dans limagerie
mdicale.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 86 / 362
fait ses preuves. Elle pourrait sortir du gu ds 2018, au mme moment quIseult. La
confrontation sera plus quintressante !
Des capteurs dlectro-encphalogrammes existent bien (EEG). Ils sont placs la
priphrie du cortex sur la tte et captent lactivit de grandes zones de contrle psy-
chomotrices du cerveau avec un faible niveau de prcision. Cest trs macro. La
mmoire et le raisonnement fonctionnent au niveau du pico. Qui plus est, si on sait
cartographier approximativement les zones fonctionnelles du cerveau, on est bien in-
capable de capter le rle de chaque neurone prise individuellement.
Pourra-t-on connaitre avec prcision la position de toutes les synapses dans
lensemble du cerveau et quels neurones elles appartiennent ? Pas vident ! Autre
solution : cartographier le cortex pour identifier les patterns de pense. Si on pense
un objet dun tel type, cela rend peut-tre actif des macro-zones distinctes du cerveau
que lon pourrait reconnaitre.
Dans The Brain vs Deep Learning Part I: Computational Complexity Or
Why the Singularity Is Nowhere Near, Tim Dettmers avance que la machine ne
pourra pas dpasser le cerveau pendant le sicle en cours. Il dmonte les prdictions
de Ray Kurzweil77.

(source du schma ci-dessus sur quelques exemples de neurones crbrales : http://neuromorpho.org)

Mais poursuivons dans la dcouverte fascinante de la complexit du cerveau. Celui-ci


contient plusieurs centaines de types de neurones diffrents (source), les illustrations
prcdente et suivante nen prsentant que quelques grandes variantes. Le cervelet
contient notamment ces tonnantes cellules de Purkineje, avec leur arbre de dendrites
relies avec jusqu 200 000 autres neurones, qui contrlent les mouvements appris.

77
Javais moi-mme mis des doutes sur les exponentielles qui sont la primitive des raisonnements de Kurzweil en avril 2015
dans trois articles sur les drives des exponentielles.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 87 / 362
Cette complexit se retrouve aussi au niveau molculaire avec de nombreuses pro-
tines et hormones intervenant dans la transmission dinflux neuronaux, comme d-
crit dans Deep Molecular Diversity of Mammalian Synapses: Why It Matters and
How to Measure It. Parmi les 20 000 gnes de nos cellules, 6000 sont spcifiques au
fonctionnement du cerveau et leur expression varie dun type de neurone lautre et
en fonction de leur environnement ! Cest dire la richesse de la soupe de protines qui
gouverne le cerveau, dont lactine qui structure la forme mouvante des neurones !
Le cerveau dun ftus comprendrait plus de mille milliards de neurones, qui meurent
rapidement. On perd en fait des neurones ds sa naissance, comme si une matrice
svidait pour prendre forme progressivement au gr des apprentissages. Le cerveau
dun enfant comprendrait plus de 100 milliards de neurones, et plus de 15 trillions de
synapses et 150 milliards de dendrites.

(source de lillustration ci-dessus)

Un cerveau adulte comprend environ 85 milliards de neurones dont 16 milliards dans


le cortex et environ 56 milliards dans le cervelet, 10 trillions de synapses (liaisons
neurones / neurones via les terminaisons multiples des axones qui sortent de neurones
et se connectent aux dendrites proches du noyau dautres neurones), et 300 milliards
de dendrites (les structures des neurones sur lesquelles ne trouvent les synapses). Il
consomme environ 20 Watts fournis sous forme dhydrates de carbone (glucoses) via
la circulation sanguine, ce qui en fait une machine trs efficace ct consommation
nergtique. Dans son dveloppement partir de la naissance, le cerveau perd des
neurones mais gagne des liaisons entre elles, et ce, toute la vie, mme si le processus
se ralentit avec lge, mme sans maladies neurodgnratives.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 88 / 362
Un neurotransmetteur arrivant via une synapse peut dclencher une cascade de rac-
tions en chaines dans le neurone cible qui va rguler lexpression de gnes et produire
des protines de rgulation qui vont modifier le comportement des dendrites dans la
rception des signaux issus des axones. Qui plus est les dendrites les rcepteurs
dans les neurones ont des formes et des comportements variables. Bref, nous avons
un systme de rgulation des plus complexes qui na pas du tout t intgr dans les
modles Kurzweiliens !

Plus de la moiti des neurones du cerveau sont situes dans le cervelet. Il gre les
automatismes appris comme la marche, la prhension, les sports, la conduite, le vlo,
la danse ou la maitrise des instruments de musique. Un neurone du cervelet contient
environ 25 000 synapses le reliant aux terminaisons daxones dautres neurones.
Ceux du cortex qui grent les sens et lintelligence comprennent chacun de 5000 et
15 000 synapses.

(source du schma qui lexplique trs bien)

Le cerveau est aussi rempli de cellules gliales qui alimentent les neurones et en con-
trlent le fonctionnement via la myline qui entoure les axones et divers autres mca-
nismes de rgulation. Il y en a au moins autant que de neurones dans le cerveau, ce
qui ajoute un niveau de complexit de plus.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 89 / 362
Il faut ajouter le rle de buffer de mmoire de lhippocampe, le vidage de ce buffer
pendant le sommeil ce qui rappelle que une bonne qualit et dure de sommeil permet
dentretenir sa mmoire. Enfin, via le systme nerveux sympathique et parasympa-
thique, le cerveau est reli au reste des organes, dont le systme digestif ainsi qu
tous les sens et notamment le toucher.
Le cerveau est imbattable dans sa densit, sa compacit et son paralllisme. Par
contre, les ordinateurs nous dpassent dans leur capacit de stockage et de traitement
de gros volumes de donnes. Si lon aura bien longtemps du mal scanner un cer-
veau au niveau des neurones, il nen reste pas moins possible den comprendre le
fonctionnement par ttonnements.
Les neurosciences continuent de progresser rgulirement de ce point de vue-l. On
comprend petit petit comment fonctionnent les diffrents niveaux dabstraction
dans le cerveau, mme si les mthodes scientifiques de vrification associes restent
assez empiriques, ralises le plus souvent avec des souris.

Mais il nest pas ncessaire de maitriser le niveau dabstraction le plus bas du cerveau
pour en simuler les niveaux levs, sans passer par un clonage. Comme il nest pas
ncessaire de maitriser les bosons de Higgs pour faire de la chimie ou comprendre la
manire dont lADN sert fabriquer des protines au sein des cellules !
Placer lintelligence de la machine dans la prolongation de celle de lhomme et sur
une simple courbe exponentielle na pas beaucoup de sens, comme dans The AI Re-
volution: Our Immortality or Extinction de Tim Urban.
En tout cas, quoi quil arrive, lintelligence dune machine hyper-intelligente naura
pas une intelligence similaire celle de lhomme. Elle sera probablement plus froide,
plus rationnelle, moins motionnelle et plus globale dans sa porte et sa comprhen-
sion du monde. Lintelligence artificielle sera suprieure celle de lhomme dans de
nombreux domaines et pas dans dautres, comme aujourdhui. Elle sera simplement

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 90 / 362
diffrente et complmentaire. Tout du moins, une chance raisonnable de quelques
dcennies.
Vu du versant de loptimisme et couple la copie du cerveau dans le silicium, lASI
aurait un impact indirect : limmortalit de lhomme, consquence des dcouvertes
gnres par lASI.
Cest videmment faire abstraction de ce qui ne peut pas encore se faire de manire
entirement numrique. Les progrs dans la sant sont contingents par
lexprimentation qui se fait encore in-vivo et in-vitro.
Lexprimentation in-silico de manire entirement virtuelle et numrique des
processus biologiques est un domaine en plein devenir. Il se heurte pour linstant
des obstacles proches de linsurmontable, mme en intgrant les merveilles des expo-
nentielles de progrs et de la loi de Moore. La recherche scientifique dans la sant en
est donc toujours rduite mener des exprimentations itratives et plutt lentes,
mme avec les appareillages les plus modernes. Avec ou sans IA, cela reste im-
muable.
Dailleurs, les meilleures solutions dIA comme lusage dIBM Watson dans la can-
crologie sappuient sur le corpus issu de toutes ces exprimentations. Il a une base
physique et relle. On pourra certainement automatiser lexprimentation biologique
encore plus quaujourdhui dans la recherche de thrapeutiques, mais cela restera tou-
jours du domaine du biologique, pas du numrique, donc plutt lent et pas trs sca-
lable.

On arriverait au stade de lAGI entre 2030 et 2100 selon les prvisions, et de lASI
quelques dcennies aprs. On se demande dailleurs ce qui expliquerait le dlai entre
les deux au vu du facteur dacclration li au matriel.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 91 / 362
IA et infrastructure informatique

Nous avons tudi dans la partie prcdente les volutions de lIA ct mthodes,
outils et logiciels. Passons ici son substrat matriel, fait dordinateurs, de proces-
seurs plus ou moins spcialiss, de systmes de stockage et de capteurs. Leurs volu-
tions respectives contribuent aussi amliorer la qualit des solutions dintelligence
artificielle.
Lun des domaines les plus importants pour lIA sont les serveurs dentrainement
pour le deep learning. En effet, si celui-ci donne de trs bons rsultats, comme dans la
reconnaissance dimages, il est trs consommateur de ressources dans sa phase
dentrainement. Il faut facilement 1000 10000 fois plus de puissance machine pour
entrainer un modle de reconnaissance dimages que pour lexcuter ensuite. Cela
explique pourquoi, par exemple, les GPU et TPU font environ 100 Tflops/s tandis
que les briques neuronales des derniers Kirin 970 de Huawei et de lA11 Bionic ne
font que 1 2 Tflops/s.

Processeurs
La loi de Moore est la pierre angulaire de nombreuses prdictions technologiques,
notamment pour ce qui concerne celles de lintelligence artificielle. Prsente comme
immuable et quasi-ternelle, cette loi empirique indique que la densit des transistors
dans les processeurs double tous les 18 24 mois selon les versions. Elle est aussi
dcline foison pour dcrire et prdire divers progrs techniques ou technico-
conomiques.
Cela peut concerner la vitesse des rseaux, la capacit de stockage, le cout dune cel-
lule solaire photovoltaque ou celui du squenage dun gnome humain. Une pro-
gression nen entraine pas forcment une autre. Le cout peut baisser mais pas la per-
formance brute, comme pour les cellules solaires PV. On peut donc facilement jouer
avec les chiffres.

Poursuivre la loi de Moore


La loi de Moore est cense sappliquer des solutions commercialement disponibles,
et si possible, en volume. Or ce nest pas toujours le cas. Ainsi, lvolution de la puis-
sance des supercalculateurs est mise en avant comme un progrs technique validant la
loi de Moore. Or, ces calculateurs sont crs avec des moyens financiers quasiment
illimits et nexistent quen un seul exemplaire, souvent ralis pour de la recherche
militaro-industrielle ou de grands projets de recherche (arospatial, gnomique, m-
to). Ce que lon peut observer dans la belle exponentielle ci-dessous issue dAMD.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 92 / 362
Dans la plupart des cas, ces technologies de luxe sont intgres dans des produits
grand public aprs quelques annes. Ainsi, la puissance des super-calculateurs des
annes 1990 sest retrouve dans les consoles de jeu des annes 2000. Au lieu de
faire des calculs en lments finis pour des prvisions mto, les consoles de jeux
calculent des millions de polygones pour simuler des images en 3D temps rel. Mais
cette puissance nest pas homothtique dans toutes les dimensions. Si la puissance de
calcul est similaire, les capacits de stockage ne sont pas forcment les mmes.
Dans la pratique, le nombre de transistors continuer daugmenter rgulirement mais
pas la frquence dhorloge, do le choix des architectures multicoeurs. Par ailleurs, il
existe une barrire mconnue, celle de Landauer, qui dfinit le niveau minimum
dnergie ncessaire pour grer un transistor. Et elle pourrait tre atteinte dici 2035.

La question est revenue au-devant de la scne alors que cette loi ftait ses 50 ans
dexistence. Un anniversaire comment pour annoncer la fin de ses effets, tout du
moins dans le silicium et les technologies CMOS. Cette technologie est sur le point
datteindre un taquet aux alentours de 5 nm dintgration sachant que lon est dj
10 nm ce jour, notamment chez Intel, et 14 nm en version commerciale (Core M
et Core i de gnration Skylake 2015).

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 93 / 362
Les architectures multi-curs atteignent de leur ct leurs limites car les systmes
dexploitation et les applications sont difficiles ventiler automatiquement sur un
nombre lev de curs, au-del de 4.
Lexcellent dossier After Moores Law, paru dans The Economist en mars 2016,
dtaille bien la question en expliquant pourquoi la loi de Moore des transistors
CMOS pourrait sarrter dici une douzaine danne lorsque lon descendra au niveau
des 5 nm dintgration. Et encore, la messe nest pas encore dite. A chaque nouvelle
gnration dintgration, les fondeurs se demandent sils vont pouvoir faire descendre
rellement le cout de fabrication des transistors. En-dessous de 14 nm, ce nest pas du
tout vident. Qui plus est, Intel met plutt laccent sur la consommation dnergie que
sur les performances brutes. Ainsi, un Core i7 7500U gnration Kaby Lake en 14
nm pour laptop na-t-il aujourdhui que deux curs et tourne environ 3 GHz !
Alors, la loi de Moore est foutue ? Pas si vite ! Il faudra tout de mme trouver autre
chose, et en suivant divers chemins de traverse diffrents des processeurs en techno-
logie CMOS. Elle avance par hoquets. Il reste encore beaucoup de mou sous la p-
dale pour faire avancer la puissance du matriel et sur lequel lIA pourrait surfer.
En 2015, IBM et Global Foundries craient une premire en testant la cration dun
processeur en technologie 7 nm base de silicium et de germanium, battant le record
dIntel qui est descendu en production 10 nm tout comme Samsung et TSMC.
Lenjeu cl est de descendre en intgration sans que les prix nexplosent. Or, la gra-
vure en extrme ultra-violet qui est ncessaire pour dessiner les transistors sur le
silicium est complexe mettre au point et plutt chre.

Le multi-patterning, que jexplique ici, permet den contourner les limitations. Mais il
coute tout aussi cher car il ajoute de nombreuses tapes la fabrication des chipsets et
peut augmenter le taux de rebus. La loi de Moore sexprime en densit de transistors
et aussi en prix par transistors. Si la densit augmente mais que le prix par transistor
augmente aussi, cela ne colle pas pour les applications les plus courantes.

Nouveaux transistors
Cela permettrait dacclrer leur vitesse de commutation et augmenter grce cela
la frquence dhorloge des processeurs. Cela peut passer par exemple par des portes
au graphne IBM avait annonc en 2011 avoir produit des transistors au graphne
capables datteindre une frquence de 155 GHz, et en 40 nm.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 94 / 362
Les laboratoires qui planchent sur le graphne depuis une dizaine danne ont bien du
mal le mettre en uvre en contournant ses cueils et le fabriquer un cot raison-
nable. Il faudra encore patienter un peu de ce ct-l mme si cela semble trs pro-
metteur et avec des dbouchs dans tous les domaines et pas seulement dans lIA.

GPU
Les GPU constituent la solution matrielle la plus largement dploye pour acclrer
les rseaux de neurones et le deep learning. Le leader de ce march est
lamricain Nvidia qui fournit des chipsets et des cartes quips de GPU dpassant
les 5000 curs. Ils sont couramment installs dans des data centers. Leur challenger
AMD est la peine, avec son API OpenCL qui bnficie dun support plus que m-
diocre par lcosystme logiciel du deep learning78.
Nvidia avait prsent au CES 2016 de Las Vegas sa carte PX2 pour lautomobile qui
intgre deux processeurs X1 comprenant 256 GPU. Les GPU Nvidia sont utiliss
pour simuler des rseaux de neurones. Cette carte doit tre rfrigre par eau car elle
consomme plus de 200 W.
Comme lexplique Tim Dettmers, un GPU nest utilisable pour des rseaux de neu-
rones que si la mmoire est facilement partage entre les curs de GPU. Cest ce que
propose justement Nvidia avec son architecture GPUDirect RDMA et avec son bus
NVLink qui atteint la vitesse de 300 Go/s avec ses derniers GPU GV100 Volta an-
noncs en mai 2017.
Cette dernire gnration de GPU utilise des curs de gnration Volta et totalise
21,1 milliards de transistors gravs en 12 nm. Ces GPU ont une puissance cumule de
120 Traflops/s79 ! On les trouve dans les cartes Tesla V100 qui quipent notamment
les serveurs DGX-1 par paquet de 8, totalisant 40 960 curs pour $150K ainsi que
dans larchitecture de rfrence HGX-1 destine aux supercalculateurs hyperscale
comme Microsoft Olympus et Facebook Big Basin. Nvidia propose aussi une version
station de travail de la DGX-1, dote de quatre cartes V100.

78
Cf AMD Too Late To NVIDIA Deep Learning Party, de Boris Suvorov, dcembre 2016. Et la dernire gnration de cartes AMD,
lances en juin 2017, les Radeon Instinct M125, a une puissance thorique de 24,6 Tflops, comparer aux dernires Nvidia V100
qui atteignent 120 Tflops.
79
Voir pas mal de dtails ici : http://www.anandtech.com/show/11367/nvidia-volta-unveiled-gv100-gpu-and-tesla-v100-accelerator-
announced. A noter que Nvidia entretient une quipe de dveloppeurs en France sous la responsabilit de Julien Demouth qui parti-
cipe la conception de ses GPU pour le deep learning.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 95 / 362
Qwant a annonc en 2017 faire lacquisition dune douzaine de ces serveurs lors dun
partenariat avec Nvidia pour les utiliser dans son moteur de recherche. Idem pour
OVH qui est en train de les dployer.
Jusqu prsent, les GPU comprenaient une myriade de curs mme deffectuer des
oprations mathmatiques simples (multiplications, divisions, additions, soustrac-
tions). Les logiciels utilisant linterface CUDA rpartissaient les traitemens dans le
GPU pour parallliser les traitements lis la gnration des effets graphiques 2D et
3D pour ordinateurs.
Pour le deep learning, les calculs taient aussi rpartis dans ces curs mais ce ntait
pas optimal.

Avec les GV100, Nvidia a ajout des tensor cores , des multiplicateurs de matrices
de 4x4 permettant de mieux parallliser les traitements dun rseau de neurones, sur-
tout dans les rseaux convolutionnels.
Ces GPU comprennent 80 streaming multiprocessors , comprenant un total de
5120 curs CUDA traditionnels (avec 64 curs en flottant 32 bits, 32 curs flottant
64 bits et 64 curs entier par SM) et 640 tensor cores (8 par SM). Cette architec-
ture prsente lavantage dtre assez flexible et gnrique et de sadapter de nom-
breux types de traitements. Elle est par ailleurs trs bien supporte ct logiciels et
frameworks.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 96 / 362
Nvidia propose aussi des stations de travail quipes galement de GPU puissants
ainsi que des cartes Jetson pour linformatique embarque. Larchitecture est com-
plte, des objets connects aux serveurs, permettant de rpartir les traitements en
fonction de la nature des traitements ainsi que des rseaux.

Un systme de surveillance peut ainsi disposer de son intelligence locale pour


nenvoyer vers les serveurs que des alertes consommant peu de bande passante et via
des rseaux tlcoms de type LPWAN (Low Power Wide Area Network) comme ce-
lui de Sigfox.
Enfin, en octobre 2017, Nvidia lanait sa nouvelle carte supportant la conduite enti-
rement autonome de niveau 5, la Nvidia Drive PX Pegasus. Elle a une puissance de
320 teraflops/s, soit 10 fois le niveau de performance de la gnration prcdente, les
Drive PX 2. La Pegasus exploite quatre processeurs embarqus dont deux de la srie
Xavier embarquant un GPU de la srie Volta. La carte sinterface avec 16 capteurs
haut-dbit donc des capteurs ultra-sons, camras, radars et LiDARs. Elle est dote de
plusieurs connecteurs Etherner 10 Gbits/s. Sa bande passante mmoire excde 1 To/s.
Cette carte permet lexcution de modles de deep learning entrains sur des serveurs
Nvidia DGX-1.

Memristors
Les memristors ont fait son apparition en 2008 chez HP aprs avoir t conceptuali-
se en 1971 par le sino-amricain Leon Ong Chua. Ce sont des composants lectro-
niques capables de mmoriser un tat en faisant varier leur rsistance lectrique par
lapplication dune tension. Un peu comme les cristaux liquides bistables qui servent
dans (feu) les liseuses lectroniques. La valeur modifiable de la rsistance permet de
stocker de linformation.
Les memristors peuvent aussi tre intgrs au ct de composants actifs classiques
dans des units de traitement. Cest trs bien expliqu dans Memristor: From Basics
to Deployment de Saraju Mohanty, publi en 2013, do sont extraits les deux
schmas ci-dessous. Le second prsente les diffrents types de memristors actuelle-
ment explors.
Ces composants sont intgrables dans des puces au silicium utilisant des procds de
fabrication plus ou moins traditionnels (nanoimprint lithography), en ajoutant une

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 97 / 362
bonne douzaine dtapes dans la production, et avec des matriaux rares comme les
oxydes de titane.

Les memristors ont t dvelopps dans le cadre des projets de recherche du pro-
gramme SyNAPSE de la DARPA. HP a t le premier en prototyper en 2008, avec
de loxyde de titane. Il en existe de plusieurs types, pouvant gnralement tre fabri-
qus dans les lignes de productions de chipsets CMOS traditionnelles, mais avec des
procds spcifiques de dpt sous vide de couches minces de matriaux semi-
conducteurs.
HP a mme lanc un partenariat avec le fabricant de mmoires Hynix, mais le projet
a t mis en veilleuse en 2012. Le taux de rebus serait trop lev lors de la fabrication.
Cest un paramtre cl pour pouvoir fabriquer des composants en quantit industrielle
et un prix de vente abordable. De plus, le nombre de cycles dcriture semblait limi-
t pour des raisons chimiques, dans le cycle de libration/captation doxygne pour
les memristors en oxydes de titane.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 98 / 362
En octobre 2015, HP et SanDisk ont cependant annonc un partenariat pour fabriquer
des mmoires volatiles et non volatiles base de memristors, censes tre 1000 fois
plus rapides et plus endurantes que les mmoires flash traditionnelles.
Dautres laboratoires de recherche et industriels planchent aussi sur les memristores
et les rseaux de neurones matriels :
IBM planche avec lETH de Zurich (le CNRS suisse) sur des ordinateurs base
de memristors. Ce mme ETH dveloppe un memristor capable de stocker trois
tats base de provskite (titanate de calcium) de 5 nm dpaisseur. Cela pourrait
servir grer de la logique floue.
Des chercheurs de lUniversit Technologique du Michigan ont annonc dbut
2016 avoir cr des memristors base de bisulfite de molybdne qui ont un com-
portement plus linaire.
Des chercheurs du MIT ont annonc dbut 2016 leurs travaux sur le chipset Eye-
riss utilisant des neurones spcialiss rparties dans 168 curs dots de leur
propre mmoire. Mais visiblement sans memristors. Lapplication vise est la re-
connaissance dimages. Le projet est financ par la DARPA.
Le projet Nanolitz aussi financ par la DARPA dans le cadre des projets Atoms to
Product (A2P) et sappuie sur des fils microscopiques pour connecter plus effica-
cement des curs et neurones dans des circuits spcialiss.
Enfin, la start-up californienne Knowm a lanc le premier composant commer-
cial base de memristors, fabriqu en partenariat avec la Boise State University,
base dargent ou de cuivre et au prix de $220. Il est destin en premier lieu aux la-
boratoires de recherche en rseaux neuronaux.
LANR franaise a financ le projet collaboratif MHANN associant lINRIA,
lIMS de Bordeaux et Thals pour crer des memristors ferriques. Le projet devait
tre termin en 2013 et avait bnfici dune enveloppe de 740 K. Difficile de
savoir ce quil en est advenu en ligne.
Le CNRS en partenariat planche aussi avec Thals sur une technologie de me-
mristors, ltat de recherche pour linstant80.

Processeurs neuromorphiques
Les processeurs neuromorphiques auraient t conceptualiss pour la premire fois en
1990, par Carver Mead81.
Ils sont spcialiss dans les traitements de machine learning et deep learning. Ils ex-
cutent en parallle les processus dentrainement puis dexcution dapplications de
deep learning et de machine learning qui sappuient sur des rseaux de neurones.

80
Cf http://www.zdnet.fr/actualites/intelligence-artificielle-creation-d-une-synapse-artificielle-39850840.htm.
81
Cf Neuromorphic Electronic Systems, Carver Mead, 1990.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 99 / 362
Ces processeurs peuvent comprendre en gnral des units spcialises dans la multi-
plication de matrices qui sont utilises dans les premires couches des rseaux de
neurones convolutionnels. Les dernires couches fully connected utilisent gale-
ment des matrices qui relient les neurones dentres avec les neurones des couches
suivantes, via des grilles comprenant les poids des synapses (exemple ci-dessous
droite). Mathmatiquement, ce sont des units de traitement qui multiplient des vec-
teurs une dimension par des matrices pour gnrer des vecteurs.
Ils sont conus pour que la mmoire qui stocke les poids des synapses et les feature
maps des rseaux convolutionnels soit la plus proche des units de traitement pour en
acclrer le fonctionnement, notamment pendant les phases dentrainement82.
Comme les GPU, ces processeurs neuromorphiques servent grer des modles de
rseaux de neurones de plus en plus grands, dacclrer les phases dentrainement, et
rduire la consommation nergtiques des machines aussi bien ct data centers que
dans lembarqu.

On peut classifier en trois catgories ces processeurs :


FPGA : ce sont des processeurs programmables qui sont utiliss lorsque les vo-
lumes sont faibles. Ce sont des circuits dont on peut activer par logiciel les
portes pour crer des neurones sur mesure. Ils sont un peu lquivalent de
limpression 3D pour les chipsets : intressants pour les faibles volumes et le pro-
totypage rapide. Cest la technologie retenue par Microsoft pour ses chipsets
Brainwave. On en trouve aussi chez diverses startups comme Teradeep (2014) ou
le japonais Leapmind (2012, $3,4M). Ces processeurs peuvent tre 10 fois plus
rapides que des GPU.
ASIC : ce sont des chipsets fabriqus en volume dont le layout est dfini une fois
pour toute avant la fonderie. Cest la technique utilise pour les processeurs Intel
ou les processeurs mobiles courants. Elle est adapte aux gros volumes. Elle est
aussi plus efficace ct puissance et conomie dnergie par rapport aux FPGA,

82
Cest une approche qui est aussi adopte par la startup grenobloise UpMem (2015, $3,6M) qui conoit des circuits de traitement
intgrant mmoire et calcul (Processing-In-Memory ou PIM), mais ddis au big data. Visiblement, larchitecture semble plus
proche de celle des GPU que des processeurs neuromorphiques.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 100 / 362
pouvant aller jusqu un rapport de 1 pour 100 1000. Cest lapproche retenue
par Google pour sa dernire gnration de TPU83.
Memristors : que nous avons examin juste au-dessus. Ce sont des circuits de r-
seaux de neurones qui mmorisent de manire non volatile les poids des synapses
des neurones. Dans les FPGA ou ASIC, ces informations sont stockes soit dans
les circuits eux-mmes, soit dans des RAM spares, et de manire volatile.

Le programme SyNAPSE de la DARPA a aboutit en 2014 la cration par IBM de


ses processeurs neuronaux TrueNorth capables de simuler un million de neurones
artificiels, 256 millions de synapses reliant ces neurones et excutant 46 milliards
doprations synaptiques par secondes et par Watt consomm. Le tout avec 4096
curs. TrueNorth utilise des neurones impulsionnels (spiking neurons) imitent mieux
le fonctionnement des neurones biologiques qui mettent des impulsions intervalle
rgulier. Ces neurones semblent plutt adapts au traitement du langage qu celui
des images.

Le chipset a t fabriqu par Samsung en technologie CMOS 28 nm et avec une


couche disolation SOI (issue du franais SOITEC !) permettant de diminuer la con-
sommation lectrique et dacclrer les traitements. Le chipsets comprend 5,4 mil-
liards de transistors en tout et fait plus de 4 cm2 de surface. Et surtout, il ne con-
somme que 70 mW, ce qui permet denvisager dempiler ces processeurs en couches,
quelque chose dimpossible avec les processeurs CMOS habituels qui consomment
beaucoup plus dnergie. A titre de comparaison, un processeur Intel Core i7 de der-

83
Lapproche de Google est dcrite en dtails ici : https://www.nextplatform.com/2017/04/05/first-depth-look-googles-tpu-
architecture/.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 101 / 362
nire gnration (Skymake) ralis en technologie 14 nm consomme entre 15 W et
130 W selon les modles, pour 1,7 milliards de transistors.
Le but dIBM est de construire un ordinateur dot de 10 milliards de neurones et 100
trillions de synapses, consommant 1 KW et tenant dans un volume de deux litres. A
titre de comparaison, un cerveau humain contient environ 85 milliards de neurones et
ne consomme que 20 Watts ! Le biologique reste encore ce stade une machine trs
efficace dun point de vue nergtique ! Une tape intermdiaire a t annonce au
printemps 2017 : un ordinateur neuromorphique dvelopp pour lUS Air Force et
dot de 64 millions de neurones mais dont le domaine dapplication na pas t prci-
s.
En parallle, le laboratoire de recherche de Zurich dIBM planche sur une autre tech-
nologie de rseau de neurones84 base de GST (Germanium-Antimony-Tellerium)
qui est aussi utilis dans les disques optiques rinscriptibles. Leurs neurones imitent
dencore plus prs les neurones biologiques avec une faible consommation, un stock-
age dtat comme avec les memristors et un peu de fonctionnement alatoire.

Google a aussi cr ses processeurs neuromorphiques, les TPU ou Tensor Processing


Units adapts notamment lexcution des applications dveloppes avec Tensor-
Flow. Ce sont eux qui ont permis la victoire dAlphaGo au jeu de Go dbut 2016. Ils
sont intgrs dans les datacenters de Google pour ses applications et services en cloud
mais ne sont pas commercialiss sparment. Ils en taient leur seconde gnration
la mi-2017. Ce sont des ASIC performants et consommant peut dnergie. Leur
layout semble surtout adapt lexcution de rseaux de convolutions.

84
Cf https://arstechnica.com/gadgets/2016/08/ibm-phase-change-neurons/.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 102 / 362
Intel a fait lacquisition de la startup Nervana ainsi que de Movidius en 2016, lui
donnant la capacit de cration de processeurs neuromorphiques ct serveur pour le
premier et dans lembarqu pour le second.
Du ct des serveurs, loffre Nervana est intgre dans Lake Crest (2016) qui est sui-
vi dans la roadmap Intel par Knights Crest (2017). Ils combinent un processeur Xeon
et un coprocesseur neuromorphique dvelopp en technologie FPGA Altera/Intel.
Ce coprocesseur dispose dune mmoire embarque au standard HBM2 de 32 Go
permettant un transfert interne de donnes la vitesse de 1 To/s, voisin des 900 Go/s
du GV100 Volta de Nvidia.
Par contre, Intel nest pas trs bavard sur larchirecture interne de tenseurs (multipli-
cateurs de matrices) de ses coprocesseurs ! Intel annoncait la livraison de ses pre-
miers FPGA Nervana Lake Crest la mi-octobre 201785.

Pour lembarqu, les versions commerciales des chipsets Fathom de Intel Movidius
ont t annonces mi 2017. Ces chipsets exploitant des processeurs vectoriels, ddis
au traitement de limage. En aot 2017, Intel annonait une nouvelle gnration de
processeurs Myriad X, remplaant les Myriad 2.

85
Cf Intel Shipping Nervana Neural Network Processor First Silicon Before Year End, Anandtech, octobre 2017.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 103 / 362
Ces Vision Processing Unit destines l'embarqu permettent de traiter un trillion
doprations de rseaux de neurones par secondes, soit 10 fois plus que pour les My-
riad 2, grce 16 processeurs vectoriels au lieu de 12 et surtout, au passage ct fa-
brication une architecture 16 nm vs 28 nm (chez TSMC, en ASIC). Au passage, le
chipset peut aussi faire de lencodage vido en 4K et ne consomme que 2W.
Fin septembre 2017, Intel annonait son processeur neuromorphique Loihi. Il est
cens arriver la mi-2018 sous forme dun chipset de test pour la recherche.
Il sera fabriqu en technologie 14 nm comme les Core i5/i7 du moment, et compren-
dra 130 000 neurones impulsionnels, comme dans les chipsets TrueNorth dIBM. Ces
neurones seront relis entre eux par 130 millions de synapses.

Le marketing dIntel voque un processeur imitant le cerveau humain et dou de fa-


cults dapprentissage, en prcisant quil supportera des rseaux de neurones rcur-
rents, hirarchiques et parcimonieux (sparse) et donc en particulier tout ce qui cor-
respond au traitement du langage et analyse de flux de donnes temporels divers
comme des ECG. Le tout, sans plus de dtails techniques !
Tandis que les chipsets TrueNorth dIBM ne grent pas lapprentissage et ne font
quexcuter les modles neuronaux dj entrains, ici, le processeur est capable
dapprentissage et dans les modes superviss, non superviss et par renforcement.
Sans quIntel ait fourni de dtails, on voit dans lillustration associe ci-dessus que ce
processeur comprend en fait deux chipsets, lun qui a lair davoir une architecture de
CPU (en haut) et lautre qui ressemble bien un rseau neuromorphique (en bas).
Dans le mme temps, Intel fait des efforts pour optimiser les frameworks de deep
learning (TensorFlow, Torch, Theano, Caffe) pour quils sexcutent plus rapidement
sur des architectures Core et Xeon traditionnelles, alors quils sont habituellement
optimiss uniquement pour les GPUs type Nvidia.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 104 / 362
Cela aurait permis damliorer les performances dun facteur x70 x85 sur les pro-
cesseurs Xeon86 qui quipent les serveurs de data centers, rapprochant leurs perfor-
mances des meilleurs GPU Nvidia. Bref, Intel aurait du mou sous la pdale dans ses
processeurs serveurs !
Qualcomm a conu son architecture de rseaux de neurones Zeroth intgre dans sa
famille de processeurs Snapdragon mais larchitecture matrielle nest pas bien claire.
Dans la pratique, elle exploite juste un DSP du processeur, mais ne dispose pas de
vritable fonction lie au deep learning.

Il en va autrement du chipset Kirin 970 de HiSilicon, la filiale de semiconducteurs du


chinois Huawei. Prsente lIFA, il sagit dun chipset mobile grav en 10 nm par
TSMC et comprenant 5,5 milliards de transistors, dont une partie lie au traitement
dapplications de deep learning comme la reconnaissance de la parole ou dimages
quils appellent une Neural Processing Unit (NPU). Le tout est complt de 8 curs
CPU et 12 curs GPU MALI (design de CPU dorigine ARM). Le NPU peut traiter
1,92 TFlops (en calculs flottants FP16). Le NPU supporte Tensorflow, Tensorflow
Lite et Caffe/Caffe2.

86
Cf TensorFlow Optimizations on Modern Intel Architecture, aot 2017 et New Optimizations Improve Deep Learning Frameworks
For CPUs, octobre 2017. Ces optimisations sappuient sur lutilisation des instructions de traitements de vecteurs AVX2 des Xeon et
AVX512 des Xeon Phi, ainsi que sur les versions 2017 des bibliothques Intel Math Kernel Library (Intel MKL) et Intel Data Analy-
tics Acceleration Library (Intel DAAL). Le jeu dinstruction AVX512 permet de raliser des oprations matricielles voisines de
celles des curs Tensor des TPU de Google et des GPU Nvidia GV100.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 105 / 362
Ce NPU utilise une conception de circuit provenant dune startup chinoise de Bei-
jing, Cambricon Technology. Cette socit a t cre en 2016 et vient de lever au
mois daout la bagatelle de $100M, auprs dun investisseur public chinois qui res-
semble notre Bpifrance. HiSilicon na pas utilis tel que, un bloc de processeur neu-
romorphique de Cambricon Technology. Ils ont travaill ensemble pour le personna-
liser et lintgrer dans le Kirin 970 et notamment pour ladapter au processus de fa-
brication du chipset qui est en intgration 10 nm, fabriqu par TSMC Tawan.
Une semaine aprs lannonce du Kirin 970 par Huawei, Apple lanait sa nouvelle
salve diPhones 8 et X. Ceux-ci intgrent aussi une fonction neuromorphique sous la
fome dun coprocesseur dnomm A11 Bionic Neural Engine. Il tourne 900 MHz
mais rien na encore filtr sur ses capacits techniques prcises. On sait sans surprise
quil est exploit par SIRI et par les fonctions de reconnaissance dimages comme le
login exploitant une vue 3D du visage. Dautres annonces de ce type suivront trs
probablement entre fin 2017 et 2018 chez Qualcomm, Samsung et Mediatek.
Dans lembarqu, nous avons aussi des chipsets chez Brainchip, Graphcore ainsi
que chez le franais Chronocam (chez qui Intel est le plus gros investisseur). Le
chipset de Chronocam est en fait un capteur vido qui intgre un rseau de neurone
permettant linterprtation immdiate des images. Il existe dautres projets
dordinateurs synaptiques base de rseaux de neurones. On peut notamment citer le
projet de Jeff Hawkins, le fondateur de Palm et celui de Stanford, qui travaille sur le
chipset Neurocore intgrant pour linstant 65536 neurones et fonctionnant trs
basse consommation.
Cr dans le cadre du projet europen Human Brain Project, le projet SpiNNaker de
Steve Furber (Universit de Manchester, UK) vise crer un chipset dun milliard de
neurones. Il sappuie cependant sur une architecture matrielle classique, avec 18
curs 32 bits ARM par chip. On est plus dans larchitecture massivement parallle
avec des milliers de processeurs de ce type que dans les processeurs vritablement
synaptiques.
KnuEdge (2007, $100M) planche sur un chipset Knupath qui est bas sur la techno-
logie LambaFabric qui permet lalignement en parallle de 512 000 units assembles
dans des chipsets de 256 curs. Loffre comprend les chipsets KnuVerse ddi la
reconnaissance de la parole pour lauthentification ainsi que les services en cloud
Knurld.io permettant dintgrer lauthentification vocale dans une application.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 106 / 362
La France est aussi prsente dans ce crneau.
Le CEA LETI planche sur des chipsets neuromorphiques produits en technologie
FDSOI par STMicroelectronics. Ils sont ddis aux systmes embarqus et la re-
connaissance dimages.
La startup franaise Scortex qui conoit des FPGA pour des applications de traite-
ment de limage. Le crateur dAldebaran, Bruno Maisonnier, est aussi en phase de
lancement dAnotherbrain, une startup de processeur neuromorphique encore stealth
qui exploiterait des travaux du Collge de France et de lUniversit Pierre et Marie
Curie.

Une quipe de chercheurs associant le CNRS et Thales situe Palaiseau travaille


aussi sur une technologie avance de processeurs neuromorphiques, en collaboration
avec des laboratoires de recherche japonais et amricains87. Ils utilisent des oscilla-
teurs qui permettent de se rapprocher encore plus du mode de fonctionnement des
neurones biologiques en facilitant la propagation temporelle des valeurs entre les neu-
rones dun systme. Cela a lair de servir surtout aux rseaux de neurones rcurrents
qui font de la reconnaissance de la parole.
Le CogniMem CM1K est un chipset ASIC intgrant un rseau de 1024 neurones
stockant chacun 256 octets qui sert aux applications de reconnaissance des formes.
Ne coutant que $94, il est notamment utilis dans la BrainCard, issue de la start-up
franco-amricaine, General Vision qui commercialise des blocs dIP pour crer
des processeurs neuromorphiques, avec ses NeuroMem. Cette technologie est aussi
intgre dans les processeurs dobjets connects Curie dIntel (avec 128 neurones,
mais abandonns par ce dernier en juillet 2017). Lensemble sert principalement aux
applications de vision artificielle dans les systmes embarqus.
Enfin, terminons ce panorama bigar avec Koniku (2014, $1,65M), une startup qui
dveloppe des neurones hybrides en silicium et biologiques. La socit californienne
se positionne aussi sur la reconnaissance dimages. Elle communique peu et il est dif-
ficile dvaluer lintrt prcis de sa technologie. Mais a en jette !

87
Cf Neuromorphic computing with nanoscale spintronic oscillators, janvier 2017.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 107 / 362
Photonique
Cest la photonique qui exploite des composants base des matriaux dits III-V88.
Aujourdhui, la photonique est surtout utilise dans le multiplexage de donnes sur
les liaisons ultra-haut-dbit des oprateurs tlcoms, dans des applications trs spci-
fiques, ainsi que sur des bus de donnes optiques de supercalculateurs.

La startup franaise Lighton.io (2016) planche sur la cration dun coprocesseur op-
tique capable de raliser trs rapidement des calculs sur de gros volumes de donnes
et de combinatoires. Le systme sappuie sur la gnration de jeux de donnes ala-
toires permettant de tester simultanment plusieurs hypothses de calcul, des fins
doptimisation. Les applications vises sont en premier lieu la gnomique et lInternet
des objets.
Lun des enjeux se situe dans lintgration de composants hybrides, ajoutant des
briques en photonique au-dessus de composants CMOS plus lents. Intel et quelques
autres sont sur le pont.
Une fois que lon aura des processeurs optiques gnralistes, il faudra relancer le pro-
cessus dintgration. Il est actuellement situ aux alentours de 200 nm pour la photo-
nique et la course se dclenchera alors pour descendre vers 10 5 nm comme pour le
CMOS actuel.

88
Un sujet que javais explor dans Comment Alcatel-Lucent augmente les dbits dInternet en 2013.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 108 / 362
Les premiers chipsets exprimentaux photoniques rseau de neurones ont en tout
cas rcemment fait leur apparition en laboratoire. Avec la cl un potentiel de multi-
plication de la performance par 5089 !

Ordinateurs molculaires
Ils permettraient de descendre le niveau dintgration au-dessous du nanomtre en
faisant raliser les calculs par des molcules organiques de la taille de lADN. Cela
reste aussi un animal de laboratoire pour linstant ! Mais un animal trs prometteur,
surtout si larchitecture correspondante pouvait fonctionner de manire tridimension-
nelle et plus rapidement que notre cerveau. Reste aussi comprendre quelle est la
vitesse de commutation de ces composants organiques et comment ils sont aliments
en nergie.
Toutes ces innovations technologiques devront surtout se diffuser un cout raison-
nable. En effet, si on extrapole la structure de cout actuelle des superordinateurs, il se
pourrait quun supercalculateur dot de la puissance du cerveau une chance pluri-
dcennale soit dun cout suprieur au PIB de lAllemagne90. Ca calme ! La puissance
brute est une chose, son rapport qualit/prix en est une autre !
La notion dIA intgrative pourrait aussi voir le jour dans les architectures matrielles.
Comme le cerveau qui comprend diverses parties spcialises, un ordinateur dou
dIA volue intgrera peut-tre des architectures hybrides avec processeurs au gra-
phne, optiques et quantiques en complments dune logique de base avec de bons
vieux CPU en produits en technologie CMOS traditionnelle.
Ceci est dautant plus plausible que certaines techniques sont insuffisantes pour crer
un ordinateur gnrique, notamment les ordinateurs quantiques qui ne sauraient grer
quune certaine classe de problmes, mais pas comprimer ou dcomprimer une vido
par exemple, ou faire tourner une base de donnes NoSQL.

89
Cf Deep learning with coherent nanophotonic circuits, octobre 2016. Voir aussi cette autre approche de traitement et de stockage
optique de linformation ralise par un laboratoire australien : Storing lightning inside thunder: Researchers are turning optical data
into readable soundwaves, septembre 2017.
90
Source : Why we need Exascale and why we won't get there by 2020, 2014.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 109 / 362
Ordinateurs quantiques
Imagins par le physicien Richard Feynman en 1982, les ordinateurs quantiques sont
mme de rsoudre certaines classes de problmes complexes doptimisation o plu-
sieurs combinatoires peuvent tre testes simultanment. Les algorithmes peuvent
tre rsolus de manire polynomiale et non exponentielle. Cela veut dire quau gr de
laugmentation de leur complexit, le temps de calcul augmente de manire linaire
avec cette complexit et pas de manire exponentielle. Donc cest beaucoup plus
rapide !
Le principe des qubits qui sous-tendent les ordinateurs quantiques est dcrit
dans Quantum computation, quantum theory and AI de Mingsheng Ying, qui date
de 2009.
Pour faire simple, lintrt dun qubit est de pouvoir avoir plusieurs tats probabi-
listes en mme temps, avec ce que lon appelle la superposition des tats. En combi-
nant plusieurs qubits, cela permet de trouver trs rapidement un point dquilibre
pour rsoudre des quations doptimisation complexes comprenant de nombreuses
variables. Un systme base de n qubits est ainsi capable de reprsenter simultan-
ment 2n tats !
Mais les qubits sont complexes mettre en uvre : quelle que soit la technologie em-
ploye, ils doivent tre refroidis quelques dizaines de millikelvins au-dessus du zro
absolu avec des systmes base dhlium liquide. Il est surtout difficile dinitialiser
leur tat et de le lire.
Lun des premiers algorithmes apparus qui soit traitable par un ordinateur quantique
est celui de Peter Shor (AT&T), en 1994. Il permet de factoriser des nombres entiers
en nombres premiers avec un temps de calcul qui volue en fonction du logarithme
du nombre plutt de son exponentielle comme avec les calculateurs traditionnels. Il
permet de casser les cls publiques utilises en cryptographie avec lalgorithme RSA.
Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 110 / 362
Ce qui le remet srieusement en question ! Ont suivi divers algorithmes de recherche
(1996), doptimisation (parcours du voyageur de commerce), de simulation de la phy-
sique des matriaux et mme des mcanismes de la photosynthse.
Dans Quantum POMPDs, Jennifer Barry, Daniel Barry et Scott Aaronson, du MIT,
voquent en 2014 comment les ordinateurs quantiques permettent de rsoudre des
problmes avec des processus de dcision markovien partiellement observables. Il
sagit de mthodes permettant didentifier des tats optimaux dun systme pour le-
quel on ne dispose que dinformations partielles sur son tat.
Quant Quantum Speedup for Active Learning Agents, publi en 2014, un groupe
de scientifiques espagnols et autrichiens y expliquent comment les ordinateurs quan-
tiques pourraient servir crer des agents intelligents dots de facults dauto-
apprentissage rapide. Cela serait un chemin vers le dveloppement de systmes dIA
cratifs.
En 2014, des chercheurs chinois de lUniversit de Sciences et Technologies de Hefei
ont t parmi les premiers exprimenter des ordinateurs quantiques pour mettre en
jeu des rseaux de neurones artificiels, pour la reconnaissance dcriture manuscrite.
Leur ordinateur quantique utilise un compos organique liquide associant carbone et
fluor. De nombreuses autres publications font tat depuis de la possibilit dutiliser
des ordinateurs quantiques pour entrainer rapidement des rseaux de neurones91.

Les nombreuses diffrences entre un ordinateur classique et un ordinateur quantique


sont rsumes ci-dessus. Avec quelques nuances de taille comme limpossibilit de
copier ltat dun qubit sur un autre qubit.

91
Comme Application of Quantum Annealing to Trainingof Deep Neural Networks, de Adachi et Henderson, 2015.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 111 / 362
Il existe de nombreuses catgories de processeurs quantiques qui se dfinissent par
leur technologie de qubits. Les principales sont base de :
Recuit simul quantique, ou quantum annealing, chez le canadien D-Wave
(1999 $174M) qui est le seul commercialiser des ordinateurs quantiques ce
jour, mme si leur efficacit est conteste.
Boucles supraconductrices, ou superconducting loops, chez IBM et Google ainsi
quau CEA en France.
Qubits topologiques, chez Microsoft avec les fermions de Majorana dont
lexistence vient tout juste dtre prouve en laboratoire, et dans les Bell Labs de
Nokia.
Quantum dots sur silicium, chez Intel, qui vient den faire une annonce offi-
cielle en octobre 2017 ainsi quau CEA.
Ions pigs, comme chez la startup ionQ (2016, $20M) qui sappuie sur des tra-
vaux de lUniversit du Maryland et de lUniversit Duke en Caroline du Nord.
Elle ambitionne de sortir son ordinateur quantique en 2018, ce qui est probable-
ment plus quoptimiste.
Ces techniques que nous naurons pas le temps ni le courage de dcrire ici en dtails
ont chacune leurs avantages et inconvnients. Certains types de qubits sont notam-
ment plus difficiles stabiliser que dautres.
Voyons tout cela dans lordre
D-Wave est la socit la plus avance dans le domaine du quantique avec ses ordina-
teurs dont les capacits voluent rgulirement depuis une demi-douzaine dannes.
Ils sont commercialiss petite chelle. Leur dernier D-Wave 2 a une capacit de
2031 qubits, un record en la matire. Leurs qubits sont fabriqus base de niobium
sur silicium, utilisant leffet Josephson. La partie quantique est isole magntique-
ment de lextrieur, avec un champ interne dun nano-Tesla.
Elle ralise une simulation toutes les 25 s, dans des batches de 10 000 oprations
identiques durant 4 secondes. La moyenne des rsultats de ces oprations est alors
value. Lordinateur consomme 15KW.
Les ordinateurs de D-Wave sont notamment utiliss par les quipes de la NASA dans
leur QuAIL, le Quantum Artificial Intelligence Laboratory, un laboratoire de re-
cherche lanc en partenariat avec Google Research. Il utilise un D-Wave Two comme
outil dexprimentation. Leurs publications scientifiques sont abondantes mais pas
faciles dabord comme les autres ! Ce centre de la NASA est situ au Ames Research
Center, l-mme o se trouve la Singularity University et quelques kilomtres du
sige de Google Mountain View.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 112 / 362
Google annonait fin 2015 avoir russi raliser des calculs quantiques 100 millions
de fois plus rapidement quavec des ordinateurs classiques sur ce DWave-Two. Ces
tests sont mal documents au niveau des entres, des sorties et des algorithmes tests.
Il se pourrait mme que ces algorithmes soient cods en dur dans les qubits des D-
Wave !
Qui plus est, la comparaison faite par Google avec les calculs sur ordinateurs tradi-
tionnels sappliquait algorithme identique alors que les algorithmes utiliss dans
lordinateur quantique ntaient pas optimiss pour ordinateurs traditionnels. Le sujet
est polmique, comme le rapportent La Tribune ou Science et Avenir. Est-ce une
querelle entre anciens et modernes ? Pas vraiment car ceux qui doutent des perfor-
mances du D-Wave travaillent aussi sur les ordinateurs quantiques.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 113 / 362
Google travaille aussi sur la cration de ses propres processeurs quantiques base de
boucles superconductrices. Avec lUniversit de San Barbara en Californie, il annon-
ait dbut octobre 2017 avoir pu crer des composants de 9 qubits stables, gnrant
un taux derreur stable et ouvrant la voie la cration dordinateurs quantiques opra-
tionnels en 201892 (ci-dessus droite). Ils prvoient de crer un chipset quivaleur de
50 qubits.
Dbut mai 2016, IBM annonait mettre disposition son ordinateur quantique exp-
rimental cryognique de 5 Qubits en ligne dans son offre de cloud (ci-dessus). On ne
sait pas trop quel type de recherche pourra tre mene avec ce genre dordinateur ni
quelles APIs sont utilises. En 2017, ils en sont crer des systmes base de 17
Qubits. Ils proviennent du laboratoire de Zurich dIBM.

De son ct, Microsoft avance aussi trs bien sur linformatique quantique avec une
technologie base de fermion de Majorana93 qui prsente lintrt de mieux stabiliser
les qubits et qui pourrait monter plus rapidement en puissance.
Ces travaux de recherche sont mens StationQ, un laboratoire de Microsoft situ
Santa Barbara en Californie et dirig par Michael Friedman, un mathmaticien m-
daille Fields. Lditeur a de plus dj dvelopp les briques logicielles pour crer des
applications autour de ses ordinateurs quantiques, dont le langage de programation
LIQUiD.
En octobre 2017, Intel se lanait officiellement dans la course de lordinateur quan-
tique en annonant un processeur quantique 17 qubits (vido). Il est conu par des
quipes dIntel siues en Oregon et en Arizona, en partenariat avec linstitut de re-
cherche en informatique quantique QuTech de lUniversit de Delft aux Pays-Bas,
qui va se consacrer au programme de test et dvaluation du chipset. Ces qubits sont
de la catgorie des supraconducteurs. Ils sont bien isols les uns des autres et leur
connectique est visible sur la photo ci-dessous. Le chipset fait la taille dune pice de
50c et est fabriqu sur des wafers de 300 mm.

92
Voir A blueprint for demonstrating quantum supremacy with superconducting qubits, septembre 2017. Deux tiers de la vingtaine
de chercheurs qui ont sign ce papier travaillent chez Google.
93
Cette particule na pas de masse ni dnergie et est sa propre antiparticule. Son existence a t thorise en 1937 et dmontre en
2016.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 114 / 362
Le CEA de Saclay planche depuis longtemps sur la cration de circuits quantiques.
Ils ont dvelopp en 2009 un dispositif de lecture dtat quantique non destructif
de qubits aprs avoir cr lun des premiers qubits en 2002.
Et le CEA-LETI de Grenoble a de son ct rcemment ralis des qubits sur compo-
sants CMOS grce la technologie SOI disolation des transistors sur le substrat si-
licium des composants.
Enfin, le groupe franais ATOS, dj positionn dans le march des supercalcula-
teurs depuis son rachat de Bull, travaille avec le CEA pour crer un ordinateur quan-
tique lhorizon 2030 dans le cadre du programme ATOS Quantum qui et voca-
tion europenne. En juillet, ATOS annonait le lancement dun simulateur
dordinateur quantique de 30 40 qubits, le Atos Quantum Learning Machine, ralis
base de chipsets Intel CMOS traditionnels, probablement des processeurs de ser-
veurs de type Xeon94, dont le nombre va de 2 16, avec une mmoire allant de 1 24
To. Ce calculateur est programmable avec le langage spcifique aQasm (Atos Quan-
tum Assembly Language). Lide est de se faire la main sur les techniques de pro-
grammation dordinateurs quantiques avant que ceux-ci ne voient le jour.
Mais la France nest pas seule en Europe sur linformatique quantique. Les pays qui
semblent le plus en pointe sont la Suisse et les Pays-Bas, dont les laboratoires de re-
cherche travaillent respectivement avec IBM et Microsoft.

94
Source : Atos lance aujourdhui le simulateur quantique le plus performant au monde, juillet 2017.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 115 / 362
Lorsque les ordinateurs quantiques verront le jour et, surtout, seront rellement pro-
grammables et gnralistes, il est probable que lon assistera une explosion de leurs
domaines dapplications. Ils pourront notamment servir optimiser rapidement cer-
tains rseaux de neurones, faire des simulations physiques dans les matriaux ou
dans la biologie molculaire.
Dans son tude Quantum Computing Market Forecast 2017-2022, le cabinet Mar-
ket Research Media prvoit que le march des ordinateurs quantiques fera $5B dici
2020, en intgrant toute la chaine de valeur matrielle et logicielle. Le premier mar-
ch serait celui de la cryptographie. Avant de parler de march, il faudrait que cela
marche ! Et nous ny sommes pas encore.

Chaque chose en son temps : la recherche, lexprimentation puis lindustrialisation.


Nous nen sommes quaux deux premires tapes pour linstant.

Mmoire
Les GPU et les processeurs neuromorphiques sont dautant plus performants dans les
phases dentrainement quils accdent rapidement aux donnes en mmoire, et no-
tamment aux paramtres des rseaux de neurones qui peuvent tre des dizaines de
millions voire des milliards de variables ajuster trs frquemment.
Pour cela, les technologies matrielles rapprochent de plus en plus les units de trai-
tement de mmoires de plus en plus rapides. Un serveur peut avoir jusqu une demi-
douzaine de niveaux de mmoire qui optimiseront la performance de lensemble. Sa-
chant que plus la mmoire est rapide, plus elle est couteuse et plus sa taille est limite.
Nous avons donc une hirachie de mmoires dont la vitesse augmente inversement
proportionnellement leur taille.
Citons les principaux niveaux de mmoire qui quipent aujourdhui les serveurs.

Mmoire cache
Au sein des processeurs se trouve de la mmoire cache qui est utilise directement
par les units de traitement. Sa vitesse daccs est ce qui se fait de plus rapide, et d-
passe les To/s (tra-octets par secondes).
Un processeur courant comprend prcisment deux trois niveaux de cache et des
registres mmoires. Plus on se rapproche des units de traitement, plus laccs cette

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 116 / 362
mmoire cache est rapide, mais plus elle est limite en capacit, de lordre de
quelques dizaines de Ko, soit juste de quoi alimenter les registres de calculs utiliss
dans les processeurs et de quoi en lire les rsultats.

HBM2 et HMC
Autour des GPU se trouve maintenant souvent une mmoire complmentaire trs ra-
pide utilisant lun des deux grands standards du march HMB2 (High Bandwidth
Memory) ou HMC (Hyper Memory Cube).

Le premier standard est promu par AMD et le Coren SK Hynix et le second par
lAmricain Micron avec le support de Samsung. Cette mmoire qui atteint au-
jourdhui 16 Go est situe dans des circuits intgrs empils pas paquets de 4 ou 8 et
relis entre eux et avec le GPU ou le CPU par des micro-conducteurs mtalliques.
Lintgration avec le GPU est plus troite pour le HBM2 car la mmoire et le GPU
sont installs sur un substrat commun tandis que pour le HMC, la mmoire est place
sur la carte mre au mme titre que le CPU95. Ces mmoires permettent datteindre
des dbits trs levs allant jusqu 900 Go/s dans le Nvidia GV100 lanc en 2017.
HBM2 est utilis dans les GPU Nvidia GV100 et HMC lest dans les processeurs
serveurs Intel Xeon Phi ainsi que dans les FPGA Intel Stratix 10MX utiliss notam-
ment par Microsoft dans ses processeurs neuromorphiques Brainwave.

NVLink
La technologie NVLink de Nvidia permet de relier les GPU entre eux ou les GPU
avec les CPU une vitesse atteignant 300 Go/s par composant. Cette connexion per-
met de rpartir optimalement les traitements parallles sur plusieurs processeurs. En
effet, les grands modles de rseaux de neurones doivent tre rpartis sur plusieurs
GPU et plusieurs serveurs. Ils peuvent tre des milliers !

95
Source du schma qui suit : A Talk on Memory Buffers, Inphi.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 117 / 362
Infiniband
Infiniband est une technologie permettant de relier les serveurs entre eux avec des
dbits compris entre 100 et 200 Gbits/s. La connexion se fait via un cble diffrent du
RJ45 des rseaux Ethernet.

Les composants supportant Infiniband sont commercialiss par lisralien Mellanox


Technologies (1999, $89M) et par Intel. Infiniband est notamment complt par le
standard RoCE (RDMA over Converged Ethernet) qui permet de permettre laccs
la mmoire dun serveur par un autre serveur. Infiniband est concurrenc par Fibre
Channel, une autre technologie de liaison entre serveurs qui peut atteindre 128
Gbits/s et sert surtout loptimisation de laccs au stockage. Toutes ces technologies
sont utilises dans les data centers et les super-ordinateurs (HPC).

GDDR5
La mmoire GDDR5 est utilise dans les cartes graphiques et est plus rapide que la
mmoire DDR4 qui est utilise actuellement dans les micro-ordinateurs. Elle atteint
une bande passante de 48 Go/s.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 118 / 362
Elle est remplace par de la mmoire HMC ou HBM2 depuis quelques temps dans les
GPU haut de gamme.

Ces nombreuses avances montrent que les fabricants de ces composants ont encore
du mou sous la pdale. Peu dobstacles les empchent ainsi, moyen terme,
dintgrer de plus grandes capacits de mmoire rapide dans les processeurs eux-
mmes. Cest une question de maitrise de la fabrication de circuits intgrs de grande
taille et avec des dizaines de milliards de transistors.
Citons pour terminer sur la mmoire un cas original avec la startup fabless Upmem
(2015, $3,5M), base Grenoble, la capitale franaise des nanotechnologies, qui in-
tgre des units de traitement DPU (DRAM Processing Units) directement
lintrieur de mmoires DRAM, permettant une acclration de certains traitements
applicables notamment au data mining. Lide, issue du CEA-LETI, consiste int-
grer dans des chipsets de mmoire des units de traitement RISC (jeu dinstruction
simple) 32 bits, le dimensionnement pouvant tre de 256 units de traitement dans
des chipsets de 16 Go de RAM. Bref, au lieu de mettre de la mmoire rapide dans des
processeurs, ils mettent des units de traitement dans la mmoire rapide ! Ces DRAM
actives sont des coprocesseurs de traitement de CPU traditionnels. Reste les fabri-
quer en volume et les faire intgrer dans des serveurs par leurs constructeurs !

Stockage
Le stockage dinformation se fait de plus en plus dans des SSD, les disques de stock-
age sans plateau mobile et base de mmoire flash NAND et V-NAND. Ce sont des
circuits intgrs plusieurs couches, empilant jusqu 72 couches de transistors. Les
SSD grand public atteignent aujourdhui une capacit de 1 To avec une vitesse
daccs de 3 Go/s. Il existe des SSD de bien plus grande capacit qui sont destins
aux serveurs de data-centers.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 119 / 362
Si la loi de Moore a tendance se calmer du ct des processeurs CMOS, elle conti-
nue de sappliquer au stockage. Elle sest applique de manire plutt stable aux
disques durs jusqu prsent. Le premier disque de 1 To (Hitachi en 3,5 pouces) est
apparu en 2009 et on en est maintenant 14 To. Donc, plus que 2 puissance 4 et la loi
de Moore est sauve !
Le progrs sest ensuite dplac vers les disques SSD mmoires NAND dont la ca-
pacit augmente rgulirement tout comme sa vitesse daccs et le tout avec une
baisse rgulire des prix. Les perspectives de croissance sont ici plus optimistes
quavec les processeurs CMOS.

Laugmentation de la densit des mmoires NAND profite des architectures en trois


dimensions qui sont maintenant courantes, comme avec les V-NAND de Samsung
qui sont utilises dans leurs SSD pour laptops, desktops et serveurs. Nous avons aussi
Toshiba (ci-dessus) avec sa technologie BiCS. Les puces de mmoire 3D compren-
nent avec plusieurs couches empiles de transistors (ci-dessus droite), ou de transis-
tors monts en colonnes. Le niveau dintgration le plus bas des transistors est ici
quivalent celui des CPU les plus denses : il descend jusqu 10 nm. On sait empi-
ler aujourdhui jusqu 64 couches de transistors, et cela pourrait rapidement at-
teindre une centaine de couches.
La technologie 3D XPoint dIntel et Micron qui combine le stockage longue dure et
une vitesse daccs quivalente celle la mmoire RAM associe aux processeurs est
aussi prometteuse mme si elle connait un double retard lallumage : ct disponibi-
lit comme ct performance.
Des disques SSD de 16 To devraient arriver dici peu ! Pourquoi cette intgration
verticale est-elle possible pour la mmoire et pas pour les processeurs (GPU, CPU) ?
Cest li la rsistance la monte en temprature. Dans un processeur, une bonne
part des transistors fonctionne en mme temps alors que laccs la mmoire est s-
quentiel et donc nactive pas simultanment les transistors. Un processeur chauffe
donc plus quune mmoire. Si on empilait plusieurs couches de transistors dans un
processeur, il se mettrait chauffer bien trop et sendommagerait. Par contre, on sait
assembler des circuits les uns sur les autres pour rpondre aux besoins dapplications
spcifiques.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 120 / 362
Ce modle de mmoire en 3D est galement appliqu la RAM, notamment par
lamricain Micron avec sa technologie Hyper Memory Cube.
Pour les supercalculateurs, une tche ardue est accomplir : acclrer la vitesse de
transfer des donnes du stockage vers les processeurs au gr de laugmentation de la
performance de ces derniers. Cela va aller jusqu intgrer de la connectique 100
Gbits/s dans les processeurs. Mais la mmoire ne suit pas forcment. Aujourdhui, un
SSD connect en PCI et avec un connecteur M.2 est capable de lire les donnes la
vitesse vertigineuse de 3,2 Go/s, soit un dixime de ce qui est recherch dans les cal-
culateurs haute performance (HPC).
Avec 3D XPoint, laccs aux donnes serait 1000 fois plus rapide quavec les SSD
actuels, modulo linterface utilise. La technologie aura probablement un impact im-
portant pour les systmes dIA temps rel comme IBM Watson. Rappelons-nous que
pour Jeopardy, lensemble de la base de connaissance tait charge en mmoire RAM
pour permettre un traitement rapide des questions 96!
Cette augmentation de la rapidit daccs la mmoire, quelle soit vive ou de longue
dure, est indispensable pour suivre les volutions venir de la puissance des proces-
seurs avec lun des techniques que nous avons examines juste avant.

(source du slide ci-dessus)

Des chercheurs duniversit et mme chez Microsoft Research cherchent stocker


linformation dans de lADN. Les premires expriences menes depuis quelques
annes sont prometteuses97. La densit dun tel stockage serait norme. Son avantage
est sa durabilit, estime des dizaines de milliers dannes, voire plus selon les

96
IBM Watson avait charg en mmoire tout Wikipedia et les questions lui taient soumises par crit et pas oralement. Bref, Watson
et les joueurs homo-sapiens ne jouaient vraiment pas armes gales !
97
Sachant nanmoins quelles ont dmarr en 1994 avec les travaux de Leonard M. Adleman aux USA, documents dans Computing
with DNA paru dans Scientific American en 1998. A cette poque, Adleman voulait crer un ordinateur base dADN. Mais sa
conclusion tait que lADN tait surtout un moyen intressant de stockage de gros volumes dinformation. Jai remarqu au passage
dans larticle que le cout de la gnration de molcules dADN tait dj relativement bas cette poque : $1,25 la paire de bases
dADN. Il dmarre en 2016 $0,2, soit seulement 6 fois moins. En plus de 20 ans ! Encore un exemple o la loi de Moore ne sest
pas du tout applique. Pour linstant !

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 121 / 362
techniques de prservation. Reste trouver le moyen dcrire et de lire dans de
lADN une vitesse raisonnable.
Aujourdhui, on sait imprimer des bases dADN une vitesse incommensurablement
lente par rapport aux besoins des ordinateurs. Cela se chiffre en centaines de bases
par heure au grand maximum. Cette vitesse sacclrera sans doute dans les annes
venir. Mais, comme cest de la chimie, elle sera probablement plus lente que les
changements de phase ou de magntisme qui ont court dans les systmes de stockage
numrique actuels. La loi de Moore patientera donc quelques dcennies de ce ct l,
tout du moins pour ses applications dans le cadre de lIA.

Capteurs et objets connects


Les capteurs et objets connects jouent un rle cl dans de nombreuses applications
dintelligence artificielle. Les micros et camras alimentent les systmes de recon-
naissance de la parole et de vision artificielle. Les smartphones et les outils daccs
Internet en gnral crent des tomberaux de donnes sur les comportements des utili-
sateurs. La smart city et les vhicules autonomes sont aussi aliments par moult cap-
teurs en tout genre.
Lun des moyens de se rapprocher et mme de dpasser lhomme est de multiplier les
capteurs sensoriels. La principale diffrence entre lhomme et la machine rside dans
la porte de ces capteurs. Pour lhomme, la porte est immdiate et ne concerne que
ses alentours. Pour les machines, elle peut-tre distante et globale. On voit autour de
soi, on sent la temprature, on peut toucher, etc. Les machines peuvent capter des
donnes environnementales trs grande chelle. Cest lavantage des rseaux
dobjets connects grande chelle, comme dans les smart cities. Et les volumes de
donnes gnrs par les objets connects sont de plus en plus importants, crant la
fois un dfi technologique et une opportunit pour leur exploitation.
Le cerveau a une caractristique mconnue : il ne comprend pas de cellules senso-
rielles. Cela explique pourquoi on peut faire de la chirurgie cerveau ouvert sur
quelquun dveill. La douleur nest perceptible qu la priphrie du cerveau.
Dailleurs, lorsque lon a une migraine, cest en gnral li une douleur priph-
rique au cerveau, qui ne provient pas de lintrieur. Lordinateur est dans le mme
cas : il na pas de capteurs sensoriels en propre. Il ne ressent rien sil nest pas con-
nect lextrieur. Une IA sans capteurs ni donnes ne sert rien.
Cette diffrence peut se faire sentir mme une chelle limite comme dans le cas
des vhicules conduite assiste ou automatique qui reposent sur une myriade de
capteurs : ultrasons, infrarouges, vido et laser / LIDAR, le tout fonctionnant 360.
Ces capteurs fournissent aux ordinateurs de bord une information exploitable qui va
largement au-del de ce que le conducteur peut percevoir.
Cest lune des raisons pour lesquelles les vhicules automatiques sont terme trs
prometteurs et plus scuriss. Ces techniques sont dj meilleures que les sens hu-
mains, surtout en termes de temps de rponse, de vision 360 et de capacit
danticipation des mouvements sur la chausse (pitons, vlos, autres vhicules). A
contrario, la finesse de la vue humaine nest pas encore gale par la vision artifi-
Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 122 / 362
cielle de fait de ses contraintes actuelles. En effet, les rseaux de neurones convolu-
tionnels utilisent des images sources basse rsolution pour tenir compte des con-
traintes matrielles actuelles.
Le march des capteurs a connu un fort dveloppement depuis la fin des annes 2000
grce lmergence du march des smartphones, aliment par liPhone et les smart-
phones Android. Il sen vend actuellement environ 1,5 milliards dunits par an et ils
sont renouvels peu prs tous les deux ans par les consommateurs.
Nimporte quel smartphone comprend au minimum une douzaine de capteurs : deux
quatre camras, un deux micros, un acclromtre, un gyroscope, un GPS, un cap-
teur de lumire, un capteur de proximit et des capteurs radio Bluetooth / Wifi / 2G /
3G / 4G. Cela a eu comme consquence dacclrer la miniaturisation et la baisse du
prix de tous ces capteurs.
Les innovations dans le secteur des capteurs se poursuivent un bon rythme et per-
mettent de crer des perceptions extra-sensorielles par rapport aux capacits hu-
maines. Nous en avons deux exemples avec les spectrographes infrarouges comme
ceux de lisralien Scio, intgrs dans une balance de Terraillon ou un smartphone
de Changhong, avec le dtecteur de gaz du franais Aryballe ou encore avec le dtec-
teur de pollution arienne dun autre franais, Plume Labs. Chacun de ces capteurs
va gnrer des donnes exploitables par des systmes de machine learning et deep
learning pour comparer le signal acquis avec des bases de donnes de signaux dj
associs des matires dj dtectes.

Les plateformes de gestion de maisons connectes tirent aussi parti de nombre de


capteurs dambiance pour optimiser le confort. Ils jouent sur lintgration de donnes
dorigine disparate : la temprature extrieure et intrieure, lhumidit, la luminosit
ainsi que les dplacements des utilisateurs, capts avec leur smartphone. Cela permet
par exemple danticiper la temprature du logement en anticipation du retour au do-
micile de ses occupants.
Cette orchestration passe de plus en plus souvent par de lapprentissage profond pour
identifier les comportements des utilisateurs et adapter les rponses du systme.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 123 / 362
Linnovation dans les capteurs photo et vidos est galement incessante, ne serait-ce
que par la miniaturisation de ceux qui quipent les smartphones et sont maintenant
dots de vision en 3D. Lamricain Rambus planche de son ct sur un capteur photo
qui na pas besoin doptique !
Les capteurs de vibrations et les microphones ont des applications industrielles in-
souponnes et rvles par lIA : la dtection danomalies. Ainsi, des capteurs pla-
cs dans des vhicules ou des machines industrielles gnrent un signal qui est analy-
s par des systmes de deep learning capables didentifier et caractriser les anoma-
lies. Ainsi, la socit Cartesiam installe Angers depuis 2016 a cr un capteur in-
tgrant un logiciel base de rseaux de neurones servant dtecter les vibrations
anormales.
Les capteurs de proximit intgrables des machines comme les robots progressent
mme dans leur biomimtisme. Des prototypes de peau artificielle sensible existent
dj en laboratoire, comme en Core du Sud (ci-dessous, source dans Nature).
Lune des mcaniques humaines les plus difficiles reproduire sont les muscles. Ils
restent une mcanique extraordinaire, conome en nergie, fluide dans le fonction-
nement, que les moteurs des robots ont bien du mal imiter.

Les capteurs biomtriques sont de plus en plus courants : dans les bracelets type
FitBit, dans les montres connectes avec leurs capteurs infrarouges dtectant le pouls
et loxgnation du sang et dans les capteurs dlectroencphalogrammes (EEG). Ces
derniers permettent lhomme de contrler un membre artificiel robotis, une appli-
cation pouvant restaurer des fonctions mcaniques de personnes handicapes, voire
dmultiplier la force de personnes valides, dans les exosquelettes ddis aux applica-
tions militaires ou dans le BTP. Lhomme peut ainsi piloter la machine car la priph-
rie du cortex crbral contient les zones o nous commandons nos actions muscu-

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 124 / 362
laires. Les camras dans le visible et linfrarouge couples dventuels autres cap-
teurs permettent de dtecter ltat psychologique de personnes distance, comme leur
niveau dintrt dans une confrence ! Cest un cas dusage de la socit franaise
datakalab qui propose cela dans les confrences et mme pour les utilisateurs
dInternet, en captant les motions visuellement et via un bracelet connect.
Certains se lancent mme dans la connexion avec le cortex crbral cognitif et visuel,
et pas seulement moteur. Des expriences de tlpathie sont possibles, en captant
par EEG la pense dun mot dune personne et en la transmettant distance une
autre personne en lui prsentant ce mot sous forme de flash visuel par le procd
TMS, de stimulation magntique transcraniale.

Si on peut dj alimenter le cerveau au niveau de ses sens, comme de la vue, en inter-


ceptant le nerf optique et en simulant le fonctionnement de la rtine ou par la TMS,
on ne sait pas lalimenter en ides et informations abstraites car on ne sait pas en-
core vraiment comment et surtout o elles sont stockes. En tout cas pas encore car
cest lambition de startups amricaines que dy arriver un jour. Cest le projet de
Neuralink, une startup cr fin 2016 par Elon Musk ou de OpenWatr98 avec son
bonnet utilisant des capteurs photo et des metteurs infrarouge pour cartographier
finelement ltat des neurones et mme, terme, le modifier. Facebook essaye aussi
de lire dans les penses pour remplacer les claviers99 !

98
Jai publi en juin 2017 une tude dtaille des projets de Neuralink et OpenWatr dans une srie de trois articles :
http://www.oezratty.net/wordpress/2017/startups-bidouille-cerveau-neuralink/.
99
Nanalyze a identifi 29 startups qui sattaquent linterface cerveau-machine dans 29 Neurotech Companies Interfacing With
Your Brain, octobre 2017.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 125 / 362
Quant au projet europen Human Brain Project pilot par le suisse Henri Markram,
il ambitionne carrment de cartographier bas niveau le cerveau humain pour
lmuler ensuite sur ordinateur. Le projet comprend la participation du laboratoire
Neurospin du CEA qui met actuellement en place le systme dimagerie par rson-
nance magntique nuclaire le plus puissant du monde.

Il faut videment prendre des pincettes avec tous ces effets dannonces. Ainsi,
dans Mashable, une certaine Marine Benoit affirmait un peu rapidement en mars
2016 quune quipe avait mis au point un stimulateur capable dalimenter directe-
ment le cerveau humain en informations. A ceci prs que ltude en question, Fron-
tiers in Human Neuroscience ne faisait tat que dun systme qui modulait la capa-
cit dacquisition par stimulation ! Pour linstant, on doit se contenter de lire dans le
cerveau dans la dimension mcanique mais pas crire dedans directement. On ne
peut passer que par les entres/sorties, savoir les nerfs qui vhiculent les sens,
mais pas crire directement dans la mmoire. Mais ce nest peut-tre quun dbut !

Big data
Le domaine du big data est troitement li lintelligence artificielle. Cest mme
dune certaine manire le sang qui lalimente. Nombre dapplications de machine
learning et de deep learning exploitent de gros volumes de donnes internes aux en-
treprises. Plus lentreprise dtient de points de contacts avec des infrastructures ou
des clients, plus volumiques sont les donnes captes exploitables.
Les infrastructures de big data sont donc cls pour alimenter les applications de lIA.
Les donnes consolides taient peut-tre faiblement exploites jusqu prsent et le
seront mieux grce la puissance des outils de lIA, surtout le machine learning dans
un premier temps. Celui-ci est dailleurs souvent prsent comme laboutissement des
outils de data analytics et de data intelligence.
Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 126 / 362
Les infrastructures de big data profitent de divers progrs dans le stockage, le parall-
lisme et la communication entre serveurs.

Dailleurs, le march du big data et de lanalytics a rapidement saut dans le bain de


lIA, mme si cela comporte probablement pas mal dIA washing. Loffre est en tout
cas plus quabondante (cf la cartographie ci-dessous).

Cloud
Les applications de lIA font aussi appel aux ressources du cloud, en particulier dans
les phases dentrainement et surtout pour les startups qui ne peuvent pas disposer de
leur propre data center.
Les grandes entreprises auront grer un quilbre entre leurs data-center on pre-
mise (chez elles) et dans des clouds privs et publics. La rapidit dvolution des
technologies de processeurs neuromorphiques et GPU que nous avons vues plus haut
justifie le choix du cloud pour viter lobsolescence rapide de ses infrastructures.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 127 / 362
Les infrastructures en cloud doivent pouvoir scaler pour sadapter lentrainement
de modles de machine learning et deep learning ncessitant daligner parfois des
milliers de serveurs. Une fois les modles entrains, leurs besoins en ressource ma-
chine sont plus faibles, surtout pour les solutions de deep learning. Ce nest pas pour
rien, par exemple, quun GPU Nvidia ou un Google TPU offre une puissance de cal-
cul situe aux alentours du 100 Tflops/s tandis que les units de traitement neuronales
embarques dans les smartphones comme le Huawei Pmate 10 et liPhone 8/X ont
une puissance de calcul situe entre 1 et 2 Tflops/s ! Lexcution dun rseau de neu-
rones est bien plus rapide que son entrainement !

Energie
Lhomme ne consomme en moyenne que 100 Watts dont 20 Watts pour le cerveau.
Cest un excellent rendement. Tout du moins, pour ceux qui font travailler leur cer-
veau. Ce nest pas facile galer avec une machine et pour raliser les tches de base
que ralise un humain. Les supercalculateurs consomment au mieux quelques KW et
certains dpassent les MW.
Des progrs sont cependant notables dans les processeurs mobiles. Consommant
moins de 5 W, ils agrgent une puissance de calcul de plus en plus impressionnante
grce des architectures multi-curs, un fonctionnement en basse tension, aux
technologies CMOS les plus rcentes comme le FinFET (transistors verticaux) ou
FD-SOI (couche disolant en dioxyde de silicium rduisant les fuites de courant dans
les transistors et amliorant leur rendement nergtique) et une frquence dhorloge
raisonnable (entre 1 et 1,5 GHz). La technologie FD-SOI issue de STMicroelectro-
nics et Soitec gagne petit petit du terrain, notamment chez Samsung, Global Foun-
dries et NXP.
La mcanique et lnergie sont les talons dAchille non pas de lIA qui est distri-
buable l o on le souhaite mais des robots. Un homme a une autonomie dau moins
une journe en tat de marche convenable sans salimenter. Un robot en est encore
loin. Do lintrt des travaux pour amliorer les batteries et notamment leur densit
nergtique. Un besoin qui se fait sentir partout, des smartphones et laptops aux vhi-
cules lectriques en passant par les robots. Les progrs dans ce domaine ne sont pas
du tout exponentiels. Cela a mme plutt tendance stagner. Dans les batteries, cest
Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 128 / 362
la loi de lescargot qui sappliquerait avec un quadruplement de la densit tous les 20
ans (source).

Des laboratoires de recherche inventent rgulirement des technologies de batteries


battant des records en densit nergtique ou du ct du temps de chargement, base
de matriaux diffrents et/ou de nano-matriaux, ou de composs diffrents au li-
thium. Il y a notamment le lithium-sulfure ou le lithium-oxygne permettant en tho-
rie datteindre une densit nergtique 20 fois suprieure celle des batteries ac-
tuelles, utilises dans les vhicules lectriques100.
Mais en elles sortent rarement, faute de pouvoir tre industrialises un cot raison-
nable ou de bien fonctionner dans la dure. Parfois, on arrive une densit nerg-
tique norme, mais cela ne fonctionne que pour quelques cycles de charge/dcharge.
Trop injuste !
Rsultat, pour le moment, la principale voie connue est celle de lefficacit indus-
trielle, choisie par Elon Musk dans la cration de sa Gigafactory dans le Nevada, une
usine $5B qui exploitera la technologie de batteries standards de Panasonic, qui a
aussi mis $1B au pot pour le financement de lusine. Une usine qui est aussi proche
dune mine de Lithium, Clayton Valley, lun des composs cls des batteries et
qui dmarrera sa production en 2020.
On peut cependant citer ltonnante performance dun laboratoire de luniversit de
Columbia qui a russi alimenter un composant CMOS avec de lnergie provenant
de lATP (adnosine triphosphate), la source dnergie principale des cellules vi-
vantes qui est gnre par les nombreuses mitochondries quelles contiennent. Cela
ouvre des portes vers la cration de solutions hybrides biologiques et informatiques
insouponnes jusqu prsent.

100
Cf http://blog.erios.org/index.php?post/2013/12/07/Stockage-de-l-%C3%A9lectricit%C3%A9%3A-les-batteries-du-futur-face-au-
tout-p%C3%A9trole.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 129 / 362
Applications gnriques de lIA

Cette partie est ddie aux applications gnriques de lIA avec deux types :
La vision, le langage et la robotique qui sappuient sur les briques fondamentales
de lIA vues prcdemment.
Le marketing, les ressources humaines et la cyberscurit qui font appel aux
briques technologiques de lIA ainsi quaux trois domaines prcdents, selon les
besoins.
Elles sont potentiellement mises en uvre par les entreprises de tous secteurs et de
toutes tailles.

Vision
La vision artificielle est lapplication la plus courante et diversifie de lIA. Cest
lune des principales applications des rseaux neuronaux et du deep learning. Lun
des objectifs de la recherche est dlever au maximum le niveau smantique de la re-
connaissance, pour identifier les personnes et objets sur les images.

Nous allons passer en revue quelques-uns des principaux usages de la vision artifi-
cielle.

Reconnaissance de visages
On la trouve pour les moteurs de recherche, les rseaux sociaux et les systmes de
scurit et/ou vidosurveillance. Elle est aussi utilise couramment dans les appareils
photos pour la mise au point et pour la dtection des sourires (ci-dessous droite).

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 130 / 362
Dans leur projet FaceNet, Google annonait en 2015 avoir atteint un taux de russite
de dtection de visage de 99,63%101. Le tout sappuyait sur un rseau neuronal 22
couches.

De son ct, Facebook et son projet DeepFace sappuyait sur la technologie issue
dune start-up isralienne face.com. Son taux de russite tait de 97,25% pour vri-
fier quune personne sur une photo est la mme sur une autre, quel que soit langle de
la prise de vue et lclairage. Cest juste en-dessous du taux de reconnaissance hu-
main qui serait valu 97,5%.

On trouve de la dtection de visages dans plein de solutions du march comme avec


la fonction Faces dApple iPhoto. Elle provient peut-tre de la start-up su-
doise Polar Rose acquise par Apple en 2010. De manire peu surprenante, Apple a
aussi acquis, dbut 2016, la start-up Emotient, spcialise dans la reconnaissance
dmotions faciales base de machine learning. Le matching de visages est une chose,
mais dtecter les motions en est une autre et on peut sattendre ce quApple utilise
cette fonctionnalit dans les volutions de ses solutions, notamment dans la visiocon-
frence Facetime.
Les APIs en cloud proposes par Microsoft Research dans le cadre de son projet Ox-
ford apportent des services quivalents aux dveloppeurs dapplications. Google fait
de mme avec ses Cloud Vision APIs. Cette abondance des offres rappelle que les
technologies de lIA, une fois au point, deviennent rapidement des commodits. Les
mthodes sont sur la place publique.

101
Voir FaceNet: A Unified Embedding for Face Recognition and Clustering. publi en juin 2015.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 131 / 362
Il faut ensuite les mettre en uvre avec du logiciel et du matriel. La diffrence se
situe dans limplmentation et aussi dans le marketing.
La reconnaissance des visages est videmment un sujet chaud pour les services de
scurit. On en voit dans tous les films et sries TV ! En quelques secondes, les sus-
pects sont identifis. Est-ce comme cela dans la vraie vie ? Probablement pas. Cela
explique pourquoi le FBI a lanc son projet NGI (Next Generation Identification) en
2009 et maintenant oprationnel. Il tait pourvu hauteur de la bagatelle de $1B et
ralis par Lockheed Martin.
Le march de la reconnaissance faciale est aussi prolixe en solutions diffuses en
OEM, comme imagga (2008, $642K) et ses API en cloud de tagging automatique
dimages en fonction de leur contenu et Cognitec qui vise surtout les marchs de la
scurit. Nous avons aussi la startup franaise Smart Me Up (2012, 3m), qui pro-
pose une solution logicielle danalyse des visages. Elle dtecte lge, le comporte-
ment et les motions des utilisateurs. La solution est commercialise sous forme de
brique logicielle en marque blanche utilisable dans des applications mtier.
En Chine, SenseTime (2014, $410M) commercialise une solution de reconnaissance
de visages dcline dans plusieurs verticaux dont le retail et les tlcoms. Elle a t
fonde par des chercheurs de Hong Kong. Ses primitives fonctionnelles sont nom-
breuses : suivi de plusieurs visages en temps rel dans des vidos, dtection
dattributs divers (sourire, style de coiffure et barbe, age, race, regroupements pour
lorganisation dalbums photos, dtection de visage vivant vs statique, maquillage
virtuel).

Les solutions de reconnaissance de visage qui valuent l'ge sont gnralement ct de la plaque. L'habit (du visage)
ne faisant pas le moine (qui est quinqua) ! Ici, sur le stand de Smart Me Up au CES 2016 de Las Vegas.

On trouve des solutions de reconnaissance de visage dans les vidos chez Kairos qui
savent aussi analyser les motions et quantifier les foules, chez KeyLemon ($1,5m
de levs) qui propose une solution en cloud, chez Matroid (2016, $3,5M), qui fonc-
tionne sur des flux vido ou des photos, chez Clarifai ($10m de levs) qui permet
notamment de faire de la curation de contenus photo et vido et dajouter une fonc-
tion de recherche dimage par tags ou similaires dans son site, ou chez le japo-
nais NEC. Il faut aussi citer OpenCV, une solution open source de dtection de vi-
Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 132 / 362
sages. Voir cette liste de solutions pour dveloppeurs de dtection de visages dans les
vidos.
La reconnaissance de visages sert videmment aussi aux applications de vido-
surveillance, comme celle de Camio (2013) qui fournit une solution en cloud
dexploitation de vidos de camras de surveillance.
En complment de la reconnaissance dimages, on peut aussi les modifier et les am-
liorer. Cest ce que propose Adobe avec Sensei, une application qui corriger les pers-
pectives et divers paramtres de selfies (vido).

Classification dimages
Linterprtation des images est un pan entier de lIA qui est la spcialit de nom-
breuses startups qui nont pas toutes t acquises par les GAFA ! Ces startups utili-
sent des techniques assez voisines bases sur le deep learning pour identifier le con-
tenu de photos ou de vidos pour en extraire des tags qui sont ensuite exploites dans
diverses applications.

Le tagging dimages progresse chaque anne. Il est maintenant possible didentifier


plusieurs objets et personnes dans une mme image. Les rseaux de neurones utiliss
sont de plus en plus profond (nombre de couche) et de plus en plus larges (nombre de
catgories dobjets reconnus et taille des bases dentrainement).

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 133 / 362
Ltat de lart progresse notamment avec le challenge ImageNet Large Scale Visual
Recognition Challenge (ILSVRC) lanc en 2010 et renouvel chaque anne102. Il
permet dvaluer ltat des lieux de la reconnaissance dimages en mettant en concur-
rence plus dune cinquantaine dentreprises et laboratoires de recherche dans le
monde. Les rseaux de neurones convolutionnels actuels de reconnaissance dimages
comprennent plus de 150 couches de neurones.

En 2016, la base de rfrence dimages ImageNet en comportait plus de 10 millions.


Elle sert de benchmark aux solutions dIA. Google et Facebook disposent de bases
dentrainement encore plus grandes, de plus de 100 millions dimages pour le premier
et avec prs de 20 000 classes dobjets diffrentes.
Laugmentation de la base de rfrence ne change rien au dimensionnement du r-
seau de neurones convolutionnel. Il rallonge son temps dentrainement.

102
Ce benchmark porte sur la reconnaissance dimages issue dune base comprenant un million dimages dans 1000 classes diff-
rentes. Le niveau derreur mesur est top-5 ou top-1. Le top-5 correspond la proportion dimages pour lesquelles le bon label ne
figure pas dans les cinq premiers considrs comme tant les plus probable par le rseau de neurones. Le top-1 correspond au label le
plus probable. Cest le score le plus intressant, le plus proche de la reconnaissance humaine. Le top-5 est un peu trop laxiste !

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 134 / 362
Laugmentation du nombre de classes dobjets complexifie le rseau dans les couches
finales de neurones dites fully connected qui font le lien entre les dernires fea-
ture maps et les classes dobjets.

Voyons ce que font les startups dans le domaine :


Clarifai (2013, $72m), dj cit, propose une API en cloud permettant daccder
leurs fonctions de reconnaissance dimages. La startup a t cre par Matthew Zeiler,
un ancien de lquipe de Jeff Dean chez Google.

Vicarious (2010, $72m) est spcialis dans la reconnaissance et la classification


dimages. Ils se sont fait remarquer en tant capable dinterprter des Captcha de
toutes sortes avec une efficacit de 90%.
Cortica (2007, $38m) extrait les attributs cls dimages fixes ou animes pour les
associer des descriptifs textuels avec sa solution Image2Text. Elle est par exemple
capable de reconnaitre une marque et modle de voiture dans une vido ou un animal
dans une photo (ci-dessous). Le tout est protg par une centaine de brevets ! La so-
cit est originaire dIsral.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 135 / 362
Superfish (2006, $19,3m) dveloppe des moteurs de recherche dimages pour les
applications grand public.
Deepomatic (2014, $950K) utilise le deep learning pour interprter le contenu, la
forme et la couleur dimages dans les mdias et les associer des publicits contex-
tuelles. Cest une startup franaise !

De son ct, Facebook sait reconnaitre un sport dans une vido en sappuyant sur des
rseaux neuronaux. Quant Google Brain, il est capable didentifier des chats dans
des vidos mais avec un taux derreurs encore trs lev, de lordre de 25%. La re-
connaissance des visages est prcise 81,7% prs (source). Il faut un dbut tout !

Dtection dimages similaires


Elle sert la recommandation dans les systmes de vente en ligne, dans les moteurs
de recherche ainsi qu lidentification de contrefaons de produits de marques. Elle
sappuie aussi sur du deep learning.

Dtection de la qualit des photos


Regaind (2014, 400K) est une startup franaise qui propose une solution de tri
automatique de photos en cloud sappuyant sur du machine learning et de deep lear-
ning. Elle permet de trier les photos sous un angle la fois narratif et descriptif et de
les tagger automatiquement. Elle compare diverses caractristiques des photos : leur
cadrage, le flou darrire plan, les couleurs, etc. La startup a t acquise par Apple
pendant lt 2017.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 136 / 362
Google Photo propose aussi une fonction quivalente.

Reconnaissance de caractres
Elle est ralise dans les textes (OCR) issus de scans. Les systmes actuels savent
dtecter les textes, les images et schmas de documents scanns. Nous avions mme
un leader en France dans le domaine avec la socit LTU, acquise par le japonais
Jastec en 2005.

Reconnaissance dcriture manuscrite


La reconnaissance de lcriture manuscrite partir dencre digitale, saisie par
exemple avec un stylet comme sur les tablettes. Ce march est moins connu que pour
la reconnaissance vocale ou dimages. Et nous y avons un champion franais avec la
socit MyScript, anciennement Vision Objects, qui est base Nantes et qui a no-
tamment vendu son logiciel Samsung.
Nous avons aussi le californien Captricity (2011, $52m), qui extrait les informations
de lcriture manuscrite et convertit automatiquement les formulaires en tableaux
avec des applications videntes dans les assurances et toutes les bureaucraties imagi-
nables (vido). La solution en cloud est mme relie SalesForce.
Ces systmes sont dailleurs rversibles car on peut aussi gnrer de lcriture ma-
nuscrite synthtique partir dune criture existante comme dans ce projet de re-
cherche de lUniversit de Toronto (ci-dessous).

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 137 / 362
Dtection dactivits
Qui est exploite dans les systmes de vido surveillance qui exploitent photos et vi-
dos. Cest ce que propose la startup tawanaise Umbo CV (2014, $2,8M) qui gre
des camras de surveillance avec une solution logicielle fonctionnant dans le cloud.

Imagerie mdicale
Pour la dtection automatise dun grand nombre de pathologies au niveau de lil,
de loreille, en dermatologie et en cancrologie. Nous verrons cela plus en dtail dans
la rubrique sur la sant.

Conduite assiste et autonome


Avec par exemple les solutions de Nvidia et Mobileye qui dtectent les pitons, les
cyclistes, les autres vhicules, la signalisation au sol et les panneaux de signalisation.
Nous le traiterons dans la rubrique ddie aux transports.

Contrle qualit en usine


Il est trs courant et se dmocratise pour vrifier la qualit des pices et produits fa-
briqus en usine. Le point cl de ces systmes est quil doivent fonctionner en temps
rel. Mais leur apprentissage est moins complexe car ils doivent analyser des images
dont la variance est faible.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 138 / 362
Les solutions de contrle qualit sappuient sur lexploitation dimagerie dans le vi-
sible, linfrarouge et mme les rayons X. Limagerie peut-tre complte par dautres
types de capteurs comme ceux qui mesurent la variation de la rsistance lectrique de
matriaux. Tous ces systmes doivent fonctionner en temps rel, au rythme de la fa-
brication dans les usines, do lintrt dutiliser des camras intgrant des proces-
seurs neuromorphiques exploitant des rseaux de neurones dj entrains.

Tldtection
La reconnaissance dimages a aussi des applications en tldtection et imagerie sa-
tellite. Le deep learning permet de crer des solutions de recherche smantique dans
de gros volumes dimages, pour dtecter des objets spcifiques comme des champs
agricoles, des panneaux solaires ou des oliennes, pour les caractriser en fonction de
leur spectre lumineux, et pour analyser des variations dans le temps de ces paramtres.
Airbus Defense and Space utilise le machine learning pour dtecter les avions dans
les aroports avec de limagerie satellite. Ils les reprent sur la base d'un jeu de don-
nes dentrainement de 40 000 prises de vues avec la capacit se dbarrasser des
nuages grce le mise en correspondance de plusieurs photos. Le taux derreur est
infrieur 4% (source).
Descartes Labs (2014, $8,28m) exploite les donnes dimage satellite pour y dcou-
vrir comment volue la production agricole, le cadastre des villes ou autres donnes
gographiques, le tout via du machine learning dvelopp sur TensorFlow et dploy
sur Google Cloud. Ils prdisent la production agricole lchelle mondiale ainsi que
les risques de famine dans les pays mergents ! Voir cette vido montrant lvolution
dans le temps de la vgtation aux USA et un exemple ci-dessous gauche de dtec-
tion automatique doliennes (issu de cette vido).

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 139 / 362
La startup allemande Terraloupe (2015, $788K) analyse aussi les images satellite
pour reconnatre ce quelles contiennent, en fonction des besoins clients (vido),
comme analyser la surface des btiments dans le foncier, le type de toit, les antennes
satellites, les panneaux solaires avec des applications dans lagriculture, limmobilier
ou lassurance (exemple ci-dessus droite). Cest aussi lactivit de Cape Analy-
tics (2014, $14M).

Google a mme lanc son application Sunroof qui permet dvaluer lintrt cono-
mique dinstaller des panneaux solaires photovoltaques chez soi (ci-dessus).

Modles gnratifs
Apparus trs rcemment, autour de 2016, les modles de rseaux de neurones convo-
lutionnels gnratifs, ou Generative Adversorial Networks (GAN) impressionnent par
leurs capacits prdire lunivers visuel partir de peu dinformations. Ils compl-
tent des images ou les transforment. Au point que lon en vient trouver que lIA est
crative. Mais elle ne fait dans ces cas quappliquer des algorithmes de la mme ma-
nire et sans discernement, comme nimporte quel filtre de retouche dimages dans
Photoshop. Et elle exploite des lments de crativit dorigine humaine. Faut-il donc
lui coller des attributs de crativit comme celle des artistes ? Pas encore, mme si
certains croient que ce temps est dj venu103.

103
Cf The Coming Creativity Explosion Belongs to the Machines, de Melba Kurman, octobre 2017 qui confond comme cest courant
la crativit des machines et celle des hommes qui les ont programmes.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 140 / 362
Dun point de vue pratique, ce sont des rseaux convolutionnels inverss qui gnrent
un contenu partir dun autre contenu, ventuellement moins dense en information.
Les exemples abondent avec104 :
La colorisation automatique de photos et films en noir et blanc. Il faut videm-
ment de grandes bases dentrainement.

Lamlioration de la rsolution dimages, ci-dessus droite, qui donne des r-


sultats tonnants 105 . Mais lhistoire ne dit pas quelle est la taille de la base
dentrainement ni si la solution fonctionne avec une grande diversit de photos. Le
diable est dans les dtails que lon ne montre pas !
Le complment dimages tronques, ci-dessous, qui donne des rsultats ton-
nants mais imparfaits.

Lapplication dun style une photo, souvent monte en pingle comme tant
de la crativit alors quil sagit dun automatisme. Ses applications commerciales
sont encore rares. Cest une application directe des rseaux de neurones convolu-
tionnels capables de dtecter des features associs des autoencodeurs, capables
de rencoder ces features partir dautres bases. Cest un procd trs mca-

104
Ils sont principalement issus de cette prsentation : Generative Adversarial Network (GAN), de Hongsheng Li.
105
Cf Super resolution with Generative Adversarial Networks de Boris Kovalenk.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 141 / 362
nique qui nest pas aussi cratif que lon pourrait le croire106 ! Lexemple en bas
provient de Li et Wand107.

Encore plus fort, la gnration dune image partir dun descriptif textuel qui
utilise des empilages de rseaux GAN (Generative Adversatial Networks).

106
Cf Can AI make anyone an artists, septembre 2017. On y trouve aussi la vaste plaisanterie pour gogos de pix2code, une AI qui
serait capable de crer un programme partir dune simple interface utilisateur, la demonstration tant faite avec une interface com-
portant deux boutons.
107
Cf StackGAN: Text to Photo-realistic Image Synthesis with Stacked Generative Adversarial Networks, 2016-2017.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 142 / 362
Lamlioration de selfies, qui est propose par Adobe qui utilise son IA maison
Sensei, exploitant du deep learning pour amliorer de manire semi-automatique
les selfies pris avec des smartphones (vido).
Le maquillage virtuel qui passe par une analyse du visage pour le dcomposer en
parties auxquelles sont appliques ensuite divers maquillages108.

La gnration davatars 3D anims partir dune simple photo, utilisant une


technique connue de rseau de neurones convolutionnels gnratifs. Elle est no-
tamment propose par la startup amricaine Loom.ai (2016, $1,35M), cre par
des anciens de Dreamworks et LucasFilm.
Nombre des exemples ci-dessus sont issus de laboratoires de recherche et sont par
nature exprimentaux et surtout imparfaits. Certains des procds se retrouvent
nanmoins intgrs dans des startups comme pour Loom.ai.

Langage
Le traitement du langage est le second plus grand domaine dapplications de lIA
avec la vision artificielle. Il comprend de nombreuses composantes et notamment la
reconnaissance de la parole, les robots conversationnels, la traduction automatique,
lextraction de donnes, la cration de rsums et la gnration de textes. Ces outils
couvrent tout le spectre qui va de la comprhension du langage son interprtation,
son exploitation puis la synthse de textes ou de paroles.
Le domaine exploite surtout le deep learning, surtout pour la reconnaissance de la
parole. Le deep learning est aussi de plus en plus utilis pour extraire les connais-
sances des textes et pour la traduction automatique.

108
Cf Makeup Like a Superstar: Deep Localized Makeup Transfer Network de Si Liu, Xinyu Ou, Ruihe Qian, WeiWang et Xiaochun
Cao, 2016.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 143 / 362
Reconnaissance de la parole
La reconnaissance de la parole sappuyait au dpart sur des techniques statistiques et
notamment baysiennes. Elle a fait des progrs continus grce lintgration de tech-
niques diffrentes telles que le deep learning, le big data, les rseaux neuronaux et
des modles de Markov base de statistiques.

Les progrs de la reconnaissance de la parole se sont acclrs depuis lutilisation


intensive du deep learning avec de nombreuses couches de neurones, jusqu1000 !
Le taux derreurs de la reconnaissance est maintenant infrieur celui de la compr-
hension humaine, quc ce soit chez Microsoft et IBM.
Les solutions de reconnaissance vocale ont encore souvent besoin daccder des
bases de donnes de rfrence, surtout sil fonctionne sans apprentissage de la voix
de lutilisateur. Cela ncessite un aller et retour avec les serveurs du service, ce qui
est frquent avec les smartphones et avec des services comme SIRI dApple. Do
lintrt de la 4G et de son dbit comme de son faible temps de latence pour les allers
et retours avec les serveurs.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 144 / 362
Pour en savoir plus, voir cet historique de la recherche en reconnaissance de la pa-
role : Survey of Technical Progress in Speech Recognition by Machine over Few
Years of Research parue en 2015. Ce sujet intgre de nombreuses branches du sa-
voir issu de plusieurs dcennies de recherches dans lIA.
On est encore loin de la solution parfaite, notamment parce que les logiciels man-
quent dinformations sur le contexte des conversations109. Le taux de fiabilit nest
jamais de 100%. Il ne lest dailleurs jamais pour lhomme galement ! Le taux
derreur de la reconnaissance est toujours plus lev dans dautres langues comme le
chinois. Do lintrt de la rcente publication en open source de la solution Deep
Speech 2 de Baidu qui fonctionne en anglais et en chinois110.
Le taux derreur est particulirement lev sil y a du bruit ambiant, comme dans la
rue, dans un endroit o il y a du monde et mme dans sa voiture. Des techniques de
captation du son et dlimination du bruit ambiant permettent de traiter en partie ce
problme. Certaines portent sur lanalyse spectrale et le filtrage de frquences.
Dautres utilisent la captation strophonique pour sparer le bruit proche (diffren-
ti) du bruit lointain (qui lest moins). Javais mme vu la start-up isra-
lienne VocalZoom au CES 2015 qui utilisait un laser pour capter les vibrations des
lvres. Il faut juste trouver o placer le laser, ce qui est plus facile sur des installa-
tions fixes que mobiles.

109
Voir aussi Why our crazy smart AI still sucks in transcribing speech paru dans Wired en avril 2016.
110
Cf Deep Speech 2: End-to-End Speech Recognition in English and Mandarin, dcembre 2015. Ce systme fonctionne avec un
rseau de neurones de 11 couches : 3 couches de convolution pour la reconnaissance des phonmes, sept couches de rseaux de
neurones rcurrents pour la dtection des mots, puis une couche de connexion ( fully connected layer ). En mandarin, il obtient un
taux de reconnaissance suprieur lhomme pour des phrases courtes. Il a t entrain avec 12 000 heures de conversations. Les
versions les plus rcentes ont t entraines avec plus de 100 000 heures de conversations en environnement bruyant.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 145 / 362
La reconnaisance de la parole est maintenant intgre dans un nombre croissant de
solutions grand public. Le march est domin par de grands acteurs amricains
(OK Google, Microsoft Cortana, Apple Siri, Amazon Alexa, Samsung Bixby qui
est probablement originaire de Viv Labs111).
Leur solutions sont disponibles la fois dans leurs propres services comme Amazon
Echo ou liPhone pour SIRI mais galement disponibles sous forme dAPI en cloud
exploitables par les dveloppeurs dapplications et de solutions mtiers. Ces solutions
vont dailleurs rduire lintrt pour certains usages de faire appel des tlcom-
mandes traditionnelles voire mme des boutons. Ce sont des plateformes qui propo-
sent un SDK et laccueil dapplications spcifiques.

Ces diffrents assistants se distinguent dans leur capacit rpondre des questions
diverses. Un rcent benchmark met les assistants de Google et Microsoft devant ceux
dApple et Amazon (ci-dessus112).

111
Viv, des crateurs de Siri, est un agent conversationnel capable de rpondre des questions complexes, bien au-del de ce que
peuvent faire Apple Siri et Google. La solution exploite la notion de gnration dynamique de programme. Aprs analyse de la ques-
tion, un programme complexe est gnr en moins dune seconde qui va la traiter. Viv a t prsent lors de TechCrunch Disrupt
New York (vido). Viv Labs (2012, $30M) a t acquis par Samsung pour $215M en 2016.
112
Cf Alexa and Cortana Will Talk to Each Other Say Amazon and Microsoft , dans Voicebot.ai, aot 2017.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 146 / 362
Ce qui explique peut-tre lannonce fin aot 2016 dun partenariat entre Microsoft et
Amazon qui vont faire en sorte que Cortana puisse dialoguer avec Alexa et rcipro-
quement, rendant ainsi, via la voix, leurs bibliothques applicatives de services com-
patibles.
Une nouvelle discipline a fait son apparition : la VUI qui est aux interfaces vocales ce
que la GUI est aux interfaces graphiques. La Vocal User Interface dune application
suit le contexte des conversations dans la dure, sait grer les interactions optimale-
ment, sait reconnaitre ses erreurs, etc.

Lamricain Nuance, qui dpasse $2B de chiffre daffaire, vend sa solution un peu
partout en OEM. Apple a fait lacquisition de la start-up VocaliQ en 2015 et Sensory
fait avancer ltat de lart de manire indpendante depuis plus de 20 ans. Le couteau
Suisse IBM Watson peut aussi servir crer sa propre solution pilote par la parole
comme la fait lAmricain Staples avec son Easy Button qui permet de passer com-
mande de fournitures de bureaux.
Mobvoi (2012, $251m) est une startup base Shanghai proposant un moteur de re-
cherche pilotable par commande vocale. Google Ventures a particip au troisime
tour de financement en 2015 avec $60m, lui permettant de mettre un autre pied sur le
march chinois o Google est domin par Baidu. Le mtier principal de cette socit
est de fabriquer des montres connectes !
Le traitement de la parole contient un sous-domaine relativement rcent : la dtection
des motions dans la parole. Cest loffre de diverses startups comme le franais
BatVoice qui se propose ainsi de capter les motions des clients appelant un call cen-
ter et dvaluer lefficacit des agents qui y rpondent et savent traiter le stress des
clients.
Cest aussi loffre dune autre startup, lisralien BeyondVerbal (2012, $11m) qui
commercialise de la proprit intellectuelle issue de longues annes de recherche
dans le domaine.
Dans le mme ordre dide, Cogito (2007, $22,5m) analyse les appels dans les
centres dappels pour donner un feedback temps rel aux conseillers en ligne. Cest
une spin-off du MIT Media Lab qui exploite les sciences comportementales. Ils com-
parent les caractristiques des conversations un historique en analysant la tonalit,
le volume, les pauses et la vitesse des discussions. Le systme est cens amliorer de
20% la satisfaction des clients.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 147 / 362
Dans la mme veine, les startups franaises Natural Talk (2016) et Cognitive
Matchbox (2016) proposent chacune une solution de routage dappels optimise aux
centres dappels qui analyse la personnalit et les motions des clients pour les orien-
ter vers le meilleur agent. Elles exploitent les APIs dIBM Watson ddies au traite-
ment du langage naturel comme Personality Insights, Natural Language Understan-
ding, Tone Analyzer, Document conversion, Twitter Insight et Natural Language
Classifier.
La reconnaissance de la parole ne permet bien entendu pas de crer une solution
complte. Il faut lui ajouter un systme qui comprend le sens des questions et qui y
rpond ! Il doit exploiter une base de connaissance, des arbres de dcision et un con-
vertisseur de texte en langage parl (text to speech).

Gnration de parole
Le text-to-speech est une technique complexe, peut-tre pas autant que le speech-to-
text, mais elle repose aussi sur lexploitation de rseaux de neurones rcurrents, his-
toire de savoir comment juxtaposer les phonmes les un aux autres en fonction du
contenu lire.
Google a une excellente solution dans le domaine tout comme Amazon avec Polly.
Ces solutions sont paramtrables pour spcifier le rythme de la gnration,
lintonation, et le style de voix.
Des startups abordent aussi sur ce march comme la canadienne Lyrebird (2017) qui
proposera sa solution aux dveloppeurs sous forme dAPI en cloud, exploitant des
serveurs base de GPU Nvidia et qui tait encore en bta en septembre 2017. Elle
permet de copier la voix dune personne partir dun court chantillon cens tre
dune minute et de contrler lmotion dans lintonation.113

113
Cf leurs dmonstrations avec les voix de Donald Trump et Barack Obama : https://lyrebird.ai/demo.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 148 / 362
Chatbots
Les robots conversationnels ou chatbots sont trs en vogue depuis 2015. Des outils
permettant den crer sont proposs par de nombreuses startups ainsi que dans di-
verses offres de grandes entreprises du numrique (Facebook, Google, ).
Les chatbots visent automatiser le service client en ligne dans les sites de e-
commerce, services financiers ou autres. Lobjectif ultime est de russir le fameux
test de Turing qui dfinit une intelligence artificielle comme tant une intelligence
indistinctible de celle de lhomme dans de telles discussions par le biais dchanges
textuels. On en est encore loin, mme avec les chatbots les plus labors. Ils sont en-
core trs dcevants dans la pratique et pas forcment apprcis des utilisateurs. Ces
chatbots peuvent avoir une interface vocale comme avec SIRI, Cortana et Amazon
Alexa.
Il est assez difficile dvaluer la maitrise technologique des diffrentes socits de ce
secteur. Elles utilisent un patchwork de diffrentes APIs et outils de deep learning
plus ou moins packags114. Certaines redveloppent leur propre moteur de traitement
du langage, ce qui peut paratre curieux en raison de labondance de solutions dj
disponibles sur le march. Dautres se contentent dun simple moteur de rgles, trs
rudimentaire dans sa porte115.

Il existe en effet diffrentes techniques pour crer un chatbot. Elles vont de la gestion
basique de questions/rponses des bots plus sophistiqus capables de trouver de
linformation dans des sources varies, de mener des discussions en mmorisant bien
leur contexte et de prendre linitiative, le tout grce des techniques avances de trai-

114
Cet article trs intressant Contextual Chatbots with Tensorflow de mai 2017 dcrit comment dvelopper un chatbot avec le SDK
de machine learning et deep learning TensorFlow de Google complt par la bibliothque TFLearn, le tout tant crit en langage de
programmation Python. Tous ces outils sont open source et gratuits.
115
Cf Larnaque chatbots durera-t-elle encore longtemps ? de Par Thomas Gouritin, octbre 2017.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 149 / 362
tement du langage, des modles prdictifs et en tenant aussi compte de lhumeur du
client. On appelle cela un chatbot de niveau 3116.
Dans tous les cas de figure, un bon chatbot doit tre aliment par des sources
dinformation diverses :
Des scnarios daccueil et de questions/rponses (exemples ci-dessous) ce qui
peut tre trs laborieux saisir si cette connaissance nest pas dj formalise dans
lentreprise ou si elle est difficile capter.

Laccs des applicatifs mtiers divers pour interroger des bases de donnes,
faire des rservations, bref, tre intgr dans divers systmes transactionnels.
Lexploitation doutils de communication existants avec les clients comme les
logs de centres dappels, les discussions dans les rseaux sociaux do lon pour-
ra extraire des dialogues entre personnes relles pour identifier des rponses de
nouvelles questions.
Toutes ces connexions ne se feront pas dun claquement de doigts !
En gnral, plus la solution est verticale, moins la startup de chatbot doit disposer de
technologie en propre. Ces socits se distinguent beaucoup plus par les marchs vi-
ss que par leurs choix technologiques ou leurs performances.
A ce stade de leur dveloppement, les chatbots ne rpondent habituellement qu des
questions trs formates dans un espace smantique limit au mtier de lentreprise
qui le propose. Ils ne savent videmment pas bien rpondre des questions trs ou-
vertes. Et lorsque la rponse est correcte, il sagit souvent dun copier-coller dune
rponse humaine existante dont la grammaire est ventuellement ajuste pour
sadapter au dialogue en cours.
Parfois mme, les chatbot gnrent un effet miroir de la btise humaine, comme ce
fut le cas en 2016 avec le chatbot exprimental de Microsoft Research qui devint ra-
pidement raciste et d tre dbranch 117. En cause, les mthodes dapprentisssage
automatiques exploitant des dialogues avec des utilisateurs. Et ctait avant le 8 no-
vembre 2016 ! Heureusement, les chatbots circonscrits un domaine mtier donn
risquent moins de se retrouver dans ce cas-l.

116
Le schma au-dessus qui dcrit les caractristiques de trois niveaux de chatbots provient de How can Chatbots meet expectations?
Introducing the Bot Maturity Model, Lon Smiers, Oracle, avril 2017.
117
Cf http://www.businessinsider.com/microsoft-deletes-racist-genocidal-tweets-from-ai-chatbot-tay-2016-3.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 150 / 362
Les chatbots sont de trois types diffrents du ct des interactions :
Ceux qui fonctionnent de manire entirement autonome. Ce sont des assistants
virtuels.
Ceux qui fonctionnent de manire semi-autonomes et sont anims par des opra-
teurs humains lorsquils ne savent pas bien rpondre.
Ceux qui aident des oprateurs humains rpondre aux questions des clients dans
les centres dappels.

Loffre peut tre segmente avec des chatbots gnralistes, des chatbots spcialiss
dans des domaines prcis (ecommerce, recrutement, ) et des outils de cration de
chatbots118 et des plateformes daccueil de chatbots comme Facebook Messenger ou
Slack.
Dans la pratique, les chatbots sont rarement prts lemploi et ncessitent un travail
de personnalisation et de mise en place qui est ralis par loffreur, par un de ses par-
tenaires services ou par lentreprise cliente elle-mme. On voit dailleurs merger des
agences de ralisation de chatbots qui sappuient sur les outils de cration de chatbots
du march.
Le nombre de startups de chatbots cres ces dernires annes est impressionnant. Il
rappelle la vague des rseaux sociaux aprs 2004 et celle des services de vido en
ligne aprs lacquisition de YouTube par Google en 2006 !

118
Cf 25 Chatbot Platforms: A Comparative Table par Olga Davydova, mai 2017, qui recense et compare 25 outils de cration chat-
bots.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 151 / 362
Leur diversit tmoigne dun march en bulition encore immature. En effet, les mar-
chs matures du numrique se distinguent en gnral par leur sdimentation autour
dun nombre limit dacteurs. Cela en prend toutefois la tournure avec quelques lea-
ders qui mergent au niveau des plateformes de chatbots :
Du ct des chatbots vocaux, Amazon Alexa semble nettement en avance. Cet
outil est surtout utilis dans la maison connecte. Il est suivi de SIRI et de Google
Assistan ;
Du ct des chatbots textuels, la platefome de Facebook Messenger domine les
usages. En effet, les grandes marques et services lont choisie parce que Facebook
est le rseau social dominant, en tout cas dans les pays dvelopps. Il est suivi de
Slack, trs utilis pour le travail collaboratif dans les entreprises.
Nous allons faire ici un panorama de quelques-unes des startups de ce secteur en
commenant par quelques plateformes de chatbots gnralistes :
Semantic Machines (2015, $12,38M) est une startup de Boston et Berkeley qui
propose des chatbots pouvant tre intgrs dans toutes sortes dusages, b2b et b2c.
Lquipe fondatrice comprend des anciens de Siri et Google Now. La solution in-
tgre la reconnaissance et la synthse de la parole.
Talla ($4M) propose une solution de chatbots pour les besoins des entreprises,
comme dans le recrutement, le marketing et la gestion de rendez-vous. Elle
sintgre dans les systmes de messagerie tels que Slack. Elle fait penser au fran-
ais Julie Desk.
Puis les chatbots spcialiss avec pour commencer, une palanque de startups d-
die la cration de chatbot pour les sites de vente en ligne : Msg.ai (2014,
$2,7m) qui est notamment dploye chez Sony, Niki.ai (NC) est une startup in-
dienne qui se focalise dans les services (transports, voyage arien, sant) et Re-
plyYes (2015, $3,5m), une startup de Seattle, qui associe machine learning et op-
Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 152 / 362
rateurs humains avec deux spinoffs, lune qui commercialise des disques vinyles
(The Edit) et lautres, des BD (Origin Bound). The Edit aurait vendu $1m de vi-
nyles en huit mois.
TARA (NC) est une startup de San Francisco qui propose un robot conversation-
nel de gestion du recrutement de freelances.
Do You Dream Up (2009) est une startup franaise qui propose un agent conver-
sationnel multilingues pour les sites web. Il est notamment utilis par Voyages-
SNCF depuis 2011 et a rcemment volu pour tre intgr dans une HelpBox,
sorte daide en ligne contextuelle interactive.
Passons quelques solutions de chatbots plus originales :
IPSoft (1998) est une startup assez ancienne de New York qui propose son chat-
bot Amelia qui est positionn sur le helpdesk IT. Il exploite un agent de dtection
dmotion des utilisateurs. La startup franaise Gorgias (2015, $1,6M) est aussi
positionne sur lautomatisation du helpdesk IT. Mais son outil aide les conseillers
de support tre plus efficaces, sans les remplacer.
Existor (1988) est une startup anglaise cratrice dagents conversationnels comme
Cleverbot qui exploite la webcam des laptops pour interprter les visages des utili-
sateurs. Cleverbot utilise la puissance des GPU des ordinateurs et des mobiles. La
socit propose aussi un avatar visuel pour mener ces conversations. Jai fait
quelques tests et ce nest pas trs probant (ci-dessous). Et pour cause, les agents
conversationnels sont souvent mise en oeuvre dans des univers smantiques trs
prcis, comme loffre dune socit donne. Ils ne permettent pas de naviguer in-
telligemment dans Wikipedia par exemple !

Snips (2013, $19,3m) est une startup franaise cre par Rand Hindi, avec un der-
nier tour de financement de $13M en juin 2017 par Korelya, le fonds
dinvestissement de Fleur Pellerin, accompagn par MAI Avenir. La socit pro-
pose un assistant vocal pour applications mobiles. Sa particularit est de fonction-
ner en mode autonome sans ncessiter un aller et retour avec un serveur. Au pas-
sage, cela lui permet de mieux respecter la vie prive de lutilisateur, y compris
lorsque le service fait appel des ressources sur Internet. La solution est int-

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 153 / 362
grable dans des applications existantes. La solution est commercialise un prix
fixe qui ne dpend pas du nombre dutilisateurs.

La startup amricano-russe Luka (2014, $4,54m) dveloppe son chatbot grand


public Replika qui joue le rle dun ami, conseiller si ce nest psychothrapeute.
Une sorte de Her, mais pas encore au point. Dans la pratique, il sert surtout
choisir des restaurants (ci-dessus droite). La startup explique que sa solution est
base sur une architecture propritaire de deep learning et quelle est dote dun
fort quotient motionnel. La startup a t cre San Francisco par deux russes,
dont un spcialiste du traitement du langage.
Publicis a dvelopp une application de recommandation de maquillage base de
chatbot pour Sephora119. Cela relve encore dune approche de service sur mesure,
pas de la cration dun produit.
Le franais Hubware (2016) utilise une approche intrigante en vendant des assis-
tants conversationnels sur mesure sans technologie en propre, en les assemblant
selon les besoins du client. Ils apprennent leur mtier avec leurs clients, une m-
thode qui rappelle celle de nombreux cabinets de conseils. A commencer par les
socits du e-commerce. Linconvnient de la mthode est que cela rapproche
plus la startup dune socit de service que dune vritable startup mme de g-
nrer des conomies dchelle.
Passons aux chatbots associant automatisation et intervention humaine :
Curious.ai (2013, $7,35m) est une startup amricaine qui commercialise Digital-
Genius qui associe deep learning et intervention humaine pour les chatbots de ser-
vices clients. Le chatbot qui fonctionne en mode texte sur site web, rseaux so-
ciaux et SMS est entrain avec des transcriptions dappels rels au service client.

119
Source : keynote de Microsoft AI en septembre 2017, https://myignite.microsoft.com/sessions/56555.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 154 / 362
Jam (2012, $1,46m) et Julie Desk (2014, $3,7m) sont deux startups franaises qui
proposent des solutions dagents conversationnels intgrant galement une assis-
tance humaine. Jam est un agent SMS qui permet des tudiants dorganiser leurs
soires. De vrais gens rpondent la main lorsque le systme ne peut pas le faire.
Les techniques utilises par Hello Jam ne sont pas bien documentes. Elles ne
semblent pas faire appel du deep learning sophistiqu. Julie Desk propose un
agent qui rpond de son ct aux mails pour lorganisation de rendez-vous. Lui
aussi est supervis par de vraies personnes pour le contrle qualit. Julie Desk a
un concurrent amricain, x.ai (2014, $44,3M).
Et enfin, voici quelques outils de cration de chatbots exploitables par les entreprises
et agences spcialises de cration de chatbots :
recast.ai (2015, $2,25m) est une startup franaise cre par des anciens de lcole
42 qui propose un outil de cration de chatbots et un SDK associ. Lensemble est
trs bien packag et sutilise en mode cloud (ci-dessous). Au cur de leur solution
se trouvent diffrentes briques internes et externes. Lquipe a pris soin de dve-
lopper certaines briques de traitement du langage en interne. La startup est dj
remarque aux USA o elle est par exemple trs bien identifie par le fonds
dinvestissement Andreessen Horowitz dans son Airplaybook120 comme un acteur
cl de la cration dagents conversationnels.

120
Ici : http://aiplaybook.a16z.com/docs/guides/nlp.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 155 / 362
Le BotMaker de Viseo (1999, $2M) est un outil de cration de chatbots textes et
vocaux en open source dot dune interface graphique interactive capable notam-
ment dinterroger les systmes dinformation des entreprises. Il sadapte aux
grandes plateformes de chatbot comme Facebook Messenger, Slack, Wechat,
Amazon Echo et Cortana. Viseo est une socit de services spcialise initiale-
ment dans le dploiement dERP et qui est devenue un gnraliste de la transfor-
mation digitale, avec 1200 collaborateurs et 130M de CA.
La startup franaise Opla.ai (2015), base prs de Clermont Ferrand, propose aus-
si un outil de cration de chatbots. Une partie des logiciels de traitement du lan-
gage a t cre par son cofondateur, Mik Bry.
Chatfuel (2016, $120K) est une jeune startup amricaine qui permet de crer ses
propres chatbots. Sa solution serait dploye chez Forbes, Techcrunch et dans la
messagerie instantane Telegram qui compte plus de 100 millions dutilisateurs.
Pandorabots (2008), une startup dOakland (Californie) qui propose une plate-
forme de chatbot en ligne, open source et multi-lingue. 285 000 chatbots avaient
t gnrs avec en date daot 2017. Ils sont intgrables dans divers environne-
ments de messagerie instantans tels que Slack et Whatsapp.
Viv Labs (2012, $30M) est une startup californienne qui propose les outils de
cration dassistants vocaux avec des fonctionnalits voisines de celles de SIRI.
Et bien videmment, les solutions du domaine issues des GAFAM, notamment
Messenger 2.1 chez Facebook qui permet de dvelopper son propre chatbot, les
outils dveloppeurs de Cortana chez Microsoft, ceux de Google et enfin, Amazon
Alexa, qui est trs utilis dans le domaine des objets connects pour les rendre pi-
lotables par la voix.
Il existe mme des prix rcompensant les chatbots sapprochant le mieux du test de
Turing ou le passant entirement : les Leobner Prizes, crs en 1990. Sil a bien t
attribu chaque anne depuis dans sa premire mouture, et notamment au crateur de
Cleverbot en 2005 et 2006, il ne la pas encore t dans la seconde, celle du passage
complet du test du Turing devant deux juges.

Traduction automatique
La traduction automatique sest longtemps appuye sur des mthodes statistiques
avec normment de bidouillage manuel.
Le deep learning a fait son apparition dans le domaine relativement rcemment. Il
exploite des rseaux de neurones rcurrents (RNN), leur variante mmoire (LSTM :
Long Short Term Memory) et de nombreuses autres dclinaisons 121 . Ce champ
dapplication sappelle en amricain le Neural MT pour Neural Machine Translation.
Ce courant est devenu dominant trs rcemment, en 2016.

121
Cf la confrence Traduction et traitement de la langue naturelle dHuggo Schwenk dans la chaire de Yann LeCun au Collge de
France en avril 2016.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 156 / 362
Contrairement la reconnaissance dimages o lIA a dpass les capacits hu-
maines, la traduction base dIA ny est pas encore. La traduction base dIA est
encore imparfaite mais elle ralise des progrs constants, les langues asiatiques tant
toujours plus difficiles grer car elles sont plus images que les langues euro-
pennes. Do la performance remarque de Rick Rashid, lpoque patron de Mi-
crosoft Research, lorsquil dmontra en Chine une solution de traduction orale de
langlais au chinois en 2012122.

Les systmes de traduction les plus sophistiqus sont ceux qui font du speech-to-
speech, savoir quils interprtent la voix et non du texte et le transforment en voix
dans la langue cible. Ils alignent donc au minimum trois agents : speech-to-text, tra-
duction puis text-to-speech. Ce dernier agent peut dailleurs lui aussi sappuyer sur du
deep learning pour gnrer une voix aussi raliste que possible123.
Lun des leaders mondiaux de la traduction est Systran. Cette socit amricaine
cre en 1968 avait dmarr en traduisant du russe en anglais pendant la guerre froide.
Elle est devenue franaise en 1986 puis acquise par le coren CSLi en 2014. Elle fai-
sait moins de 10M de chiffre daffaire en 2009.
Google et Microsoft proposent chacun de leur ct un systme de traduction automa-
tique avec lapplication mobile Google Translate dun ct et Cortana de lautre.
Mais elles nont pas la mme fonctionnalit : Google Translate traduit le texte photo-
graphi dans des images tandis que Cortana fait du speech-to-speech. Google Tran-
slate est galement disponible sous forme dun service Internet capable de grer des
dizaines de langues. Google Translate a fait dnormes progrs fin 2016 avec
lintgration de son systme GNMT (Google Neural Machine Translation) qui ex-
ploite massivement du deep learning.

Extraction de donnes
Le traitement du langage a dautres applications diverses consistant exploiter les
donnes qualitatives extraites de textes.

122
Visualisable ici : https://www.youtube.com/watch?v=Nu-nlQqFCKg.
123
La mthode est documente dans cette prsentation Deep Learning in Speech Synthesis de Heiga Zen de Google qui date de
2013 : https://static.googleusercontent.com/media/research.google.com/fr//pubs/archive/41539.pdf.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 157 / 362
Elles permettent didentifier des personnes, des socits, produits, lieux, prix ou dates
dans des textes et notamment sur Internet et dans les rseaux sociaux. Elles classifient
ces informations selon divers critres comme les sujets de discussion ou la
tonalit, que lon appelle lanalyse de sentiments. Les techniques dIA sont de plus en
plus courantes dans ces applications.
Lexploitation de rseaux de neurones RNN et de LSTM permet aussi damliorer la
capacit dtecter les sentiments dans des textes, de manire plus fine quavec une
simple analyse syntaxique classique124. Ces techniques servent mme dtecter les
discours de haine sur Internet125.
De nombreuses startups oprent dans ce secteur. Langlais Wrapidity (2015) a dve-
lopp une technologie pour automatiser lextraction de donnes partir de contenus
Web non-structurs. Elle a t acquise par la socit de datal analytics Meltwater
(2014) dbut 2017. DefinedCrowd (vido avec son ukull de circonstance) capte
les donnes vocales ou textuelles et les exploite, notamment pour de lanalyse de sen-
timents. Weotta (2011) met en uvre ce genre de technique dans son application
WeottaGo, une application de recommandation mobile.
Le franais Heuritech (2013) propose sa solution logicielle Hakken danalyse s-
mantique, de tagging et classement automatiques de textes, images et vidos sous
forme dAPIs. Ils proposent aussi HeuritechDIP qui permet damliorer sa connais-
sance des clients et danticiper leurs besoins, videmment, surtout dans les applica-
tions de commerce en ligne. Le tout exploite force marchine et deep learning. La star-
tup sappuie sur les travaux de recherche du CNRS LIP6 et de lISIR de lUPMC (Pa-
ris VI).
Proxem (2007, 1m) est une autre startup franaise qui propose une solution
de traitement automatique du langage permettant de filtrer, analyser, tagger et classi-
fier automatiquement de gros volumes de donnes textuels, comme dans les commen-
taires dutilisateurs dans les rseaux sociaux ou sites de e-commerce. Le tout sappuie
sur des techniques de machine learning et de deep learning.
Loutil permet notamment dexplorer les donnes analyses de manire visuelle pour
identifier des patterns et signaux faibles. Elle sest fait remarquer en 2016 en tant
utilise par lquipe de campagne dEmmanuel Macron pour analyser le contenu des
enqutes terrain et faire ressortir les thmatiques cls.
La startup franaise Keluro (2014) cre par des anciens de lENS se focalise de son
ct sur lexploitation des emails dentreprises pour en tirer des informations exploi-
tables et structurer les conversations. Ils exploitent des techniques de machine lear-
ning pour la classification des informations. La solution est en bta depuis septembre
2016.
SkipFlag Rover exploite les donnes circulant dans les entreprises notamment dans
les outils collaboratifs comme Slack pour crer des bases de connaisances capables

124
Cf OpenAI sets benchmark for sentiment analysis using an efficient mLSTM, avril 2017.
125
Cf Internet researchers harness the power of algorithms to find hate speech, octobre 2017.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 158 / 362
de rpondre aux questions cls. Encore une application exploitant lanalyse du lan-
gage.
DeepQA, lune des briques dIBM Watson, permet de crer des agents conversa-
tionnels. Elle permet dextraire des rgles de textes, comme des documents scienti-
fiques. Cela permet dalimenter en retour des moteurs de rgles de systmes experts.

Il existe videmment divers outils de dveloppement spcialiss dans le traitement du


langage. On peut citer notamment la bibliothque open source Gensim crite en Py-
thon qui sert notamment analyser des textes, identifier des sujets traits ou des
sentiments et peut-tre notamment exploite dans des applications de commerce en
ligne.

Moteurs de recherche
Les moteurs de recherche se sont dvelopps avant que lIA devienne mainstream
mais ils font de plus en plus appel lIA pour amliorer leurs fonctionnalits.
LIA joue notamment un rle cl dans la recherche dimages, pour les tagger
automatiquement ou pour rechercher des images similaires. Cette dernire fonction
sappuie de plus en plus sur du deep learning et des rseaux de neurones
convolutionnels.
Les outils de traitement du langage naturel sont aussi mis en uvre pour comprendre
le contenu et le contexte des recherches et pour dcoder la voix des vidos.
Google utilise depuis quelques annes son outil maison RankBrain pour amliorer la
pertinence des recherches, en complment de lhistorique PageRank. Il serait utilis
dans plus de 15% des requtes dutilisateurs. Le systme dtermine les termes qui ont
un sens voisin des mots utiliss dans la recherche en fonction de son contexte.
En France, Antidot (1999, $3,5m) est connu pour son moteur de recherche pour en-
treprises. Il propose une fonction de classification automatique de contenus ainsi que
damlioration de la pertinence des rsultats de recherche sappuyant sur du machine
learning.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 159 / 362
Sinequa (2002, $5,33m) est un fournisseur franais de solutions de big data et
danalyse de donnes pour les grandes entreprises. Il fournit un moteur de recherche
smantique capable dexploiter les donnes issues de nombreux progiciels (ERP,
CRM, gestionnaires de contenus, etc). La socit a annonc en 2015 investir dans le
machine learning pour amliorer la performance de ses solutions.
Il existe aussi de nombreux moteurs de recherche spcialiss comme pour les mtiers
juridiques, vus plus loin dans la partie correspondante.
Dans le domaine de la recherche, nous avons notamment Iris.ai (2015, $422K), une
startup dOslo qui facilite la recherche documentaire de travaux de recherche et af-
fiche des nuages de mots cls facilitant la navigation dans les rsultats. Elle ambi-
tionne aussi dautomatiser certaines fonctions des chercheurs sur le plus long terme
(vido). La startup organise aussi des Scithons, des hackathons scientifiques permet-
tant la mise en rseau de chercheurs et dentreprises.

Gnrateur de textes et de rsums


La gnration de texte partir de donnes brutes issues de bases de donnes ou de
rsums partir de textes est un autre pan du march. Nombre de ces solutions sont
exploites dans les mdias comme nous le verrons dans la partie correspondante.
Le franco-amricain Yseop (2008) est un de ces spcialistes. Bas Lyon et Dallas,
il propose notamment Savvy, un plugin pour Excel qui traduit en texte comprhen-
sible les donnes dun graphe. Les techniques employes associent un moteur de
rgles et des algorithmes gntiques. Il a un concurrent amricain, avec loutil
Wordsmith dAutomated Insights (2007).

Narrative Science (2010, $40,4m) est ainsi capable de rdiger tout seul des textes
partir de donnes structures quantitatives et non structures, avec son outil Quill. Il
est utilis dans les mdias et dans le marketing. Cest un peu un quivalent des solu-
tions du franais Yseop. Lun des usages typiques est de produire une brve
dinformation sur le cours de la bourse ou les rsultats trimestriels dune socit.
Cest une information dont le formatage est trs rptitif. La startup vise les marchs
de la distribution, financiers et les services publics. La socit complte depuis 2016
les textes quelle gnre avec des graphes gnrs par la startup Qlik.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 160 / 362
De nombreuses startups sont positionnes sur ce secteur, comme Arria qui vise les
marchs financiers, des utilities, de la sant et du marketing, les franais LabSense et
Syllabs, les Allemands Retresco (2008) qui produit automatiquement des comptes-
rendus de comptitions sportives et Textomatic (2010, $40M) ou Automated In-
sights (2007, $10,8M).

Robotique
La robotique est un domaine part entire qui tire de plus en plus partie des briques
techniques de lIA.
La notion de robot est trs ancienne et remonte lantiquit, mais le mot serait apparu
en 1920 dans une pice de lcrivain tchque Karel Capek. Le premier robot mobile
capable de sadapter son environnement tait Shakey (1966-1972). Il tait quip
de divers capteurs dont une camra et des dtecteurs de proximit et reli des mini-
ordinateurs DEC PDP-10 et PDP-15 via une liaison radio.
Les dfinitions dun robot ont volu avec le temps. Aujourdhui, on voque un engin
interagissant avec le monde physique pour accomplir diverses tches et qui sadapte
lenvironnement.
Voici une gradation de la notion dautomate et de robot de mon cru :
Automate : il rpte lidentique un geste programm, via un logiciel ou par la
saisie dun geste humain. Cest l que lon peut ranger les machines dusinage
commande numrique, les robots de peinture qui excutent systmatiquement le
mme geste ainsi que les imprimantes 3D. Les robots de chirurgie tlcommands
sont aussi dans cette catgorie.
Robot : qui ajoute lautomate la capacit ragir son environnement avec des
rgles programmes de manire traditionnelle par logiciel. Cest le cas dun robot
dembouteillage qui sait sarrter si un incident est dtect par des capteurs
simples. Les premiers robots de cette catgorie ont t crs par Unimation et ins-
talls chez GM en 1961. De nombreux robots industriels manipulateurs ont t
crs pendant les annes 1970, aux USA (Cincinnati Milacron, Unimation), au Ja-
pon (Hirata) et en Sude (ASEA).
Robot : qui ragit son environnement grce des sens qui font appel de
lintelligence artificielle et notamment la vision. Cest le cas de nombreuses cat-
gories de drones et de certains robots humanoides. Cette catgorie de robots vo-

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 161 / 362
lue donc en liaison troite avec les progrs rcents de lIA notamment dans
lapprentissage profond.
Robot : qui en plus des fonctions prcdentes est dot de capacits
dapprentissage et dadaptation. Ils sont plutt rares.
Les robots sont souvent ddis des tches dangereuses (centrales nuclaires, dmi-
nage), rptitives (peinture), stressantes (assemblage), fatigantes (manutention, BTP,
tonte de la pelouse), ennuyeuses (vissage), rpugnantes (nettoyage), ou impossibles
raliser de manire classique (rovers sur Mars, drones ariens, ). Ils interviennent
aussi l o ils sont moins chers dans la dure que des oprateurs humains.
La robotique ncessite lintgration de trs nombreuses disciplines : la mcanique, les
moteurs, les capteurs et les sens artificiels (vision, toucher, ouie, gaz, humidit, pres-
sion, temprature, proximit), la planification et le raisonnement.
Un robot est dans la pratique un agent compos de trs nombreux agents qui doivent
tre bien coordonns. Il doit accomplir des tches avec plus ou moins de degrs de
libert et dinitiative. Il doit pouvoir sadapter son environnement et grer les im-
prvus. Et enfin, il doit respecter les fameuses lois de la robotique de lcrivain Isaac
Asimov issues de I, Robot (1950)126.
Les sciences de la robotique cherchent rpondre de nombreuses questions cls :
Comment le robot peut-il se reprsenter le monde qui lentoure ? Cest une ques-
tion dinterprtation de ses sens visuels et autres.
Comment doit-il ragir aux vnements quil peroit ?
Comment peut-il apprendre de lexprience ? Comme lorsquil apprend viter un
obstacle de manire prventive et non pas au dernier moment.
Comment doit-il interagir avec lutilisateur ?
Comment quilibrer ses objectifs et les contraintes de son environnement ?
Comment peut-il planifier ses tches ?
En robotique comme dans le reste de lIA, le biomimtisme est aussi une source
dinspiration. Larticulation du fonctionnement entre le cortex crbral et le cervelet
fait lobjet de nombreuses tudes sur la coordination des mouvements. Le cervelet
joue le rle de coprocesseur de mouvements appris pour le cortex. Il fonctionne sur
un mode supervis avec un apprentissage progressif, comme pour celui de la marche
pour les enfants en bas ge.

126
Un robot ne peut porter atteinte un tre humain, ni, en restant passif, permettre qu'un tre humain soit expos au danger ; un
robot doit obir aux ordres qui lui sont donns par un tre humain, sauf si de tels ordres entrent en conflit avec la premire loi ; et un
robot doit protger son existence tant que cette protection n'entre pas en conflit avec la premire ou la deuxime loi.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 162 / 362
Les neurones du cervelet sont organiss diffremment de ceux du cortex. Le cortex
comprend 16 milliards de neurones alors que le cervelet en contient au moins 56 mil-
liards. Ils qui sont plus denses et plus connects entre eux que dans le cortex. Par
contre, alors que le cortex comprend de trs nombreuses cellules gliales qui rgulent
leur activit et la transmission des influx nerveux des axones reliant les neurones
entre eux, le cervelet en comprend beaucoup moins. Qui plus est, le cervelet est
proche de la molle pinire. Tout est fait pour lui permettre de fonctionner en temps
rel !
La position du cervelet dans la boite cranine empche den mesurer lactivit
comme on le fait avec des capteurs dlectroencphalogrammes autour du cortex. Sa
densit est telle que mme Neuralink nenvisage pas dy placer des lectrodes pour
nous apprendre instantanment bien danser ou pratiquer tel ou tel sport. Le cervelet
conserve donc un caractre plus mystrieux que le cortex. Et il est encore plus diffi-
cile imiter que le cortex. Avec la qualit de nos sens, cela explique indirectement
pourquoi la robotique, surtout humanode, progresse plutt lentement alors que la ro-
botique industrielle et non humanode constitue lessentiel de ce march.

Ainsi, selon IDC127, le march de la robotique mondial tait de $71B en 2015 et de-
vrait atteindre $135B en 2019, gnrant une croissance annuelle de 17%. Le march
des services en robotique tait estim de son ct aux alentours de $9B $11B en

127
Source : http://fortune.com/2016/02/24/robotics-market-multi-billion-boom/.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 163 / 362
2015 selon les sources. Il sest vendu presque 300 000 robots industriels en 2016 et
cest la Chine qui capte la plus grande partie de ce march, tant en production quen
installations.

Les gros consommateurs de robots sont sans surprise les grands pays industriels : la
Chine, la Core du Sud, le Japon, les USA, lAllemagne et lItalie, qui est devant la
France. La base installe des robots industriels serait denviron 2 millions dunit la
mi 2017.

Le march est surtout concentr sur les robots industriels mais ce sont les robots hu-
manoides qui font le plus parler deux. Les japonais cherchent depuis des dcennies
conevoir de tels robots capables de soccuper de leur population vieillissante. Cest
un choix technologique li un choix politique de ne pas favoriser limmigration. La
population japonaise est dailleurs en dclin du fait dun faible taux de natalit.
Le robot humanoide le plus avanc du ct de sa capacit se mouvoir est probable-
men Asimo de Honda, cr en 1986 et rgulirement mis jour depuis. Il danse,
court, monte et descend les escaliers et peut aussi tourner en rond. Sa dextrit est par
contre moyenne et il nest pas trs fiable. Cest toujours un engin de laboratoire et de
dmonstration, dont les versions succesives sont gnralement construites une dou-
zaine dexemplaires.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 164 / 362
Cette soif de robots explique les investissements de Softbank, dune part avec
lacquisition en 2013 du franais Aldebaran Robotics, devenu Softbank Robotics et
dautre part, avec celle de Boston Dynamics et de Schaft auprs de Google en 2017.
Les robots humanoides Nao et Pepper de Softbank Robotics illustrent ltat de lart
actuel. Ils ont une belle capacit de mouvement grce une mcanique de bon niveau,
surtout Nao. Ils interagissent en parlant avec l'utilisateur, mais de manire encore li-
mite. Pepper est cens capter les motions des humains qu'il a en face de lui, grce
IBM Watson, mais sa capacit de dialogue est encore approximative. Dans la pra-
tique, ces robots sont des SDK sur lequels sont construits des applications mtiers
comme un agent de renseignement pour un centre commercial, un point de vente
(Softbank ou Nespresso Tokyo) ou un lieu de transport.
Les agents conversationnels sont des chatbots vocaux qui ne rpondent qu des
questions scriptes et en fonction des bases de donnes ou de connaissances aux-
quelles ils sont connects.
Les robots les plus impressionnants du moment nont aucune capacit de dialogue.
Ce sont ceux de Boston Dynamics, Spot et Handle (ci-dessus, droite), capables de
rouler avec habilet et de dplacer des paquets dans des tagres. Leur capacit
comprendre leur environnement en temps rel constitue un rel progrs. Mais ce sont
des prototypes, pas des produits dploys dans les entreprises.

De nombreux robots avec des capacits mcaniques plus limites sont proposs pour
servir de centres de renseignement ambulants dans des lieux publics comme les
centres commerciaux ou les aroports. Ce sont en quelque sorte des tablettes rou-
lettes, comme chez le chinois Qihan, le franais Hease Robotics, un autre robot
franais, cr Lyon et anim par les logiciels dun autre Lyonnais, la startup Hoo-
mano. Il y a aussi ceux dautres startups franaises, Partnering Robotics (2007) et

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 165 / 362
Wyca Robotics ou le Japonais Robosoft Kompa (1996, $15,7M). Leur fonction
principale est donc lie lagent conversationnel mtier quils intgrent et qui gre un
spectre souvent troit de discussion. Je me moque un peu de ces tablettes roulettes
mais leur forme a une utilit. Elle est dabord plus facile fabriquer et grer et elle
permet dviter de faire basculer le robot dans la valle de ltrange (uncanny valley).
Elle corrrespond au sentiment ressenti qui peut tre dsagrable lorsque lon a faire
un robot trop proche dun tre vivant.
De leur ct, les exosquelettes ont moins de capteurs sensoriels. Ils sont surtout pilo-
ts par lutilisateur, notamment via la partie de leur corps qui fonctionne encore
comme pour le franais Wandercraft (2013, $19,4M), qui vient de dmontrer en
septembre 2017 son premier prototype oprationnel, ou le japonais Cyberdyne, et
qui remonte parfois au cortex moteur dans les lobes biparitaux comme pour le projet
dexosquelette quatre membres du laboratoire grenoblois Clinatec qui est destin
aux ttraplgiques.
Il y a moins dIA et plus de mcanique dans ces produits. Lun des points cls est la
miniaturisation des moteurs et des batteries pour rendre ces engins aussi lgers et pra-
tiques que possible. Les exosquelettes peuvent tre partiels comme avec la main ro-
botise de lAmricain BrainRobotics et lexosquelette lombaire Atlas du franais
Japet Medical Devices.

De nombreux robots que nous venons de voir sont inspirs duvres de science-
fiction. Les robots commercialiss en volume et vritablement oprationnels prennent
bien dautres formes.
Cest le cas des robots de sol . Quil sagisse daspirateurs (Roomba de iRobot),
de tondeuses gazon (Friendly Robotics et Husqvarna) ou de systmes de scurit
mobile (EOS Innovation128, AI.mergence), leur principale fonction est de se mou-
voir au sol, dviter les obstacles, de balayer optimalement une surface donne, et de
raliser une tche mcanique spcifique.

128
LESN Econocom a dclin le robot dEOS Innovation pour en faire un robot dinspection de data-center en 2017, Captain DC.
EOS Innovation tait une filiale du franais Parrot qui a t ensuite acquise par Econocom. Cf https://vimeo.com/170005575.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 166 / 362
Leurs capteur de proximit voire visuels leur permettent de cartographier leur envi-
ronnement et de sy mouvoir. Ils doivent aussi souvent pouvoir retrouver leur station
de recharge de batterie. Une variante de ce genre de produit est ltonnante valise ro-
bot de Cowarobot qui suit automatiquement son utilisateur (vido) et que javais d-
couverte loccasion du CES 2017.
Les loisirs sont un autre domaine pour les robots, avec le robot joueur de ping pong
du fabricant de composants Omron (ci-dessous, vu au CEATEC de Tokyo en octobre
2014 et qui nest quun dmonstrateur pour un fabricant de composants) ou le ramas-
seur de balles de tennis de Tennibot. Le joueur de ping pong robotis exploite surtout
un systme de vision stroscopique coupl un systme prdictif de la position de la
balle en fonction des gestes de son comptiteur humain. Le ramasseur de balles uti-
lise ses capteurs de vision pour dtecter les balles et les ramasser.

Les robots dusines sont de leur ct mis contribution pour devenir barmen ou ges-
tionnaires de machine caf comme avec le Bionic Bar, install dans les paquebots
du croisiriste amricain Royal Carribean et le Denso Barrista Robot vu au CES
2017, une dclinaison dun robot dusine pour un usage grand public de dmonstra-
tion, Denso tant surtout un quipementier pour lindustrie automobile.
Il existe aussi plein de robots transporteurs de charges pour les entrepots, comme les
robots manutentionnaires de Kiva qui ont t acquis par Amazon pour $775m en
2012 (ci-dessous gauche).

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 167 / 362
Dans les transports, les robots de FuelMatics remplissent automatiquement votre r-
servoir dessence si vous avez install leur bouchon spcifique dans votre vhicule
(ci-dessus droite).
Dans larospatial, les robots doivent tre trs autonomes. Cest le cas des rovers So-
journer et Curiosity qui explorent Mars. Les communications aller et retour entre
Mars et la Terre durent plus de 45 mn. Ces robots doivent donc se dbrouiller tous
seuls en fonction de leur plan de charge. La consquence est quils sont plutt lents.
Les tlescopes spatiaux sont aussi trs autonomes, commele James Webb Telescope
qui sera lanc en octobre 2018 et mettra plus de deux semaines se dployer avec des
dizaines doprations de dpliement de sa structure en origami.

Les drones militaires savent grer leur vol de manire autonome mais sont pilots
distance, notamment pour les ordres dobservations ou de lancements de missiles. Il
en va de mme pour les drones sous-marins qui sont tlguids.
On se demande cependant quoi peut rimer ce robot russe, le FEDOR, tout droit sor-
ti de Robocop qui tire avec prcision sur une cible fixe (vido). Si lobjectif est de
faire peur sur les risques de lIA et de la robotique, il sera rapidement atteint.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 168 / 362
Comment fonctionnent tous ces robots ? Un peu comme pour le Machine Learning et
le Deep Learning, leurs crateurs ont rarement dvelopp des logiciels idoines pour
leur donner vie. Ils sappuient le plus souvent sur des SDK du march. Plusieurs star-
tups sont prsentes sur ce march et notamment Vicarious (2010, $122M) et Kin-
dred (2014). Des startups comme lAmricaine Neurala (2006, $14M) sont spciali-
ses dans lIA pour le pilotage automatique des drones avec leur SDK Brain4Bots
intgrant deep learning, vision artificielle et support de GPU comme ceux de Nvidia.

20 ans aprs la renaissance des rseaux neuronaux, en 2006, le japonais Osamu


Hasegawa crait les rseaux neuronaux auto-organiss incrmentalement (Self-
Organising Incremental Neural Network ou SOINN), utilisables dans des rseaux
neuronaux auto-rplicables et capables dauto-apprentissage. En 2011, son quipe
dveloppait un robot utilisant ces SOINN capable dauto-apprentissage (vido), illus-
trant magistralement les applications des rseaux neuronaux (ci-dessus droite).

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 169 / 362
La robotique est encore un grand champ dexprimentation et de makers. Un grand
nombre de projets dtudiants et de chercheurs ttonnent pour faire avancer le do-
maine. On a par exemple des robots de tri de pices de lgo (source) ou de rsolution
du Rubiks Cube en une demi seconde (vido).
De nombreuses startups se lancent avec plus ou moins de bonheur dans le domaine.
Les me-too sont lgion et on attend toujours des robots capables de bien apprhender
leur environnement et dinteragir avec. Se dveloppe galement une conomie de
services et dingnierie en robotique129.
Cela explique pourquoi nombre de mtiers manuels sont bien plus protgs au-
jourdhui que le sont certains mtier de cols blancs grant des processus rptitifs,
bien plus faciles automatiser.

Marketing et vente
Le marketing et la vente, surtout en ligne, sont lun des marchs les plus florissants
des applications de lIA. Elles sont mises en uvre dans toutes les tapes du cycle de
vente et loffre de startups y est tellement abondante que cela en devient risible, la
cartographie ci-dessous totalisant 5000 logos.
Heureusement, toutes ces startups ne font pas appel de lIA mme si un trop grand
nombre sen vante ! Et lexcellent Panorama des solutions dintelligence artificielle
pour le marketing publi par Fred Cavazza en octobre 2017 permet dy voir un peu
plus clair (ci-dessous droite).

129
Comme avec iSee Automation, une startup issue du MIT qui est finance dans le cadre du fonds de deep techs The Engine lanc
par ce dernier et dot de $200M (source).

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 170 / 362
Dans le marketing amont et le planning, lIA aide segmenter ses clients, com-
prendre leur besoin, dfinir des marchs et clients cibles et interagir directement
avec eux. Le profiling dutilisateurs dans les rseaux sociaux permet de faire du mi-
cro-ciblage doffres.
Ltape de dveloppement de la notorit tire parti de solutions qui aident optimiser
le plan mdia et le reach de ses campagnes. Les chatbots interviennent aussi bien en
avant-vente quen aprs-vente et leur offre est abondante comme nous lavons vu
prcdemment130.

Les outils de recommandation de produits dans les sites de vente en ligne sappuient
sur du machine learning. Les catalogues de produits sont valoriss avec des systmes
de reconnaissances dimages similaires. Les sites web tirent parti doutils
doptimisation du parcours utilisateur. Enfin, de nombreux outils automatisent ou ac-
compagnent le rle des conseillers commerciaux dans les centres dappels entrants et
sortants. Bref, la panoplie des outils dIA en marketing et vente est vaste, surtout pour
les sites de vente en ligne.

130
Voir aussi cet excellent Panorama des solutions dintelligence artificielle pour le marketing publi par Fred Cavazza en octobre
2017.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 171 / 362
Une bonne part des startups de ce secteur proposent des solutions gnralistes int-
grant plusieurs outils et accdant des sources de donnes externes. Lucy dEquals3
(2015) sappuie sur Watson pour segmenter les clients, dfinir ses messages et opti-
miser son mdia planning.

Albert de la startup AdGorithms (2010, IPO en 2015) intgre des outils de segmen-
tation d'audience, dachats mdias, doptimisation plan mdia cross-channel, de tests
et optimisation et danalytics. Dans la pratique, cest une grosse boite noire exploitant
de nombreuses sources de donnes. Albert et Lucy sappuient tous les deux sur des
briques dIBM Watson.
Loptimisation des messages et contenus est aussi le domaine des startups amri-
caines assez bien finances que sont Captora (2012, $27m) et Persado (2012, $66m).
La planification des messages et des mdias sappuie sur la gestion et lanalyse des
donnes issues des mdias sociaux comme avec Meshfire (2012, $350K), Cortex qui
prdit la raction des Internautes aux contenus (2014, $500K) et SimpleReach (2010,
$24,2m).

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 172 / 362
Il existe des solutions plus spcialises comme Tailor Brands (2014, $5m) qui aide
crer son logo et sa charte de communication aprs avoir fourni les attributs de sa
marque. Lagence de communication McCann de Tokyo utilise de son ct une IA
comme directeur de cration. Tout cela est bien vaporeux car pas trs bien document.

Nous avons aussi des solutions doptimisation de sites web comme Webpage.ly
(2015) qui est focalis sur le rfrencement naturel (SEO) et fonctionnement en mode
cloud. Tilofy (2013, $1m) est de son ct une solution solution de prdiction des ten-
dances dans le fashion et les usages, dont les mthodes et techniques ne sont pas pr-
cises mais qui doit faire appel des techniques danalyse du langage (NLP).

Network Insights (2006, $77,2m) propose Audience.ai, un outil danalytics qui ex-
ploite les traces des utilisateurs dans les rseaux sociaux pour dfinir des profils de
prospects et clients ultra-prcis et des messages associs ultra-cibls. Ce nest pas
sans rappeler les mthode de Cambridge Analytica qui avait jou un rle pour cibler
les messages pro-Trump dans les swing states pendant la prsidentielle amricaine
2016. Cette approche marketing consistant faire du micro-ciblage multi-factoriel sur
des clients avant de lancer ses campagnes marketing est aussi propos par une startup
de Palo Alto, Mariana (2014, $4M).
Meltwater (2001, $60m en dette) propose des solutions en cloud de veille et
danalyse de linformation sur les mdias en ligne et sociaux. Elle croit rapidement
par acquisitions, avec quatre acquisitions en 2017 dont celle de langlais Wrapidity,
issue dun projet de lUniversit dOxford. Meltwater couvre la veille stratgique, la
pige mdia en ligne, le ciblage de journalistes, le-rputation, lanalyse des rseaux
sociaux et de sentiments sur les marques et la mesure de performance des campagnes
marketing en ligne. Le tout est prsent dans un tableau de bord (exemple ci-dessous
gauche).

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 173 / 362
Conversica (2007, $56m) est un outil dautomatisation de la communication par mail
des prospects (exemple ci-dessus droite). Comme dhabitude, les techniques dIA
ne sont pas prcises mais relvent certainement de combinaison doutils de NLP
(traitement du langage). Loutil sinterface comme il se doit avec ceux de SalesForce
et met le client en relation avec un vritable conseiller commercial si ncessaire.
Cest une sorte de Julie Desk applique aux premiers traitements dune demande dun
prospect. Une explication du processus dans cette vido.
En complment du prcdent, People.ai (2016, $7M) fournit de son ct des outils
daide et de coaching de conseillers commerciaux pour les former closer les deals,
par analyse de patterns dappels antrieurs, et aussi pour les viter de passer trop de
temps avec les clients impossibles closer. Pour ce qui est de visualiser leur outil,
cest une autre paire de manche : impossible ce stade ! A part quelques vidos de
formation pour conseillers commerciaux.
Langlais Qubit131 (2010, $75m) a dvelopp un moteur de dtection automatique
des opportunits de revenu base de machine learning, exploit principalement par
les sites de vente en ligne. Cest en fait un outil de segmentation automatique de
clients pour identifier ceux qui sont les plus prometteurs. Le systme permet aussi de
piloter des campagnes en ligne dA/B Testing doffres commerciales cibles.

131
Il est dommage que cette socit utilise une dnomination lie linformatique quantique, quelle nutilise pas du tout. Quand on
cherche des vidos les concernant, on tombe bien videmment en premier sur des explications sur les qubits de linformatique quan-
tique et pas sur leurs propres vidos. Cest ballot !

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 174 / 362
La startup franaise PredicSis (2013, $1,3M) est sur le mme secteur avec ses outils
de prdiction du comportement des clients qui sappuie sur des techniques de ma-
chine learning. Elle sert notamment limiter le churn dans les entreprises proposant
des services sur abonnement. Leur solution est notamment dploye chez American
Express, Natixis, Crdit Agricole, Orange et EdF.
Enfin, le spcialiste de lquipement des centres dappels Genesys est cens utiliser
IBM Watson pour amliorer ses services en analysant le flot de donnes gnr par
les appels clients.
Histoire de boucler la boucle, reste vrifier, par analyse des sentiments, que cette
monte en charge de lutilisation de lIA dans la relation clients naboutisse pas un
rejet de ces mmes clients excds par les robots, comme la slection directe
larrive (SDA) dans les centres dappels !

Ressources humaines
Peut-on injecter de lintelligence artificielle dans les ressources humaines ? Il semble
que oui, tout du moins, essentiellement dans les processus de recrutement. Cest en-
core en observant les crations de startups que lon peut se faire une ide des grandes
tendances.
Nous avons tout dabord des outils danalyse prdictive pour identifier des talents
chasser avec Entelo (2011, $41M) et Gild (2011, $26mn). Ce genre doutil sappuie
sur des techniques de prdiction exploitant du machine learning et laccs du big
data. Entelo est dot dun moteur de recherche qui scrute les profils dindividus sur
Internet pour les exploiter, partir de 70 critres comme ltat de leur employeur (ac-
quisition, IPO, volution du cours de bourse, analyse de sentiment). La partie IA de
ce genre de solution nest pas visible par les candidats sollicits. Ce sont des outils
dempowerment des recruteurs. La startupe franaise Clustree (2013, $11,5M), lan-
ce par Bndicte de Raphlis Soissan, utilise aussi lIA pour rapprocher loffre et la
demande.
Nous avons aussi des outils daide la rdaction dannonces demplois efficaces et
danalyse des rponses des candidats comme chez Textio (2014, $29,5M) (exemple
ci-dessous). On est ici dans le domaine du traitement du langage (NLP).

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 175 / 362
IBM Watson est utilisable pour analyser votre personnalit partir de vos crits,
en sappuyant sur Personality Insights et Tone Analyzer, deux outils danalyse de vos
crits132 qui font partie des diffrentes API de Watson. La solution permet en tout cas
de dtecter lhumeur de lauteur, comme sa tristesse. Et peut-tre damliorer les re-
crutements, tout du moins de candidats qui ont une vie publique sur Internet.

Lanalyse de personnalit peut aussi exploiter les vidos dinterviews, mme si le


candidat parle une machine, comme un jeu de serious gaming. Cest ce que propose
lAmricain HireView (2004, $93M). Leur logiciel analyse les visages et identifie
des traits de personnalit. La solution est dploye chez Unilever aux USA 133 .
Lhistoire pourrait se compliquer si les recruteurs se mettaient utiliser des variations
de ces systmes danalyse du visage comme ce prototype de Stanford qui dtermine
automatiquement les prfrences sexuelles134.

Le recrutement est aussi un autre terrain de jeu pour les chatbots comme celui que
lagence franaise TheChatbotFactory a dploy la BNP.

Cyberscurit
La cyberscurit est aussi un beau terrain de jeu pour lIA, pour dtecter les menaces
quil sagisse de spam demail, de mail de phishing ou didentification de vulnrabili-

132
Cf IBM Watson Developer Cloud, Personality Insights et IBM Watson Developer Cloud, Tone Analyzer.
133
Cf ltude de cas documente par HireVue : https://www.hirevue.com/customers/unilever-finds-top-talent-faster.
134
Cf This AI knows whether youre gay or straight by looking at a single photo, septembre 2017.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 176 / 362
ts diverses dans les rseaux et systmes dinformation, notamment les non mal-
ware attacks (remote login, attaques par scripts et macros, etc).
Les tentatives de phishing sont dtectes par GreatHorn (2015, $8,83m) ou avec
Lookout (2007, $282m) qui scurise les mobiles avec un modle prdictif. Les mal-
wares sont dtects avec du machine learning par Cylance (2012, $177M).
Lisralien DeepInstinct (2014, $32M) protge les systmes contre les failles de s-
curit rcentes (zero day threats). Ce serait la premire startup exploiter le deep
learning - avec des GPU Nvidia - tandis que la plupart utilisaient du machine learning
jusqu prsent pour faire de lanalyse multifactorielle des menaces en lieu et place
de lutilisation de bases de signatures de virus. Dans le mme genre, Recorded Fu-
ture (2009, $33M) utilise le machine learning pour dtecter les menaces de scurit
en temps rel.

Des startups comme Onfido (2012, $30M) vrifient lidentit de clients de service en
ligne. Cest de la dtection de fraude base sur du machine learning et du prdictif.

Lisralien Fortscale (2012, $32M) identifie de son ct les menaces internes dans
les entreprises, avec sa solution User & Entity Behavioral Analytics (UEBA). Il va
dtecter des comportements suspects comme la copie de fichiers de grande taille sur
des cls USB ! Dans les pays o ce genre de surveillance est autorise !

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 177 / 362
IBM qui met Watson toutes les sauces la aussi dclin dans la cyberscurit. Leur
Cognitive Soc (Security Operations Center) analyse toute la littrature disponible sur
la cyberscurit pour aider les entreprises dtecter et circonscrire les menaces. Ci-
gnitive Soc est reli trois outils dIBM : BigFix Detect qui dtecte les attaques dans
les noeuds de rseaux, QRadar Advisor qui analyse les incidents et IBM Resilient,
qui gre les rponses aux dtections dincidents de scurit.
Des startups se sont aussi spcialises sur la cyberscurit des objets connects. Cest
le cas de lamricain SparkCognition (2013, $38,9M). Loffre sarticule autour de
DeepArmor, une solution dantivirus qui ne sappuie pas sur un dictionnaire de signa-
tures mettre jour rgulirement. Elle est complte par SparkPredict qui teste de
nombreux paramtres et variables de fonctionnement de systmes embarqus pour
dtecter leurs failles de scurit.
Lisralien Beyond Security (1999) propose une solution dans le mme registre qui
teste tous les effets de bord de protocoles rseaux et logiciels pour identifier des trous
dans la passoire des objets connects. Les oprateurs tlcoms sont aussi intresss
par dautres formes de fraudes. Ainsi, Orange utilise la solution Skymind (2014,
$3,32M) pour dtecter la fraude aux cartes SIM en exploitant les logs dappels via un
rseau de neurones utilisant un autoencodeur.
Lintelligence artificielle va gnrer de son ct de nouvelles menaces. En effet, les
algoritgmes de machine learning et de deep learning peuvent tre retourns contre
eux-mmes par des pirates, en tant aliment par des donnes bidouilles qui altrent
leurs sens. Ces attaques peuvent intervenir tout dabord au niveau des capteurs ou des
rseaux pour injecter des donnes modifies.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 178 / 362
Les rseaux de neurones de vision artificielle peuvent tre tromps avec des images
modifies par une technique base de deep learning voisine de la stganographie, qui
nen change pas lapparence pour la vision humaine (exemple ci-dessous droite)135.

Ainsi, un panda lgrement modifi devient-il un singe pour lalgoritme de deep lear-
ning. Cela vient des mthodes de rseaux de neurones convolutionnels et de leurs
techniques de reprsentation hirarchiques qui ne correspondent pas la dcomposi-
tion fonctionnelle humaine mais des mthodes que lon pourrait qualifier de plus
mathmatiques et qui sont contournables.
Bref, cest comme dans larmement. Des mesures de dfense amnent la cration
des contre-mesures et de leurs propres contre-mesures dans une course sans fin !
Dans la cyberscurit, la tranquilit ultime est une vue de lesprit !

135
Cf Practical Black-Box Attacks against Deep Learning Systems using Adversarial Examples, fvrier 2016.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 179 / 362
Applications mtiers de lIA

Dans cette grande partie, nous allons faire un tour dhorizon de lusage de
lintelligence artificielle dans un bon nombre de marchs verticaux. Dans la pratique,
ils sont tous concerns de prs ou de loin. Sans grande surprise, les secteurs dactivit
qui exploitent le plus lIA sont ceux qui gnrent le plus de donnes, comme ceux de
la finance ou la sant.

Dans ce qui suit manqueront les secteurs de lnergie, celui de lducation et celui des
jeux vidos que jaurais loccasion de traiter dans une version ultrieure de ce docu-
ment.
Ici encore, linventaire couvrira des projets clients et les offres de startups. Elles ne
sont pas toujours bien documentes, notamment dun point de vue quantitatif, ce
dautant plus, que nombre dannonces portent sur des proof of concepts et pas
forcment sur des solutions dployes grande chelle.

Transports
Le march des transports est vaste avec lautomobile, le transport arien, le transport
ferroviaire, fluvial et maritime.
Tous ces secteurs sont transforms de prs ou de loin par lIA. Par exemple, sans que
cela transparaisse, il est probable que les systmes doptimisation du transport mari-
time par containers soit de plus en plus optimiss par des techniques de machine lear-
ning, voire deep learning, remplaant des techniques traditionnelles. Le yield mana-
gement des compagnies ariennes bnficie aussi de ces avances en intgrant a mi-
nima du machine learning dfaut de deep learning.
Mais cest surtout le transport automobile qui progresse le plus grce lIA, via les
vhicules conduite assist ou autonome que nous allons examiner de prs.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 180 / 362
Vhicules autonomes
Les vhicules autonomes sont une catgorie de robots capable datteindre un objectif
en tenant compte de leur environnement et dimprvus. A la diffrence des robots
humanodes, ils sont cependant bien plus matures.
La raison est simple : mme si cest une tche complexe, faire rouler un vhicule sur
une route, malgr toutes les contraintes que cela reprsente, prsente moins de con-
traintes et difficults que de se mouvoir dans lespace en 3D et dinteragir avec
lenvironnement physique.
Dans une voiture, la surface de contact est relativement simple et limite : un plan et
des roues ! Plus est faible le nombre de degrs de libert, plus lautomatisation est
facile grer. Cest pour cela que les mtros automatiques comme les lignes 1 et 14
Paris sont dj monnaie courante ou que les avions volent le plus souvent en pilote
automatique.
Cela explique aussi pourquoi des minibus autonomes comme ceux du franais Navya
peuvent circuler dans certains lieux publics o les autres vhicules ne circulent pas.
Lhtrognit des vhicules amne une complexit laquelle les voitures auto-
nomes doivent faire face.

La voiture automatique est une ralit progressive . Elle existe. Elle est dmontre.
Si elle nest pas encore courante, son contexte dutilisation crdible sagrandit
danne en anne. On passera trs graduellement de lautoroute en conduite semi-
autonome la conduite en route traditionnelle puis en ville. Elle mritera alors plei-
nement son appellation dauto-mobile !
La phase la plus dlicate sera dintgrer la conduite autonome dans des villes embou-
teilles et surtout hors des USA (Naples, Calculta, Shangha, la place de lEtoile
Paris) et les faire cohabiter avec des vhicules conduite traditionnelle, sans comp-
ter les deux roues et les pitons.
Le problme sera techniquement plus simple grer lorsque 100% des vhicules se-
ront conduite automatique dans les villes. Pour rgler les problmes dhtrognite,
on interdira long terme la conduite manuelle. Cest le stade 5 de la conduite auto-
nome.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 181 / 362
Les progrs de ces dernires annes sont significatifs. Ils rsultent defforts qui ont
dmarr en 2004 lors de dfis lancs aux chercheurs par la DARPA. Les premiers
vhicules autonomes de chercheurs roulaient convenablement pendant peine
quelques dizaines de secondes.
En 2016, Tesla, dmontrait que ses voitures autonomes pouvaient faire un trajet
complet de manire automatique, au-del des fonctionnalits de lAutopilot qui est
surtout cens servir rester dans sa voie sur autoroute (conduite automatique de ni-
veau 3). Voir la vido 1 et la vido 2 avec une Tesla X. Certes, les rues empruntes
ont un trafic trs faible, elles sont trs larges et aucun piton nest visible, comme
souvent aux USA. Des situations que lon rencontre plus rarement dans les villes eu-
ropennes. Les dmonstrations des Google Car sont du mme acabit mme si elles
circulent plus lentement que les Tesla.
En 2015 et 2016, plusieurs expriences de conduite autonome de camions ont t ra-
lises en Europe, avec notamment Volvo. Des milliers de kilomters ont t parcou-
rus par une srie de camions sur des voies rapides traversant plusieurs pays.
Il faut aussi creuser derrire les effets dannonce. Ainsi, Uber annoncait lancer son
premier service pilote de voitures autonomes Pittsburgh en septembre 2016 avec
des Ford Fusion. Mais les vhicules sont tout de mme pilots, ou tout du moins con-
trls, par des conducteurs dans un premier temps ! Une exprience mene San
Francisco avec 16 vhicules de tests Volvo XC90 PHEV a ensuite tourn court fin
2016 aprs une interdiction par la municipalit de la ville. Uber a alors dplac ses
vhicules en Arizona, plus accueillant.

Un grand nombre de techniques sont mises en uvre dans les vhicules conduite
assiste ou autonome : de nombreux capteurs (ultra-sons, radar, vido, LiDAR), des
systmes de vision artificielle (Mobileye, Nvidia, ), des tlcommunications (la 5G
jouera un rle cl), des services en cloud (cartographie 2D et 3D des environnements,
cartographie pour dterminer la route) et des systmes experts de prise de dcision.
Les progrs rcents sont ds aux avances parallles dans tous ces domaines.
Lcosystme qui se met en place fait intervenir de nombreux acteurs spcialiss et
crant des produits qui deviennent des plateformes comme les processeurs de Nvidia.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 182 / 362
Pour comprendre son environnement, un vhicule autonome doit disposer dune vi-
sion stroscopique ou 3D. Cest aujourdhui le rle des LiDAR avec leur laser tour-
nant mais ils sont pour linstant trop chers, coutant plusieurs milliers dEuros lunit.
Leur march est domin par le californien Velodyne et quelques copycats chinois.
La bataille en cours consiste crer des LiDAR dits solid state nayant pas besoin
de pices mcaniques mobiles rotatives comme les LiDAR existants. Nombre de star-
tups comme Quanergy ou LeddarTech proposent ce genre de solution, mais avec des
angles de vue limits qui obligent cumuler plusieurs capteurs pour disposer dun
angle de vue quivalent aux LiDAR rotatifs. Lautre solution consiste utiliser des
capteurs 2D traditionnels et du deep learning pour interprter les scnces. Cest ce
que fait lisralien Mobileye qui vient dtre acquis par Intel pour $15B.

Les systmes embarqus intgrent le plus souvent un GPU Nvidia adapt au deep
learning dinterprtation des images gnrs par ces capteurs divers. La rsolution
des images traites par ces systmes est encore mdiocre, ce qui limite leur prcision.
Elle samliorera sans doute avec les progrs venir de ces GPU.

Tesla est probablement le constructeur qui a le plus de vhicules semi-autonomes en


circulation avec ses Tesla S et le mode Autopilot qui est rgulirement mis jour. Le
premier accident mortel dun vhicule ainsi quip est intervenu mi 2016.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 183 / 362
Un procs sen est suivi qui a ddouan Tesla. Le conducteur navait pas respect les
consignes de scurit et les alertes. Mais le camions blanc dans lequel la Tesla stait
encastr ntait pas facile viter pour le capteur Mobileye de la Tesla. Le construc-
teur a donc fait voluer sa configuration en multiolant les capteurs, passant notam-
ment dun huit capteurs RGB. Labsence de LiDAR pourrait cependant reste un
handicap.

La fonction Autopilot qui a des quivalents chez dautres constructeurs nest pas la
seule qui automatise certaines tches de la conduite.
On peut aussi compter sur :
Le parking automatique, comme avec Park4U de Valeo qui est install sur de
nombreux vhicules haut de gamme de marques allemandes et franaises. Fini les
crneaux difficiles raliser !
Le maintient dans sa file sur voie rapide (Lane Keeping Agents), une des fonc-
tions cls de lautopilot des Tesla S.
Les manuvres avec des agents capables de doubler un vhicule et dautres qui
permettent de sortir de la voie rapide. Il existe aussi des agents qui vitent les col-
lisions.

Un grand dbat a cours au sujet de la gestion des dilemmes par les vhicules auto-
nomes en cas daccident, lorsquil leur faudra choisir entre la mort certaine du con-
ducteur, de ses passagers et de personnes sur la route ou entre plusieurs personnes
diffrentes sur la route (enfants, adultes).

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 184 / 362
Ce sont en fait des expriences de pense assez loignes de la ralit. Bien rares sont
les conducteurs humains qui ont eu grer de tels dilemmes dans la pratique 136. Cela
conduit cependant des chercheurs proposer lintgration de formes dthique dans
les algorithmes et rgles de fonctionnement des systmes conduite autonome137.
Au-del de ces questions thoriques dthique et mme sils se dploieront par tape,
les vhicules autonomes produiront des transformations radicales de lindustrie auto-
mobile et de nombreuses industries adjacentes.
Tout dabord, il est fort probable que les vhicules personnels perdront de leur attrait
pour une bonne part de la population, notamment en ville.
Les flottes de vhicules autonomes avec une forte densit de circulation rpondront
plus vite la demande en termes de temps de rponse quun vhicule personnel gar
dans un parking quil faut aller chercher. Cela pourra remettre en cause la structure
du mtier de constructeur automobile.

Quelques exemples :
Il y aura moins de voitures en circulation et moins dembouteillages dans les
villes domines par les vhicules autonomes.
Les passagers pourront vaquer dautres occupations dans leur vhicule, quil
sagisse de travail ou de loisir. Les techniques de personnalisation numrique de
lenvironnement des vhicules se dvelopperont.
Il y aura, si tout va bien, beaucoup moins daccidents138, avec un impact sur le
march des assurances dun ct et aussi, sur les systmes de sant.
Lusage de vhicules autonomes sera accompagn dune migration la propul-
sion lectrique, avec un impact positif sur la qualit de lair dans les villes.

136
Cf Robot Cars And Fake Ethical Dilemmas de Patrick Lin, Forbes, avril 2017. Qui explique que les dilemmes thiques voqus
ne sont que des expriences de pense thoriques qui prsentent lintrt de pousser la rflexion aussi loin que possible.
137
Lapproche peut consister gnrer un vote social pour identifier la prfrence intgrer dans lIA. Est-ce de lthique pour
autant ? Pas vident ! La foule est-elle toujours intelligente ? Vous avez deux heures ! Cf A Voting-Based System for Ethical Deci-
sion Making, septembre 2017.
138
La route fait 1,3 millions de morts par an dans le monde, concentrs en Inde et en Chine en volume, puis aux USA ! Plus que
nimporte quelle guerre. Il faut y ajouter entre 20 et 50 millions de blesss. Cf http://asirt.org/initiatives/informing-road-users/road-
safety-facts/road-crash-statistics.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 185 / 362
Les parkings pourront tre plus compacts, ceux-ci ne ncessitant pas dtre acces-
sibles par les passagers.
Les villes pourront tre ramnages. Les temps de trajets seront plus prdictibles
et lintermodalit plus facile mettre en uvre. Cela rendra la vie des banlieu-
sards plus acceptable et aura un impact sur le march immobilier.
En tout cas, ils se mettent tous en branle pour se prparer cette volution radicale du
march. Cest le cas de Ford qui a lanc en 2017 sa filiale commune avec Carnegie
Mellon, Argo AI, dote dun budget de $1B. Renault Nissan sest aussi lanc,
lannonant au CES 2017. PSA nest pas en reste, ayant dj test en France une
Peugeot autonome en 2015 et un C4 Picasso en juin 2017. Dans ce cadre, le construc-
teur franais sest associ lamricain nuTonomy (2013, $19,6M) qui dveloppe les
logiciels de pilotage galement utiliss par Ford.

Voici quelques autres startups du secteur, quil est trs difficile de dpartager. Ils uti-
lisent gnralement les mmes bases technologiques :
Optimus Ride (2015, $5,25M) une spinoff du Massachusetts Institute of Techno-
logy qui dveloppe la partie logiciel de vhicules autonomes de niveau 4.
Netradyne (2015, $16M) est un spcialiste de deep learning appliqu la la vision
des vhicules autonomes avec leur plateforme logicielle Driveri.
Drive.ai (2015, $62M) a t cr par des anciens de Stanford qui veulent aussi
proposer une plateforme de conduite autonome base de deep learning.
Comma.ai (2015, $3M) ambitionne de proposer une sorte de SDK permettant de
rendre autonomes des vhicules existants.

Autres usages
Dans les transports, lIA a dautres usages que la conduite autonome.
Elle peut servir optimiser les trajets, notamment les professionnels. Cest un des
domaines o Uber travaille, pour optimiser le temps de travail de ses conducteurs.
IBM propose une solution Watson on Wheels qui optimise aussi les trajets en
fonction dinformations sur la qualit de la voirie. Une analyse des donnes issues
des smartphones, de lenregistreur de bord, de camras, de la vitesse et du rgime

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 186 / 362
moteur permet dvaluer le comportement du conducteur et, ventuellement, de mo-
duler ses primes dassurance en consquence. Enfin, lanalyse du bruit du moteur
permet de faire de la maintenance prventive. Cest une fonction aussi propose par
la startup Otosense (2014), qui est base Cambridge (USA) et cre par le franais
Sebastien Christian.
La maintenance prdictive est aussi un sujet dintrt pour la SNCF, avec Quant-
metry, Global Sensing Technologies et IBM Watson. Cette mme SNCF utilise des
chatbots dans les rsaux sociaux.

Enfin, dans le transport arien, la robotique joue un rle mergent avec par exemple,
le BagBot qui remplit automatiquement les containers de valises dans quelques aro-
ports europens depuis 2014 et le Skywash qui lave les avions de toute taille depuis
1997, notamment Frankfort en Allemagne.

Sant
Cest le march vertical le plus attirant pour les startups de lIA avec celui de la fi-
nance et du commerce. LIA est notamment utilise dans la gnomique et dans laide
au diagnostic dans la ligne de la solution en oncologie que nous avons vue au sujet
dIBM Watson. Ce qui suit nest probablement quune liste trs partielle des startups
de ce secteur dactivit prometteur.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 187 / 362
Nous allons segmenter les usages de lIA en trois grandes catgories : les biotechs,
les outils de diagnostics et enfin, tout ce qui se rapporte aux systmes de sant.

Biotechs
Lunivers de la pharmacie et des biotechs est un trs gros consommateur de logiciels
et dIA. En cause, les volumes de donnes grer et analyser, commencer par ceux
qui viennent de toutes les techniques en omique : la gnomique (analyse de
lADN et de lARN) et la protomique (analyse des protines). La baisse du cout du
squenage de gnomes de toutes les espces vivantes a gnr dnormes quantits
de donnes exploiter.
LIA peut aider comprendre la structure des gnes et de leur expression, lpissage
des gnes (comment les diffrentes parties dun gne sassemblent), le repliement des
protines sur elles-mmes aprs leur production dans les ribosomes des cellules ou la

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 188 / 362
dtermination des paramtres qui favorisent ou pas lexpression des gnes, notam-
ment ceux qui dclenchent des cancers.
Le schma ci-dessous illustre la varit des usages de lIA dans ces domaines
(source). Les techniques employes tournent essentiellement autour du machine lear-
ning. Le deep learning commence aussi faire son apparition dans certains cas
dusages lists ci-dessous139.
Le deep learning permet de raliser des prdictions de comportements de molcules
et de structures de protines, des problmes mathmatiques trs complexes rsoudre
par des mthodes traditionnelles140. Et nous nen sommes quau dbut dans ce do-
maine, linformatique quantique pouvant plus long terme permettre daller encore
plus avant dans ces simulations.
Bien quutiliss essentiellement en imagerie mdicale, les rseaux de neurones con-
volutionnels (ConvNets ou CNN) sont aussi exploits en gnomique. Mais ce sont les
rseaux de neurones rcurrents (RNN) qui sont plus couramment employs, car ils
sont adapts lanalyse de donnes squentielles comme pour le langage, or lADN
est un langage, base de quatre lettres (ATCG).

Nous ne traiterons pas ici du sujet dans ses recoins mais plutt lillustrer par quelques
startups actives dans le domaine comme presque partout ailleurs dans ce document.
Innoplexus (2011) est une startup indo-allemande qui propose son moteur de re-
cherche iPlexus dinformations mdicales et exploite 27 millions de publications,
365 000 rapports de tests cliniques et un million de thses. Le tout exploite du ma-
chine learning et du traitement du langage.

139
Source : Deep Learning in Bioinformatics des corens Seonwoo Min, Byunghan Lee et Sungroh Yoon (2016).
140
Cf Scientists develop machine-learning method to predict the behavior of molecules, octobre 2017.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 189 / 362
IKTOS (2016) est une startup franaise toute rcente qui utilise du deep learning
pour raliser des simulations biologiques de leffet de mdicaments. Lide consiste
screener des molcules existantes et identifier in-silico leurs interactions avec des
protines connues selon un cahier des charges donn dattaques de cibles des fins
thrapeutiques. Ils exploitent pour cela un rseau de neurones qui converti la structure
des molcules connues dans un langage intermdiaire qui est ensuite rapproch des
protines cibles. Ils ne sont pas seuls sur ce march qui comprend dautres startups
telles que Certara, ChemAxon, Mind the Byte, Optibrium et Tripos.
Atomwise (2012, $6,35m) est une startup amricaine qui utilise le machine learning
pour dcouvrir de nouveaux mdicaments et vrifier leur non toxicit. Le principe
consiste simuler linteraction entre des milliers de mdicaments connus et une pa-
thologie telle quun virus, et didentifier celles qui pourraient avoir un effet par simu-
lation des interactions molculaires. Un premier rsultat aurait t obtenu en 2015 sur
un virus dEbola. La simulation in-silico permet de choisir quelques mdicaments qui
sont ensuite tests in-vitro avec des cellules humaines.
La startup franaise Owkin (2016, $2,1M) est sur un crneau voisin que lon appelle
le drug repositioning qui permet dtudier des essais cliniques et dvaluer
lintrt de certains mdicaments sur dautres pathologies que celles qui ont t tes-
tes. Le tout sappuie sur du machine learning.
Insilico Medicine (2014, $14M) fait partie du grand nombre dacteurs qui cherchent
trouver de nouvelles solutions curatives contre le cancer et les maladies du vieillis-
sement base de gnomique et de big data. Cest en fait un prestataire de services qui
cr de nombreuses solutions ad-hoc base de deep learning. Il aide notamment
dautres entreprises identifier de nouvelles thrapies, comme Pharmaceutical Artifi-
cial Intelligence. Leur logiciel en ligne aging.ai vous permet de dterminer votre ge
partir de vos rsultats danalyse sanguine (mais vous pouvez aussi vous rappeler de
votre date de naissance, ou au pire, consulter votre carte didentit).

Aide au diagnostic
Laide au diagnostic est probablement le domaine de la sant o lIA a le plus prosp-
r ces dernires annes.
Le deep learning et les rseaux de neurones convolutionnels sont omniprsents dans
linterprtation dimagerie mdicale. Il rend accessibles les connaissances des spcia-
listes aux mdecins gnralistes, ce qui est particulirement utile dans les dserts m-
dicaux et dans les pays mergents.
Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 190 / 362
Ces solutions dimagerie utilisent peu prs toutes les mmes techniques et solutions
logicielles mais sont paramtres de manire diffrente selon les pathologies recher-
ches et avec des jeux dentrainement spcifiques. Elles vont bien au-del des tech-
niques simples daugmentation de contraste. Elles dtectent des formes particulires,
des densits spcifiques et ralisent aussi des mesures prcises. Elles peuvent aussi
comparer avec prcision des images dans le temps en tenant compte des variations de
prises de vues.
Pour tre entrains, ces solutions doivent videmment exploiter des bases dimagerie
dj tages issues de rseaux de laboratoires, cliniques et hopitaux. Ces donnes ne
sont pas forcment ouvertes et les startups doivent monter des partenariats ad-hoc
pour les rcuprer.

Quasiment tous les pans de limagerie mdicale sont touchs par le deep lear-
ning pour la dtection de pathologies :
Micrortinopathie par analyse du fonds de lil, surtout pour les diabtiques
avec le franais DreamUpVision.
Glaucome avec IBM Watson en Australie, une des principales causes de ccit
dans le monde qui est dtecte trop tardivement dans la moiti des cas.
Lentrainement est bas sur lexploitation de 88 000 fonds de rtines141.
Pathologies de loreille comme les oreillons et clatements de tympans par ana-
lyse du tympan avec un otoscope avec le franais i-nside qui a entrain sa solution
de deep learning avec 250 000 images.

141
Source : https://www.ibm.com/blogs/research/2017/02/watsons-detective-work-could-help-stop-the-silent-thief-of-
sight/?glaucoma

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 191 / 362
Ostoporose par analyse de radios avec lIsralien Zebra Medical Vision (2014,
$20M) qui dtecte aussi les compressions de vertbres, la statose hpatique (foie
gras) et les hmoragies crbrales.

Cancers du poumon et fractures osseuses par analyse de radios avec Enli-


tic (2014, $15M) qui est un gnraliste de lexploitation de radios. Cest aussi le
champ daction de Riverain Technologies qui est focalis sur la cage thoracique.
Pathologies cardiaques par analyse dchographies avec Baylabs (2013) et chez
Arterys (2011, $13,72M) ainsi que chez lisralien DIACardio (2009, $2M)
Pathologies du sein avec Volpara Solution (2009, $5,5M + IPO) qui ralise des
analyses densitomtriques prcises et aussi QVCad (2006, $4,75M) ainsi quavec
le franais Therapixel (2013, $600K). Ces systmes peuvent notamment tre en-
trains avec les 640 000 images issues de 86 000 patientes, rcupres dans la
base du Digital Mammography DREAM Challenge lanc aux USA entre 2016 et
2017142.
Pathologies du cerveau comme avec le Belge Icometrix (2011, $2,17M) avec
son logiciel Msmetrix qui analyse les rsultats dimagerie mdicale pour dtecter
les lsions, mesurer leur volume ainsi que celui du cerveau avec des applications
ddies la sclrose en plaques. Et aussi avec MedyMatch (2013, $2M) qui d-
tecte les hmoragies crbrales et exploite les briques de reconnaissance dimage
dIBM Watson.
Analyse de cellules cancreuses dans des biopsies avec le Finlandais WebMi-
croscope (2013, $1,7M) qui ralise ses analyses dans le cloud laide de GPU.
Comme de nombreuses solutions dIA en imagerie mdicale, elle dtecte des cel-
lules cancreuses et apporte aussi un rsultat quantitatif par comptage de cellules
(exemple ci-dessous).

142
Cf https://www.synapse.org/#!Synapse:syn4224222/wiki/401743.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 192 / 362
De nombreuses startups se positionnent comme des gnralistes couvrant plusieurs
pathologies :
Enlitic (2014, $15M) qui propose de laide au diagnostic en sappuyant sur les
rsultats de divers systmes dimagerie mdical (IRM, scanner, radios) et sur du
deep learning (ci-dessous gauche avec son fondateur Jeremy Howard). Il dtecte
des pathologies mergentes le plus tt possible, notamment les cancers du poumon.
Il aide aussi identifier plusieurs pathologies simultanment143.

Behold.ai (2015, $20K) a dvelopp une solution danalyse dimagerie mdicale


pour aide les radiologues faire leur diagnostic. Cela sappuie sur du machine
learning. Le systme compare les images de radiologie avec et sans pathologies
pour dtecter les zones problmes, comme les nodules et autres formes de l-
sions. HealthMyne (2013, $11,5M) propose aussi un logiciel gnraliste analyse
de radios qui produit des rapports quantitatifs sur certaines observations.
VoxelCloud (2015, $13,5M) qui couvre le cancer du poumon, la rtinopathie dia-
btique, les maladies coronariennes et du foie.

143
Cf la vido de son CEO, Jeremy Howard TEDx Bruxelles en dcembre 2014. Il y aborde un point cl : il ny a pas assez de
mdecins dans le monde. Lautomatisation des diagnostics est donc un impratif incontournable.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 193 / 362
Lunit (2013, $5.5M), une startup corenne qui propose une solution logicielle de
deep learning gnrique dinterprtation dimagerie mdicale, notamment de ra-
dios et qui semble commercialise en OEM.
Butterfly Network (2011, $100M) est en train de crer un chographe dont toute
llectronique tient sur un seul composant, et dont les images sont analyses par
computer vision . Il semble quil utilise plusieurs metteurs ultra-sons, un peu
comme le systme de OpnWatr qui fonctionne dans linfrarouge pour faire de
limagerie crbrale. Son fondateur Jonathan Rothberg a de lexprience, ayant
cr et revendu deux socits de squenage de lADN, 454 Roche et Ion Tor-
rent Thermo Fisher.

Et il faut videmment compter avec IBM qui dveloppe une panoplie de solutions
dinterprtation dimagerie mdicale avec Watson Health et dont les solutions lo-
gicielles sont aussi exploites par bon nombre de startups du secteur144.
Limagerie mdicale nest pas la seule source de diagnostics mdicaux. Il faut ajouter
lanalyse dECG (lectrocardiogramme) et dEEG (lectroencphalogrammes), les
tests en laboratoires (sang, urine) ainsi que les tests dADN (gnotypie et squenage
complet). De nombreuses startups ambitionnent dexploiter tout ou partie de ces don-
nes pour amliorer les diagnostics, surtout dans le cadre de mdecine prventive et
pas seulement curative.
Cardiologs (2014, $1.2M) est une startup franaise qui dveloppe une solution logi-
cielle en cloud danalyse les donnes des ECG ralises selon les rgles de lart avec
plusieurs patches dlectrodes (4 sur les membres, 6 sur le thorax) en cabinet mdical,
par des infirmiers ou des docteurs. Les rsultats sont fournis sur une interface web.
Elle sappuie sur des mthodes de machine learning exploitant des rseaux de neu-
rones convolutionnels avec apprentissage supervis (ConvNets). Ct cloud, ils utili-

144
Cf cette intressante analyse de la position dIBM Watson dans limagerie mdicale : http://www.nanalyze.com/2017/08/ibm-
dominate-radiology-ai/ ainsi que IBMs Automated Radiologist Can Read Images and Medical Records de Tom Simonite, fvrier
2016 dans la MIT Technology Review.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 194 / 362
sent comme nombre de startups de lIA les ressources de Google Tensorflow. Cela
permet de fournir une rponse en quasi-temps rel. Ils ont entrain leur systme avec
des bases dECG dont une base de 100 000 ECG venant du Minnesota rcupre en
2015. Il faut payer pour, mais ce nest pas trop cher ! Leur systme est capable de
prdire une centaine de troubles sur 12 canaux (ECG au repos) et une quinzaine sur 1
2 canaux (ECG ambulatoire). Le systme dtecte notamment la fibrillation atriale,
qui est corrle lapparition dAVC accidents vasculaires crbraux du fait
dune mauvaise circulation du sang, dont le risque augmente avec lge et qui est plus
facile traiter lorsquelle est prcoce.
Dans la pratique, lanalyse dECG passe par lutilisation des plusieurs mthodes et
diffrents rseaux de neurones (rcurrents, convolutionnels, autres) 145 . Lefficacit
des mthodes dpend de la pathologie dtecter. Par exemple, la fibrillation attriale
est mieux dtecte avec un rseau convolutif.

HealthReveal (2015, $11,3M) propose une solution en cloud de prvention de


lapparition de maladies chroniques lies au style de vie, base sur lutilisation de
capteurs biomtriques divers.

145
Voir Machine Learning in Electrocardiogram Diagnosis, 2009.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 195 / 362
Forward (2016) est une tonnante startup amricaine qui veut inventer le cabinet
mdical. Son premier site San Francisco est quip de tous les capteurs, outils
danalyses de laboratoires, ADN compris, et systmes dimagerie mdicale pour faire
un bilan de complet 360146. Ce nest pas une clinique pour autant.

Freenome (2015, $70M) est une socit de San Francisco qui produit des analyses de
biopsies liquides essentiellement du sang - permettant la dtection de cancers mer-
gents (vido). Cela repose probablement sur de limagerie de cellules sanguines aprs
exposition des marqueurs chimiques et gnomiques.
Portable Genomics (2011) est une startup cre par des franais implants San
Diego aux USA. Elle a cr une solution logicielle mobile de collecte et de visualisa-
tion des donnes de sant dune personne. Elle en assure le stockage en ligne, sous le
contrle de lutilisateur. La solution collecte aussi bien les donnes de gnomique
issues dun squenage (complet du gnome) ou dun gnotypage (analyse de varia-
tions types des gnes) que celles de la sant en gnral : historique des pathologies,
mode de vie et donnes issues dobjets connects. Cela permet de constituer une vue
360 du patient, indispensable aussi bien pour les praticiens que pour crer des
bases de donnes sant exploitables par la recherche et les entreprises de pharmacie.
Cela permet aussi didentifier le niveau de risques de diverses pathologies. La socit
se positionne comme une plateforme de collecte, de partage et de montisation de
donnes personnelles de sant, sappuyant sur un modle de partage de revenu avec
les utilisateurs.
Deep Genomics (2014, $3,7m) a cr le DG Engine qui analyse les variations du g-
nome les mutations de lADN et la manire dont elles affectent le fonctionnement
des cellules et gnrent des pathologies. Ce sont des genome-wide association study
(GWAS) qui produisent des analyses de corrlations entre modifications des gnes et
pathologies (le phnotype). Les analyses ralises par Deep Genomics ont la parti-
cularit dintgrer tout le cycle de vie des gnes et notamment leur pissage qui cor-
respond lextraction de la partie codante des gnes jusqu leur translation, sa-
voir la conversion de lARN qui rsulte de lpissage en protines dans les ribosomes.
Ils proposent en open source leur base de donnes SPIDEX de mutations de gnes et

146
Loc Le Meur a film avec son smartphone une visite assez complte de Forward San Francisco et cest trs instructif :
https://www.facebook.com/loic/videos/381807855521818/.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 196 / 362
de leurs effets sur leur pissage147. Lambition est de mener de la mdecine person-
nalise mais on en est encore loin. La socit a t cofonde par Brendan Frey, qui
avait fait son PhD Toronton avec Geoff Hinton, un chercheur canadien lorigine
du dcolage du deep learning en 2006 et qui est maintenant chez Google.
Pathway Genomics (2008, $43M) est une socit amricaine qui propose divers
tests gntiques et biopsies cibls par risques pathologiques permettant didentifier
des facteurs de risques divers et varis en cardologie (Cardia DNA Insight), dermato-
logie (SkinFit), BRCATrue (cancer du sein), ColoTrue (cancer du colon) et obssit
(Healthy Weight DNA Insight). Le test Mental Health DNA Insight permet dvaluer
limpact des traitements en psychothrapies et le Pain Medication DNA Insight va-
lue lefficacit probable des analgsiques. La socit utilise IBM Watson. Ici, on a
surtout affaire un bon packaging par pathologie car les donnes exploites par ces
diffrents tests proviennent gnralement des mmes analyses, comme la gnotypie
ralise par 23andme qui analyse plus de 500 000 variations dans les gnes (gnoty-
pie base de SNP, ou single nucleotid polymorphisms).
Sophia Genetics (2011, $58,75M) est une startup suisse qui propose une solution de
diagnostic base sur lanalyse du gnme. Elle dj dploye dans plusieurs centaines
dhpitaux dans le monde.
Ginger.io (2011, $28,2m) a cr un outil de diagnostic et de prescription de traite-
ment pour diverses pathologies neuropsychologiques. Il exploite des applications
mobiles pour le diagnostic et du machine learning. La solution permet un auto-
traitement de certaines pathologies par les patients.
Lumiata (2013, $20M) est dans la mme ligne un systme danalyse de situation de
patient permettant dacclrer les diagnostics, notamment en milieu hospitalier.
MedWhat (2010, $560K) propose une solution gnrique daide au diagnostic qui
sappuie sur la panoplie totale de lIA (deep learning, machine learning, NLP). Elle
se matrialise sous la forme dune application mobile faisant tourner un agent con-
versationnel qui ont indique ses symptmes, qui pose des questions de qualification
et oriente ensuite le patient (vido de dmo). Elle stocke aussi le dossier mdical du
patient. La startup a t cre par des anciens de Stanford, mais cela ne semble pas
suffisant pour dcoller !
Nous allons terminer ici avec IBM Watson qui est dclin sur un grand nombre de
cas dusages et notamment sur laide au diagnostic du cancer en partenariat avec de
nombreuses cliniques amricaines ainsi qu ltranger, et en exploitant les don-
nes phnotypiques (prsence de la maladie) et gnotypiques du patient et les bases
de connaissance du secteur composes de millions de documents (recherches, tudes
cliniques, etc). Ces outils destins aux cancrologues ont t largement survendus par
le marketing dIBM et ne sont pas encore vritablement prouvs grande chelle.

147
Voir The human splicing code reveals new insights into the genetic determinants of disease qui explique les fondements
scientifiques de leur procd.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 197 / 362
La solution Watson for Oncology a t cr initialement en partenariat avec
lassureur sant Anthem (anciennement WellPoint) et le Memorial Sloan Kettering
Cancer Center (MSK) de New York, qui associe un hpital et un centre de recherche.

Elle a ensuite t dploye dans plus dune quinzaine dtablissements aux USA et
ailleurs dans le monde comme en Inde, mais sans que lon sache auprs de combien
de praticiens et sur combien de cas de patients. Elle est fournie sous forme de service
en cloud, avec un abonnement dont le prix na pas t rendu public par IBM.

La solution analyse les dossiers de patients atteints de tumeurs cancreuses, y com-


pris le squenage dADN des tumeurs148, aide au diagnostic, dtermine des traite-
ments possibles et value leur efficacit relative.
Elle aide notamment optimiser lusage de la chirurgie, de la radiothrapie et de la
chimiothrapie. Les cancers sont des pathologies idales pour Watson car elles sont
plurifactorielles. Mais ce nest pas (encore) de la mdecine prventive.
Les tudes scientifiques publies sont trs nombreuses et toujours fournies avec des
rsultats statistiques sur des cohortes de patients. Il faut les croiser avec des logiques
statistiques et cognitives complexes pour en tirer des conclusions. On connait par
exemple le lien entre les mutations des gnes BCRA1 et BCRA2 et les cancers du
sein.

148
Semble-t-il, et non pas un simple gnotypage, mais on peut aussi squencer lARN qui value lexpression des gnes dans les
tumeurs.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 198 / 362
Des donnes statistiques peuvent exister qui font le lien entre type de thrapies et
types de mutation de ces gnes. On est ici dans le domaine du big data non structur
contrairement au big data dans le marketing qui est bas sur des donnes bien plus
structures en gnral (logs Internet, donnes dachats ou de consommation, bases de
donnes relationnelles, etc). Il semble que cette partie de la solution ait t dvelop-
pe en partenariat avec Cleveland Clinic.

Watson utilise des sources dinformations varies pour faire son diagnostic, et il
pioche notamment dans les 44 000 nouvelles publications scientifiques annuelles sur
le cancer. Les articles ne sont pas toujours faciles exploiter : autant le texte relati-
vement facile analyser, autant les illustrations qui ne sont pas fournies sous format
structures comme dans lexemple ci-dessous, ne doivent pas tre facilement exploi-
tables. Or elles fournissent des donnes critiques, exploitables statistiquement, sup-
poser que Watson puisse comprendre leur signification.
Lexploitation de la littrature scientifique ne doit donc pas tre bien vidente ce
niveau. Par contre, elle est peut-tre plus aise pour les tudes lies aux AMM (auto-
risations de mise sur le march) et autres tudes pidmiologiques. On se demande
par contre si Watson sait tenir compte de la forte proportion de publications scienti-
fiques qui est entache de fraudes ou exagrations149.
Dans les dmonstrations, la solution base de Watson fournit au praticien un choix
de traitements qui sont fournis avec un indice de confiance, comme la probabilit de
survie. Aprs avoir dmarr avec les cancers du poumon, les cancers couverts int-
grent maintenant les leucmies, les mlanomes, ceux du pancras, des ovaires, du
cerveau, du sein et du colon.

149
Dans How to Make More Published Research True, John Ioannidis indiquait en 2014 que 85% des ressources des chercheurs sont
gaspilles et leurs rsultats publis sont faux ou exagrs. Dans Raise standards for preclinical cancer research, Glenn Begley et Lee
Ellis indiquaient en 2012 que 90% des rsultats de 53 tudes majeures dans le domaine du cancer ntaient pas reproductibles. Donc,
si elles sont utilises par Watson, il ne peut pas en sortir grand-chose dutile ! Voire, cela peut mme tre dangereux. Enfin, dans
Believe it or not: how much can we rely on published data on potential drug targets?, Florian Prinz, Thomas Schlange et Khusru
Asadullah indiquaient en 2011 que 79% des rsultats de 67 travaux de recherche en cancrologie et cardiologie ntaient pas repro-
ductibles chez Bayer. Qui plus est, les recherches qui donnent lieu des rsultats ngatifs sont bien moins publies celles qui sont
concluantes. Ce sont toutes ces tudes qui alimentent Watson for Oncology ! Le biais statistique quelles induisent est norme !
Source de cette liste : Bio-Modeling Systems - The Mechanisms-Based Medicine Company de Manuel Gea, juillet 2017. Do
lintrt dinitiatives comme le centre METRICS de Stanford, qui vise faire de la mta-recherche, donc dauditer les pratiques des
chercheurs pour les amliorer.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 199 / 362
Dans cette application, Watson bat lhomme dans la force brute : il compulse notam-
ment des bases de donnes de recherche en oncologie pour aider les cancrologues.
Mais do viennent ces donnes ? Fait-il progresser la recherche ? Indirectement oui
car il va alimenter ces bases de donnes quil utilise avec des rsultats de traitement
saisis par les praticiens.
Par contre, il ne fait pas directement progresser la recherche sur les cancers. Il ne faut
pas oublier que les articles scientifiques exploits ont chacun ncessit de 3 7 an-
nes de recherche ralises par plusieurs chercheurs ! Cest un travail considrable.
Watson utilise les rsultats de la recherche existante, recherche qui sappuie sur des
expriences in-vitro et in-vivo, que lon ne sait pas encore simuler numriquement, et
les rsultats statistiques associs. Bref, on a encore besoin de chercheurs ! Pour auto-
matiser ce processus, il faudra passer par plusieurs stades dvolution de lIA : ajou-
ter la dimension crative et conceptuelle, automatiser des tests in-vitro et in-vivo avec
des robots et en dernier lieu, bien plus tard, raliser ces tests in-silico quand les algo-
rithmes et la puissance de calcul le permettront.
Tout cela est bien merveilleux mais le marketing dIBM autour du cancer est un peu
trompeur et ses prouesses largement survendues. Dans la pratique, les annonces vo-
ques ci-dessus ne sont pas vraiment prouves ni dployes grande chelle150.
Dans les applications sant de Watson, on peut aussi citer lapplication
de GenieMD qui permet aux patients, aux USA, de faire un premier niveau
dautodiagnostic de problmes de sant courants et dtre ensuite mis en relation avec
des praticiens. Il permet aussi de suivre lobservance de la prise de mdicaments. La
solution exploite les informations fournies par les patients en langage naturel. Cest
une application gnrique qui pourrait tre mise en oeuvre dans les stations de tl-
mdecine pour les dserts mdicaux.
En 2014, le Baylor College of Medicine a cr son application KnIT (Knowledge
Integration Toolkit) base de Watson pour identifier des therapies contre le cancer.
Prcisment, elle analysait la littrature scientifique pour suggrer six protines ki-
nases capables de contrler le fonctionnement de la protine p53 qui jouerait un rle
dans le dveloppement denviron la moiti des cancers. En 30 ans, selon IBM, moins
dune trentaine de nouvelles protines auraient t dcouvertes. Ce qui mriterait
dtre vrifi !
Enfin, au CES 2016, IBM prsentait avec lquipementier mdical Medtronic une
autre solution utilisant Watson pour prdire la survenue dhypoglycmies des diab-
tiques de type 1. Les donnes exploites taient visiblement moins massives que
celles de lapplication sur les cancers. Lhypoglycmie est gnre par une boucle de
rtro-action plus simple qui associe lactivit physique, la prise dinsuline et
lalimentation.

150
Cf IBM pitched its Watson supercomputer as a revolution in cancer care. Its nowhere close de Casey Ross., septembre 2017 et
Why Everyone Is Hating on IBM WatsonIncluding the People Who Helped Make It de Jennings Brown en octobre 2017.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 200 / 362
Il faut donc mesurer les trois ce qui nest pas trop compliqu pour les deux premire
mais moins vidente pour la dernire, mme avec les capteurs de type Scio. Cepen-
dant, lapplication est probablement pertinente pour ceux des diabtiques qui prati-
quent un sport intensif et pour lesquels les risques dhypoglycmie sont importants et
rpts.

Systmes de sant
Les solutions de systmes de sant couvrent des besoins divers : lobservance des
traitements, les robots chirurgicaux151, les robots pour soccuper des personnes ges,
lvitement derreurs de prises de mdicaments, le suivi des dpenses de sant ou
loptimisation des ressources des hpitaux et praticiens. Ils gnrent de gros volume
de donnes, do les nombreux cas dusage potentiels de lIA.
En voici quelques exemples, toujours pris dans lunivers florissant des startups :
Cognitive Scale (2013, $40M) a cr la solution Cognitive Clouds qui est propose
aux adolescents atteints de diabte type 1 pour les aider se rguler, en intgrant les
aspects mdicaux (prise dinsuline, suivi de glycmie), dactivit physique et
dalimentation. Il y a des dizaines de startups qui visent le mme march et avec plus
ou moins de bonheur. Trs souvent, elles mconnaissent le fonctionnement des diab-
tiques dans la rgulation de leur vie et leur segmentation. Le franais Diabeloop pro-
pose une solution complte intgrant un capteur de glycmie en continu et une pompe
insuline et un logiciel de suivi exploitant lui aussi des briques dIA.
MedAware (2012, $10,3M) fournit une solution qui permet dviter les erreurs de
prescription mdicamenteuse en temps rel pour les mdecins. Avec des morceaux de
big data et de machine learning dedans qui exploite notamment des bases de donnes
mdicales dhistoriques de patients.
Hindsait (2013) propose une solution en cloud servant identifier les dviations dans
les dpenses de sant. Cela sert donc surtout aux financeurs des systmes de sant
que sont les assurances publiques, prives et les mutuelles. Ca fait moins rver le pa-
tient !
Doc.ai (2016) propose un chatbot de dialogue avec un mdecin virtuel, ddi
lanalyse de rsultats de laboratoires, ce qui nempche pas, ensuite, daller voir un
mdecin et surtout un spcialiste.

151
La plupart des robots chirurgicaus sont tlcommands comme les Da Vinci de la startup amricaine Intuitive surgical qui sont
spcialiss dans les oprations de labdomen et sont dploys depuis plusieurs annes.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 201 / 362
OrCam Technologies (2010, $56M) apporte la vision aux mal voyant via une cam-
ra relie un systme de reconnaissance dobjets qui dcrit les scnes de manire vo-
cale. Cest une startup isralienne. On a ici un mlange de computer vision et de text
to speech. La camra miniature se positionne sur des lunettes traditionnelles et com-
prend un couteur.

La startup franaise Panda Guide (2015) est positionne de son ct avec un systme
ddi aux aveugles qui se positionne autour du cou et est complt doreillettes audio.
La partie IA tourne dans le smartphone en mode offline avec un modle de vision
entrain sur serveur, capable de rcconnaitre un millier dobjets de la vie courante.

Industrie
Lindustrie manufacturire est probablement le secteur dactivit qui exploite lIA
depuis le plus longtemps, ne serait-ce que dans les systmes de conception assiste
par ordinateurs, dans la simulation et dans la robotique de production, elle-mme
grosse consommatrice de vision artificielle. Les systmes experts sont aussi couram-
ment utiliss dans lindustrie depuis trois dcennies.

Nous avons dj rapidement voqu les robots de production dans la rubrique sur les
robots.
Autodesk a rcemment dvelopp autour de sa solution Dreamcatcher une fonction-
nalit base de machine learning qui permet de choisir diffrents designs en phase de

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 202 / 362
conception dobjet. Elle exploite une base de formes et dobjets qui est automatique-
ment adapte lobjet en phase de conception.
Cest le croisement des objets connects et de lIA qui gnre le plus de nouvelles
opportunits de solutions, notamment dans la maintenance prventive et
loptimisation des ressources. La maintenance des ascenseurs fait appel au machine
learning chez Kone et Schindler.

Loprateur amricain dolienne Invenergy exploite une solution logicielle issue de


lditeur de logiciels SparkCognition (2013, $39M) avec machine learning et deep
learning pour dterminer les priodes de maintenance prventive des oliennes en
avance de phase, exploitant quatre annes de donnes sur 100 oliennes et 27 va-
riables de fonctionnement.
Le fabricant japonais de composants Rohm propose des composants danalyse du
bruit de moteurs exploitant des rseaux de neurones. Les alertes sont remontes en
central via des rseaux de tlcommunication bas dbit.

Dans toutes les usines, il est courant de faire du contrle qualit des pices usines
avec des camras et des solutions de computer vision, comme chez Foxconn qui ana-
lyse ainsi la qualit de ses cartes lectroniques en sortie de bains de soudure.
Lindustrie est influence par les applications grand public, notamment dans lunivers
des objets connects. Citons par exemple le franais Ween et son systme de contrle
du confort qui sappuie sur une IA dtectant le comportement des habitants (notam-
ment leurs trajets) pour optimiser leur confort thermique. Ici, base de machine lear-
ning. Et puis Modiface qui fait de la recommandation cosmtique en fonction de
lanalyse du visage, ici avec des rseaux de neurones convolutionnels.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 203 / 362
Agriculture
Lagriculture est un autre vaste domaine o lIA a de nombreuses applications, en
particulier en robotique, mais aussi en amont, avec les outils de la tldtection qui
sappuient de plus en plus sur la reconnaissance dimage base de deep learning et
sur lagriculture de prcision qui associe les objets connects lIA.

Tldtection
Lun des premiers domaines dapplication de lIA dans lagriculture, que nous avons
dj abord, touche la tldtection par satellites ou par drones. Il exploite le trai-
tement dimages et notamment les variations dans le temps des observations. Il per-
met dvaluer de nombreux paramtres comme la qualit des terrains, leur hydrata-
tion et la qualit prvisible des rcoltes, lchelle de son exploitation aussi qu
lchelle globale, ce qui permet danticiper les cours de vente de sa production voire
de les optimiser.
La tldtection sappuie sur de satellites, des avions mais aussi sur des drones. La
startup suisse Gamaya (2015, $4M) propose une camra multispectrale pour drones,
scannant une quarantaine de frquences lectromagntiques dans le visible et non vi-
sible. Le tout pour produire des cartographies prcises des champs et identifier leurs
parties qui seraient atteintes de pathologies ou manquant dirrigation.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 204 / 362
Agriculture de prcision
Bowery Farming (2015, $31M) est une startup de New York dont le systme
dexploitation BoweryOS sappuie sur de la vision artificielle et du machine learning
pour suivre ltat de plants et optimiser leur croissance en diminuant le besoin en eau.
PEAT (2015) est une startup allemande dont lapplication mobile Plantix exploite de
simples photos de vgtaux prises par des smartphones pour identifier les maladies
ou parasites qui les affectents. Lapplication fournit des recommandations. Celle-ci
est gratuite et la startup espre exploiter les donnes rcoltes, un modle cono-
mique toujours difficile mettre en place.
Benson Hill BioSystems (2012, $34,5M) est un autre startup amricaine qui a dve-
lopp la plateforme CropOS servant prdire le rendement de rcoltes en fonction de
diffrentes caractristiques des plantes, comme leur capacit optimiser la photosyn-
thse via leur ADN. La socit a aussi cr un outil ddition de gnes CRISP 2.0
cens tre plus efficace que le trs connu CRISP-Cas9.

Robots agricoles
LIA intervient surtout dans les techniques de robotisation dexploitation. Comme
partout ailleurs, les robots de lagriculture sont trs spcialiss. Certains soccupent
des animaux comme pour la traite des vaches mais lessentiel est li au cycle de vie
des rcoltes allant du semis aux rcoltes.
Les robots prsentent lavantage thorique de permettre des conomies de main
duvre sur des travaux qui sont en gnral pnibles et saisonniers. Reste faire en
sorte que cela soit rentable, les robots transfrant des dpenses dexploitation (sa-
laires) vers des dpenses dimmobilisation (investissement dans les robots) sauf sils
sont lous.
Nombre de robots agricoles sont surtout des projets de laboratoires de recherche qui
nont pas pour autant abouti des annes plus tard des produits industriels. Cest le
cas du projet CASC (Comprehensive Automation for Specialty Crops) de lInstitut de
robotique de lUniversit Carnegie Mellon, focalis notamment sur les rcoltes de

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 205 / 362
pommes et dautres arbres fruitiers et dont les vidos datent de 2012. Ils planchaient
mme sur des robots destimation de taille de rcolte de fruits.
Le projet a t financ par le dpartement de lAgriculture fdral US (USDA) hau-
teur de $10M entre 2008 et 2012. Y participait lindustriel John Deere qui ne semble
pas avoir transform cela en robots industriels. Il est en effet encore difficile de crer
des robots fiables et des cots raisonnables pour ces tches.
La manipulation directe des fruits et lgumes est une sacre paire de manche. Cela
fait une bonne vingtaine dannes que des robots sont mis au point pour les rcoltes
de fruits et lgumes en tout genre : ramassage de fruits dans les arbres comme les
pommes, de melons, de tomates, de fraises, de concombres152, dasperges et mme la
rcolte et la dcoupe de fleurs.
Ces tches sont complexes mener. Les robots doivent dtecter les fruits et lgumes
de taille et formes diverses, qui sont souvent cachs derrire des feuilles ou des
branches. Ils doivent ensuite les rcuprer avec prcaution, sans les abimer puis les
placer dans un rcipient mobile. En extrieur, les robots doivent si possible rsister
aux intempries, une contrainte que lon nimpose pas aux robots dans les usines.
Une mthode consiste changer la forme des arbres pour les adapter la rcolte des
pommes ! Un peu comme un utilisateur dordinateur ou de mobile sest habitu aux
idiosyncraties frquentes de ces appareils.
La PME franaise Carr a conu Anatis 2 en 2014 (ci-dessous gauche), un robot
bineur ddi aux cultures maraichres et quip de camras en tout genre pour se
mouvoir et analyser le terrain (vido). Bases La Roche sur Yon, la PME est mal-
heureusement en procdure de sauvegarde dentreprise depuis septembre 2016. Elle
faisait prs de 11M de CA en 2016, mais avec un dficit visiblement chronique de
plus dun million dEuros. Lentreprise qui compte 87 salaris produisait historique-
ment de loutillage agricole traditionnel. Il est difficile dinnover dans une PME tradi-
tionnelle !

152
Vous rigolez, mais un japonais, Makoto Koike, a cr un systme de tri de concombres anim par une application dveloppe
avec TensorFlow (vido et source de linformation) ! Il utilise de la vision artificielle et dtecte plusieurs paramtres : la couleur, la
taille, la forme, des dfauts des concombres analyss.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 206 / 362
Le franais Nao technologie a cr un autre robot de binage, le Oz, qui a t produit
en quelques dizaines dexemplaires (vido et ci-dessus droite). Il permettrait de di-
minuer lusage des produits phytosanitaires. Le franais SITIA a cr un tracteur
autonome (vido). Une startup suisse EcoRobotix (2011, $3M) a cr un robot de
dsherbage (vido) qui a un peu plus de chances dtre commercialis que le robot
Weedmaster, un concept du designer industriel suisse Fabian Zimmerli et na pas t
industrialis.

Le robot de surveillance et de dsherbage Thorvald 2 du norvgien Saga Robotics


permet dviter de faire appel des pesticides (vido, ci-dessus droite). Il semble
quil sagisse dun projet de recherche. Il semble quil en soit aussi de mme dun
autre robot de dsherbage, le AgBot 2, de linstitut de recherche australien QUT
Research (vido, ci-dessus gauche).
CNH Industrial a cr un concept de tracteur autonome pour crales (vido) qui
travaille la nuit sans broncher. Il est pilotage par tablette pour la programmation des
tches et des terrains traiter.
Nombre de robots de rcole de fruits sont ainsi encore gnralement du domaine de
lexprimentation, comme pour les concombres (vido), les pommes destines la
production de cidre chez SFM Technology (vido) ou les poivrons (vido).
Une startup de San Diego, Vision Robotics, sattaque la rcolte de raisins, histoire
de remplacer les travailleurs immigrs du Mexique quil est plus difficile de faire tra-
verser la frontire (vido qui date de 2012) !
La spin-off du laboratoire de recherche SRI de Menlo Park Abundant Robotics a
cr un robot exprimental de rcolte de pommes dans lEtat de Washington, lun des
plus gros producteurs de pommes aux USA (vido), avec la Pennsylvanie ( Johnny
Appleseed ). Il les aspire avec une sorte de ventouse (ci-dessous droite)153.

153
Cette intressante prsentation dcrit diffrentes mthodes de rcolte de pommes :
https://agrifoodroboticsworkshop.files.wordpress.com/2015/11/zhang2015iros_afr.pdf.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 207 / 362
La culture et la rcolte des champignons fait lobjet de recherches lUniversit de
Warwick au Royaume Uni. Leur robot exprimental de rcolte sait dtecter les
champignons arrivs maturit pour les rcuprer, via lanalyse de leur taille par re-
connaissance dimages. Ces robots doivent travailler 24h sur 24 et dans des environ-
nements sous-terrains pas trs hospitaliers.
Au Japon, les chercheurs de lUniversit dOkayama planchent depuis plus de 25
ans sur les robots de rcolte de tomates, concombres, raisins et fraises. Une analyse
spectracle dans le proche infrarouge des fruits est ralise pour dtecter ceux qui sont
mrs (sorte de Scio usage professionnel).
On peut ajouter cet inventaire la Prvert le Prospero, un robot de semis cinq
pattes qui est toujours un prototype (ci-dessus gauche).
Le robot ramasseur de fraises SW 6010 de lEspagnol Agrobot (vido) a lair opra-
tionnel, avec cueillette robotise mais intervention humaine pour remplir les bar-
quettes (ci-dessous gauche).
Lamricain Blue River Technologies (2011, $30,35m) propose de son ct un sys-
tme robotis de culture de laitues contenant une barde de capteurs, dont certains
sont 3D, pour optimiser lentretien de laitues ou de plants de mais (ci-dessous
gauche). Il a aussi lanc des tracteurs de semis de coton dont seul loutillage, mais
pas le pilotage, est robotis, avec des camras qui dtectent les mauvaises herbes et
un systme qui dpose dessus de lherbicide (ci-dessous droite).

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 208 / 362
Les tracteurs autonomes sont plus faciles mettre au point car ils reprennent des
techniques relativement prouves de vhicules autonomes. Cest le cas du Bonirob
des allemands Bosch et Amazonen-Werke qui est un tracteur autonome modulable
(ci-dessous) et peut servir notamment au binage de la terre. Mais il na pas lair dtre
encore commercialis grande chelle pour autant.

LAmricain ATC (Autonomous Tractor Company) se positionne comme le Tesla


des tracteurs en les lectrifiant entirement. Ils ont aussi conu un tracteur autonome
lectrique ltat de concept (ci-dessous gauche).
LAmricain Harvest Automation a cr un petit robot, le HV-100 qui dplace des
pots, une tche pas trop complexe voisine de celle des robots dentrepots. On en re-
vient aux choses simples !

A terme, on verra apparaitre des fermes o lensemble des processus sont robotiss,
surtout pour les cultures sous serres. Dans la nature, les robots doivent composer avec
des terrains par toujours rguliers.
Aprs ces quelques recherches de robots agricoles, je me rends compte finalement
que lon en est peu prs au mme stade que pour les robots humanodes : les d-
monstrations et effets dannonce sont nombreux, mais les ralisations concrtes op-
rationnelles le sont bien moins. Cela ne veut videmment pas dire que cela ne mar-
hera jamais mais que la mise au point de ces robots agricoles dans des conditions
conomiques satisfaisantes est encore un long chemin sem dembuches.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 209 / 362
Finance
La finance est un autre de ces marchs verticaux qui croule sous les donnes et ne
pas savoir quen faire ! Cest donc un terrain trs favorable lusage de techniques de
machine learning, dans tous les mtiers de la banque et de la finance154, du front of-
fice au back office en passant par les fonctions analytiques, sans compter les tech-
niques de base utilises depuis longtemps comme la reconnaissance automatique de
lcriture manuscrite dans les chques.
Lobjectif est toujours doptimiser les oprations, den rduire les cots, de personna-
liser les offres, damliorer la relation client.

Les services financiers donnent lieu la cration dun grand nombre de startups qui
fournissent quelques indications des usages prometteurs de lIA dans les mtiers de la
finance.
Ceci tant dit, le march bancaire est trs verticalis et a plutt bien rsist aux coups
de boutoir des startups depuis plus de 20 ans, malgr une insatisfaction chronique des
clients. La banque directe se dveloppe lentement, surtout en France. Les Fintechs
ambitionnent de disrupter le march tous les tages (mobilit, Bitcoins, crowdfun-
ding, etc) mais sont encore trop focalises sur les moyens de paiement.
En dautres termes, elles grent plus les petits flux que les gros flux de transactions et
les stocks dinvestissements. LIA pourrait-elle acclrer la mutation du secteur ?
Est-elle un facteur qui peut faire voluer la notion de confiance, critique dans le sec-
teur, dun type dacteur un autre 155? Pour linstant, rien ne semble lindiquer.

154
Le schma vient de Tomorrows AI-Enabled Banking de IPSoft.
155
Le problme tant que le grand public na plus confiance en grand-chose. Tout le monde en prend pour son grade : les politiques,
les mdias et les entreprises. Cf le baromtre mondial de la confiance 2017 dEdelman.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 210 / 362
Les startups ont aussi un obstacle franchir : le machine learning quil soit supervis
ou pas, ne peut pas produire de rsultats probants sans un gros volume de donnes.

Chatbots
Ici comme dans le commerce en ligne, les chatbots sont trs la mode et donnent lieu
une plthore doffres de startups et de banques. Le march se structure en gros en
trois types dacteurs : les startups proposant leur chatbot grand public qui sinterface
plus ou moins avec les services bancaires de lutilisateur, les startups qui proposent
des chatbots en marque blanche pour les banques et les banques qui proposent un
chatbot leurs clients.
Les startups de la premire catgorie sont trs nombreuses avec les anglais Cleo
(2015, $3M), Plum (2016, $500K) et Chip (2016), et puis Abe (2016), Digit (2013,
$36M), Trim (2015, $2,2M), Penny (2015, $1,2M) et Dyme.co (2014, $250K). Il va
sans dire quil y aura de la casse dans ce secteur, comme dans nimporte quel march
dans lequel sengouffrent des dizaines de startups faiblement diffrenties, et souvent,
pas trs bien finances. Il est probable que celles qui sen sortiront le mieux seront
celles dont lcosystme sera le plus dense, avec les interfaces avec les banques,
dautres services financiers voire commercants.
Ct marque blanche, nous avons avec notamment lAmricain Kasisto 156 et son
chatbot MyKai (2013, $11M) qui est notamment utilis par MasterCard, ci-dessous
gauche, Finn.ai (2014) et puis bien videmment IBM Watson qui est notamment
mis en uvre en France par Crdit Mutuel CIC, non sans quelques ractions nga-
tives des syndicats de salaris inquiet pour limpact sur lemploi dans les agences.

156
Avec plus ou moins de bonheur, voir : https://www.wired.com/2016/06/new-banking-ai-now-chatbots/.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 211 / 362
Aux USA, des chatbots ont t lancs par Bank of America avec Erica qui est plutt
structur comme un systme de recommandation et est aussi commandable par la
voix (ci-dessous droite), et American Express sur Facebook Messenger depuis fin
2016 et Wells Fargo depuis mi 2017, au Royaume Uni, par Barclays et son
Launchpad qui permet dexcuter des tches de son application mobile classique en
mode dialogue, sans que cela soit dailleurs plus efficace et chez Santander en Es-
pagne157 ou Swedbank en Sude avec son agent conversationnel textuel et vocal d-
velopp par lAmricain Nuance. En Chine, les principales banques comme la Bank
of China ont un chabot intgr dans Wechat.
La banque singapourienne OCBC a cr un chatbot dnomm Emma (tous les pr-
noms fminins y passent) spcialis dans lattribution de prts pour la rnovation
de logements158.
En France, nous avons aussi Orange qui a lanc en 2017 son offre bancaire avec
Orange Bank, qui sappuie fortement sur une application mobile et lusage intensif
dIA, notamment dans un chatbot.

Mais au juste, est-ce que les chatbots fonctionnent bien et sont apprcis des utilisa-
teurs ? Rien nest moins sr ! La qualit dun chatbot dpend surtout des processus
qui ont t intgrs dans sa base de connaissances. Ils sont souvent trs limits et les
capacits de dialogue des chatbot ne vont pas trs loin.
Un bon chatbot doit laisser la main un vritable interlocuteur lorsquil dtecte que
la communication ne se droule pas convenablement et les banques nont pas encore
mis en place de genre de solution. Le message marketing mis en avant est toujours
ambigu : les chatbot permettent damliorer la satisfaction client. Dans la pratique, ils
servent surtout rduire les cots du retail banking159.

157
Voici la source de nombre de ces diffrents exemples : Artificial Intelligence in Digital Bankin de MAPA, novembre 2016.
158
Source : OCBC bank launches first artificial intelligence powerd home & renovation loan specialist, avril 2017.
159
Cf Bots Arent Ready To Be Bankers de Forrester, aot 2016.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 212 / 362
Optimisation dinvestissements
La seconde catgorie de startups qui sest engouffre dans lexploitation de lIA des
fins financire est celle qui couvre toutes les solutions doptimisation de gestion des
investissements, surtout boursiers. La majorit des solutions sont b2c et quelques
unes sont b2b.
Loptimisation dinvestissements boursiers est propose par DataFox (2013, $6,8m),
AdvisorEngine, anciennement Vanare (2014, $26M) avec son logiciel en cloud de
gestion dinvestissements personnels et WealthArc (2015, $1,5M) et sa solution des-
tine aux conseils en gestion de patrimoine.

La gestion financire en ligne est propose par Wealthfront (2008, $129M) et Bet-
terment (2008, $273M), deux startups extrmement bien finances et qui ne ciblent
visiblement que le march US ! Et puis aussi Pefin (2015) qui gre galement la fi-
nance personnelle des foyers de tous niveaux de patrimoines.

On trouve mme des solutions pour identifier des startups dans lesquelles investir
avec Mattermark (2012, $17,2m) et le russe TalentBoard et sa solution
Test4startups (ou T4S). Dans la pratique, Matermark est devenu un fournisseur de
base de donnes dentreprises servant la dtection de prospects pour la vente en tout
genre et pas seulement pour les investissements par les socits de capital risque.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 213 / 362
Le fonds dinvestissement de Hong-Kong Deep Knowledge Venture spcialis dans
la sant communiquait avec fracas en 2014 sur le fait que lun des membres de son
comit dinvestissement tait une IA. Cest en fait une solution extrmement pointue,
dvelopp par Aging Analytics (UK), spcialis dans la recherche sur les technolo-
gies de lutte contre le vieillissement. Mais indiquer quune IA a une place dans un
board est aussi stupide que si un cabinet dexpert comptable indiquait quun PC qui-
p dun tableur Excel en tait un de ses employs. Aussi sophistique soit-elle, une
solution dIA reste un outil daide la dcision. Elle fournit des informations qui ser-
vent daide la dcision, comme dans nimporte quel autre processus de dcision qui
sappuie sur la rationnalit de donnes.
La startup franaise Khresterion (2014) propose un logiciel daide au diagnostic
dans divers domaines. Ils sappuient sur un moteur de rgle, K Engine, qui exploite
une reprsentation de la connaissance sous forme dontologie et adopte une structure
en graphe et non darborescence, ce qui la rend trs ouverte. Cela permet de grer la
contradiction et la non compltude dinformations. La socit travaille dans les do-
maines financiers et juridiques aprs avoir tt du domaine de la sant.
LendUp propose des prts aux particuliers en optimisant leurs taux dintrts de prts
avec (2011, $111M). Dans la pratique, cest une forme de systme de micro-sub-
primes, attribuant des crdits des particuliers qui ne peuvent pas accder aux crdits
dans les circuits traditionnels. Comme cest une activit plus risque que les crdits
traditionnels, la startup doit se couvrir avec des algorithmes qui limitent les risques en
question ! Dans la pratique, lIA dtecte les clients potentiels qui ont des comporte-
ments sains commele fait de bien rembourser ses crdits et davoir un budget
quilibr ! On peut se demander pourquoi il faut de lIA pour dterminer cela !
Et enfin, lAmricain H&R Block a mise IBM Watson dans les mains de ses conseil-
lers fiscaux brick and mortar pour optimiser la fiscalit de ses clients. Cest un
modle qui sera probablement de plus en plus courant : des AI qui amliorent la pro-
ductivit des professionnels dans les services mais ceux-ci conservant un contact hu-
main avec les clients.

Gestion financire dentreprises


Ces solutions existent depuis longtemps et voluent pour intgrer des briques dIA,
en gnral de machine learning, pour identifier des phnomnes anormaux dans les
comptes des entreprises.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 214 / 362
Nous avons de lautomatisation de comptabilit avec Smacc (2015, $3,9M) qui cible
les TPE et PME.
Et puis de loptimisation de planification financire dentreprises avec Anaplan
(2006, $239m), Adaptive Planning ($22,5m) et Trufa (2013, $15,9m).

Gestion des risques et fraudes


La dtection de fraude est un cas dapplication classique du machine learning. Les
fraudes sont dtectes en collectant un maximum dinformation sur les payeurs et en
identifiant les patterns de mauvais payeurs. Cest ce que propose Sift Science
(2011, $53,6m) avec une offre de scurisation gnraliste destine aux banques et
commercants et aussi lIsralien Riskified (2012, $63m), qui est focalis sur les sites
marchands.
La banque Santander utilise la reconnaissance vocale pour scuriser les transactions,
avec la solution de la startup espagnole Fonetic qui analyse les motions dans les
conversations tlphoniques.
Les banques doivent aussi passer au peigne fin toutes les transactions de plus de
$10K pour dtecter le blanchiment dargent sale. L encore, il faut faire appel du
machine learning voire du deep learning pour trier les centaines de milliers de tran-
sactions. Cest ce que propose de faire la startup Simularity (2011) qui aide dtec-
ter les anomalies dans de nombreux marchs verticaux, dont la finance160.
Deux startups amricaines spcialises dans les applications de gestion de la confor-
mit des transactions Lucid (2004, $15M) et Feedzai (2009, $26M) utilisent toutes
deux le machine learning pour dtecter 80% des fraudes.
La gestion des risques porte aussi sur le credit rating161 demprunteurs bas sur les
informations disponibles sur les rseaux sociaux avec TrustingSocial (2015), qui
nest pas sans poser diverses questions sur le respect de la vie prive. De nombreux
services de crowlending tels que Kabbage (2009, $488M), Lending Club (2007) et
ZestFinance (2009, $67M) font aussi appel au machine learning pour le credit rating.

Robotic Process Automation


Depuis 2015, la Robotic Process Automation dcrit les outils dautomatisation des
processus internes des entreprises couvrant la finance et le marketing. Elle consiste
permettre des agents base dAI de naviguer par eux-mmes dans les diffrentes
applications de lentreprise afin de mener des tches prdfinies comme la collecte de
documents.
LIA permet en thorie ces agents dvoluer par eux-mmes pour ingrer de nou-
velles rgles.

160
Cf leur intressant livre blanc Artificial Intelligence (AI) for Financial Services.
161
Cf Application of Artificial Intelligence Techniques for Credit Risk Evaluation de Ahmad Ghodselahi et Ashkan Amirmadhi qui
dcrit une mthode de credit rating base darbres de dcision, de machine learning et deep learning exploitant une dizaine dagents
diffrents.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 215 / 362
Les tudes de cas se font jour, comme illustr ci-dessous 162!

Lun des impacts de cette robotisation des processus sera de rduire lemploi dans les
entreprises concernes et surtout chez leurs sous-traitants, et notamment en Inde pour
les entreprises anglo-saxonnes163.

Pas loin de nous, la startup roumaine UiPath (2012, $30M) est positionne exacte-
ment sur ce crneau-l164. La solution se dcoupe en trois parties : UiPath Studio qui
permet de dcrire les processus business de lentreprise, et aussi denregistrer des ses-
sions daccs des applications, UiPath Robot qui gre lautomatisation des proces-
sus et UiPath Orchestration qui permet de grer le robot et lorchestration (vido). Il
va sans dire que cette automatisation des processus na rien de magique et quelle re-
quiert beaucoup de paramtrage manuel.

162
Source : Robotics Process Automation 6 questions to master it, janvier 2017 de la socit de conseil parisienne Ailancy.
163
Source : Introduction to Robotic Process Automation, a primer, de l'IRPA, Institute for Robotic Process Automation, 2015. Source
du schma : RPA and Beyond de TATA, juin 2017.
164
Cf Les "robots logiciels" de cette startup roumaine prennent le travail peu qualifi d'employs de bureau, aot 2017.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 216 / 362
Cette forme de RPA reprend les anciens concepts des solutions de gestion de
workflow.

Assurance
Comme la finance, le mtier dassureur tourne essentiellement autour de la donne.
Loptimisation de la gestion du risque est encore plus critique que dans les services
financiers puisquelle fait partie du cur de mtier.
Dans lassurance, lIA intervient dans tout le cycle de vie : pour crer des produits,
segmenter ses clients, cibler ceux qui prsentent le moins de risques, proposer les
bonnes offres aux clients, grer le prventif, grer les expertises et dtecter les
fraudes165. La relation client fait, comme dans les banques, aussi appel aux chatbots166.

De nombreuses startups se sont videmment aussi lances dans ce secteur et en ex-


ploitant des briques dIA. Nous avons par exemple KenSci (2015, $8,5M) qui et sp-
cialis dans les prdictions base de machine learning, et la franaise Shift Techno-
logy ($11,8M) qui est spcialise dans la dtection de fraude, avec une solution en
cloud. Riskgenius est lorigine dune solution de traitement du langage qui gre le
cycle de cration et modification de contrats dassurances. Cyence (2014, $40M) a
cr une solution base dIA qui value le risques en cyberscurit dentreprises
clientes.

De son ct, lassurreur Allianz, exploite les donnes internes et externes


lentreprise pour identifier la situation du client ou prospect. Il peut par exemple d-
tecter que le client gare habituellement son vhicule dans une zone dune ville o les

165
Cf Emerging Technologies Transforming the $4tn Insurance Industry, de CommerzVentures, 2016.
166
Cf https://chatbotsmagazine.com/why-chatbots-are-taking-over-the-insurance-industry-57b5151bb56a.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 217 / 362
vols sont plus nombreux que la moyenne et proposer une assurance contre le vol. Le
tout est exploit dans un chatbot qui sappuie sur IBM Watson.
Les assurances font aussi appel la reconnaissance dimage dans le cadre
dexpertises, notamment automobiles ainsi que pour scanner les constats. Langlais
Tractable (2014, $10M) propose une solution dinspection visuelle dautomobiles
base du deep learning pour de la classification automatique (vido).
Understory (2012, $9,7M) est une startup dans les objets connects qui fournit des
capteurs denvironnement (humidit, temprature, vent, prcipitations) assimilables
des stations mto miniatures qui permettent dauditer a postriori lorigine de dgats
dorigine mtorologiques.
IBM Watson a t mis en uvre dans Insurance Assistant de lUSAA (United Ser-
vices Automobile Association), un agent conversationnel qui permet aux clients de
cette assurance ddie au personnel militaire US de sy retrouver dans ses offres et
services.
Les assurances sont partenaires de fournisseurs de solutions de maison intelligente
pour rduire les risques de sinistres dans les logements ainsi quavec divers fournis-
seurs de solutions de sant pour rduire les cots de sant, pour ce qui est des assu-
reurs sant, surtout aux USA. Les assurances peuvent aussi encourager les conduc-
teurs faire auditer leur mode de conduite via des capteurs CANII dont loffre est
actuellement trs abondante.
Les processus internes aux assurances peuvent tre automatiss avec des solutions et
mthode de Robotics Process Automation dj voque au niveau des services
financiers. Elles peuvent par exemple faire appel Captricity (2011, $52M) et sa
solution de gestion documentaire.
Enfin, une startup peut ambitionner de remplacer les compagnies dassurance tradi-
tionnelles. Cest le cas de Lemonade (2015, $60M), est une socit dassurance en
ligne pour propritaires et locataires base New York qui sappuie fortement sur
lIA dans tous ses processus et se passer dintermdiaires (les courtiers), y compris
des chatbots dans la relation client (vido). La socit utilise les sciences comporte-
mentales pour limiter la fraude. Par exemple, les constats sont raliss par vido en
ligne qui sont ensuite exploites avec des solutions dIA de dtection dmotion du
style de celle dAffectiva (2009, $25M).

Distribution
Le monde de la distribution prsente des contrastes marquants entre le commerce en
ligne et le commerce traditionnel. Les premiers sont des utilisateurs intensifs de nu-
mrique tous les tages, y compris dIA et les seconds ont des processus plus tradi-
tionnels qui voluent bien plus lentement. Cest mme le cas chez les grandes en-
seignes qui ont pignon la fois sur rue et sur Internet.
Les innovateurs du secteur doivent conserver dans leur mire les clients. Leurs besoins
ne sont pas sorciers : ils souhaitent trouver rapidement ce quils cherchent, pouvoir
comparer les offres et trouver les meilleures au niveau fonctionnel et tarifaire, pou-

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 218 / 362
voir obtenir le produit rapidement, et pouvoir le dpanner ou retourner facilement en
cas de problme.
Les besoins des commercants ? Ce sont des intermdiaires entre les marques et les
consommateurs. Ils doivent analyse les tendances, comprendre les sentiments autour
des marques, mettre les produits bien markets dans les maisons des consommateurs,
rduire leurs frais de gestion, optimiser les stocks et leur rotation, limiter la fraude (en
ligne) et la dmarque inconnue (en magasin). En gros, les retailers veulent soit pr-
dire le futur, soit linfluencer leur avantage.

IA pour le retail physique


Voici quelques startups qui exploitent diverses briques dIA pour rpondre aux be-
soins de retailers traditionnels ct assortiment produit, optimisation des rayons, lutte
contre la dmarque inconnue, dans le web-to-store et la recommandation.
Predictix (2005, $40M), qui fait partie dInfor depuis 2016, est spcialis dans
loptimisation de linaire. Comme son nom lindique, il doit utiliser des techniques
de machine learning pour faire du prdictif. Celect (2013, $15,3M) permet aussi
doptimiser lassortiment des rayons en fonction danalyses prdictives comporte-
mentales des clients.
Le franais Vekia (2008, $2,7M) utilise le machine learning pour faciliter
loptimisation dapprovisionnement. Sa solution est dploye chez Leroy Merlin, But,
MrBricolage et Jacadi.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 219 / 362
LAmricain Reflektion (2012, $27,8M) aide les commerant convertir les pros-
pects en clients partir de son moteur de recherche de point de vente pour les grandes
enseignes comme Disney.
Le franais Teemo (2014, $17,6M), anciennement Databerries, est un spcialiste du
ciblage de clients mobiles. Il les cible en fonction des lieux quils visitent, par trian-
gulation des signaux Wi-Fi, si celui-ci est activ dans les smartphones. Ils ont dj
plus dune centaine de clients dont Leroy Merlin, Carrefour et Casino.
La startup franaise Occi (2015) permet aux commercants denvoyer des recomman-
dations personnalises leurs clients, et sur leur smartphone, pour peu quils laient
convaincu dinstaller son application ou quils disposent de son numro de tlphone
ou de ses identifiants de rseaux sociaux.

Le franais Neosensys est un spcialiste de la vido-surveillance avec deux cas


dusage : la dtection et la prvention de la dmarque inconnue grce un suivi mul-
ti-camras de personnes suspectes et loptimisation de linaire en fonction de
lanalyse des parcours des clients dans les points de vente. La socit collabore avec
lINRIA pour le dveloppement de ses solutions.
Percolata (2012, $5M) exploite camras de surveillance, captation audio, dtection
de smartphones et machine learning pour prdire le trafic dans les magasins. Il croise
ces donnes avec lhistorique de performance des vendeurs pour planifier les quipes
de vente gnrant le plus haut niveau de chiffre daffaire.
Quidivi (2006, $1,4M) est une startup franaise qui analyse le visitorat en magasin
via camras et machine vision. Ses outils mesurent non seulement le trafic mais aussi
lattention. Ils dtectent lge et le sexe des visiteurs.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 220 / 362
IBM propose une solution danalyse des donnes clients et de sources diverses pour
anticiper les besoins du march et adapter les inventaires et les stratgies de tarifica-
tion.

IBM propose aussi un Personal Shopper t ralis en partenariat avec Fluid (1999,
$24M). Le premier client est la chane de distribution de vtements sportifs North
Face. Il sagit l encore dun agent conversationnel utilisable via le service en ligne
du site marchand. Le corpus de donnes utilis exploite tout le catalogue du site ainsi
que les diffrents critres de choix des vtements. Le dialogue propos est trs scrip-
t. Son arborescence semble limite. Le systme a t prsent au Big Show 2016 de
la National Retail Foundation New York167.

IA pour le commerce en ligne


Le commerce en ligne intgre dabord presque tout ce que lon trouve de nouveau
dans le marketing, pour le ciblage publicitaire et commercial et sur les techniques
dupselling et cross-selling bases sur la recommandation qui sappuient sur le ma-
chine learning.

167
Pour en savoir plus voir ce compte-rendu dtaill sur le JDN : Comment The North Face a appliqu Watson lexprience
dachat.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 221 / 362
Le commerce en ligne peut exploiter dautres nouveauts base dIA :
Loptimisation de lactivit de commerciaux sdentaires et prdiction du compor-
tement des clients avec des startups particulirement bien finances : InsideSales
(2004, $251M), Lattice (2015, $9,3M), Clari (2012, $26M), Wise.io (2012,
$3,6M) et Spiro (2014, $1,5M). Il est assez difficile de dpartager toutes ces star-
tups !
Loptimisation du parcours client en ligne avec Gainsight (2011,
$154M), Jetlore (2011, $7M) et OnCorps (2011, $2,3M). Le canadien Granify
(2011, $13M) va jusqu suivre pas pas le parcours en ligne des clients pour d-
tecter ceux qui pourraient abandonner le panier en cours de constitution et leur
proposer une action ou information permettant de lviter. Le franais Influans
(2016, $6M) optimise aussi le parcours client pour leur proposer le bon produit
avec les bonnes incitations et au bon moment. La startup a t cre par deux an-
ciens fondateurs de Talend, Bertrand Diard et Fabrice Bonan.
TargetToSell (2012, 5M) est une autre startup franaise qui optimise le parcours
client au niveau du site et pour chaque visiteur. La startup sappuie sur un mix de
machine learning classique et dun rseau de neurones pour optimiser le parcours
du parcours en fonction du profil du visiteur et de ses gots de produits capts au
niveau du site.
De nombreuses solutions permettant de trouver la bonne taille et le bon style pour
shabiller avec langlais Thread (2012, $16,32M), le styliste en ligne Stitch Fix
(2011, $42M) qui exploite le dialogue en langage naturel, Volumental (2012,
$3M) pour le choix de ses chaussures et Thirdlove (2013, $13,6M) pour la taille
de son soutien-gorge.
Loptimisation de prix en fonction de lactivit des concurrents, avec le franais
Daco (2016) qui sappuie sur du deep learning.

Diffrents moteurs de recherche avec lisralien Twiggle (2014, $35M) qui per-
met des recherches textuelles et imite le comportement dun commercial tradi-
tionnel et puis, dans les moteurs de recherche dimages pour optimiser la gestion
de site de vente en ligne avec ViSenze (2012, $14M), Cortexica ($6,6m de levs)
Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 222 / 362
et son logiciel findSimilar en cloud, Grokstyle (2016, $2M) et Slyce ($37m de le-
vs et IPO en avril 2015). Et puis le moteur de recherche FashionBot de GoFind
(2016) qui permet de retrouver dans un site en ligne ce que lon trouve dans un
magasin.

Un systme de recommandation bas sur du machine learning avec Dato (2013,


$23,5m), une startup a t monte par des anciens de Carnegie Mellon sous la
forme initiale dun projet open source. Mme histoire avec Reflektion (2012,
$27M), adopt par Disney et Converse, qui propose du ciblage produit temps rel.
La dtection de fraude pour le commerce en ligne avec Fraud.net qui sappuie
probablement sur du machine learning.

Des chatbots en tout genre avec lamricain Satisfi Labs (2016) et lagence fran-
aise TheChatbotFactory qui cr des chatbots sur mesure. Elle a cr un chatbot
sommelier pour Auchan sous Facebook Messenger.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 223 / 362
Les ecommancants font aussi appel des solutions dautomatisation de la gestion des
entrepots pour peu quils aient la taille critique.
Les livraisons sont souvent ralises par des sous-traitants spcialiss (ColisPriv, ).
Ils pourront un jour mettre en route la camionnette propulsion lectrique robotise
de Mercedez-Benz dont lintrieur comprend un robot de manipulation de colis qui
les transmet deux drones via des ouvertures sur le toit. Le last mile par les airs !
Les drones viennent de Matternet dans lequel Mercedes a investi 562M 168 . Et
Amazon est le premier client en vue pour ce genre de solution.

Mdias
Les mdias font partie de ces mtiers qui ont t particulirement bousculs par
lirruption des outils numriques, dInternet et des mdias sociaux. Leur chiffre
daffaire a baiss, leurs revenus publicitaires ont en parti migr vers dautres acteurs,
que ce soit les GAFA, les services en ligne doffres demplois ou dans limmobilier.
Les moyens baissant, ceux qui sont allous aux journalistes pour mener leurs en-
qutes ont fondu dautant. Nombre de mdias ont dclin, surtout dans la presse quo-
tidienne nationale et rgionale.
Ladoption de nouvelles mthodes de travail ne sest pas faite sans mal. Les rdac-
tions digitales tant trop souvent spares des rdactions historiques. Les premires
ont adopt des mthodes peu recommandables, republiant des informations sans
prendre le temps denquter, gnrant des effets de caisse de rsonnance ce que lon
appelle maintenant les vraies fausses nouvelles. Les seconds ont de leur ct ignor
les outils permettant leurs crits dtre mieux diffuss.
Sur ce arrive la vague de lIA qui entraine tout sur son passage et qui peut son tour
bouleverser une fois de plus les mdias. Avec la crainte quelle gnre une nouvelle
vague dflationniste du ct de lemploi.
Nous allons donc voir ici comment les mdias, et surtout la presse, peuvent tirer parti
de lIA la fois pour la production de contenus, pour leur diffusion et pour leur mo-
ntisation 169 et si cela prte consquence. LIA est comme Internet et Google

168
Nombreux details ici : http://www.businessinsider.fr/us/mercedes-electric-vision-van-drone-delivery-service-photos-2017-3/.
169
Cf http://www.meta-media.fr/2017/05/07/et-si-les-medias-redevenaient-intelligents.html.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 224 / 362
Search. Elle peut entrainer le meilleur comme le pire. Elle permet aussi bien
damliorer la qualit de ses contenus que de se dsengager de ce point de vue-l.
LIA peut notamment aider les journalistes analyser les donnes et dtecter des ten-
dances partir de sources dinformations multiples allant des sources ouvertes habi-
tuelles aux sources indites comme les donnes publies par Wikileaks. Elle peut
aussi aider convertir les donnes en texte, les textes en contenus audio et vido. Elle
permet danalyser des objets, des images, de reconnaitre des personnes dans des pho-
tos, ce qui est trs utile pour comprendre des situations captes par des photo-
journalistes.

Recherche
Les nombreux moteurs de recherche documentaires gnriques du march peuvent
tre exploits par les journalistes sils peuvent sen quiper. Il en existe quelques-uns
qui sont ddis aux journalistes, comme Salient de Lore.ai (2016), un outil danalyse
de contenus qui permet de raliser des recherches, des liens entre documents, de les
classifier et de les exploiter, le tout sur plusieurs sources et plusieurs langues.

Production
Nombre de startups sont apparues ces dernires annes qui automatisent la cration
de contenus. Comme presque partout dans lIA, ce quelle produit ne vient pas de
nulle part mais rutilise des contenus existants crs par de vrais gens.
Nous avons pu balayer quelques startups spcialises dans la gnration automatique
de textes et de rsums dans la rubrique sur le traitement du langage. Une faible par-
tie dentre elles ciblent les mdias, pour ce que lon appelle le robot journalism
comme le franais Syllabs et sa solution Syllabs Media ou encore lAmricain Tex-
tomatic (2010, $40M). La raison est simple : ce march est moins solvable que la
finance ou le marketing !
Les robots rdacteurs ne font pas de vritable journalisme. Ils gnrent des textes r-
ptitifs sur de gros volumes de donnes comme pour produire les rsultats dlections
lchelle locale, dans le cadre de comptitions sportives ou pour la mto. Ils trans-
forment le plus souvent des donnes numriques en phrases avec des templates plus
ou moins flexibles. Mais les gnrateurs de langage peuvent de plus en plus tenir
compte du contexte des donnes pour choisir les bonnes formulations.
Cest le cas avec la publication en mai 2017 dun article du Los Angeles Times an-
nonant un tremblement de terre dchelle 3.8 (vido)170. Larticle na dans la pra-
tique pas t crit par un systme base dIA mais par un petit programme dnomm
ClickBot dvelopp par un journaliste du LA Times. Un journaliste a ensuite compl-
t larticle la mano.

170
Larticle en question : http://www.latimes.com/local/lanow/la-me-earthquakesa-earthquake-39-quake-strikes-near-view-park-
windsor-hills-calif-onvisi-story.html.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 225 / 362
Lagence Associated Press publie depuis 2015 des dpches cres par des robots
journalistes pour les annonces standardises, notamment dans lactualit financire
(vido).
Le traitement de gros volumes de donnes gnrs par des sources telles que
Wikileaks ncessite aussi des outils spcifiques. Ils sont souvent dvelopps bas
cout partir des nombreuses briques logicielles en open source du march. Les rdac-
tions des mdias ne sont pas suffisamment fortunes pour se payer les services dune
grande ESN ou dun SAP !
La simple digestion de vidos est trop longue pour une rdaction dans le print. Les
outils de transcript de vidos en texte sont donc les bienvenus. Cest une fonction
standard dans YouTube (ci-dessous) !

Dautres solutions de gnration de contenus ddis aux mdias ont vu le jour sur
dautres types de contenus. Valossa (2015, $650K) propose ainsi une solution en
cloud de reconnaissance dimages dans les vidos adapt aux besoins des broadcas-
ters. Elle permet linterprtation de vidos, dtecte les personnes, leur verbatim et les
thmes couverts (ci-dessus droite). Elle ajoute des mtadonnes aux scnes analy-

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 226 / 362
ses exploitables dans les outils danalytics voire pour les gnrateurs de guides de
programmes.
Le breton Mediawen (2014) gre la traduction de contenus vido en temps rel en
sappuyant sur IBM Watson puis text to speech, en voix de synthse ou sous titrage.

Lisralien Wibbitz (2011, $11,8M) est connu pour sa solution qui gnre automati-
quement des vidos dactualit partir de contenus textuels et de scrapping de conte-
nus vidos.
Une tude amricaine montre que les lecteurs font plus confiance des articles pro-
duits par des robots que par des journalistes171. Cela mrite videmment un peu de
recul car les articles produits par les robots journalistes ne font le plus souvent que
transformer des donnes chiffres en phrases et ne vhiculent donc pas dopinion ou
de jugement de valeur. Sauf si les donnes sont fausses ! Et, sans surprise, les
journalistes naiment pas les robots journalistes172 !

171
Source du schma droite : The Artefacts of Automated Journalism: Producers Perspectives and Audience Assessments de Neil
Thurman.
172
Cf http://www.newstatesman.com/science-tech/technology/2017/03/human-journalists-hate-robot-journalists-says-new-report.qui
propose au passage un petit test de dtection de brves rdiges par des robots et des journalistes. Il nest pas trop difficile dobtenir 5
sur 5 au test. Ce qui est rassurant pour les journalistes !

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 227 / 362
Mais il vous est peut-tre dj arriv de tomber sur des vidos sur YouTube se pr-
sentant sous la forme de slideshow avec une voix off robotise lisant un texte. Ce
sont des bots de gnration de spam vidos ! Bref, le pire ! Dans dautres cas, ce sont
des vidos qui se lancent toutes seules dans des journaux en ligne et qui lisent les ar-
ticles. Cest bien pour les mal voyants mais pnible pour les autres !
Lindustrie musicale tire aussi parti de lIA pour la production et la diffusion de con-
tenus.
Le canadien Landr (2012, $9m) propose un service en cloud dautomatisation du
mixage audio, qui va crer des morceaux de musique agrables lcoute (vido).
LAmricain Popgun.ai (2017) utilise le deep learning pour apprendre les bonnes
rgles musicales partir de compositions humaines et pour enrichir des composi-
tions existantes. La dmonstration de leur prototype Alice est sympathique (vido)
mais pas forcment facile mettre en pratique.
Amper Music (2014, $4M) est un site en ligne, pour linstant gratuit, qui com-
pose automatiquement de la musique via de lIA (vido). Il faut tout de mme le
paramtrer pour indiquer ses souhaits en termes dinstruments, de tempo, de style
et de dure. Cest pratique pour crer des compositions qui vont alimenter les vi-
dos de dmonstration de startups, et viter les habituelles musiques dukull qui
les accompagnent rgulirement.
Pacemaker (2011, $4M) est un DJ base dAI qui exploite les contenus de ser-
vices de musique en ligne comme Spotify.

Diffusion
Newswhip (2011, $9M) propose un outil danalyse de lcho des mdias et sujets
dans les rseaux sociaux. Il permet daffiner sa stratgie rdactionnelle pour que les
sujets publis collent bien aux attentes des lecteurs. Ils sont utiliss par des mdias
anglo-saxons comme le Huffington Post, Buzzfeed, la BBC et The Guardian. Cest
aussi ce que fait Banjo (2010, $121M) et qui ne cible pas que le march des mdias,
sinon, il naurait pas lev ce montant.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 228 / 362
La startup Echobox (2013, $3,4M) propose de son ct Larry, un assistant ddi la
diffusion des contenus de mdias dans les rseaux sociaux exploit par le Monde, Le
Figaro, Libration, VICE et New Scientist. Comment a marche ? Leur IA analyse
les contenus du mdia et les tendances dans les rseaux sociaux, puis pousse ces con-
tenus dans la page Facebook (ou autre) du mdia en gnrant automatiquement les
titres, rsums et illustrations, histoire de maximiser leur diffusion. Ca ne va pas
jusqu choisir les illustrations pour les publier sur Instagram en fonction des photos
qui sont populaires dans ce service. Cest la prochaine tape !
Enfin, la start-up de dcouverte de musique Decibel Music Systems (2010) utilise
IBM Watson dans son application MusicGeek pour faire de la recommandation.

Montisation
Dune manire gnrale, lIA peut aider les mdias identifier les sujets porteurs en
analysant les tendances dans les mdias sociaux et agencer le sommaire des mdias
dans leur version web et mobile.
Le californien True Anthem (2008, $4,2M) est une plateforme intgre de distribu-
tion de contenu destine aux mdias. Elle permet notamment loptimisation de la dis-
tribution des contenus au travers des mdias sociaux, via un ciblage de contenus as-
sist par IA, qui dcide notamment du moment optimum pour publier les contenus.
Leur service est exploit par Reuters et CBS Interactive. Dun point de vue technique,
True Anthem a lair dexploiter des systmes danalyse du langage (NLP) et des mo-
teurs de rgles.
Adomik (2012, $1,3M) est une startup franaise qui propose un outil de prdiction
base de machine learning pour optimiser la publicit programmatique. Loutil est sur-
tout destin aux publishers.
De son ct, le Financial Times utilise une solution base de machine learning pour
dterminer la corrlation comportementale entre lengagement dans le mdia et le
churn173.

173
Source : https://digitalcontentnext.org/blog/2017/06/13/artificial-intelligence-gains-momentum-news-media/.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 229 / 362
Tourisme
Le tourisme est un autre terrain de jeu propice aux innovations base dIA : les don-
nes sont abondantes, notamment via les intermdiaires de la rservation en ligne et
chez les compagnies ariennes et leurs services de rservation mutualiss tels que
Sabre et Amadeus, cest un march grand public, il peut exploiter les outils de la mo-
bilit et ceux des objets connects.
Les systmes de rservations de vols et htels exploitent toutes les techniques imagi-
nables de yield management pour les remplir aux prix les plus levs. Certains
systmes exploitent de la logique floue.

Chatbots
Les chatbots de prparation de voyages sont trs nombreux, surtout aux USA. On en
trouve qui sont attachs des niches varis ou des offres spcifiques comme pour
les trains Amtrak, pour le processus de checking en ligne de KLM174, Air France
KLM qui a un chatbot pour Facebook Messenger, avec le chatbot de Voyages SNCF
sur Facebook Messenger (vido), Mercure Bot, toujours sur Facebook Messenger175
ou Ask Mona, un chatbot de slection de visites culturelles en France.
SnapTravel (2016, $9,2M) permet de choisir son htel en fonction de ses contraintes
budgtaires et via divers supports de communication (SMS, Facebook Messenger et
mme Slack). Il associe comme certains chatbots de lIA et de lintervention humaine
et scanne les offres dExpedia, de Priceline et de dizaines de sites. Bref, cest un mo-
teur de recherche commande textuelle. Pana (2015, $1,45M) est un quivalent des-
tin aux voyages professionnels.

Les applications mobiles gnralistes chatbot de prparation de voyage ne manquent


pas aux USA. Nous avons par exemple Lola (2015, $44,6M), cr par Paul English,
le fondateur du moteur de recherche de voyages Kayak revendu Priceline pour $2B,
Mezi (2015, $11,8M) et Skyscanner (2003, $197M, acquis par le chinois Ctrip en
novembre 2016). Toutes ces applications se ressemblent et accdent gnralement
aux mmes sources de donnes176.

174
Voir cette liste de quelques dizaines de chatbots : https://www.30secondstofly.com/ai-software/ultimate-travel-bot-list.
175
Que jai test et qui napporte pas grand-chose, et en plus est trs lent.
176
Cf http://www.nanalyze.com/2017/04/artificial-intelligence-ai-travel/.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 230 / 362
Parcours touristiques
La cration de parcours touristiques personnaliss devrait tre un bon champ
dapplication de lIA. On indiquerait sa ville, ses prfrencs en termes de types de
visite, le nombre de jours, les moyens de transports prfrs et le budget et le systme
produirait automatiquement des propositions dagendas avec horaires, transports et
un forfait pour tout payer.
Mais aujourdhui, cest encore plutt du domaine de la science fiction et de la singu-
larit. Pourquoi donc ? Parce quil est trs difficile dobtenir toutes les donnes struc-
tures ncessaires, que les marchs sont fragments, que les billetteries en ligne ne
sont pas standardises pour les visites et quil faut tout refaire dans chaque ville. Mais
cela arrivera bien un jour. Vous objecterez avec tel ou tel service qui existe dj, mais
vous rendrez compte, de prs, quil manque toujours quelque chose comme la cra-
tion dun parcours qui intgre les temps de transport.
Mais lapplication mobile Google Trip qui fonctionne mme en mode dconnect
commence sen approche tout de mme (vido). Mais la vido de prsentation est
trompeuse ! Les parcours de visite sont prformats et ne sont pas personnalisables.
LAmricain Wayblazer (2014, $5M) propose des recommandations contextualises
et personnalises et tourne au-dessus dIBM Watson (vido). Il personnalise
laccompagnement photographique des propositions en fonction des recherches tex-
tuelles multicritres de lutilisateur. Cest une sorte de concierge numrique commer-
cialis aux professionnels du tourisme. Une solution quivalente est propose par
lAmricain GoMoment (2010).
Gogobot (2010, $39M) et son application Trip.com utilise un modle prdictif qui
exploite la segmentation socio-dmographique du voyageur, le moment et la mto
pour proposer des visites. Mais lintgration nest pas extraordinaire au premier abord
lorsque lon teste le site qui spare htel et avion alors que loffre devrait tre int-
gre, comme dans Opodo.
Et des guides de visites en ralit augmente, qui seraient des quivalents de
Pokemon Go servant quelque chose ? Cela arrive au compte goutte, mais avec des
couts de production par attraction qui sont encore trop levs pour tre gnraliss.
Reste aussi inventer une IA qui rendrait les serveurs des cafs parisiens plus sympas
et orients clients !

Exprience touristique
Lexprience touristique peut samliorer en tirant parti de lIA diffrents tages.
Jai pour linstant dcouvert cet outil de prdiction propos aux hteliers par la star-
tup franaise Victor&Charles qui sappuie sur IBM Watson et exploite toutes vos
donnes publiques des clients disponibles dans les rseaux sociaux pour en analyser
linfluence, les affinits et lhumeur. Il propose alors des recommandations lhtel
qui vous accueille pour lui permettre de personnaliser votre arrive, et notammentt de
trouver la personne la plus approprie pour sen charger.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 231 / 362
Cela sappliquera plutt des htels quadri-toils ou plus ! La solution utilise IBM
Watson Conversation, Natural Language Understanding, Personality Insights et Tone
Analyzer. Le matching de personnalit est une fonctionnalit que la startup souhaite
commercialiser au-del du march de lhtellerie. Son dveloppement na pas dur
plus de deux mois.
Depuis quelques annes, vous pouvez installer sur votre smartphones diverses appli-
cations, notamment de Google, qui traduisent automatiquement la signaltique tout
comme les menus de restautants.
Et puis surtout, cette exprience client en environnement ferm prsente par Carni-
val lors dun keynote au CES 2017 (vido). Elle consiste proposer un badget RFID
aux passagers des paquebots qui permet daccder tous les services du navire, ces
services tant personnaliss en fonction des prfrences et de lactivit des passagers.

Robots
Si vous aimez les robots, le tourisme pourra vous donner loccasion den croiser.
Tout dabord en vous quipant vous-mmes dune valise robot comme ltonnante
Cowarobot (vido). Dorigine chinoise, la startup avait russi sa leve de fonds sur
IndieGogo avec $581K de rcolts en septembre 2016. A ce jour, les valises ne sont
toujours pas livres aux early-adopters !
Vous pouvez aussi croiser des robots mobiles dinformation de Qihan dans les aro-
ports comme Shanghai.
Enfin, si vous allez au Japon, vous pourrez faire un sjour dans lhtel pilote Henn-
na de Tokyo avec ses 75 chambres et dont laccueil est ralis par des robots depuis
2015 (vido).
Vous le choix entre une htesse robot ou un vlociraptor robot qui ne font que servir
dinterface visuelle pour lautomate qui vous permet de faire votre checking et qui
existe dj dans diverses chaines dhtel en France. Ce mme htel robotise le trans-
port de vos bagages dans votre chambre.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 232 / 362
Ce nest quun dbut ! Aprs, si vous avez besoin de rencontrer de vraies personnes
pour alimenter votre organisme en srotonine et en dopamine, cest une autre affaire !

Juridique
Le lancement de la startup canadienne Ross Intelligence (2014, $13M) qui sappuie
sur IBM Watson il y a quelques annes a cr un signal fort sur le march : les m-
tiers intellectuels comme celui davocat allaient tre transforms radicalement par
lIA177.
Quen est-il dans la pratique ? Quand on y regarde de prs, on constate quune bonne
partie des outils de lIA dans les mtiers juridiques sont des moteurs de recherche
amliors qui permettent de consulter les lois et la jurisprudence.
En complment, des applications plus labores voient le jour, pour comparer des
contrats, pour les optimiser et pour faire aussi des prdictions sur lissue dun procs.
Dans lensemble, les techniques dIA exploites dans le domaine juridique tournent
autour du NLP (Natural Language Processing).

Ltude de 2016 Altman Weil Law Firms in Transition 2017 indique que la moiti
des cabinets davocats US de plus de 1000 salaris utilisent dj des outils dIA. Ce
taux est infrieur 10% pour les autres tailles de cabinets. Cela rappelle la situation
de nombreuses professions librales (notaires, experts comptables, mdecins) qui sont
fragilises par leur fragmentation face aux ruptures technologiques quelles sont
lentes adopter vis--vis de grandes organisations plus structures.

177
Cf Legal Aspects of AI de Richard Kemp, novembre 2016, qui voque la fois les usages de lIA dans les mtiers juridique et les
impacts juridiques de lIA.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 233 / 362
En mme temps, les solutions dIA juridiques ne vont pas remplacer les avocats et
juristes qui devront encore longtemps grer leurs clients et plaider. Elles affecteront
surtout les mtiers du paralegal dans les cabinets. Elles amlioreront la productivit
de nombreux professionnels, comme les tableaurs lont fait pour tous les mtiers ex-
ploitant des donnes chiffres depuis plus de 35 ans. Comme toute technologie qui se
dploie largement, lIA pourrait aussi permettre un largissement du march juridique
tout en ayant un effet dflationniste sur les prix.
Dans Legal Aspects of Artificial Intelligence178 de Richard Kemp (novembre 2016),
on trouve cette petite liste intressante dtude de cas dusage de lIA dans des cabi-
nets davocats amricains. A chaque fois, il sagit deffets dannonce, sans quil y ait
encore de vritables retours dexprience.

Moteurs de recherche juridiques


Une grande majorit des startups juridiques de lIA proposent donc des moteurs de
recherche dans les textes de lois et de jurisprudence. Elles florissent particulirement
bien dans les pays anglo-saxons dont le droit est influenc par la jurisprudence (dit de
case law ), tandis que le droit europen et surtout franais, est plus fortement in-
fluenc par les lois et rglements ( common law , ou droit romain).

Ross Intelligence (2014, $120K), fonde par le canadien Andrew Arruda qui a fait
une partie de ses tudes la Sorbonne, sappuie sur IBM Watson et est utilis par
quelques grands cabinets davocats aux USA comme Baker Hostetler en mai 2016.
Cest essentiellement un moteur de recherche que lon interroge avec des questions
poses en langage naturel. Il est cens devenir plus intelligent au gr de son usage, ce

178
Cf https://www.lexology.com/library/document.ashx?g=53ef5f3a-b41a-4a24-ba7c-1ec6d53187f7.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 234 / 362
qui nest pas vident comprendre car la rponse des questions ne constitue pas une
forme dapprentissage supervis ou par renforcement.
Nous avons divers autres systmes dinterrogation de bases de connaissances comme
Ravel Law (2012, $15M), issu de lcole de droit et celle dinformatique de Stanford
et acquise par LegalNexis en 2017, Casetext (2013, $20,8m) qui est focalis sur
lanalyse de jurisprudences et Judicata (2012, $7,8m) qui lui aussi sintresse
lanalyse de la jurisprudence.

En France, Supra Legem est une ressource en open source et open data pour accder
la jurisprudence (ci-dessus droite).

Simulations et prdictions
Le franais Case Law Analytics est une startup proposant une solution danalyse des
alas juridiques dune affaire. L encore, il doit y avoir beaucoup de NLP au pro-
gramme. Lun des cofondateurs est un ancien directeur de recherche de lINRIA sp-
cialis en modlisation mathmatique en conomie, finance et droit. La solution ana-
lyse la jurisprudence, tablit et visualise des modles probabilistes permettant
dvaluer non seulement lissue dune affaire mais galement ses lments quantita-
tifs comme les dommages et intrts. Comme partout dans lIA, la qualit dune va-
luation dpend de la quantit dtudes de cas analyses. Si votre cas est indit, ltude
de la jurisprudence napporte pas grand-chose. La startup qui est porte par lINRIA
est en phase damorage.
Un autre franais, Predictice (2016), est aussi positionn sur la justice prdictive.
Cest cependant une solution gnraliste avec un moteur de recherche de documents
juridiques. La startup exploite les donnes ouvertes de Lgifrance (textes de droit) et
Jurica (jurisprudence). Au passage, elle est hberge chez OVH.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 235 / 362
Proprit intellectuelle
La proprit intellectuelle est un champ part entire du droit avec ses spcialistes,
les conseils en proprit intellectuelle. Les bases de donnes associes tant spci-
fiques, celles des marques et des brevets.
Juristat (2012, $1,62M) ralise des analytics sur les donnes publiques sur les
brevets et les avis des agents de lUSPTO pour optimiser les stratgies de protec-
tion de brevets. Cest une solution ddie au march US. Le financement de la
startup lexplique en partie. Il est encore limit pour permettre un dveloppement
international rapide.
Turbo Patent (2008, $3,45M) produit des reportings sur la qualit et la valeur
dun portefeuille de brevets.
Lex Machina (2009, $10M) fournit une solution de prdiction sur les litiges de
proprit intellectuelle. Elle exploite des solutions danalyse du langage dvelop-
pes lUniversit de Stanford.
Onomatics (2012, $3,5M) propose TrademarkNow qui est focalis comme son
nom lindique sur les recherches portant sur la protection des marques (ci-dessous).
Il est cependant difficile dy identifier des morceaux dIA.

Autres usages
Business analytics, analyse de contrats, gestion de contrats de confidentialit et chat-
bots grand public au programme !
ClockTimizer est un outil de business analytics pour cabinets davocats qui permet
dvaluer le temps pass sur des contrats clients et daffiner ensuite les devis pour
dautres clients bass sur lexprience. Les outils exploitent la fois des donnes tex-
tuelles (mots cls des contrats, etc) et quantitatives (temps pass, etc).

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 236 / 362
Kira Systems (2015) propose une solution de due diligence et danalyse de con-
trats. Cest aussi lactivit dun autre Canadien, eBrevia (2012, $2M) qui a codve-
lopp sa solution avec lUniversit de Columbia qui couvre notamment le droit de
limmobilier.
Neota Logic est une startup qui est spcialise dans la prparation de contrats de con-
fidentialit (NDAs). LIA quelle contient est cense permettre la slection des bons
templates en fonction des besoins. Ca peut tre aussi bien un moteur de rgles pas
trop complexe ou un outil de machine learning exploitant quelques dizaines de va-
riables et de la PCA (Principal Components Analysis) pour identifier les paramtres
cls de choix des templates.
DoNotPay est un chatbot anglais cr par un jeune de 19 ans qui permet de faire sau-
ter les contraventions aux USA et au Royaume Uni. Il a ensuite t tendu la ges-
tion de nombreux cas de droit civique. Lensemble exploite IBM Watson, ce qui
montre quavec un peu de dtemination une personne isole peut le paramtrer effi-
cacement.

On compte notamment LegalZoom, un service davocat en ligne couvrant la fois le


droit des affaires et le droit civil179 qui sappuie sur IBM Watson.

179
Voir ce numro de The American Lawyer qui en parle bien.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 237 / 362
Services publics
LIA peut servir de manire gnrique dans les services publics, notamment pour la
cration de chatbots, pour lanalyse de donnes avec du machine learning, pour me-
ner des analyses macro-conomiques et tudier les donnes de recensement.
Du ct de lducation, les applications de lIA ne sont pas trs nombreuses en ltat.
Elle intervient dans les universits pour les aider recruter les meilleurs tudiants
Plexuss (2014) ou, au contraire, pour aider ces derniers trouver la meilleure univer-
sit avec Admitster (2014). Mais on parle des USA, pas de la France !
Les applications sont plus nombreuses dans le contexte de la ville intelligente pour
prdire lusage des infrastructures, optimiser la consommation dnergie ou grer la
scurit par la vido-surveillance.

LIA peut aussi servir pour la police et la justice. La police de la ville de Durham, au
Royaume-Uni exprimentait en 2017 une application dveloppe par lUniversit de
Cambridge servant classifier les suspects arrts pour valuer leur niveau de risque,
exploitant quatre annes darchives darrestations. Le systme est dnomm HART
pour Harm Assessment Risk Tool180.
La Chine exprimente un systme quivalent qui ambitionne daller plus loin en ten-
tant de prvoir o des crimes pourraient avoir lieu en suivant les dplacements de
groupes de criminels connus181. Un tel systme ne peut fonctionner correctement que
sil dispose dune base de donne de ces suspects et sil est capable de suivre leurs
dplacements en temps rel. Lexploitation dimages de camras de vido-
surveillance peut servir cela et dtecter des comportements suspects comme ceux
des pick-pockets182.

180
Le digital evangelist Stphane Mallard dans ses confrences, comme dans L'intelligence Artificielle - A l'aube de la disruption
ultime, indique que ce systme permet de prvoir les crimes lavance, avec la date et lieu. Ce nest pas du tout la fonction de
HART ! Comme de nombreux vanglistes du secteur, les exemples donns qui relvent dune revue de presse de premier niveau
sont souvent trs exagrs dans leur porte et leur fonction relle. En pratique, et pour ce qui concerne les anglais, cette fonctionnalit
est anticipe pour 2030. Aujourdhui et 2030, ce nest pas la mme chose ! Cf The real Minority Report: By 2030, police could use
AI to predict and prevent crimes BEFORE they happen, septembre 2016. Les exagrations de ce genre sur lIA sont trs courantes.
181
Cf China seeks glimpse of citizens future with crime-predicting AI en juillet 2017.
182
Encore faut-il alors intervenir ! On na pas besoin dIA pour identifier les pick-pockets dans les lieux touristiques Paris et ils ne
sont pas arrts pour autant.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 238 / 362
Renseignement et dfense
LIA a videmment de nombreuses applications dans le vaste secteur de la dfense et
du renseignement.
La robotique est dj trs largement utilise, que ce soit avec des robots de dminage
dj oprationnels en Irak ou en Afghanistan (mais ils sont tlcommand) et surtout
avec les drones ariens, eux-aussi tlcommands mais dots doutils de reconnais-
sance de leur environnement et de pilotage automatique.
LIA est aussi utilise dans la prdiction dvnements comme chez Predata (2015,
$3,25M).

Elle peut servir identifier des terroristes potentiels en fonction de profiling exploi-
tant diverses sources de donnes, issues notamment de lespionage des communica-
tions lectroniques. Ces outils utilisent du machine learning, de la PCA (Principal
Components Analysis) pour identifier les paramtres permettant de les distinguer du
reste de la population. LIA sert trouver des aiguilles dans de vastes bottes de foin.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 239 / 362
Acteurs de lintelligence artificielle

Nous allons dans cette partie dcrire une bonne part de lcosystme de lIA : avec
les grandes entreprises (amricaines) du secteur, les startups et leurs tendances, et ce
qui se passe en France aussi bien ct recherche que startups.

Grandes entreprises du numrique


Les grands acteurs du numrique occidental sont tous trs impliqus dans lIA pour
amliorer leurs solutions. Nous avons en tte les GAFAMI : Google, Amazon, Face-
book, Apple, Microsoft et IBM. Tous ne jouent pas le mme rle dans les grandes
entreprises. Seuls IBM, Microsoft, Amazon et dans une seconde mesure Facebook et
Google, proposent des plateformes et solutions adaptes aux grandes entreprises.
IBM et Microsoft sont les entreprises investies dans lIA depuis le plus longtemps.
Lun des initiatieurs du Summer Camp de Darmouth en 1955 tait Nathanel Roches-
ter, un chercheur dIBM. Et Microsoft a cr son laboratoire de recherche en 1991,
principalement ddi aux avances de lIA.
Les GAFAMI ont la particularit de publier en open source presque toutes leurs
briques logicielles de base de lIA. Ce sont donc des commodits. La russite dans
lIA comprend quelques ingrdients de base : une plateforme logicielle intgre et
ouverte, des ressources en cloud ventuellement enrichies par des architectures mat-
riels propritaires diffrencies, laccs des donnes sachant que les les plus intres-
santes proviennent dactivits grand public (ci-dessous, la liste des aplications de lea-
ders, y compris les chinois Alibaba et Baidu), des partenaires adoptant la plateforme,
ou la capacit interne grer des projets clients et enfin, surtout, des talents.

Sur les grands marchs horizontaux, ces GAFAMI et leurs quivalents chinois ont de
fortes chances de devenir les leaders de lIA183. Il reste probablement de la place pour
des acteurs positionns sur des marchs verticaux que ces grands acteurs ciblent mal,
mme IBM.

183
Cf Why AI consolidation will create the worst monopoly in US history, aot 2016.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 240 / 362
Est-ce que les leaders chinois vont dpasser les GAFAMI ? Cest une hypothse la
mode184. Les grandes entreprises chinoises du numrique185 et les startups chinoises
bnficient dun terrain favorable : une masse de chercheurs et dveloppeurs forms
en Chine ou dans le reste du monde, un march intrieur de plus de 500 millions
dInternautes, un march mobile ultra-dvelopp et une rglementation qui se pose
beaucoup moins de questions sur la protection de la vie prive.
Malgr tout, il subsistera encore longtemps un cloisonnement des marchs au niveau
des donnes et des applications entre la Chine et le monde occidental. Sauf accidents
de parcours, les grands chinois ne feront pas lacquisition de GAFAMI. Si Baidu et
dautres font quelques progrs significatifs dans le deep learning, les techniques utili-
ses qui sont gnralement open source ne sont pas des diffrentiateurs stratgiques
suffisants. Seule la donne acquise dans leur pays lest et les donnes captes par les
leaders chinois manquent de diversit pour bien couvrir les besoins lchelle mon-
diale186.
Ces grands leaders chinois ont recrut des talents chez des concurrents amricains.
Rien que chez Baidu, Andrew Ng qui tait auparavant chez Google tandis que Qi Lu
provenait de Microsoft et Yahoo. Quand Hugo Barra, ex Google pass avec fracas
chez Xiaomi en 2013, il les a quitts dbut 2017 et est devenu VP de la ralit vir-
tuelle chez Facebook. La recherche chinoise fait des progrs mais est encore en
piggy-back dune bonne part de la recherche nord-amricaine (USA + Canada).
Bref, comparer la Chine aux USA en matire dIA nest pas vident, surtout si les
indicateurs sont anecdotiques et pas conomiques.

184
Cf China May Soon Surpass America on the Artificial Intelligence Battlefield, fvrier 2017 et Chinas AI awakening, paru en
octobre 2017.
185
On compte notamment les BATX (Baidu, Alibaba, Tencent, Xiaomi) auxquels il faudrait au minimum ajouter Huawe qui est le
seul des grands chinois massivement prsent hors de Chine en plus de Xiaomi. Et pour cause, cest un fournisseur de technologies,
pas un oprateur de services en ligne comme Baidu, Tencent ou Alibaba. Il y a aussi Wechat qui est aussi dans cette catgorie.
186
Si lon sintresse la reconnaissance de visages, Google pourrait avoir un avantage sur les leaders chinois. En effet, la qualit
dun tels systme est lie la diversit des visages qui servent son entrainement. Google est mieux plac pour disposer dune
grande diversit de visages dans ses bases. Il en va de mme pour Facebook, ne serait-ce que de par la grande diversit des visages
que lon peut trouver aux USA. Cette diversit est bien moindre en Chine. Pour bien entrainer une IA base de deep learning, la
varit des donnes fournies est cl ! On pourrait appliquer le mme raisonnement plein dautres types de donnes qui sont dpen-
dants de la langue et de la culture : la parole, les modes de consommation, les modes de vie, de transports, etc.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 241 / 362
Lautre benchmark habituel des grands groupes consiste observer leurs acquisitions.
Comme il y a une guerre de talents dans lIA, cest un indicateur de leur monte en
puissance. De ce ct-l, Google est plutt en tte de peloton.
Les GAFAMI adoptent une double approche de plateforme pour attirer des dvelop-
peurs dapplications avec des frameworks le plus souvent open source et gnrer des
conomies dchelle et dintgration verticale pour capter une partie aussi grande
que possible de la valeur ajoute, quil sagisse de sa dimension technique (comme
dans le hardware) ou sa dimension dusages (pour le grand public).
Cette intgration verticale couvre de nombreux domaines comme les chipsets neuro-
morphiques (IBM, Google, Microsoft), les serveurs (Facebook, IBM), les applica-
tions et donnes grand public (tous sauf IBM), les donnes mtier (surtout IBM), la
mobilit (Google, Apple, Facebook), la ralit virtuelle (Google, Facebook, Micro-
soft), la cration et/ou la distribution de contenus (Google, Amazon, Apple, Face-
book) et plus rarement, les services, le conseil et lintgration (surtout chez IBM).
Pour rsumer la situation des GAFAMI :
IBM est un acteur trs prsent dans les grandes entreprises avec sa plateforme lo-
gicielle couteau suisse IBM Watson et son activit de services. Cest le grand
du secteur qui est investi dans lIA depuis ses dbuts, en 1955 !
Google est un acteur dominant du numrique grand public couvrant de larges pans
de la vie des utilisateurs (recherche, email, mobile, TV, maison connecte). Cela
lui permet de capter de gros volumes de donnes pour alimenter ses IA . Il do-
mine aussi le dveloppement de solutions dIA avec son framework open source
TensorFlow.
Amazon est le leader du retail en ligne et du cloud dentreprise. Il sest taill une
bonne place dans les chatbots vocaux avec Alexa.
Microsoft propose une belle plateforme logicielle dIA couvrant le machine lear-
ning et le deep learning, ainsi quune excellente activit de recherche fondamen-
tale, mais lditeur souffre dun dficit marketing dans le domaine, notamment
auprs des startups.
Facebook domine les rseaux sociaux et la communication mobile (WhatsApp,
Instagram), des logiciels qui exploitent de plus en plus dIA. Il domine le march
des chatbots avec Messenger.
Apple est une socit trs intgre verticalement dont lapproche plateforme, sur-
tout en cloud, est moins prgnante dans lindustrie. Mais iOS tant un passage
oblig, il est mcaniquement prsent chez de nombreux dveloppeurs.
Oracle, SAP et SalesForces ont mis lIA leur menu mais font moins parler
deux du fait de leur positionnement entreprise.
Toutes choses que nous allons examiner un peu plus en dtail dans ce qui suit, acteur
par acteur !

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 242 / 362
IBM
IBM est lun des premiers grands acteurs du numrique qui ait mis le paquet sur lIA
relativement tt, au moins partir de 1996. IBM articule lIA autour du concept
dinformatique cognitive et de la marque un peu fourre tout IBM Watson.

Une analyse au vitriol de 53 pages publie en juillet 2017 par la banque


dinvestissement Jefferies187 dcrit bien les enjeux dIBM vus par la lorgnette des ac-
tionnaires : Watson est un bel artifice de communication, mais sa traduction en avan-
tage comptitif nest pas vidente pour lentreprise dont la stratgie est tiraille entre
celle de prestataire de service et dditeur de logiciel. Elle fait face des concur-
rences multiformes : les grandes socits de services et intgrateurs (CapGemini,
ATOS, Orange Business Services pour la France), les grands diteurs de plateformes
(Microsoft, Oracle, ) et les fournisseurs de ressources en cloud (Amazon en tte).
Qui plus est, IBM a aussi bien du mal attirer les talents qui sont aspirs par les
GAFA et les startups de la Silicon Valley. Au point que dbut septembre 2017, IBM
annonait le lancement dun laboratoire conjoint de recherche avec le MIT financ
hauteur de $24M par an sur 10 ans.
Google et Facebook sont des concurrents plus indirects, ceux-ci nayant pas de vri-
table approche des grandes entreprises pour leurs projets stratgiques.
Lhistoire
Dans les annes 1960, IBM aurait stopp brutalement ses travaux de recherche en IA
par peur que les postes de managers soient remplacs par des machines. Ctait aussi
le rsultat dune remonte des clients qui avaient aussi peur de perdre leur poste.
Fast forward. IBM a du faire sa mue de constructeur vers le mtier dditeur de logi-
ciels coupl celui de prestataire de services partir de 1993. Aujourdhui, IBM est
une socit nouveau en lent dclin, en tout cas en termes de chiffres daffaires.
IBM gnre maintenant lessentiel de son profit parts gales entre logiciels et ser-
vices. La synergie entre les deux mtiers est plutt bonne mme si la branche services
dIBM travaille aussi avec les technologies concurrentes. Ils savent dployer des so-
lutions qui intgrent des logiciels dOracle, de Microsoft, de SAP, bref de tout, en
fonction des contraintes du client.

187
Cf IBM Creating Shareholder Value with AI? Not so Elementary, My Dear Watson, Jefferies Franchise Note, juillet 2017.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 243 / 362
La question reste cependant pour tout acteur du march de ne pas rater les vagues
technologiques. IBM sen tait pas trop mal sorti en 2000 en se positionnant dans le
e-business. Sa campagne de communication martelait le rle de one-stop-shop pro-
vider dIBM pour ses clients.
IBM a petit petit dlaiss ses activits matrielles dans les machines de commodit.
Le dlestage sest fait par tapes : les imprimantes avec la cration de Lexmark en
1991, les PC cds en 2004 au chinois Lenovo, et puis les serveurs PC cds gale-
ment Lenovo, en 2014. Par contre, ils ont toujours mis sur les grandes architec-
tures, dans la ligne de leur ligne historique de mainframes. Do limportance pour
eux du HPC (High Performance Computing) et de lintelligence artificielle.
La premire incartade dIBM dans lIA sest manifeste au grand jour avec la victoire
de lordinateur IBM Deeper Blue contre Gary Kasparov en 1997. Cela a contribu
relancer les recherches dIBM sur lIA dans les annes 2000.
La seconde grande tape a t la victoire dIBM Watson au jeu Jeopardy en 2011.
Jeopardy est une sorte de Questions pour un Champion amricain, sans Julien Le-
pers. Watson nest pas infaillible. Cette victoire fut un peu enjolive et construite par
la communication dIBM qui au passage, a t pilote lchelle mondiale par
lagence Ogilvy.
Dans partie intressante et moins mdiatise188 organise avec Miles OBrien et Da-
vid Gondek, lun des crateurs de Watson, Watson ne sait pas indiquer pendant quelle
dcennie Klaus Barbie a t condamn ni indiquer sur quelle place de Dallas (Dealey
Plaza) JFK a t assassin, ni ce quest la vermiphobia (la phobie des vers) ou la ailu-
raphobia (phobie des chats), toutes ces informations tant disponibles sur Wikipedia.
Il ne sait pas non plus identifier des recettes de cuisine en fonction de leurs compo-
santes. Watson a aussi du mal rpondre des questions formules avec peu de mots
et comprenant des ambiguts ou des doubles sens. Tout est question de base de con-
naissances. Celle-ci comprenait 200 millions de pages de donnes structures et non
structures reprsentant un total de 4 To, toutes charges en mmoire pour assurer un
temps de rponse rapide.
Watson tait au dpart un projet de recherche baptis BlueJay (2007) focalis sur
lexploitation de gros volumes de donnes non structures. Il sintgrait dans la vo-
lont dIBM Research de sattaquer un grand dfi, comme passer le fameux test de
Turing. Watson tait dabord prsent comme un ordinateur, sappuyant sur une ar-
chitecture massivement parallle base 750 serveurs utilisant des processeurs Po-
wer7 octo-curs tournant 3,5 GHz totalisant 16 To de RAM.
Watson est devenu une plate-forme logicielle, respectant en cela les canons de la r-
ussite dans le numrique. Elle est propose aux dveloppeurs sous forme dAPIs en
cloud. Lhistoire est bien raconte ici.

188
Cf https://www.youtube.com/watch?v=YgYSv2KSyWg.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 244 / 362
Dans la pratique, Watson sappuie principalement sur la solution DeepQA dIBM et
le framework Apache UIMA (Unstructured Information Management Architecture)
qui permet dexploiter des donnes non structures.
IBM avait annonc investir plus de $1B sur le Cognitive Computing, un peu comme
il avait annonc au dbut des annes 2000 investir la mme somme sur le dvelop-
pement de Linux. Cest donc un beau pari marketing et business quIBM fait ici. Et
cest plutt bien vu car une bonne part du futur des solutions numriques va utiliser
les techniques de lIA. Il faut toujours se positionner sur un futur pas trop lointain
pour viter de rater les trains de la technologie qui passent !
Depuis 2011, Watson est devenu le sujet phare de la communication dIBM. Ctait
dailleurs le seul thme de lintervention en keynote de Ginni Rometty au CES de
Las Vegas de janvier 2016. IBM organise aussi chaque anne une grande confrence
World of Watson dont la dernire dition avait lieu New York du 23 au 24 mai
2016189 et ldition parisienne avait lieu le 10 octobre 2017.
Les logiciels
A chaque solution dIA, son assemblage de composants htroclites ralis sur me-
sure pour rpondre un besoin. Cest particulirement vrai dIBM Watson. Ce der-
nier est un trs bon coup business et marketing dIBM, qui a russi simplifier un
sujet trs complexe.
Ils ont ainsi vulgaris les capacits de Watson et pu cacher sa complexit, voisine de
celle de larchitecture de WebSphere. IBM Watson est comme le fakir du clbre
sketch de Pierre Dac et Francis Blanche190 : ds que lIA peut jouer un rle dans un
projet, il peut le faire .
IBM Watson nest pas un produit. Cest une architecture et une plateforme faite de
nombreuses briques logicielles.

189
Les vidos des keynotes de ldition de mai 2015 sont disponibles pour la premire et la seconde journe.
190
Cf Le Sar Rabindranath Duval de 1956 7 minutes 44s qui comprend dailleurs le sketch Le biglotron qui constitue une excel-
lente description prmonitoire dIBM Watson dans 9 minutes et 50 secondes qui date de 1958. Et une variante avec La voyante
Arnica qui date de 1957, partir de la cinquime minute.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 245 / 362
IBM Watson est propos aux dveloppeurs de solutions sous la forme dAPIs
REST191 qui permettent daccder une large panoplie de services, qui sont intgres
dans la plateforme en cloud Bluemix, avec notamment :
Conversation (anciennement Dialog), un outil qui permet de grer
des conversations scriptes pour des agents conversationnels, avec des arbres de
dcision. Ce genre doutil est mis en uvre depuis des annes dans les systmes
de chat des sites de commerce en ligne. Les dialogues gnrs sont limits car
prprogramms192.
Discovery (anciennement Retrieve and Rank), un service qui sappuie sur le logi-
ciel open source Apache Solr et qui permet de traiter les requtes et questions en
sappuyant sur un mix de moteur de recherche et de machine learning.
Visual Recognition : pour toutes les applications de reconnaissance de limage,
trs utilises en particulier dans le diagnostic partir dimagerie mdicale. Cette
solution peut tre exploite dans des endroits inattendus comme avec la startup
franaise 3D-minded, et son application mobile "Le Croqueur" qui identifie les
chocolats de grands chocolatiers partir dune photo, sorte de Shazam du chocolat.
Natural Language Understanding : qui permet de classifier automatiquement
des donnes textuelles, issues en gnral de questions poses par des clients en
langage naturel.
Document Conversion, un service qui permet de convertir tout document textuel
(PDF, Word, HTML) pour les faire ingrer par les services de Watson. Cest
lalimentation de la base de connaissances.
Ces outils sont entranables via IBM Watson Knowledge Studio (ci-dessous) qui
permet Watson de digrer le vocabulaire dun secteur dactivit donne. Cest de
lapprentissage supervis qui servira ensuite dans des applications danalyse de textes
ou de cration de chatbots.

191
Avec requtes http comprenant des GET et des POST et renvoyant le rsultat.
192
Voir ce tutoriel de dveloppement de chatbot datant de dbut 2017, exploitant Conversation et dautres briques logicielles dIBM
Watson : https://www.ibm.com/developerworks/library/cc-cognitive-chatbot-watson/index.html.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 246 / 362
Il faut y ajouter Watson Explorer qui permet de crer des solutions personnalises
danalyse de donnes structures et non structures, cest une sorte de Netvibes pour
Watson.

Ces diffrentes briques de Watson se retrouvent elles-mmes intgres dans des pro-
duits tels que Watson Analytics pour la comprhension du language naturel.
Watson est aussi dclin sur quelques marchs spcifiques au niveau applicatif avec
Watson Oncology (cancrologie), Watson Cybersecurity, Watson Virtual Agent
(chatbot)
Crer une application Watson revient donc souvent crer du code, du contenu et
raliser un travail dintgration pour crer un agent conversationnel intelligent 193 .
Dans des approches verticales, il faut dfinir des scnarios de dialogues assez prcis

193
Dans la pratique, Watson sait aussi reconnaitre des images et on peut aussi lutiliser pour crer un systme expert.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 247 / 362
et avoir sous la main beaucoup de donnes exploitables, aussi bien structures que
non structures.
Do limportance pour IBM davoir un cosystme de partenaires solutions mme
de couvrir les besoins de divers marchs verticaux. Pour ce faire, IBM a lanc un
programme partenaire assez classique qui comprend laccs aux APIs, une commu-
naut, un programme dacclration de trois mois et un catalogue de solutions pour
promouvoir les partenaires. A ce jour, lcosystme dIBM Watson comprend envi-
ron plusieurs centaines de socits dont un bon nombre de startups. Le programme
dacclration porte surtout sur laccompagnement technique mais donne aussi
lopportunit de pitcher son offre pour rcuprer un part du fonds dinvestissement de
$100m cr pour loccasion.
En plus de son cosystme, IBM dveloppe lactivit de services pour prendre en
main de bout en bout les projets de ses grands clients. Alors que lquipe dorigine de
Watson ne faisait que quelques personnes, elle comprendrait maintenant environ 10
000 personnes dans le monde, principalement des consultants, avant-vente et dve-
loppeurs, dont 800 en France, y compris, un centre davant-vente et de support situ
Montpellier.
Lensemble est intgr dans les IBM Cognitive Business Solutions avec une focali-
sation sur quelques marchs cls : lassurance, le retail et la sant, jusqu proposer
des solutions en apparence cl en main.
IBM a aussi ouvert un centre de recherche ddi lIOT et Watson Munich asso-
ci un investissement de $200M, probablement pluriannuel, et dclin Watson sur
lIOT avec des outils notamment ddis lanalytics et au machine learning.
Ces quelques milliers de personnes alloues Watson sont un bon dbut mais encore
peu au regard des plus de 200 000 collaborateurs dIBM Services. La migration
dIBM vers un business cognitif suffisamment diffrenti des autres socits de
services globales dans le monde est une course contre la montre. Et ces dernires ne
se laisseront probablement pas faire, mme si elles auront probablement quelque
temps de retard lallumage et du mal recruter (ou former, si on peut rver) les ta-
lents en machine et deep learning.
Quid du prix de Watson ? Il serait fourni coup de licence logicielle dun prix sup-
rieur au million de dollars, mais avec un tarif plus proche de ceux du cloud pour les
partenaires. IBM prvoit de gnrer $10B de CA grce Watson dici une dizaine
dannes. Ce qui ferait plus de 12% de son CA actuel.
Reste savoir comment se positionne IBM par rapport lventail de solutions du
march. IBM communique peu sur le dtail de larchitecture des briques technolo-
giques logicielles que contient Watson. Ou alors, on y trouve des briques logicielles
intgres dans loffre de manire un peu rapide comme les Watson Analytics qui
permettent par exemple de segmenter automatiquement une audience client en fonc-
tion de ses comportements et didentifier ceux des segments susceptibles de gnrer
du churn (perte de clients).

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 248 / 362
IBM a aussi lanc Power AI, qui est le pendant infrastructure ouverte de Watson. En
gros, cest une offre matrielle et cloud gnrique capable de faire tourner des appli-
cations dIA dveloppes avec les outils du march tels que Caffe, Theano et mme
TensorFlow. Ici, Watson nest plus spcifiquement de la partie.
Avec leur approche service et intgration, IBM pourra cependant toujours affirmer
quil sait intgrer les autres briques du march. Bref, Watson est, en ltat, un objet
difficile benchmarker avec sa concurrence !

Les donnes
IBM dfinit dans sa communication ce quest un bon projet pour Watson :
Il doit traiter un gros volume de donnes. Makes sense !
La solution doit permettre de rpondre rapidement aux questions des utilisateurs,
dans cette logique dagent conversationnel fonctionnant en mode ques-
tions/rponses.
La varit des questions traites doit tre grande grce une large palette de
comprhension. Le systme doit pouvoir traiter en profondeur les questions poses.
Watson doit tre en mesure dvaluer la validit des rponses, avec un indice de
confiance, comme il le faisait dans Jeopardy.
Les projets doivent tre longs closer et mener avec les grandes entreprises surtout
si elles doivent mettre de lordre dans leurs donnes, comme ce fut le cas avec les
projets de systmes experts dans les annes 1980. Ils ont probablement galement des
clients dans les secteurs militaires et du renseignement US qui ne donnent pas lieu
de la communication marketing. Finalement, les rfrences sont maintenant bien plus
nombreuses avec les partenaires diteurs de logiciels quavec IBM en direct.
IBM est trs dispers verticalement mais avec un discours assez creux par secteur et
relativement peu de rfrences clients hors USA. Les outils marketing et la commu-
nication presse dIBM rpte le mme discours gnrique sur Watson avec un zest de
vertical. Quand aux dploiements annnoncs, il est toujours bien difficile dvaluer
sils sont sortis de la phase pilote.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 249 / 362
Pour renforcer sa prsence dans certains marchs verticaux, IBM a fait quelques ac-
quisitions cls :
Avec The Weather Company pour $2B en 2016, afin dalimenter Watson avec
des donnes mtorologiques destines diverses applications comme pour identi-
fier les risques mtorologiques dans la dfinition de primes dassurances dans
limmobilier. Et aussi pour prvoir le trafic de clients dans le retail.
Avec Promontory en 2016 et ses outils de gestion de risques et de conformit
permettant dtoffer son offre dans la finance.
Dans la sant, avec quatre acquisitions priphriques aux donnes de sant : Ex-
plorys (2009, $15M) avec sa plateforme de cloud dans la sant, Phytel (1996,
$22,5M) et sa solution de suivi de prise de traitements, Merge Healhcare (1987)
et ses outils de gestion dimagerie mdicale et Truven Health Analytics (2012) et
ses outils danalytics pour les professionnels de sant.

IBM a investi au moins $7B en acquisitions dans lIA, bien plus que Google ne la
fait. En plus des startups voques ci-dessous, il a notamment absorb en 2014 la
startup Cognea (2013), cratrice dun agent conversationnel, AlchemyAPI (2005,
$2M), une startup de deep learning danalyse de textes et dimages, de reconnais-
sance de visages, de tagging automatique dimages acquise en 2015, et IRIS Analy-
tics (2007), une startup allemande danalyse temps-rel ddie la dtection de
fraudes aux moyens de paiement, sappuyant sur du machine learning.
Le matriel
Nous avons vu dans les parties concernant les processeurs neuromorphiques et quan-
tiques quIBM tait acteur intressant avec dun ct ses processeurs TrueNorth et de
lautre, ses premires expriences dordinateur quantique qui sont disponibles dans le
cloud.
Tout ceci permet IBM de conserver un peu davance dans sa capacit produire des
calculateurs de haute performance. Mais lindustrialisation grande chelle le bs qui
blesse chez IBM. Pour que ces investissements soient rentables, il leur faudra gnrer
du volume et trouver des dbouchs pour ces composants. En effet, pour ce genre de
technologie, rien ne dit que lintgration verticale soit la meilleure approche. Surtout
si la concurrence se structure de manire horizontale comme Intel le fait avec succs
sur le march des PC et des serveurs depuis 35 ans.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 250 / 362
Google
Si IBM domine lactualit de lIA du ct des entreprises, Google est le roi du ptrole
ct services grand public. Et sa communication na rien envier celle dIBM.
Presque tous les services de Google font appel de lIA : dans Google Search en g-
nral, dans la recherche dimages similaires de Google Search ou Google Photos,
dans lantispam de Gmail194, dans les agents conversationnels de Google Home et
Google Assistant, dans ses Google Car et mme dans Android.
Le CEO de Google dmarrait la confrence Google I/O en juin 2017 en indiquant que
la priorit numro un de la socit ntait plus la mobilit mais lIA. Mais ds lan
2000, les fondateurs de Google considraient que leur moteur de recherche ntait
que la premire brique dune grande intelligence artificielle gnralise !

En matire dIA, est est relativement facile de diffrencier Google dIBM. Les deux
maitrisent des technologies logicielles sommes toutes assez voisines. La diffrence
principale rside dans la manire de les mettre dans les mains des clients. Les deux
ont des plateformes logicielles et cloud mises disposition des dveloppeurs et des
startups. Tandis quIBM fonctionne en mode projet et service avec les grandes entre-
prises, Google propose des services prs de deux milliards dinternautes. Cela lui
permet daccumuler dnormes volumes dinformations quil utilise pour entrainer
ses IA, ce quIBM narrive faire que sur certains marchs verticaux et via
quelques acquisitions cibles.
Google a-t-il intrt copier IBM ? Pas vraiment. La profitabilit et la croissance de
Google sont excellentes alors quIBM a une profitabilit de socit de service et est
en dcroissance.
Lhistoire
Lactualit abonde depuis 2014 dacquisitions mdiatises de startups de lIA par les
grands acteurs du numrique, Google en premier. Cela alimente quelques fantasmes
sur leurs avances qui sont quelque peu enjolives. Google aurait, selon certains, ac-
quis tout ce qui existerait de bien comme comptences dans lIA. Cest videmment
une vue de lesprit. Oui, Google a fait bien plus dacquisitions dans le domaine de
lIA que les autres grands du numrique, mais rappelons-nous le ct trs artisanal de

194
LIA dantispam de gmail gnrerait seulement 0,05% derreurs. Elle exploite un systme de deep learning rparti sur 16 000
CPU avec plus dun milliard de connexions entre neurones.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 251 / 362
ce secteur. Ce nest pas parce que vous achetez quelques verreries de luxe que vous
tes le seul savoir fabriquer des verres de luxe ! Lartisanat est trs souvent un mar-
ch trs fragment. On peut le constater au regard des effectifs des startups acquises.
Ils sont en gnral trs limits, comme ils ltaient dailleurs pour les acquisitions par
Facebook de startups telles quInstagram, Whatsapp ou Oculus Rift, qui navaient par
ailleurs aucun rapport avec lIA.
Lacquisition la plus mdiatise de Google dans lIA fut celle de
langlais DeepMind en 2014 pour un montant record dans ce secteur de $625m. Et
surtout, pour peine une cinquantaine de personnes dont une douzaine de chercheurs
en machine learning. Ce qui fait le chercheur $50m, un record comparativement aux
dveloppeurs qui sont estims environ $1m $2m pour des acquisitions de jeunes
startups. DeepMind sest depuis surtout fait remarquer en tant lorigine dAlphaGo.
Google avait auparavant mis la main sur la socit de reconnaissance vo-
cale SayNow en 2011 puis sur Viewdle et PittPatt en 2012, qui faisaient tous les
deux de la reconnaissance faciale et de mouvements. En 2013, ils mettaient la main
sur le spcialiste des rseaux neuronaux Dnnresearch, et embauchaient ainsi le ca-
nadien Geoff Hinton, considr comme le pre du deep learning.
Ont suivi Dark Blue Labs et Vision Factory, deux socits dOxford qui nont pas
lev de fonds. Sy ajoutrent la solution de recommandation dimages JetPack, le
spcialiste de la traduction automatique Quest Visual, et celui de la reconnaissance
de mouvements Flutter qui a probablement enrichi loffre logicielle de Dropcam,
une startup de camras de surveillance qui est dans le giron de Nest, une filiale
dAlphabet.

Lanne 2014 a vu Google/Alphabet acqurir une belle brochette de startups dans la


robotique avec Schaft (robot humanode et bras articul, japonais), Industrial Per-
ception (robots industriels, spcialis dans la vision 3D), Redwood Robotics (bras
robotiss, issue du SRI et acquise un an aprs sa cration), Meka Robotics (aussi
dans les bras robotiss, qui avait contribu la cration de Redwood Robo-
tics), Holomni (roues robotises), Bot & Dolly (bras articuls mouvements trs
souples servant aux tournages de cinma), Autofuss (encore des bras articuls) et sur-
tout Boston Dynamics, connu pour ses robots mdiatiss dous de capacit de
marche quatre puis deux pattes mais que Google a cd Softbank Robotics en
Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 252 / 362
2017. Schaft a t galement cd Softbank Robotics la mme anne ! Bref, la stra-
tgie robotique attrape tout de Google est prendre avec des pincettes.
Que deviennent toutes ces acquisitions ? Tout ce qui relve du traitement des images
et du langage sest retrouv dans les services de Google, notamment mobiles. La ro-
botique ? Elle a dbouch sur aucune application commerciale pour linstant car ces
technologies sont toujours en phase de gestation ou destines des marchs de niche,
ou aux usages internes de Google comme pour les vhicules utiliss pour cartogra-
phier les rues. Et Google ne cherche pas concurrencer les leaders de robots indus-
triels (ABB, Fanuc, etc).
Google fait des progrs rguliers dans le traitement des images, comme
avec PlaNet qui identifie quel endroit ont t prises des photos dextrieur ou pour
compter les calories dans des photos de plats cuisins. Google utilise aussi beaucoup
dIA sensorielle pour faire voluer les fonctions de conduite automatique de ses
Google Car.
LIA googlelienne a connu un sursaut de mdiatisation dbut 2016 avec la victoire de
la solution AlphaGo contre le champion du monde coren Lee Sedol construite par
une quipe dune vingtaine de personnes de sa filiale DeepMind au jeu de Go contre
le champion du monde Sud-Coren (vido de la premire partie). Ces victoires ont
t prsentes comme des tapes importantes des progrs de lIA, faisant cho la
victoire de Deeper Blue aux checs contre Gary Kasparov en 1997. La diffrence ?
Le jeu de Go est plus difficile simuler car la combinatoire de jeu est bien plus
grande quaux checs. AlphaGo ne peut donc pas compter que sur la force brute.
Il doit combiner plusieurs mthodes pour tre efficace : liminer des options de jeu
inutiles via le Monte Carlo Tree Search ou MCTS et exploiter une base de jeux
permettant didentifier des tactiques gagnantes. Il ralise ensuite un apprentissage
supervis base de deep learning en exploitant 150 000 parties connues. Il choisi ses
coups avec un rseau de neurones convolutionnel. Il fait de lapprentissage par ren-
forcement en jouant contre lui-mme. Et lensemble exploite la puissance machine de
GPU et de TPU que nous avons vu dans la partie consacre aux processeurs neuro-
morphiques. Dans "Artificial Intelligence and the Singularity" publi en 2016, Piero
Scaruffi se faisait un malin plaisir de relativiser cette victoire (ci-dessous droite) en
rappelant la consommation dnergie du systme par rapport aux 20W du cerveau
humain ! On pourrait ajouter que depuis plus de 30 ans, nimporte quel tableur gagne-
rait haut la main toute partie contre les champions du monde du calcul mental !

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 253 / 362
La performance a t documente dans un article publi dans la revue Nature en
janvier 2016. Un peu vexs, les corens ont demble lanc un plan de financement
public de 765m dans lIA sur cinq ans avec les gants comme Samsung, LG, Hyun-
dai et SK Telecom. En mai 2017, une version amliore dAlpha Go battait le cham-
pion chinois Ke Jie.
Pour la petite histoire, en 2015, Matthew Lai dveloppait DeepChess, un systme de
deep learning avec renforcement qui gagnait aux checs en apprenant lui-mme op-
timiser son jeu en moins de 72 heures sur un simple PC. Il tait recrut par DeepMind
dbut 2016 et il a contribu aux volutions dAlphaGo partir de ce moment-l !
Tout cela faisait en tout cas une excellente publicit pour DeepMind dont les solu-
tions de machine learning ont heureusement dautres applications comme la curation
de mdias, mme si elles font moins parler delles car elles ressemblent de prs ce
quIBM fait dj dans la sant avec Watson. Leur DQN est un rseau neuronal pro-
fond dot de capacits dauto-apprentissage et DeepMind Health donne lieu une
collaboration avec la NHS britannique dans lapplication Streams de dtection de
blessures aux reins dans les urgences.

Les logiciels
Google utilise lIA pour enrichir ses propres offres grand public, que ce soit autour de
son moteur de recherche multifonctions ou de business plus priphriques dAlphabet
(sant, IoT, automobile). On la rerouve aussi dans Google Assistant et Google Home,
ces agents conversationnels pilotables la voix et au clavier.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 254 / 362
Cest aussi un grand fournisseur de platteformes de dveloppement en open source ou
pas, et dans lembarqu ou en cloud.
Il publie rgulirement de nombreuses APIs de services dIA dans le cloud pour les
dveloppeurs. Google est aussi lorigine de la bibliothque de machine et deep lear-
ning TensorFlow qui est trs couramment utilise par les startups de lIA. Comme
IBM, nombre de ses services couvrent le traitement du langage, y compris la traduc-
tion, ainsi que la vision artificielle.
Cette panoplie couvre une majeure partie des besoins de crateurs dapplications
base dIA.

Mais Google regorge de dveloppeurs et dquipes projets en tout genre. Nous avons
par exemple les projets Google Brain195 lancs en 2011 par une petite quipe de
chercheurs qui comprend Jeff Dean, Greg Corrado, Andrew Ng et Geoff Hinton de-
puis 2013.
Cette quipe est lorigine de systmes dencryption volutifs publis en octobre
2016196 et dun tonnant programme damlioration dimages pixellises publi en en
fvrier 2017, exploitant des images de 8x8 pixels197 pour augmenter leur rsolution
32x32 pixels. Limage du milieu est celle que lIA de Google reconstitue partir de
celle de gauche. Cest impressionnant. Mais attention au fait que les images de dpart
semblent tre des versions basse rsolution de la base dentrainement.

195
Google Brain est distinct de Deep Mind qui est bas au Royaume Uni, reste relativement indpendant aprs son acquisition en
2014.
196
Qui l aussi a beaucoup fait fantasmer avec lIA qui cr son propre langage que les hommes ne comprennent pas . Cf
https://qz.com/822216/google-taught-artificial-intelligence-to-encrypt-messages-on-its-own/.
197
Cf Pixel Recursive Super Resolution, fvrier 2017. Qui rappelle le scnario du film No way out avec Kevin Costner, sorti en
1987. Il faut prciser que le systme est entrain avec les images de la dernire colonne.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 255 / 362
En mai 2017, ils publiaient aussi dtonnant travaux montrant comment ils pouvaient
utiliser le machine learning pour amliorer larcitecture dun rseau de neurones qui
est dhabitude cre manuellement (illustre ci-dessous gauche198).

Lquipe de Google Brain est aussi lorigine damliorations diverses de Google


Translate199.
Les dveloppeurs de Google sont aussi lorigine davances rgulires dans les r-
seaux de neurones de reconnaissance dimage. Cest le cas de Facenet qui amliore
les techniques de reconnaissance de visages, entrain sur 260 millions dimages et
efficace 86% en 2016. La mthode ? Une variante de rseau de neurone convolu-
tionnel200 (ci-dessus droite).
Les donnes
Il va sans dire que la puissance de Google vient de la quantit astronomique de don-
nes quils accumulent sur les faits et gestes Internetiens et mme dans le monde
physique de millions dutilisateurs. En gros, Google sait ce que lon recherche
(Search), o lon est et o lon va (Android, Maps), quels moyens de transport on uti-
lise (Maps, Android), ce que lon change avec les autres (Gmail), le temps que lon
passe sur tel et tel cran, et plus rarement, ce que lon cherche et regarde la TV
(Google TV).
Ils ont la comptence pour stocker, indexer et grer ces donnes dans le cloud. A par-
tir de l, ils peuvent tester tout un tas dides sans grandes limites !
Le matriel
Google a dvelopp ses propres processeurs neuromorphiques en 2015/2016, le TPU.
Leur architecture est maintenant publique201. Ce sont des processeurs programmables
capables de grer des rseaux de neurones fully connected (couches de neurones

198
Et dans Using Machine Learning to Explore Neural Network Architecture, mai 2017.
199
Cf Google's Neural Machine Translation System: Bridging the Gap between Human and Machine Translation, 2016.
200
Cf FaceNet: A Unified Embedding for Face Recognition and Clustering, juin 2015. Lun des trois auteurs, James Philbin, a quitt
Google en 2015. Il est depuis le directeur de la vision artificielle de Zoox (2014, $290M), une startup ultra-bien finance qui veut
devenir un oprateur de service de vhicules autonomes.

201
Cf https://www.nextplatform.com/2017/04/05/first-depth-look-googles-tpu-architecture/.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 256 / 362
interconnectes) ainsi que les premiers tages de rseaux de neurones convolution-
nels (ncessitant des multiplieurs de matrices). Ces TPU servent gagner AlphaGo
et grer bien dautres briques dAI de Google qui semblent en production.

Mais Google nenvisage pour linstant pas de commercialiser ces processeurs. Cela
devient leur technologie, fabrique en volume en ASIC, pour quiper leurs datacen-
ters. Mais comme Google est le premier consommateur de serveurs au monde, ils ont
les conomies dchelle qui le permetttent.
Pour ce qui est des ordinateurs quantiques, Google se contente de tester avec la NA-
SA les ordinateurs quantiques du canadien D-Wave. Rien na filtr sur une ventuelle
technologie dordinateur quantique sortant des laboratoires de Google.
Google est sinon concepteur de produits intgrant des logiciels dIA, quil sagisse de
Google Home, des smartphones Pixel ou des futures Google Car, qui pourraient
terme tre fabriques par des constructeurs automobiles, Google fournissant
llectronique, les logiciels (sous Android) et les solutions en cloud associes.

Amazon
Vu du monde de lentreprise, Amazon est un acteur cl de lIA, essentiellement via
son offre intgre de cloud sous la bannire des Amazon Web Services (AWS).
Amazon est le leader mondial des services gnriques en cloud, utilis largement par
les entreprises tout comme par les startups.

Les logiciels
Vu du grand public, il est aussi prsent dans lIA via lAmazon Echo et le service en
cloud de dialogue en langage naturel Alexa qui lquipe et qui est trs largement uti-
Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 257 / 362
lis par lcosystme des objets connects. Il tait quasiment devenu le standard par
dfaut des objets commandables la voix introduits au CES 2017. On le trouvait ain-
si support par un nombre incalculable dobjets connects : radiorveils, robots chez
UBTech, lampes connectes, copycats de lAmazon Echo chez Lenovo, routeur chez
Linksys, dans llectromnager chez LG Electronics ou chez GE, dans les aspira-
teurs robots de Samsung et Neato et mme chez Ford qui le supportera dans ses v-
hicules pour commander leur dmarrage distance et grer les parcours (vido). Il y
aurait ce jour plus de 17 500 applications compatibles avec Alexa202, dnommes
skills et rien quaux USA, dont Mylestone (2016, $4M), une application dune star-
tup de Boston qui se propose de grer votre mmoire photographique par commande
vocale via Alexa.

Loffre dAPIs dAI pour les dveloppeurs dapplications en cloud comprend, outre
Alexa, Amazon Rekognition, une fonctionnalit danalyse dimages base de deep
learning qui permet didentifier des objets, de les tagger, dliminer des contenus illi-
cites, danalyser les expressions dans les visages et de les reconnaitre. Amazon Polly
est une solution de text-to-speech raliste lance fin 2016 (vido et confrence tech-
nique) avec un choix de 47 voix dans 25 langues. Amazon Lex est le moteur de ges-
tion de conversations texte et vocale dAlexa. Et un moteur de traduction doit bientt
voir le jour, issu de la startup amricaine Safaba (2009) acquise en 2015.
Du ct des couches basses, nous avons Amazon Machine Learning (qui consolide
les outils de cration et excution de modles de machine learning), DSSTNE (Deep
Scalable Sparse Tensor Network Engine, ou destiny , qui permet de crer des mo-
dles de machine learning et de deep learning faciles dployer sur GPU Nvidia
en gnral), Amazon EMR (Elastic MapReduce), Spark (pour la distribution de trai-
tements sur serveurs, logiciel de la fondation Apache) et SparkML (ou Spark MLlib,
une bibliothque qui permet de distribuer des traitements de machine learning) ainsi
que BigDL, une bibliothque de deep learning. Tous ces logiciels sont open source !
Les entreprises payent les ressources en cloud pour les hberger.

202
Source : https://www.voicebot.ai/amazon-echo-alexa-stats/.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 258 / 362
Amazon est comme tous les GAFAMI un acqureur de startups rgulier, mais pas
trs actif du ct de lIA. On peut noter celle du spcialiste des robots dentrepts
Kiva (2003, $18M) en 2012 pour $775M, dIvona (2004), spcialiste du text to
speech, acquis en 2013, dAngel.ai (2015, $8M) en septembre 2016, crateur dun
chatbot gnraliste qui a certainement du les aider amliorer Alex et de harvest.ai
(2014, $2,74M) dtection de failles de scurit, acquis en 2017.
Les donnes
Accessoirement, Amazon est le leader mondial du commerce en ligne et la part quil
reprsente dans ce march est en croissance, surtout aux USA o il captait 46% du
march en 2016 (cf schma ci-dessous gauche). Cest lui qui possde le plus gros
inventaire de produits dans son catalogue, qui est estim plusieurs centaines de mil-
lions de produits, notamment via les offres intgres dans sa place de march. En
consquence de quoi, comme Google, il dispose dun beau pactole de donnes pour
analyser les comportements des Internautes dans leur casquette de consommateurs. Il
dispose aussi de donnes sur la consommation culturelle via ses services Prime Video,
ses tablettes Kindle et sa box TV Fire, surtout aux USA.
Amazon est donc un gros utilisateur et de longue date de techniques de machine lear-
ning pour optimiser tout son processus de vente et de logistique. Il les utilise pour
planifier la demande et grer au plus prs les stocks, pour dfinir les prix, les offres
de livraison, pour la recommandation de produits, la dtection de fraudes et de con-
trefaons, pas toujours parfaite dailleurs.
Cela explique probablement pourquoi Amazon est lun des plus gros recruteurs aux
USA de spcialistes de machine learning203 (chart ci-dessous droite).

203
Source : IBM (IBM) Creating Shareholder Value with AI? Not so Elementary, My Dear Watson de Jefferies, juillet 2017.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 259 / 362
Microsoft
Microsoft est un acteur de poids dans les infrastructures informatiques des entreprises
et son arsenal logiciel dans lIA est quivalent sur de nombreux points avec celui de
ses concurrents. De manire assez classique, son offre couvre le traitement du lan-
gage, de la vision artificielle, des donnes et la gestion des connaissances. Mais
lditeur est plus discret dans sa communication autour de lIA et son marketing pro-
duit est moins efficace, tout du moins comparativement IBM et Google.

Les logiciels
Microsoft a ceci de commun avec IBM quil entretient depuis des dcennies de
grandes quipes de recherche fondamentale et particulirement investies dans les dif-
frents champs de lintelligence artificielle.
Cr en 1991, Microsoft Research occupe plus de 1000 chercheurs rpartis dans le
monde, et y compris en France, dans un laboratoire commun mont Orsay avec
lINRIA. La principale quipe europenne est situe Cambridge au Royaume-Uni.
Microsoft Research emploie un nombre record de prix Nobel et de scientifiques ayant
gagn la mdaille Fields. Cela nen fait pas pour autant les initiateurs de business si-
gnificatifs pour Microsoft. Tout au plus sont-ils lorigine de nombreuses innova-
tions incrmentales qui ont aliment les produits phares de lditeur. Le correcteur
orthographique qui souligne les mots dans Word tait ainsi sorti de ces laboratoires
en 1995. Cela permet de relativiser le rle de la recherche pour dominer une industrie.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 260 / 362
Apple qui na pas formellement de laboratoire de recherche domine ainsi le secteur
du mobile ! Chez Google, la frontire entre recherche et dveloppement est plus floue.
Les activits de Microsoft Research dans le machine learning sont imposantes
avec plusieurs dizaines dquipes projets impliques. Dans les projets, on trouve
les grands classiques qui portent sur lamlioration de la reconnaissance de la parole
et des images et notamment le tagging automatique de vidos. Et puis, en vrac, un
agent conversationnel dtectant des troubles psychiatriques (DiPsy), un outil de re-
connaissance de chiens originaire de Chine qui fonctionne lchelle individuelle,
pas celui de la race (Dog Recognition) et un outil de tri de pices de monnaie pour
les rfractaires aux Blockchains (Numiscan).
Les quipes de Microsoft Research sont lorigine davances comme le systme de
dialogue en langage naturel Cortana. Comme nombre de technologies dIA provien-
nent de MSR chez Microsoft, lditeur se retrouve mettre systmatiquement en
avant les travaux de ses chercheurs, parfois un peu trop au dtriment des quipes pro-
duit business.
Microsoft qui est maintenant rsolument tourn vers le cloud fait tout de mme
quelques acquisitions de startups pour acclrer son time to market dans lIA ou
dans la priphrie de lIA. Les quipes de recherche fondamentale travaillent en effet
sur des domaines o le risque est plus scientifique et technique que march tandis que
les startups sont censes uvrer une un risque march.
Le risque est mme parfois motionnel et dans limage, comme la montr le robot
conversationnel Tay qui sest mis tenir des propos nazis et a t dbranch. Tay
tait sorti de Microsoft Research et ses propos relevaient dun apprentissage supervi-
s non filtr ! Tay a t remplac en avril 2017 par un autre chatbot au doux nom de
Zo qui est intgr dans la messagerie instantane Kik. Zo est une version anglaise
dun chabot chinois de Microsoft dnomm Xiaoice. Mais Kik nest pas trs trendy
chez les Internautes !
Les acquisitions dans les startups de lIA sont peu nombreuses chez Microsoft. On
peut citer Revolution Analytics, qui faisait de lanalyse prdictive sappuyant sur le
langage open source R, acquise en 2016. Un moyen de sattirer un cosystme de d-
veloppeurs ! Toujours en 2016, Swiftkey, un logiciel de clavier virtuel mobile qui
sappuierait lui aussi sur du machine learning. En 2015, Microsoft avait aussi mis la
main sur Prismatic, un agrgateur de news sappuyant sur du machine learning, ainsi
que Double Labs, une application Android de notification elle aussi base sur du
machine learning. En 2017, ctait au tour de Genee (2014, $1,45M) un gestionnaire
dagenda virtuel et du Canadien Maluuba (2011, $8,2M), un spcialiste du deep
learning appliqu au traitement du langage qui planche sur lAGI (Artificial General
Intelligence), dont les quipes se sont faites remarquer en faisant gagner leur solution
au Pac-Man avec leur technique Hybrid Reward Architecture204 (vido).

204
Cf Hybrid Reward Architecture for Reinforcement Learning, juin 2017, qui dcrit une architecture dapprentissage par renforce-
ment avec des agents fonctionnant en parallle.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 261 / 362
Il nempche que lditeur a bien compris les enjeux de lIA et cherche se position-
ner comme fournisseur de plateforme dIA pour les dveloppeurs, le Conversation
As a Platform et le Microsoft Bot Framework, qui rappellent dans leur structure
loffre des APIs dIBM Watson. Il a t annonc lors de la confrence Build qui
sest tenue San Francisco en avril 2016 (voir les vidos de keynotes du premier
jour et du second jour).

Larchitecture dIA de Microsoft sappuie sur :


Lagent Cortana, bon tout faire, qui rpond la voix, joue le rle de traducteur.
Cest un peu lquivalent dAmazon Alexa et de Google Assistant. Quelques bots
ont t dvelopps avec les APIs de Microsoft mais loffre na rien voir avec
labondance autour dAmazon Alexa.

Diverses applications qui intgrent des briques dIA, comme Office 365, Dyna-
mics 365 et lapplication mobile de gestion de photos Pix. Le traitement du lan-
gage base dIA est dissmin dans Office, et depuis des annes. En septembre
2017, Microsoft annonait lintgration de services de machine learning du cloud
Azure dans Excel, qui se manifestent sous la forme de fonctions (ci-dessous).

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 262 / 362
Les services cognitifs qui comprennent plus dune vingtaine dAPIs sensorielles
qui font de la reconnaissance dimages, du traitement du langage naturel (NLP),
de la gestion de connaissances et de la recherche. A bas niveau, Microsoft propose
en open source son framework de deep learning CNTK (Computational Net-
work Toolkit) depuis fin 2015. Les API de vision artificielle permettent par
exemple de dtecter les motions dans les visages et destimer lge des personnes
(ci-dessous).

Des outils de cration dapplications avec lIDE Visual Studio (Integrated Deve-
lopment Environment) et ses Code Tools for AI, et aussi loutil Azure Machine
Learning Studio, lanc en 2015, qui permet de crer ses modles de machine lear-
ning et de les mettre en production. Annonc en septembre 2017, Azure Machine
Learning est maintenant dcoup en trois modules avec Workbench pour la mod-
lisation, Experimentation pour le test de modles sur les infrastructures du cloud
dont des GPU, et Model Management, pour les dploiements. Le tout avec une
application native fonctionnant sous Windows et MacOS. La plateforme Azure est
ouverte et intgre nombre doutils open source du march avec notamment Ten-
sorFlow et Caffe (frameworks), et aussi Apache Spark (pour la distribution des
traitements sur les serveurs) et Docker (pour le dploiement dapplications).

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 263 / 362
Linfrastructure en cloud Azure et les logiciels serveurs de Microsoft.
Du matriel spcifique, notamment des processeurs neuromorphiques dvelopps
dans des chipsets FPGA.
Dans ces diffrents tages, on trouve loutil de cration de chatbot Microsoft LUIS
(Language Understanding Intelligent Service) lanc dbut 2017, loutil de traduction
Microsoft Translator et ses Translator Speech Translation API (dont le processus
est illustr ci-dessous) ainsi que le Microsoft Bot Framework et le BotBuilder qui
servent crer son propre chatbot.

Les donnes
Microsoft dispose dune activit grand public, certes pas aussi soutenue que celle de
Google, mais qui lui permet davoir une forte expertise dans le cloud ainsi que dans
la captation de donnes dusages, mme dalimenter ses outils de machine et deep
learning. Il en va ainsi du moteur de recherche Bing, de Skype, de MSN, de la con-
sole de jeu Xbox et bien videmment de Windows.
Le matriel
Comme Google et IBM, Microsoft a dvelopp sa propre architecture serveur pour
grer des rseaux de neurones. Elle sappuie sur des processeurs dvelopps en tech-
nologie FPGA. Larchitecture sinscrit dans le projet Brainwave dont les contours ont
t dvoils fin aot 2017205 et qui sappuient sur :

205
Cf https://www.microsoft.com/en-us/research/blog/microsoft-unveils-project-brainwave/.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 264 / 362
Une architecture de serveurs massivement parallle et distribue associant CPU
et FPGA.
De processeurs FPGA fabriqus par Intel en technologie 14 nm, les Stratix 10
(ex Altera)206. Ce sont des FPGA mmoire qui stockent les paramtres des r-
seaux de neurones et vitent de faire appel de la DRAM dans les serveurs, ce qui
est bien plus rapide. Leur architecture de FPGA est dite soft DNN et donc re-
programmables, tandis que celle des TPU de Google nest pas reprogrammable
( hard DNN), ce qui apporte, pour faire simple, plus de flexibilit.
Larchitecture est qui plus est optimise la fois pour des rseaux de neurones
convolutionnels (CNN, pour le traitement de limage) qui ncessitent de multiplier
des matrices et des rseaux de neurones rcurrents (RNN, pour le traitement de la
parole et du langage). Cela leur apporte une plus grande flexibilit pour les d-
ploiements grande chelle dans leurs data-centers.

Un compilateur et un environnement dexcution systme permettant de d-


ployer des modles du Microsoft Cognitive Toolkit tout comme de Google Ten-
sorflow.
Cette architecture est dploye dans les datacenters de Microsoft Azure depuis 2016.
En parallle, Microsoft Research planche aussi sur les ordinateurs quantiques mais il
est encore trop tt pour en parler dun point de vue pratique.

Oracle
Avec SAP, Oracle est lun des plus gros diteurs de logiciels dentreprise au monde.
Il est plutt discret dans son intgration de lIA dans la stratgie. Comme lditeur
gre de gros volumes de donnes depuis des dcennies, ils doivent exploiter des tech-
niques sapparentant au machine learning depuis quelques temps, sans forcment le
marketer.

206
Microsoft avait produit ses premiers FPGA en 2011 dans ses serveurs Catapult V0 pour la gestion dindex de Bing. La V1 de
Catapult sortait en 2012. En 2013, 1600 FPGA taient mis en production. Capatupt V2 sortait en 2014 avec une architecture de bus
optimise pour faire communiquer les CPU avec les FPGA dans les serveurs, via un bus PCI 64 Gbits/s (4 canaux).

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 265 / 362
Ils se sont mis le faire en intgrant progressivement et ouvertement divers outils de
machine learning dans leurs logiciels dinfrastructures horizontaux et applications
mtiers verticales.
On en trouve ainsi dans Oracle Management Cloud Services, dans Oracle Advan-
ced Analytics, Oracle Data Miner et Oracle Internet of Things Cloud Service,
qui sont des outils danalytics divers, exploitant des arbres de dcision et gnrant des
rapports divers.
Oracle annonait aussi son Chatbots for Developers en 2016 et une plateforme de
dveloppement associe et le service associ, Intelligent Bot Cloud Service (IBCS).
Leur outil permet de crer des chatbot commande textuelle ou vocale. Je nai pas
trouv son origine.

Quid des acquisitions dans lIA ? Oracle est assez friand de startups, mais curieuse-
ment, pas vraiment dans lIA. On note surtout celle de lisralien Crosswire (2013,
$5M) en 2016 qui propose une solution cross-device de ciblage et danalytics publici-
taires dot doutils de prsentation graphique.

SAP
SAP a adopt vis vis de lIA une position voisine de celle dOracle, assez discrte,
et intgrant progressivement lIA dans son offre.
Nous avons dans lordre, de bas en haut :
SAP Clea qui comprend des services de machine learning et de deep learning
pour les dveloppeurs avec traitement classiques langage, vision et donnes. La
nature de ces briques technologiques ni leur origine nest prcise dans la littra-
ture marketing de SAP. Curieuse pratique. En mme temps, SAP nest pas le roi
du ptrole dans le recrutement de dveloppeurs et surtout de ceux des startups.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 266 / 362
Leonardo qui fait partie de la plateforme HANA, avec divers outils de machine
learning non prciss.

Lintgration de ces technologies dans diverses solutions applicatives comme dans


les outils danalytics issus de lacquisition en 2008 de Business Objects, les SAP
BusinessObjects Cloud for Analytics. Elle se fait tape par tape comme lindique
la roadmap ci-dessous.

Salesforce
Chez Salesforce, loffre dIA sappelle modestement Einstein, une offre dIA en
cloud au service des forces de vente.
Loffre qui sappelle prcisment Einstein High Velocity Sales Cloud comprend les
briques suivantes :
Einstein Lead Scoring : avec des outils base de machine et deep learning de
reprage des meilleurs leads dun pipe commercial en fonction dune analyse mul-
ticritres (pour peu que la base soit bien renseigne). Un cas dusage classique
du machine learning en tout cas.
Einstein Activity Capture : capture des informations utiles dans les mails et ca-
lendriers et des modles personnaliss de rponses par e-mails.
Lightning Sales Console : un espace de travail personnalisable de suivi des meil-
leurs leads.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 267 / 362
Lightning Dialer : pour contacter les prospects en un clic.
Salesforce Engage : notifications en temps rel dopportunit dinteraction client.
Salesforce AppExchange : un cosystme de solutions tierces-parties.

Une bonne partie dEinstein provient de briques et de comptences rcupres par


SalesForce loccasion de lacquisition de diverses startups : RelateIQ (2011, $69M)
en 2014, qui tait spcialises dans la relation client, devenu SalesForceIQ, une version de
SalesForce pour les PME, PredictionIO (2013, $2,65M) acquis en 2016 pour sa solution
open source de machine learning et MetaMind (2014, $8M) acquis en 2016 pour ses solu-
tions de reconnaissance dimage, soit lquivalent de 175 data scientists. Einstein
sappuie aussi sur les APIs dIBM Watson.

Facebook
Le leader mondial des rseaux sociaux est avide dIA tous les tages pour amliorer
lensemble de ses services, qui vont des fonctions de reconnaissance de photos dans
ses diffrents services mobiles tout ce qui permet de mieux cibler les publicits
pour optimiser les revenus en passant par le Bot Framework servant la cration de
chatbots sintgrant dans lapplication Facebook Messenger et lanc en avril 2016.

La socit a plus dune centaine de chercheurs en IA dont le clbrissime Yann


LeCun, inventeur des rseaux de neurones convolutionnels qui sont la base de la re-
connaissance dimages dans le deep learning. Il gre le FAIR (Facebook Artifical In-
telligence Research) Paris depuis 2015. Yann LeCun est aussi depuis peu professeur
au Collge de France sur le deep learning207.

207
Voir sa leon inaugurale qui fait un trs bon panorama technique du machine learning.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 268 / 362
Parmis les projets de recherche, DeepFace est une solution de deep learning de re-
connaissance des visages avec un rseau de neurones de neufs couches et 120 million
connexions entrain sur quatre millions dimages. La precision du systme serait de
97%. Le systme a bnfici de la contribution de Yaniv Taigman, issu de Face.com,
acquise en 2007. Facebook veut utiliser la reconnaissance dimages pour informer ses
utilisateurs mal-voyants du contenu visuel de leur timeline.
Les autres acquisitions de Facebook dans lIA comprennent :
Jibbigo (2009) en 2013, pour son systme de traduction speech-to-speech.
Pebbles Interfaces (2010, $14,45M) en 2015, pour son systme de captation de
gestes.
wit.ai (2013, $3m) en 2015, une petite startup de Palo Alto, pour ajouter des fonc-
tionnalits de reconnaissance de la parole dans ses services et notamment de Mes-
senger. Mais Wit.ai est aussi une plateforme utilise par des milliers de dvelop-
peurs.
Surreal Vision (2014), une startup anglaise acquise par Oculus en 2015, spciali-
se dans vision 3D.
Faciometrics (2015) en 2016, pour sa solution mobile danalyse de visages.
Ozlo (2014, $14M) fin juillet 2017, qui aide trouver un bon restaurant.
Les quipes de Facebook planchent aussi sur la reconnaissance automatique de sports
dans les vidos ou de chiens dans les photos. Facebook a aussi dvelopp une fonc-
tion qui dcrit le contenu de photos, adapte aux aveugles, presque simultanment
une fonction du mme genre propose aux aveugles par Microsoft.
Le gant des rseaux sociaux rve aussi probablement de crer des solutions de mar-
keting ultra-intelligentes, capables de devenir les aspirations et intentions des utilisa-
teurs. Par exemple, une solution qui saura que je change de ville tous les ans pour
mes vacances et vitera de mexposer des publicits lies des villes dj visites !
Enfin, on ne peut pas ngliger les applications potentielles de lIA dans la ralit
augmente. Cest un enjeu pour Facebook (Oculus Rift), pour Google (qui finance
Magic Leap dans ce domaine) et Apple (qui aurait un projet dans le domaine).

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 269 / 362
Prochain gros projet : dtecter les fake news ! Vaste programme !

Apple
Apple est bien plus orient produits et marchs que ne le sont IBM et Microsoft. Non
seulement la socit na pas formellement de laboratoire de recherche fondamentale
mais elle ne publiait jusquen 2016 aucun papier dans le domaine de lIA. Cest tout
le contraire de linnovation ouverte ! Elle a cependant publi un premier papier fin
2016 sur la reconnaissance dimages208.

Les acquisitions dApple sont peu nombreuses en rgle gnral. Dans lIA, on peut
compter Turi (2013, $25M) en 2016 pour $200M qui avait dvelopp un projet
danalytics base de machine learning, Emotient (2006, $6M) en 2016 pour la re-
connaissance des visages et des motions, VocalIQ (2011, $1,2M) en 2015 qui devait
enrichir les fonctionnalits de reconnaissance de la parole de SIRI en ajoutant de
lauto-apprentissage, ainsi que Perceptio (2014) en 2015, dans la reconnaissance
dimages sappuyant sur du deep learning. SIRI est de son ct le rsultat de
lacquisition en 2010 de la startup SIRI (2007, $24M) en 2010, elle-mme issue dun
projet de SRI International financ par la DARPA, et de lusage des technologies
issues de lamricain Nuance Communications, la socit leader du secteur de la
reconnaissance de la parole qui fait plus de $2B de chiffre daffaire ! Ce dernier uti-
lise en partie des technologies issues de Scansoft, provenant du belge Lernout &
Hauspie qui avait acquis la technologie de reconnaissance de la parole de Ray Kurz-
weil !
Apple utilise beaucoup dIA dans ses iPhone. Les iPhone 8 et X annoncs en sep-
tembre 2017 intgrent le chipset A11 Bionic et sa fonctionnalit neuromorphique
Neural Engine, ddie lexcution dapplications de deep learning, comme pour la
fonction FaceID de reconnaissance de visage ainsi que pour la reconnaissance de la
parole avec SIRI. Il y a fort parier que cela permettra de faire merger de nom-
breuses applications mobiles exploitant cette capacit.
Apple sinon comble les trous dans son offre dIA via son partenariat avec IBM qui
porte notamment sur Watson, une manire indirecte de sduire les grandes entreprises
et les DSI, la grande bte noire de Steve Jobs.

208
Cf Learning from Simulated and Unsupervised Images through Adversarial Training en dcembre 2016.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 270 / 362
Il est cependant probable quApple devra faire quelques acquisitions dans le cadre de
son projet de voiture automatique.

Startups
Dun point de vue technique, nous avons bien vu que lIA se mettait en uvre avec
un ensemble de techniques assez disparates, presque toutes disponibles en open
source, assez concentres sur le traitement du langage, de limage et des donnes et
avec une gradation assez forte dans le niveau dintelligence des solutions. Nous avons
aussi vu la forte dpendance entre les solutions dIA et les donnes qui les alimentent.

Caractristiques
Pour ce qui est des startups, lIA est devenue un phnomne de mode comme lont
t les rseaux sociaux (vers 2004), la vido (vers 2006), la mobilit ( partir de
2009), les objets connects (vers 2011) ou le cloud. Une startup qui ne brandit pas
lIA comme sauce magique parait dpasse par les vnements. Et nous avons dj
des sous-modes avec les chatbots, la robotique, la cognitif, etc.
On sourit souvent des startups qui ont "cr une IA" alors qu'elles ont correctement
paramtr un rseau de neurones avec TensorFlow partir d'exemples et aprs avoir
ttonn, ou qu'elles ont utilis une vieille technique de prdiction base de machine
learning.
Ces effets de mode sont notamment aliments par les prvisions de chiffre daffaires
des analystes, comme IDC qui prdit que le march de lIA reprsentera $46B de CA
en 2020209. Ces valuations ont toujours tendance gonfler des chiffres qui sont dans
la pratique incalculable. Ainsi, quel est le CA en IA de Google, Facebook ou Micro-
soft, qui ne sont dailleurs visiblement pas intgrs dans lestimation dIDC ? Une
donne intressante serait dvaluer le CA additionnel gnr par lIA chez les di-
teurs de logiciels et startups, mais la part de lIA dans la valeur ajoute dun Oracle
ou dun SalesForce est bien difficile valuer. On a connu le mme phnomne avec
les prvisions sur le march des objets connects210.
Cela amne la gnralisation du phnomne de lIA washing, dcrivant ces startups
qui usent et abusent de la terminologie de lIA, souvent, sans prciser la manire dont
leur solution en tire parti.
Depuis dbut 2016, ma position sur la question a cependant volu. Les techniques de
lIA sont largement disponibles, en open source, dans le cloud et dans lembarqu.
Les techniques du machine learning sont relativement faciles mettre en uvre.
Celles du deep learning ncessitent un effort conceptuel plus important, mais acces-
sible aux jeunes dveloppeurs et data scientists.

209
Cf Worldwide Spending on Cognitive and Artificial Intelligence Systems Forecast to Reach $12.5 Billion This Year, According
to New IDC Spending Guide, avril 2017.
210
Que javais eu loccasion de dcrire dans La grande intox des objets connects en aot 2015.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 271 / 362
LIA est en train de devenir lquivalent moderne du dveloppement web : un en-
semble de techniques de plus en plus abordables. Laurent Alexandre aime dire que
les investisseurs dans les startups de lIA ne valent pas grand-chose et que leurs in-
vestisseurs sont des gogos, les seuls crateurs de vritables IA tant les GAFA. Cest
videmment exagr !
Les GAFA crent et utilisent des IA sous la forme de logiciels open source et de data
centers. Les algorithmes innovants sont encore crs en masse par des chercheurs is-
sus duniversits du monde entier. Les GAFA nont pas encore le monopole de la
crativit. Qui plus est, les solutions techniques sont open source et ne doivent pas
obligatoirement tourner dans les infrastructures des GAFA. Comme lInternet, lIA
est tout de mme trs distribue.
Derrire lhabillage marketing, il reste comprendre ce que la startup a rellement
produit : a-t-elle assembl des briques logicielles existantes de manire traditionnelle,
a-t-elle cr des briques spcifiques, a-t-elle juste entran un modle assez simple et
mis en forme des donnes, do viennent-elles et la solution est-elle une simple ap-
plication directe de techniques existantes ? En gnral, cest bien le cas. Mais le
choix, la programmation et lentrainement dun modle de deep learning ou de ma-
chine learning pour rpondre un besoin spcifique requiert des comptences encore
rares.
On ne devient pas dveloppeur dans lIA du jour au lendemain, de mme quil a fallu
du temps pour que les dveloppeurs dapplications procdurales ou client serveur
sadaptent la programmation vnementielle du web et avec ses nombreux frame-
work qui changent tout le temps (jquery, Angular, React, Node). Selon IDC, 1% des
logiciels utiliseraient de lIA auourdhui et en 2018, 75% des dveloppeurs intgre-
ront de lIA dans leur code, ce qui est probablement un peu optimiste, ne serait-ce
que pour tenir compte du laps de temps pour se former211.
Quelles sont les caractristiques dune bonne startup faisant appel de lIA ? Ce sont
quasiment les mmes que pour les grandes entreprises voques dans la partie prc-
dente :
Talents : une startup dans lIA doit faire appel des talents techniques varis avec
des data-scientists, des dveloppeurs maitrisant le paramtrage de systmes de
machine learning et deep learning, et les autres connaissances techniques clas-
siques allant du back-end au front-end. Le design est aussi de la partie car les solu-
tions logicielles se distinguent encore par l.
Mtier : une bonne startup connait bien le mtier de ses clients, ses contraintes,
ses besoins et aspirations. Elle sait crer une solution qui sintgre bien dans
lexistant.
Donnes : il ny a pas dIA sans accs des donnes pour entrainer ses modles.
Les donnes exploites par la startup peuvent tre de trois types : ouvertes et faci-

211
Source : IDC FutureScape: Worldwide IT Industry 2017 Predictions.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 272 / 362
lement disponibles sur Internet (open data, ImageNet212, WordNet, MNIST), col-
lectes de manire exclusive la startup, par exemple via ses objets connects, ou
provenant des systmes dinformation de ses propres clients. La diffrentiation de
la solution provient gnralement de la combinaison des trois sources. Une startup
nexploitant que des donnes ouvertes aura moins de barrires lentre. Et pour
accder aux donnes des entreprises clientes, il faudra souvent faire du spcifique
ce qui rduira les effets dconomie dchelle de la startup. Autre question cl : o
sont stockes les donnes ? Comment est gr le respect de la vie prive des utili-
sateurs pour les applications grand public ? La startup est-elle prte respecter la
nouvelle rglementation europenne RGDP en mai 2018 ?
Technologies : quand une startup indique avoir cr son IA , il est bon de creu-
ser un peu pour se faire expliquer le pourquoi du comment. Quels outils a-t-elle
exploit pour crer sa solution ? Quelles mthodes de machine learning ou quels
types de rseaux de neurones ? Quelle est la partie algorithmique qui est spci-
fique la startup ? Est-ce quelle a dvelopp un savoir-faire spcifique dans
lassemblage de briques algorithmiques diverses ?
Produit : est-ce que la solution est gnrique ou demande-t-elle dadopter un
mode projet lourd pour sa mise en uvre chez chaque client ? Si on est en mode
projet chaque fois, on sera dans la catgorie des services outills, la startup tant
hybride entre startup produit et entreprise de services du numrique (ESN) avec
peu dconomies dchelle.

Business : quel est le modle conomique de la startup ? Est-il rcurrent ? O sont


les conomies dchelle ? Des questions sommes toutes classiques.
Financement : cest toujours le nerf de la guerre pour le dveloppement de vri-
tables startups, celles qui ont une grande ambition, notamment internationale.
Nous avons vu dans les numrations nombreuses de ce document que les startups
US bnficiaient souvent de financements importants, pouvant facilement dpas-
ser les $30M, ce qui est plus rare en France et en Europe en gnral.
LIA en est encore au stade artisanal et du bricolage. Cela ne se voit videmment pas
directement quand on fait le tour dhorizon des startups du secteur. Surtout dans le
mesure o la plupart dentre elles sont b-to-b et diffusent leurs solution en marque

212
La base ImageNet a t cre en 2009. Elle comprenait au dpart 16 millions dimages associes manuellement 100 000 mots de
la base ouverte WordNet, ces mots tant organiss dans une arborescence.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 273 / 362
blanche. Vous les retrouverez ventuellement dans les agents conversationnels des
sites web de marques, dans le ciblage marketing qui vous touche avec une offre perti-
nente (ou pas du tout), dans des robots capables de dialoguer plus ou moins avec
vous, ou dans les aides la conduite de votre voiture haut de gamme.
Lun des moyens de se rendre compte indirectement de cet aspect artisanal consiste
dvaluer la part produit et la part service des entreprises du secteur. Plus la part du
produit est faible, plus on est dans le domaine de lartisanal. Cela napparait pas dans
les donnes publiques mais peut au moins dobtenir quand on a loccasion dobserver
la loupe ces entreprises : dans le cadre dune relation grand compte/startup, dun
investissement ou mme dun recrutement. On peut lobserver galement dans les
profils LinkedIn des salaris de lentreprise sils sont disponibles. Bref en utilisant ce
que lon appelle des sources dinformation ouvertes.

Et aussi, ne pas oublier davoir une dmonstration du logiciel ! Dans lIA,


lergonomie est aussi importante que la fonction !

Cartographie
Je vais mappuyer sur ce suivi du secteur par le site VentureScanner qui tait actua-
lis en juillet 2017213. Il organise le march des startups de lintelligence artificielle
en 13 segments et value leur anciennet et leur financement.

213
Cf https://www.venturescanner.com/blog/2017/artificial-intelligence-market-overview-and-innovation-quadrant-q3-2017. En
juillet 2017, ils suivaient 1888 startups dans lIA dans 13 catgories sur 70 pays reprsentant $19B de leves de fonds.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 274 / 362
Et voici leur dcoupage, un peu restructur pour le simplifier :
Plateformes : machine learning, deep learning, rseaux de neurones, composants
o Plateformes de deep learning et machine learning (256 startups, $2,9B) :
qui font avancer ltat de lart ct algorithmie, avec des modles prdictifs
divers.
Donnes : prdictif, analytics, recommandation, en gros, ce qui ne concerne pas le
cognitif, la vision et le langage
o Systmes de recommandation (102 startups, $1,5B) : pour prdire les
comportements des utilisateurs. On en trouve notamment dans la musique,
la vido et la restauration.
Vision : recherche d'images, commande gestuelle
o Applications vision (214 startups, $1,1B) : applique des marchs verti-
caux comme dans le ecommerce ou la sant.
o Plateformes vision (191 startups, $2B) : technologies horizontales dans la
vision artificielle comme les moteurs de recherche dimages ou les systmes
de tagging dimages.
o Reconnaissance de vidos (24 startups, $104M) : comme pour dtecter les
contenus protgs.
o Commande gestuelle (60 startups, $694M) : la frontire entre objets con-
nects et captation de mouvements et dimages.
Langage : chatbots, traduction, extraction, recherche

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 275 / 362
o Traitement du langage (304 startups, $2,2B) : solutions techniques dans le
domaine pour comprendre le langage, le traduire, le rsumer, le gnrer, etc.
o Reconnaissance de la parole (163 startups, $1,1B) : avec des logiciels de
reconnaissance de la parole, fournis en cloud ou en mode embarqu.
o Traduction vocale (21 startups, $45M) : traduction speech to speech
utilisable dans des contextes divers comme dans les chats vidos.
o Assistants virtuels (186 startups, $1,3B) : les fameux chatbots, qui sont d-
clins en plateformes de chatbots et en chatbot pour marchs verticaux ou
horizontaux, en b2b et b2c.
Robots : plateformes, humanoides, services
o Robots (168 startups, $2,8B) : du robot domestique au robot industriel.
Mtier : avec applications verticales (transports, sant, finance, ecommerce, juri-
dique, agriculture) et horizontales (scurit informatique, RH, marketing)
o Applications mtier (570 startups, $8,3B) : qui exploitent le machine lear-
ning et le deep learning en exploitant des donnes mtier, comme la dtec-
tion de fraude bancaire ou la gnration de leads. Un schma de CBInsights
montre que les domaines daction de ces startups sont en priorit dans la
sant, la vente et le marketing puis les fintechs. LIoT et la business intelli-
gence sont aussi dans le top 5 mais ne sont pas spcifiquement verticaux.
o Applications contextuelles (33 startups, $132M) : une catgorie un peu
fourre-tout dapplications qui captent des donnes de lenvironnement de
lutilisateur. Leur cartographie de juillet 2017 nest pas bien jour car Cle-
versense qui est dans cette catgorie a t acquis en 2011 par Google.

Dans la pratique, la frontire entre plateformes gnriques et applications mtiers est


tnue. Nous avons par exemple vu dans le domaine de la sant des startups spciali-
ses dans limagerie mdicale sur une seule pathologie (rtinopathie diabtique, der-
matologie) ou dautres qui en couvraient plusieurs. Dans le traitement des donnes,

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 276 / 362
des socits de plateformes sont en fait rapidement spcialises dans le marketing ou
la finance.
On constate une volution la hausse du financement des startups de ces secteurs. De
2009 2017 (cf les schmas ci-dessous de Venture Scanner de juillet 2017).

Lanciennet des startups de ce secteur est plutt grande avec un bel talement sur la
date de cration. Il y a certes un pic autour de 2012 pour celles qui ont lev des fonds.

Caractristiques
Au-del des facteurs cls de succs voqus prcdemment, les startups de lIA, sur-
tout amricaines, ont quelques points communs marquants :
Elles ont majoritairement des approches march b-to-b avec des marchs vi-
ss qui sont toujours les mmes, entre horizontal et vertical. Exemples de march
sursaturs : la dtection de fraudes dans la finance et et lanalyse prdictive du
comportement des consommateurs dans le marketing en ligne et mobile.
On y trouve souvent les ombres de la DARPA, de la NSA et de la CIA comme
clients voire mme comme investisseurs pour cette dernire, via son fonds InQTel.
Surtout pour les solutions horizontales. Ce nest pas une question de Small Bu-
siness Act mais simplement de besoins de ces organisations de dfense et de ren-
seignement !
On retrouve aussi beaucoup danciens de luniversit de Stanford et du MIT dans
les startups de lIA, gnralement bards dun ou de plusieurs PhD en IA.
Les technologies dIA employes sont assez mal documentes. Le machine lear-
ning et le deep learning reviennent souvent sans que lon puisse valuer si les star-
tups ont rellement fait avancer ltat de lart. Comme il se doit, une startup doit
prsenter un risque march plus quun risque technologique ou scientifique. Cest
pourquoi les startups de lIA sont gnralement positionnes dans lapplication de
techniques dIA connues des marchs divers, horizontaux ou verticaux. Elles
profitent aussi parfois de leffet dopportunit en labellisant IA des projets qui
quelques annes auparavant auraient t vendus sous le sceau du big data.
Les solutions sont trs souvent proposes sous la forme dAPIs en cloud mais les
approches plateformes sont encore mergentes car elles ne bnficient pas dun ef-

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 277 / 362
fet push/pull courant dans le grand public (la demande pour des smartphones An-
droid entrainant celles dapplications tournant dessus).
Les leves de fonds sont encore relativement modestes dans lensemble. On d-
passe dans de rares cas les $100M. Ce nest pas beaucoup par rapport plus de
$1B ralises par des licornes telles que Pinterest ou MagicLeap. Les licornes sont
presque toutes des startups grand public.

Plateformes de deep learning


Cest une catgorie de startups importante en volume mais aussi la plus droutante
car difficile valuer. Voici un tour dhorizon de quelques-uns de ses acteurs, no-
tamment les plus visibles dentre eux.
Numenta (2005) est une socit lance par le crateur de Palm, Jeff Hawkins. Elle
fait du deep learning en cherchant identifier des tendances temporelles dans les
donnes pour faire des prvisions. Leur solution Grok permet de dtecter des anoma-
lies dans des systmes industriels et informatiques. Ils imitent le fonctionnement du
cortex crbral et de principes biologiques reprenant le principe de la mmoire par
association et temporelle (Hierarchical Temporal Memory) thoris par Jeff Haw-
kins en 2004 dans louvrage On Intelligence, o il tente de dcrire le fonctionnement
du cerveau et la manire de lmuler214. Les rsaux de neurones base de HTM utili-
sent des neurones plus sophistiqus que les rseaux de neurones habituels.

Hawkins pense que le cerveau est principalement une machine prdictive qui nest
pas forcment dote dune capacit de calcul parallle intensive mais plutt dune
mmoire associative rapidement accessible. Il insiste sur limportance du temps dans
les mcanismes de rtropropagation mise en uvre dans les rseaux neuronaux uni-
quement dans les phases dapprentissage. Alors que le cerveau bnficie dune mise
jour sensorielle permanente.

214
Louvrage est tlchargeable gratuitement ici : https://papers.harvie.cz/unsorted/Jeff%20Hawkins%20-
%20On%20Intelligence.pdf.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 278 / 362
Les thses de Hawkins sont intressantes et constituaient un pot-pourri des connais-
sances en neurosciences il y a plus de 10 ans maintenant. Elles sont videmment con-
sidres comme un peu simplistes215.
Jajouterai ces critiques que Hawkins oublie ngligemment le rle du cervelet et du
cerveau limbique dans les apprentissages et le prdictif. Le cervelet contient plus de
neurones que le cortex et il gre une bonne part des automatismes et mcanismes
prdictifs, notamment moteurs.
Numenta propose aussi NuPIC (Numenta Platform for Intelligent Computing) sous la
forme dun projet open source. Cette socit est trs intressante dans le lot car elle
utilise une approche technique plutt originale qui dpasse les classiques rseaux
neuronaux.
Sentient Technologies (2007, $143M) dveloppe pour sa part une solution dIA
massivement distribuable sur des millions de CPUs, visant les marchs de la sant, de
la dtection de fraudes et du du e-commerce. La socit dit employer des mthodes
dIA avances pour dtecter des tendances dans les donnes. Cest du big data revi-
sit. Le systme imite les processus biologiques pour faire de lauto-apprentissage.
On trouve des morceaux de deep learning et des agents intelligents dedans. Ces
agents sont valus avec des jeux de tests et les meilleurs conservs tandis que les
plus mauvais sont limins. Bref, cest une sorte de Skynet. Lun des fondateurs de la
socit est franais, Antoine Blondeau, et bas Hong Kong.

Digital Reasoning (2000, $73M) a t cre par des anciens dOracle et de la CIA
(entre autres provenances) et est finance par In-Q-Tel, le fonds dinvestissement de
cette dernire. Sa solution danalyse de donnes est utilise par le renseignement et la
dfense US ainsi que dans la finance. Comme celle de Skymind, sa solution Synthe-
sys est en Java et ouverte. Elle permet danalyser des donnes structures et non
structures, y compris des conversations tlphoniques. Elle sert dtecter des com-
portements anormaux dans les communications lectroniques. Cest donc un outil
utilis par la NSA dans la gestion de ses interceptions (PRISM & co).

215
Voir ces critiques chez Jeff Kramer, Ben Goertzel et sur Quora.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 279 / 362
Scaled Inference (2014, $8M) propose une plateforme de machine learning en cloud
via des APIs. Elle comprend de la reconnaissance de formes, des dtectons
danomalies, des algorithmes de prdiction. Startup cr par un ancien de Google.
Solution pas encore disponible.
Skymind (2014, $3,3M) a t cre par des anciens de Vicarious. Elle propose une
solution open source en Java Deeplearning4j.org capable danalyser des flux de
donnes. Elle est notamment utilise dans la dtection de fraude, le commerce et le
CRM.
BigMl (2011, $1,63M) a lair dtre un outil danalyse assez gnrique qui analyse
les comportements clients, permet du diagnostic de matriel, dans la sant, dans les
risques pour des prts. Lensemble sutilise via des APIs attaquant un service en
cloud. Au moins, leur site fournit des exemples de traitement de jeux de donnes
comme ce modle prdictif de succs de campagne de financement participatif sur
Kickstarter en fonction de leurs diffrentes caractristiques. Intressant !

Cycorp (1994) est une sorte de laboratoire de recherche priv en IA financ par des
contrats du gouvernement US, dont la DARPA, et dentreprises prives. Le projet de
recherche Cyc dont il est issu a plus de 30 ans au compteur ! Il vise modliser les
connaissances et permettre dautomatiser la recherche scientifique. Il propose une
suite doutils en open source et licence commerciale permettant dexploiter des dic-
tionnaires, ontologies et bases de connaissances pour rpondre des questions
danalystes.
Ayadsi (2008, $106M) interprte aussi de gros volumes de donnes pour y identifier
des signaux faibles pertinents. Le projet a dmarr Stanford et avec des finance-
ments de la DARPA et de la NSF, lquivalent amricain de lAgence Nationale de la
Recherche franaise.
Narrative Science (2010, $40M) propose Quill, une plateforme qui analyse les don-
nes structures et non structures issues de sources diverses pour en extraire ce qui
est important et en produire des rsums automatiquement. La solution permet no-

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 280 / 362
tamment dexploiter les donnes issues de Google Analytics ou dhistorique de tran-
sactions financires (ci-dessous). Startup cre par un ancien de Google et de Carne-
gie Mellon.
Synapsify (2012, $1,45M) a cr CORE, un outil danalyse et de traitement en lan-
gage naturel qui fait de la recommandation de contenus.
Idibon (2012, $6,9M) analyse les textes structurs, notamment issus des rseaux so-
ciaux, pour les classifier automatiquement et raliser des analyses statistiques dessus.

Moteurs danalyses prdictives


Les startups de ce domaine proposent des outils dingestion et danalyse de gros vo-
lumes de donnes structures et non structures (documents, images, etc). Les outils
danalyse sappuient sur un panach de mthodes associant des statistiques, du data
mining, du machine learning et du deep learning). Certains proposent leur solution en
open source et la plupart les diffusent surtout en cloud.
Versive (2012, $57M), anciennement Context Relevant, propose des outils danalyse
prdictive applicables diffrents marchs. Le glissement smantique semble gnra-
lis : au lieu de parler de big data, ce qui est trop vague, les startups parlent plutt
danalyse prdictive qui exploite de gros volumes de donnes. Serait-ce de lIA was-
hing ? Conceptuellement oui, mme si ce genre dentreprise utilise probablement des
briques de rseaux neuronaux et de machine learning en plus de mthodes plus tradi-
tionnelle.
Work Fusion (2010, $71,3m) propose lautomatisation de lexploitation de gros vo-
lumes de donnes non structures. Il donne limpression de rcuprer les documents
comme le fait IBM Watson dans ses outils dingestion. Il est par exemple capable de
rcuprer les rsultats financiers de nombreuses entreprises et den prsenter une syn-
thse. La mthode relve de la force brute au lieu dexploiter la chimre du web s-
mantique qui na pas vraiment vu le jour. Comme le web smantique demandait un
encodage spcifique et structur des donnes, peu de sites lont adopt et lextraction
de donnes reste empirique. Le traitement mme de ces donnes pour les interroger
na pas lair de faire partie de leur arsenal.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 281 / 362
Sentenai (2015, $1,8m) propose une plateforme danalyse prdictive, en cloud, qui
est notamment positionne dans lanalyse de donnes issues dobjets connects. La
startup, base Boston, a t cre par un ancien de TechStars Boston, Rohit Gupta.
La startup donne limpression de ne pas avoir grand chose dautre dans sa besace que
ses fondateurs et la capacit recruter des dveloppeurs sur la cte Est. Elle est trs
early stage et na pas grand chose raconter ce stade.
Cette catgorie comprend de nombreux autres acteurs tels que Alteryx (2010,
$163M), Predixion Software (2009, $37M), RapidMiner (2007, $36M), Alpine
Data Labs (2011, $25M) et Lavastorm (1999, $55M).

Ecosystme franais de lIA


Depuis 2016, diverses initiatives (France Is AI dISAI, le plan France IA du gouver-
nement) cherchent valoriser les startups de ce nouveau march et de mettre en
avance lexcellence franaise et ses opportunits.
Ce comportement est assez frquent face de nombreuses vagues technologiques :
dans les jeux vidos, dans les objets connects, dans la cyberscurit, pour ne prendre
que quelques exemples.
Lhabitude est de mettre en valeur voire de monter en pingle lexcellence de nos in-
gnieurs et de nos chercheurs, quils soient rests en France ou expatris dans de
grandes entreprises du numrique internationales. Et nous avons Yann LeCun, le pre
des rseaux de neurones convolutionnels, qui uvre chez Facebook ! ISAI a invento-
ri de son ct 270 startups franaises oprant dans lIA dont une bonne vingtaine ont
des implantations ltranger et notamment aux USA.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 282 / 362
Il est clair que lIA constitue une belle opportunit de bien positionner le pays. Cest
un secteur prometteur, surtout dans la mesure o les plateformes correspondantes
sont encore en devenir. Mais nous sommes aveugls par les mmes erreurs de pers-
pective que par le pass. Ce qui fera les forces et les faiblesses de ces startups nest
pas li lIA mais gnrique. Limportant est de savoir quelle vitesse ces startups
se financent, dveloppent un prototype viable, gnrent leurs premires rfrences
clients et se dploient commercialement ltranger, surtout aux USA. Ces besoins
sont gnriques.

On a tendance rsonner en filires industrielles (ci-dessus, la cartographie du plan


France IA de mars 2017) pour les intgrer, notamment via les Ples de Comptivit
ou dans le cadre de partenariats avec de grandes entreprises franaises que lon quali-
fiera de traditionnelles. Cest un norme pige et une perte de temps. Dans lIA
comme ailleurs dans le numrique, lintgration est mondiale, pas franaise. Une star-
tup ne peut gagner terme quen devenant une plateforme. Et les plateformes ne sont
pas franaises, elles sont mondiales. Lavantage des startups amricaines est dans la
dimension de leur march intrieur, qui conditionne la fois leur surface commer-
ciale initiale et leur capacit de financement. Pour les galer, il faut trouver cette sur-
face et la surface franaise est toujours comprise entre 1/7,5 (PIB) et 1/30 (finance-
ment dans le capital risque) vis--vis des USA. Il faut donc voir grand pour les meil-
leurs.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 283 / 362
Cela correspond dailleurs un progrs rcent de lcosystme entrepreneurial fran-
ais. On compte chaque anne une trentaine de startups qui dpassent les 10M de
financement. Et elles sorientent de plus en plus linternational. Il faut continuer.
Lautre dveloppement de lcosystme de lIA, moins visible, concerne les presta-
taires de services et ceux qui proposent du service outill. Nombre dagences de
communication, web agencies et autres entreprises de services numriques se met-
tentr progressivement lIA et structurent leurs offres.
Cest par exemple le cas de lagence OWI Tech, cre en 2009, qui est spcialise
dans la relation client et lexploitation du traitement automatis du langage. Ils propo-
sent notamment des projets dtudes clients, de chatbot et de traitement de mails
automatis. Ils ont dploy une solution chez Total en partenariat avec lagence Niji.

Recherche
Avant dvoquer le cas des startups, faisons un tour dans lcosystme de la re-
cherche en IA franais. Il a t trs bien inventori dans le cadre du plan France IA
du gouvernement, publi en mars 2017216.
La recherche franaise est dissmine dans plus de 220 quipes de recherche totali-
sant 5300 chercheurs, avec de nombreux projets collaboratifs associant laboratoires
publics, universits et, parfois, entreprise prives. Les principaux organismes se foca-
lisant sur lIA sont lINRIA, le CNRS et le CEA.
Les chercheurs franais sont les plus prolixes en publications scientifiques, derrire
les amricains et les chinois qui dominent le secteur. La canadiens ne sont pas loin,
aussi bien Toronton quau Qubec. Montral ambitionne ainsi de devenir une capi-
tale de lIA et a mme rcemment accueilli un laboratoire dIA du franais Thals217.

216
Cf https://www.economie.gouv.fr/France-IA-intelligence-artificielle. Ce plan a t lanc par Axelle Lemaire puis repris par son
successeur Christophe Sirrugue. Il faut considrer que le plan prsent en mars 2017 tait un rapport dtape qui doit tre mis jour
par Cdric Villani dici dbut 2018
217
Cf Thales choisit le Canada pour son hub mondial en intelligence artificielle, octobre 2017. Bas Montral, le laboratoire cor-
tAIx a t lanc en collaboration avec lInstitut Qubcois dIntelligence Artificielle (MILA) o travaille la star canadienne de lIA,
Yoshua Bengio, lIVADO (Institute of Data Valorization), lInstitut dIntelligence Artificielle du Qubec et lInstitut Vector de
Toronto.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 284 / 362
LINRIA a publi courant 2016 un excellent livre blanc qui dcrit ses priorits et pro-
jets dans lIA218. De manire assez classique, les projets portent sur le langage, la vi-
sion et la robotique. LINRIA planche aussi beaucoup sur lIA symbolique avec le
web smantique, les neurosciences et sciences cognitives ainsi que sur la programma-
tion par contrainte. Elle sintresse la protection de la vie prive ainsi quaux appli-
cations de lIA dans la sant.
Le projet Orpailleur men Nancy est ddi la reprsentation des connaissances et
au raisonnement. Lquipe planche sur lextraction de donnes dans les bases de con-
naissances non structures, et notamment dans le domaine de la sant, le mme que
celui qui est investi par IBM Watson et plein de startups. Ils collaborent notamment
avec le centre de lutte contre le cancer de Nancy.
Lquipe Magnet travaille directement sur le machine learning et lauto-apprentissage.
Celle de Linkmedia travaille sur lextraction intelligente de donnes des contenus
multimdias et notamment la dcouverte de leurs liens et structures.
Le projet Sequel qui est bas Lille travaille sur lapprentissage squentiel de don-
nes, notamment celles qui proviennent de lenvironnement.
Il est difficile de caractriser les spcificits de la recherche franaise en IA. Elle est
multi-domaine sans spcialisation apparente. On peut cependant y distinguer une
force dans lIA symbolique et la logique formelle, dans le traitement du langage ainsi,
en filigrane, quun souci de crer des solutions dIA responsables vis--vis de la so-
cit219.
Une association cre en 1993 fait la promotion de la recherche en IA, lAssociation
Franaise pour lIntelligence Artificielle (AFIA). A noter quen France, comme il y
a toujours du pour et du contre, nous avons aussi une Association contre lIA,
lAFCIA, cre en 2015 qui vise simplement interdire lchelle mondiale toute
recherche sur lIA220.
Le dfi pour ces chercheurs et leurs autorits de tutelle est de trouver des applications
marchs de leurs travaux. En consultant la liste des participations dIT-

218
Cf Intelligence artificielle, ddis actuels et laction dInria, 2016, 82 pages.
219
Cela se retrouve notamment dans les travaux de Laurence Devillers, du CNRS-LIMSI qui portent sur le langage, sur la dtection
des motions et sur lthique de lIA.
220
Cf On peut tre contre lintelligence artificielle par principe de Irne Rgnauld, publi sur Uzbek&Rica en janvier 2017

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 285 / 362
Translation 221 qui est lun principaux financeurs de projets issus de lINRIA, on
constate que lIA est souvent en filigrane de ces projets.
Les travaux des chercheurs en IA naboutissent pas naturellement des projets entre-
preneuriaux. Ne serait-ce parce quil faut une couche de traduction entre ces ralisa-
tions et leurs applications et que les innovations des startups rsultent souvent de la
combinaison de plusieurs mthodes et techniques222.
En France, la recherche dans lIA semble mieux finance ct civil, mme sil est
difficile de le vrifier par les chiffres. On ne sen plaindra pas. A ceci prs que la
R&D militaire US a une qualit : elle est oriente vers des objectifs pratiques selon
des cahiers des charges. De son ct, la recherche civile franaise fonctionne plutt
de manire trs dcentralise.

Un point cl : lIA ne doit pas tre quune affaire dhommes. Comme dans le dve-
loppement logiciel, on y trouve malheureusement plutt une toute minorit de
femmes alors que ces technologies vont conditionner le futur de lhumanit et du tra-
vail. Pourtant, on trouve plein de femmes remarquables dans lIA, comme le montre
cet inventaire US223.

Startups horizontales
Voici quelques startups que jai pu reprer dans les solutions techniques dIA plus ou
moins gnriques, en plus de celles qui sont dj cites dans le corps du document et
notamment dans les applications gnriques et les applications mtiers de lIA.

221
Cf le portefeuille de participations dIT Translation.
222
Pour apprcier la difficult transformer la recherche en IA en solutions mtiers, vous pouvez par exemple consulter les actes de
la dernire confrence ICML sur le machine learning qui sest tenue dbut aot 2017 en Australie :
https://2017.icml.cc/Conferences/2017/Schedule.
223
Cf Meet these incredible women advancing AI research, Topbots, mai 2017.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 286 / 362
Il subsiste quelques acteurs spcialiss dans la recherche et qui ont intgr petit pe-
tit des techniques dIA dans leurs offres. Antidot et Sinequa sont anciens dans le pay-
sage mais, linstar de nombreux diteurs b2b, ils peinent crotre pour atteindre la
taille critique, mme sils commencent se dvelopper linternational comme Sine-
qua qui y raliserait plus de 50% de son chiffre daffaire.
Dataiku (2013, $45,7m) fait voluer les concepts de business intelligence et de data
mining avec son Data Science Studio (ci-dessous), un ensemble doutils danalyse de
donnes qui exploitent du machine learning pour la cration de modles de donnes
et leur simulations. Cest visiblement la startup franaise la mieux finance dans lIA
ce jour.

Moodstocks (2008) proposait une solution mobile de reconnaissance dimages, four-


nie sous la forme dAPIs et dun SDK multi-plateforme. Elle a t acquise par
Google en 2017.
Zelros (2015, 80K de love money) propose une plateforme en cloud B2B qui per-
met aux applications mtiers daccder aux donnes structures ou non ainsi quaux
modles prdictifs et en langage naturel via un bot conversationnel exploitable via
Slack, par SMS, Skype Entreprise ou quivalents. La startup est base Paris.
DreamQuark (2014) dveloppe des solutions dintelligence artificielle base de r-
seaux de neurones et de deep-learning avec des mcanismes dauto-apprentissage ca-
pables dexplorer tous seuls tous types de donnes de les traiter. La startup propose
des outils danalyse via sa plateforme Brain qui permet dexplorer, optimiser et valo-
riser les donnes structures (bases de donnes) et non-structures (images, sons,
voix) dans les secteurs de lassurance et la sant.

Objets connects
Cest un domaine o les entrepreneurs franais sont assez prolixes en gnral. Il nest
donc pas tonnant dy trouver quelques startups intgrant des briques dIA dans leurs
solutions. Le scnario le plus rpandu est li la consommation dnergie et la mai-
son connecte, avec des solutions faisant de lauto-apprentissage du comportement de
ses habitants pour piloter des actions dconomies dnergie et dautomatisation di-
verses.
Craft.ai (2015, $1,1M) est une jeune startup spcialise dans lInternet des objets.
Elle permet de crer des solutions logicielles dorchestration dobjets connectes qui
apprennent toutes seules des comportements des utilisateurs et des donnes environ-
Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 287 / 362
nementales captes par les objets connects. La solution est commercialise sous la
forme dAPIs destines aux dveloppeurs dapplications. Lapproche est intressante
dans son principe. Reste trouver un modle conomique solide.

Angus.AI (2014) est un peu lquivalent de Craft.ai, mais pour les robots et divers
objets connects qui doivent percevoir ce qui se passe dans leur environnement. La
startup cre par des anciens ingnieurs dAldebaran qui ont dvelopp la partie logi-
cielle des robots Nao et Pepper, propose une solution logicielle embarque dans les
robots leur apportant les fonctions de base de reconnaissance vocale et faciale et de
dtection dobstacles. Elles sont fournies sous la forme dun kit de dveloppement et
dAPIs (interfaces de programmation). Ils sappuient beaucoup sur des solutions open
source du march. Ils travaillent dj avec la SNCF, mais pas sur des robots.
Ubiant (2011), bas Lyon propose une solution matrielle et logicielle de gestion
de la maison intelligente, de lclairage et de lnergie qui sappuie sur du machine
learning et sur le Luminion, un objet connect interagissant avec lutilisateur via des
LED de couleur indiquant si la consommation du foyer est suprieur celle du voisi-
nage. Cest une offre b2c.
Vivoka (2015) a dvelopp Lola, un logiciel de contrle des quipements de la mai-
son connecte. Elle sappuie sur une box relie Internet qui se pilote via une appli-
cation mobile et par commande vocale. Le projet lanc sur Kickstarter na pas port
ses fruits.
Iqspot (300K) est une startup bordelaise qui analyse la consommation nergtique
des btiments et sensibilise ses occupants pour la diminuer. Le tout avec du machine
learning. Cest une participation dIT-Translation.
Xbrain.io (2012) est une startup franaise tablie dans la Silicon Valley ainsi qu
Paris et Lille qui se spcialise dans les applications de lIA lautomobile et la robo-
tique. Sa plateforme xBrain Personal Assistant permet de crer des agents conversa-
tionnels, utiliss notamment dans les centres dappels. Elle sappuie sur la reconnais-
sance vocale, sur la gestion de contexte, sur la dtection des intentions et la gestion de
rgles. Elle utilise notamment des GAN (generative adversatial networks) pour la g-

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 288 / 362
nration de dialogues ralistes. Son crateur, Gregory Renard, planche sur lIA de-
puis prs de 20 ans.
Scortex (2015) dveloppe des solutions matrielles et logicielles base de chipsets
neuromorphique en FPGA apportant lautonomie aux robots et objets connects et
qui intgrent notamment la reconnaissance dimages et de la parole. Cest lIA de
linformatique embarque !

Commerce et marketing
Lcosystme franais a toujours t prolixe en startups b2b et b2c dans le secteur du
ecommerce et du marketing. Il est donc normal dy retrouver quelques startups int-
grant de lIA.
AntVoice (2011, $3,5M) propose une solution de recommandation prdictive pour
les sites de ecommerce qui sappuie sur de lintelligence artificielle. Cest un spcia-
liste du big data marketing. La solution analyse la pondration de la relation entre
Internautes et produits et sappuie sur la thorie des graphes.
Datapred (2014) propose galement une solution danalyse prdictive base sur du
machine learning. La socit cible divers marchs professionnels dont celui de la dis-
tribution, en plus de la finance, de la logistique et de la sant. Elle permet par
exemple de simuler des hypothses marketing et leur impact sur une chane logistique
de distribution en tenant compte dun grand nombre de paramtres. Comme cest
souvent le cas, le lancement dun projet requiert une bonne part de service et de per-
sonnalisation avant sa mise en oeuvre oprationnelle.
DataPublica / C-Radar (2011) est une socit qui propose une solution en cloud de
marketing prdictif B2B permettant de cibler les bons prospects. Elle sappuie sur
lexploitation des donnes administratives et financires des entreprises issues de
sources publiques, des sites web associs, des rseaux sociaux et des mentions dans
les mdias. Ces donnes permettent alors de segmenter automatiquement les clients,
de prioritisation de ces segments, le tout sappuyant sur un apprentissage supervis.
Lapproche permet par exemple de segmenter les startups dun secteur dactivit
donn (Medtech, Fintech). La socit est une autre participation dIT Translation.
Elle a t acquise par lditeur de logiciels Sidetrade en juin 2017.
Dautres startups franaises se positionne sur ce crneau comme Compellia (2015),
qui analyse des sources donnes ouvertes et identifie des vnements cls de la vie
des entreprises pour crer des listes de prospects qualifis, sachant que le processus
est spcifique chaque march.
Il y a aussi TinyClues (2010, $7,37), une startup plus tablie qui utilise des solutions
de machine learning pour identifier les produits que les clients de sites de vente en
ligne sont le splus succeptibles dacheter, histoire doptimiser les campagnes marke-
ting cibles au niveau du ciblage comme des messages et des offres.
SearchXPR (2013, $2M) est une startup cre Clermont-Ferrand qui a cr le
concept de srendipit psycho-cognitive issu dune thse soutenue en 2010
par Jean-Luc Marini, lun des cofondateurs de la socit. Le concept est mis en uvre

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 289 / 362
dans la solution Oorace, destine au commerce en ligne et mme traditionnel.
Elle permet danalyser ltat desprit du consommateur et dvaluer sa rceptivit
des propositions commerciales inattendues, affichables notamment dans des
offres cibles sapparentant du retargeting publicitaire un peu moins bourrin que
celui de Criteo. Le tout sappuie sur de lanalyse syntaxique des sites visits et du
parcours du visiteur, associant algorithmes et sciences cognitives analysant les mo-
tions des utilisateurs, avec la cl une augmentation des taux dachat et du niveau
des paniers moyens. Le service est fourni sous la forme dAPIs en cloud. Reste sa-
voir si les algorithmes relvent rellement de lIA et comment ils fonctionnent. Cest
la secret sauce de la socit, vaguement documente ici. Pas forcment de lIA au
sens classique du terme, mais plutt une algorithmie bien sentie, probablement astu-
cieuse dans sa forme, qui permet dviter la force brute de nombreux solutions de
machine learning.
Dictanova (2011, $1,3M) est une socit nantaise lorigine dune solution
danalyse textuelle des feedbacks clients dans les rseaux sociaux ou sites de vente en
ligne, en liaison avec les outils de CRM pour optimiser la relation client. Les tech-
niques utilises comprennent lanalyse smantique de textes et la classification auto-
matique. La solution est fournie en cloud. Cest une autre participation dIT-
Translation.
Modizy (2012, $275K) propose un assistant dachats dans la mode bas sur un algo-
rithme dintelligence artificielle. Modizy propose aussi une place de march reliant
consommateurs et marques.
Do You Dream Up (2009) propose une solution de chat automatique pour les sites
en ligne. La socit est base Paris, Bordeaux et Londres. Et elle a dj une bonne
douzaine de clients grands comptes ayant dploy sa solution.
Tastehit (2014) utilise du machine learning et du big data pour personnaliser les sites
de e-commerce en temps rel.
CompareAgences (2012) intermdie la relation entre agents immobiliers et particu-
lier dans le cadre de la vente de biens. La startup emploie 12 personnes et gnre 200
000 visiteurs uniques par mois. 1000 agences immobilires sont intgres en France.
Le tout est base de machine learning, sans plus de prcisions.
Cypheme (2015, $1,3M) est une startup proposant une application mobile de dtec-
tion de produits contrefaits, sappuyant sur un algorithme de machine learning appli-
qu la qualification dimages. Cest une sorte de Shazam de la contrefaon.

Sant
Cest un domaine trs porteur pour les applications de lIA. Seulement, voil, nous
sommes un peu la traine dans lune de ses grandes applications : la gnomique.
Mais la sant va au-del de la gnomique, heureusement.
CardioLogs (2014) a cr une solution dinterprtation automatique des lectrocar-
diogrammes (ECG) en temps rel sappuyant sur du machine learning, dj vue dans
la rubrique sur le secteur vertical sant. Uberisation en puissance des cardiologues ?

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 290 / 362
Pas si vite ! Cela permet surtout de rendre un suivi plus rgulier des patients risques
ou atteints de maladies chroniques.
DreamUp Vision (2015) est une startup issue de Dreamquark, une startup spcialise
dans lanalyse de donnes pour la sant et les assurances. Elle propose une solution
danalyse des images de la rtine obtenues par un fond de lil traditionnel. Elle
permet de dtecter les rtinopathies diabtiques mergentes aussi bien que les oph-
talmos. Elle se situe dans un mouvement comprenant quelques autres acteurs dans le
monde qui traitent automatiquement les rsultats dimagerie mdicale. Cest ainsi le
cas dune autre startup francilienne, Qynapse qui analyse de manire itrative les r-
sultats dIRM crbrales pour suivre lvolution de traitements, notamment dans la
lutte contre les cancers du cerveau.
Dexstr.io (2014) est une startup toulousaine fournissant la solution Inquiro qui ex-
ploite les donnes mdicales non structures pour faciliter la recherche
dinformations pour les socits de pharmacie. En gros, cest de la recherche docu-
mentaire, un peu comme le font Sinequa et Antidot, mais avec un tuning adapt la
documentation scientifique dans la sant. Leur concurrent serait plutt lapplication
dIBM Watson loncologie. Cest encore une participation dIT-Translation.

Applications mtiers
Cest l que la crativit est la plus dveloppe.
Riminder (2015) est une startup spcialise dans les RH qui sappuie sur du deep
learning pour proposer des outils daide la dcision. Il aider les chercheurs demploi
construire leur parcours professionnel et les actifs dvelopper leur carrire, en ex-
ploitant une base de connaissance de plusieurs millions de parcours de cadres.
White (2015) est une startup qui permet la saisie automatique de pices comptables
pour lexpertise comptable et laudit. Loutil est capable de comprendre la structure
du document et de le traiter convenablement dans son environnement. Il va au-del
des solutions traditionnelles dOCR (optical characters recognition).
niland (2013) est une participation de IT-Translation, la structure de valorisation des
projets de recherche issus notamment de lINRIA. Elle a t cre par des anciens de
lIRCAM et sappuie sur 10 annes de travaux de recherche. Elle utilise le deep lear-
ning analysant le contenu de la musique pour rendre son exploration dans les plate-
formes de diffusion plus intelligente. Elle identifie les similarits entre morceaux
pour les classifier automatiquement. La solution sera exploite par CueSongs (UK,
une socit fonde par le chanteur Peter Gabriel) et motionelements (Singapour) qui
sont ddis aux professionnels de la musique. La solution est aussi illustre par le
service en ligne www.scarlett.fm et sappuie sur Soundcloud pour vous permettre de
crer une web radio personnalise en fonction de vos gots.
Dhatim (2008) automatise la gestion des factures et le contrle des dclarations so-
ciales avec comme premiers clients les oprateurs mobiles (pour les factures) et
dautres (pour les dclarations sociales). Dans ce dernier cas, la solution permet
dviter de gnrer des incohrences dans les dclarations sociales et les pnalits qui

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 291 / 362
vont avec les contrles qui sont eux invitables. La solution sappuie sur une combi-
naison de centaines de rgles mtiers et de machine learning qui dclenche des ac-
tions automatises.
Sline (2013), dit par la socit Evi, propose une panoplie dapplications bureau-
tiques intgrant un agent conversationnel permettant de dialoguer et poser des ques-
tions en langage naturel. On y trouve notamment un traitement de texte, un tableur,
un gestionnaire dagenda, un carnet dadresses, un gestionnaire de tches, une mdia-
thque, un logiciel de gestion de finances et un gestionnaire de messagerie instanta-
ne. Dilemme classique : faut-il recrer tout un existant complexe pour y intgrer une
nouvelle fonction ou ajouter cette fonction aux produits existants du march (Micro-
soft Office, Open Office). Question douverture, de simplicit de mise en oeuvre et
de modle conomique !
Bayes Impact (2014, $120K) est une socit originale qui veut utiliser lIA pour le
bien public et se positionne comme une ONG. Son crateur Paul Duan sest fait con-
naitre en lanant un partenariat avec Ple Emploi pour faciliter le rapprochement
entre loffre et la demande demplois.
Dans un compte-rendu sur lcosystme entrepreneurial de La Runion 224 , javais
aussi identifi quelques startups qui utilisent le machine learning : logiCells (ERP
smantique) et Teeo (analyse de consommation dnergie pour les entreprises).
Ce tour est probablement incomplet et les oublis du secteur se feront immanquable-
ment connaitre. Et dici peu de temps, lusage du machine learning et du deep lear-
ning seront aussi courants dans les startups que lappel des bases de donnes
NoSQL : une banalit !
Le top du top de la startup dIA ? Utiliser lIA dans une solution dagent conversa-
tionnel en cloud qui fait du big data sur des donnes issues de lIOT en scurisant les
transactions via des Blockchains. Le Bingo de la startup dIA est lanc !

224
Ici : http://www.oezratty.net/wordpress/2016/ecosysteme-entrepreneurial-reunion/.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 292 / 362
LIA dans la socit

Nous allons sortir ici des considrations techniques et dentreprises pour aborder la
place de lIA dans la socit et tenter de traiter quelques questions cls. Quels boule-
vesements annonce-t-elle, notamment dans le travail et lemploi ? Quelles craintes et
espoirs soulve-t-elle ? Comment la politique et lEtat sen emparent-ils ? Comment
la rglementation pourrait-elle voluer ? Quel est le rle des entreprises de ces points
de vue-l ?

Craintes sur lIA


LIA gnre-t-elle plus de craintes que les machines tisser, les chemins de fer,
laviation commerciale, lnergie nuclaire ou les OGM au moment de leur appari-
tion ? Il est difficile de comparer des poques diffrentes mais lIA est en tout cas
rentre dans le club plutt ferm des technologies qui font peur.
Une bonne part de ces peurs provient de la science fiction plus que de la science, ain-
si que des effets dannonce enjolivs la moindre avance dans le deep learning, et
une conception gomtrie variable de la notion dintelligence. On use et on abuse
trop facilement de la loi de Moore, simplifiant volont la notion mme
dintelligence humaine pour la comparer celle des machines.
Qui plus est, lIA conserve un ct magique qui permet de faire prendre des vessies
pour des lanternes de vastes audiences y compris duques. Mais, mme en tant
prudent et conservateur, on peut estimer que lIA aura un impact aussi important que
les 35 annes de vagues dinnovations numriques qui viennent de se succder. Cest
au minimum une grande vague de logiciels 2.0 qui est lance vive allure.
Une bonne part des craintes provient aussi de la propension projeter sur les robots et
lIA nos propres dfauts. La vision antropomorphique de lIA est lorigine dune
bonne partie de nos fantasmes et peurs sur lIA. Elle est justifie dans la mesure o
une bonne partie du savoir exploit par lIA est dorigine humaine. Cest en limitant
cet antropomorphisme la fois dans nos projections et dans la cration de systmes
base dIA que lon peut revenir sur un terrain de confiance vis--vis de cette dernire.

Les risques
LIA gnre une peur pour lHomme dtre dpass par ses propres crations, la peur
de perdre le contrle de son devenir, la fois intellectuel et pour la maitrise du monde
physique.
Cette peur est alimente par la perspective de voir merger dici quelques dcennies
peine une IA gnraliste quelque peu mythique (AGI = artificial general intelligence)
omnisciente, omnipotente et contrlant tout notre monde physique, et qui pourrait en
retour nous asservir.
Cette peur sappuie sur une extrapolation des capacits actuelles de lIA, une vision
un peu simpliste dune lapplication ad-vitam de la loi de Moore et surtout, sur les

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 293 / 362
mconnaissances des mcanismes de lIA. On observe ainsi que plus les prvision-
nistes de lIA ont de vritables connaissances scientifiques en IA et en neurosciences,
moins ils en ont peur. La plupart considrent mme que lAGI, tout comme la singu-
larit, sont des mythes225.
Dans des scnarios de prospective dignes des meilleures dystopies de science fiction,
la premire AGI gnrerait delle-mme une ASI (Artificial Super Intelligence) qui
prendrait le contrle de la plante et annihilerait toutes les autres AGI, physiquement,
via un contrle direct des infrastructures, ou via divers hacks . Cette anticipation
est une vue de lesprit trs centralisatrice226.
Certes, Google domine lInternet occidental avec son moteur de recherche et Face-
book domine les rsaux sociaux occidentaux mais Internet reste assez distribu en
ltat.

Comme avec lusage de nombreuses autres technologies (automobile, armes feu,


), le vrai danger est lHomme lui-mme. Cest lui qui dcide ce quil va en faire227.
LIA prsente ainsi des risques bien plus prosaques, comme toutes les technologies
numriques : dans sa scurit et dans ce quon lui demande de faire ! La scurit dun
systme dIA peut tre compromise plusieurs niveaux : dans les rseaux et le cloud,
dans les capteurs, dans lalimentation en nergie. Les bases de connaissances peuvent
aussi tre induites en erreur par linjection dinformations errones dans des images
qui visent altrer son comportement, par exemple dans le cadre dun diagnostic m-
dical complexe. On peut imaginer lapparition dans le futur danti-virus spcialiss
pour les logiciels de deep learning.

225
Exemple avec cette confrence O va nous mener dintelligence artificielle de Georges Mitaut, en dcembre 2016, ingnieur
en tlcommunications retrait, qui ressasse les lieux communs habituels sur lIA et la singularit sous forme dune revue de presse
bien slidise. Au milieu de sa prsentation et propos de Google se trouve un logo de TensorFlow. Le confrencier indique alors que
cela fait de lIA mais quil na aucune ide de la manire dont cela fonctionne ! Ce nest pas une exception ! La majorit des conf-
renciers sur lIA font de la prospective alors quils ne connaissent mme pas les mcanismes actuels de lIA et ltat de la recherche
fondamentale. Cest consternant !
226
Voir cette intressante analyse des biais cognitifs de ces prvisions alarmistes : The Seven Deadly Sins of Predicting the Future of
AI de Rodney Brooks, septembre 2017.
227
Cf Will AI kill us all after taking our jobs? de Fabio Ciucci publi en juillet 2017 ainsi que AI (Deep Learning) explained simply
publi en juin 2017.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 294 / 362
Comme le code et les logiciels rgissent de plus en plus notre vie, ce sont les rgles
quils excutent qui organisent la socit. LIA est aussi base sur des rgles (pour les
systmes experts) et sur le mimtisme des sens et comportements humains (pour le
deep learning). Comme ce qui a t expriment involontairement : si un chatbot
sentraine en discutant avec des internautes racistes, il deviendra lui-mme raciste.
Bref, lenfer, cest lHomme, pas lIA !
Les dangers potentiels dune hypothtique AGI sont surtout lis aux interactions entre
les machines lexcutant et le monde extrieur. Un robot logiciel nest pas dangereux
sil tourne dans une machine isole. Il peut le devenir sil contrle une arme de des-
truction massive ou des infrastructures stratgiques dans le monde extrieur et quil
est programm par des forces malfiques.
La capacit dbrancher une AGI est devenue un thme de recherche des plus s-
rieux. Google annonait en janvier 2016 quil travaillait sur la notion de kill
switch de lIA sans que lon en connaisse dailleurs la nature. On sait juste que ce
sont des chercheurs de DeepMind qui tudient des scnarios dinteraction entre ro-
bots et hommes dans des situations sous contrainte multiples : assurer une tche dun
ct et ragir des imprvus dautre part.
Le kill switch de lAGI qui permettrait de la dconnecter si elle devenait dange-
reuse devrait surtout porter sur sa relation avec le monde physique. Mme si les films
de science fiction tels que Transcendance rappellent que rien nest sr de ce ct l et
que la tendance tout automatiser peut fournir un trop grand contrle du monde rel
aux machines.
Nous manquons aussi de recul. LHomme est dj dpass par ses propres crations
depuis longtemps228, dabord du ct de la force physique, puis de calcul, de mmoire
et enfin de traitement. Les machines mcaniques dpassent la puissance humaine de-
puis des lustres.
Je mtonne toujours de notre capacit contruire des paquebots et porte-avions de
plus de 300 m de long et pesant de 100 000 250 000 tonnes. Un tableur compte plus
vite que nimporte quel champion de calcul mental, ce depuis 1979. Autant la capaci-
t de traitement parallle dun cerveau humain est impressionnante, autant sa capacit
de stockage est limite dans la pratique. Une simple cl USB de quelques dizaines de
Go peut contenir plus de textes que ce que nous lisons, crivons, entendons et disons
pendant toute notre vie 229! Et plus les outils numriques stockent linformation et
sont faciles interroger, moins on la retient. Les machines ont toujours t pilotes et
contrles par lHomme.

228
Et pas besoin den ajouter avec des annonces comme New AI Can Write and Rewrite Its Own Code to Increase Its Intelligence,
fvrier 2017,
229
Je me suis amus faire le calcul suivant : une personne qui vit 85 ans reprsentant 31 025 jours, pendant lesquels elle va lire 100
pages par jour, en crire 20 par jour, et parler ou couter parler pendant 8 heures par jour raison de 200 mots la minute va gnrer
ou tre expose 41 Go de donnes textuelles. Cest videmment un cas extrme. Pour les gens moins bavards, moins lecteurs et
moins producteurs, cela va tomber largement moins de 10 Go. Ce qui ne fait pas grand-chose ! Mme si cette valuation la louche
nintgre pas la mmoire visuelle et auditive.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 295 / 362
LIA est aussi anxyogne car elle peut gnrer des systmes prennes dans le temps.
Ses processus dapprentissage bnficient de la mmoire presque infinie des ma-
chines. LIA serait donc immortelle, tant que ses systmes de stockage ne dfaillent
pas. On peut se rassurer en rappelant quun disque dur peut planter tout bout de
champ au bout de cinq ans et quun disque SSD actuel ne supporte au mieux que
3000 cycles dcriture ! Mais leur remplacement robotis est tout fait possible dans
des datacenters. Enfin, les data centers ont besoin dnergie et ils sont encore rares
tre autonomes de ce point de vue-l230.
Mais les forces obscures humaines veillent au grain. Quelle sera larme de destruction
massive base dIA ?

Lautre peur, plus court terme, et que nous tudierons plus loin concerne les volu-
tions des mtiers qui soit disparairont soit deviendront bien plus productifs grce
lIA. Cest une crainte conomique et sociale plus quune crainte de perte de contrle
de lIA par lHomme.

Les pessimistes
La premire source de pessimisme est la science fiction. Si lon observe la production
cinmatographique des dernires dcennies, les dystopies prennent largement le des-
sus des utopies. Lutopique Bicentenial Man en 1999 a t un flop tandis que tous les
Terminator et son Skynet ont t des blockbusters231.
Ceci tant dit, les films racontant la vie heureuse de familles avec trois enfants sont
moins frquents que les films dhorreur ou les policiers en tout genre. Les morts
parmis les agents de la CIA dans certains films et certaines sries despionnage (Ja-
son Bourne, 24, Scandal, etc) permettraient de remplir le mur de mmorial de la
CIA !

230
Un data center aliment par sa propre centrale nuclaire serait trs dangereux. Et il nexiste pas de data centers aliments entire-
ment par des panneaux solaires photoltaques. Leurs onduleurs permettent en gnral de tenir quelques heures ou journes sans ali-
mentation lectrique.
231
Mme si on passe de la dystopie lutopie pour ce qui est du rle de ce robot partir du second film. Avec un bon robot contre un
mauvais robot, la dualit bien/mal humaine reproduite dans les machines !

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 296 / 362
Les alertes sur les risques de lIA gagnent en crdibilit et cho lorsquelles provien-
nent de personnalits scientifiques et entrepreneuriales. Lastrophysicien Stephen
Hawking nhsitait pas prophtiser en 2014 que lorsque lIA dpassera
lintelligence humaine, ce sera la dernire invention humaine, celle-ci ayant ensuite
pris entirement le pas sur lespce humaine 232! Il reprenait son compte une citation
dIrwin John Good de 1965 publie dans Speculations Concerning the First Ul-
traintelligent Machine233 selon laquelle la machine ultra-intelligente sera la dernire
invention que lhomme aura besoin de crer (ci-dessous). Pour autant, si Hawking sy
connait bien en trous noirs, il nest pas forcment spcialis en rseaux de neurones et
deep learning.

Cette thse se retrouve dcrite dans le menu dans de nombreux ouvrages, comme
ceux de Nick Bostrom dans Superintelligence, paru en 2014 ou dans Our Final In-
vention, Artificial Intelligence and the End of the Human Era de James Barrat,
paru en 2015.

232
Notamment ici : http://www.bbc.com/news/technology-30290540.
233
Trouv ici : http://www.kushima.org/is/wp-content/uploads/2015/07/Good65ultraintelligent.pdf.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 297 / 362
Ces prdictions partent du principe que lon arrivera un jour crer une machine su-
perintelligente dont la puissance croitra de manire exponentielle et qui contrlera
toutes nos destines du fait de lhyperconnexion des infrastructures physiques et des
objets de la vie courante.
Le cofondateur de Sun Microsystems, Bill Joy, avait t lun des premiers alerter
lopinion avec Why the future doesnt need us, un long texte publi en 2000 dans
Wired234, tirant la sonnette dalarme sur les dangers des progrs technologiques dans
lIA, les nanotechnologies et les biotechnologies. Ctait bien avant la fin du premier
squenage complet du gnome humain qui avait cot une fortune235.
Bill Joy tait en fait effray des perspectives avances par Ray Kurzweil quil avait
rencontr dans une confrence en 1998 et aprs avoir lu son The age of spiritual
machines, paru six ans avant The singularity is near.
Sen est suivie une grosse dcennie de calme ct alertes. Aprs Stephen Hawking en
2014, Bill Gates et Elon Musk ont repris le flambeau de Bill Joy en 2015 pour de-
mander une pause technologique et une rflexion sur les limites ne pas dpasser
avec lintelligence artificielle comme avec la robotique. Pause de quoi prcisment ?
Ce ntait pas bien clair. Peut-tre pour les rares startups bien finances qui planchent
sur lAGI comme Numenta.

234
Ici donc : http://www.wired.com/2000/04/joy-2/.
235
On y apprend dailleurs quil avait rencontr Jacques Attali et que ce dernier avait indirectement influ le cours des vnements de
Java !

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 298 / 362
Il existe mme des instituts de recherche qui planchent sur la question des risques de
lIA, tels le Center for the Study of Existential Risk de Cambridge et le Future of
Humanity Institute dOxford.

Les dangers perceptibles de lIA sont lorigine de la cration dOpenAI, une initia-
tive visant non pas crer une IA open source les grands logiciels de lIA sont dj
presque tous open source - mais surveiller et analyser ses volutions. Il sagit dune
ONG cre par Elon Musk qui veut sassurer de manire asez manichenne que lIA
fasse le bien et pas le mal. Cest une vision assez naive du fonctionnement du capita-
lisme. Si par exemple, les mthodes de recrutement se mettent utiliser de plus en
plus lanalyse automatique de personnalit via les vidos enregistres par les candi-
dats, on est dj aux limites de lthique, mais ce nest pas de lAGI qui menace
lhumanit.
OpenAI est dot de $1B de financement et doit faire de la recherche. Cest un peu
comme si une organisation patronale stait lance dans une initiative visant rendre
le capitalisme responsable236. Cest dailleurs la mission que voudraient se donner
diffrents Etats en orientant la recherche et les investissements vers de lIA respon-
sable dans la ligne de la tech for good , la technologie pour le bien de lHumanit
et pas celle qui sert la publicit cible qui est sa contrapose la plus courante.
Cest la forme que prend Partnership on AI237, une initiative et association cr en
2016 et rassemblant comme membres fondateurs un bon bout des GAFAMI : Google,
Facebook, Amazon, Microsoft et IBM. Il manquait Apple qui les a rejoints en janvier
2017. Donc, ce sont bien exactement les GAFAMI au complet ! Lassociation est
prside par Eric Horvitz, le patron de Microsoft Research et Mustafa Suleyman de
Google, le co-fondateur de DeepMind. Elle doit dbattre des questions souleves par
lIA et des meilleures pratiques adopter pour en mitiger les risques. Quand on y re-
garde de prs, cette association prend la forme dune organisation de lobbying avec
les mthodes associes : des thmatiques dfendre, lappel des experts divers,
lorganisation de dbats et un pied dans la porte des politiques pour viter des drives

236
Cf OpenAI dans Wikipedia et Why you should fear artificial intelligence paru dans TechCrunch en mars 2016.
237
Cf https://www.partnershiponai.org/.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 299 / 362
rglementaires gnant linnovation. Eric Horvitz promeut de son ct lutilisation de
lIA pour le bien de lhumanit238.
Une autre initiative associe deux fondatrices issus de Microsoft Research et Google :
ArtificialIntelligenceNow, lance mi 2016 par Kate Crawford (Microsoft Research)
et Meredith Walker (Google Open Research Group). Base New York, elle est est
focalise sur limpact de lIA sur les droits civiques, sur lemploi, les biais et la scu-
rit des infrastructures. Elle a publi un premier rapport en 2016239.
Sous des couverts de bonne gestion du principe de prcaution, ces initiatives des
GAFAMI sont analyser sous la loupe des pratiques habituelles du lobbying. Elles
visent calmer les peurs et assurer les pouvoirs publics quune autorgulation de
lIA est possible par les acteurs de lindustrie. Cela vise surtout viter que ces der-
niers simmiscent dans la stratgie de ces grands acteurs. Et dans le cas o il viendrait
lide des pouvoirs publics de rguler lIA dune manire ou dune autre, dtre prt
avec des propositions compatibles avec leurs stratgies. Cest de bonne guerre mais il
ne faut pas tre dupes !
Enfin, Elon Musk a aussi lanc fin 2016 sa startup Neuralink dont lobjectif est de
relier lIA lhomme pour viter den perdre le contrle240, via des nano-lectrodes
directement implantes dans le cerveau et capables dactiver slectivement les neu-
rones.
Dans la pratique, ce projet est loin de pouvoir tenir ce genre de promesses. Il servira
probablement surtout amliorer ltat de lart du traitement de certaines pathologies
neurodgnratives diverses, qui ne ncessitent pas dagir au niveau de neurones in-
dividuels241. Et quand bien mme le systme fonctionnerait, il rendrait lhomme vul-
nrable au hacking dune IA pirate par dautres hommes mal intentionns ! Cest
donc une solution tout fait bancale.

Les optimistes
Les optimistes semblent moins nombreux. On y trouve bien videmment les singula-
ristes dont le pape actuel, Ray Kurzweil, anticipe lmergence dune AGI autour de

238
Cf son support de prsentation, bien document dtudes de cas dusages positifs de lIA : AI in Support of People and Society,
juin 2016, 81 slides.
239
Cf The AI Now Report - The Social and Economic Implications of Artificial Intelligence Technologies in the Near-Term, A
summary of the AI Now public symposium, hosted by the White House and New York Universitys Information Law Institute, juillet
2016.
240
Lide est inspire des neural laces de lauteur de science fiction Iain M. Banks. Cf The novelist who inspired Elson Musk If you
want to understand where society is heading, read the novels of Iain M. Banks, Silicon Valleys favourite author, de Tim Cross, mars
2017.
241
On peut aussi imaginer des solutions visant activer les neurones de lhippocampe qui est une sorte de gatekeeper de la mmoire.
Cest lui qui transfre la mmoire court terme au sein du cerveau limbique vers la mmoire long terme du cortex en priphrie du
cerveau.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 300 / 362
2030-2040242 en nous promettant monts et merveilles qui peuvent nous encourager
procrastiner sur la rsolution des problmes daujourdhui (rchauffement climatique,
surpopulation, ingalits, ).
Pour le sceptique clair Piero Scaruffi, nous sommes tiraills entre deux extrmes
de science-fiction avec des pessimistes qui pensent que lIA va tous nous tuer et des
singularistes qui estiment quelle va nous rendre immortels.
Au milieu de lchuiquier des optimistes se situent des personnalits telles que Mark
Zuckerberg qui estime que lHomme sera raisonnable dans ses usages de lIA243 et
puis Ginni Rometti dIBM qui recommande de ne pas avoir peur des robots 244 .
Dautres comme Sarah Kessler prvoient que la transformation des mtiers gnrera
un nouvel quilibre, pas forcment moins bon que lactuel, et quil ny a pas lieu de
sinquiter245.
Les optimistes sont aussi souvent les vritables spcialistes de lIA qui voient de prs
lingratitude de la discipline et estiment en gnral que lon est trs loign de lAGI
et de lASI. La plupart des auteurs qui prdisent une ASI ne sont en effet pas des sp-
cialistes de lIA246 !
Le principal moyen de sen loigner est de faire la distinction entre lassociation de
lintelligence humaine avec sa chair et ses sens, et nimporte quelle forme
dintelligence intgre dans une machine dnoue de cette chair et de ces sens.
Lun des cueils principaux des prvisions pessimistes est leur anthropomorphisme247,
tourn dans le mauvais sens 248 ! Le deep learning exploite souvent de lexpertise
dorigine humaine, dans DeepMind AlphaGo aussi bien que dans les systmes de re-
connaissance dimage en imagerie mdicale, Il en va de mme pour IBM Watson en

242
Ray Kurzweil est prsent selon les circonstances comme le directeur de la recherche de Google, son patron de la R&D en IA,
directeur de lengineering quand ce nest pas chief futurist . Alors que les deux principales quipes dIA de Google, Google Brain
chez Google X et celle de DeepMind ne dpendent pas de Kurzweil. Il na rien produit ou annonc depuis son arrive chez Google en
2012. On sait juste quil planche sur le traitement du langage avec une quipe dune vingtaine de personnes, comparer aux 300
personnes qui travaillent chez DeepMind. Il travaillerait la cration dun chatbot qui rpondrait autoamtiquement nos emails
notre place. Cf What is Ray Kurzweil up to at Google ? Writing your emails, fvrier 2017. Il a fait une apparition au CEBIT 2017 o
il a pass le plus clair de son temps rappeler les effets de la loi de Moore et de ses dclinaisons dans dautres domaines. Et
dvoquer quelques avances dans la comprhension du fonctionnement du cerveau. On a surtout pu remarquer quil a maintenant
une chevelure de quadra alors quil tait quasiment chauve avant. Grce aux plus de cent pillules quil prend chaque jour depuis des
annes pour prolonger sa dure de vie, une greffe ou une perruque ?
243
Cf Intelligence artificielle : Zuckerberg (Facebook) na pas peur, dans ZDNet, fvrier 2016.
244
Cf At Davos, IBM CEO Ginni Rometty Downplays Fears of a Robot Takeover de Claire Zillman dans Fortune, janvier 2017.
245
Cf The optimists guide to the robot apocalypse de Sarah Kessler, mars 2017.
246
Mais la situation sinverse entre Elon Musk (pessimiste) et Mark Zuckerberg (optimiste) lorsque le premier accuse le seccond
dignorance sur lIA. Et on revient au point initial lorsque le roboticien Rodney Brooks contredit Elon Musk. Dans This famous
roboticist doesnt think Elon Musk understands AI, TechCrunch, juillet 2017.
247
Comme cette petite tribune de Stphane Mallard, Digital Evangelist, comme quoi lIA sera capable de tout faire et dtre crative.
LIA, plus crative que lHomme ?, dans lADN, avril 2017. Et on se fait avoir rgulirement par lIA ! Cf Artificial Intelligence
Has Become Meaningless de Ian Bogost dans The Atlantic, mars 2017.
248
Encore une savoureuse citation de Piero Scaruffi : In private conversations about "machine intelligence" i like to quip that it is
not intelligent to talk about intelligent machines: whatever they do is not what we do, and, therefore, is neither "intelligent" nor
"stupid" (attributes invented to define human behavior). Talking about the intelligence of a machine is like talking about the leaves of
a person: trees have leaves, people don't. "Intelligence" and "stupidity" are not properties of machines: they are properties of hu-
mans. Machines don't think, they do something else. Machine intelligence is as much an oxymoron as human furniture. Machines
have a life of their own, but that "life" is not human life..

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 301 / 362
cancrologie qui exploite la littrature scientifique dorigine humaine sur le sujet.
LIA applique une force brute sur une vaste base de donnes dintelligence humaine.
Lapprentissage supervis fonctionne par imitation et utilise des tags dorigine hu-
maine. Et lapprentissage non supervis, comme dans les premires phases des r-
seaux de neurones convolutionnels exploite en bout de course de lappentissage su-
pervis. Idem pour les modles gnratifs qui appliquent des styles dorigine humaine
divers contenus. La soi-disante crativit des rseaux de neurone gnratifs
sappuie toujours sur la crativit dorigine humaine quelle ne fait que rpliquer ma-
chinalement et de manire prdictible !
Bref, en matire dintelligence, lIA imite le plus souvent celle de lhomme quelle
met en forme et peut grer en masse quelle nen gnre ex-nihilo.
Pour scarter de cet antrophomorphisme, on peut adopter la posture de Kevin Kelly,
auteur du best seller The inevitable , et qui considre que lIA doit tre considre
comme alien 249. On peut aussi couter les envoles lyriques du philosophe Grady
Booch qui explique pourquoi il ne faut pas avoir peur de lIA (vido), que lHomme
entrainera ne pas lui nuire.
De son ct, le chercheur franais Jean-Gabriel Ganascia, auteur du Mythe de la
singularit (2016) dnonce avec justesse la construction de mythes autour de lIA et
de la singularit250.
On peut aussi samuser de la crdulit de ceux qui ont aval la cration de Rocket
AI (2016), une startup dveloppant un rseau de neurones rappelant ceux de Numen-
ta et baptis Temporal Recurrent Optimal Learning (TROL). Il sagissait dune
grosse blague de potaches de lIA 251 soulignant la crdulit de lcosystme de
linnovation.
Autre mthode, se rassurer une fois encore avec les crits de Piero Scaruffi252. Ce
dernier cherche dmontrer que la singularit nest pas pour demain. Il sappuie pour
cela sur une vision historique critique des volutions de lintelligence artificielle. Il
pense que les progrs de lIA proviennent surtout de laugmentation de la puissance
des machines, et bien peu des algorithmes (ce qui serait nuancer). Il relativise les
performances actuelles de lIA, montes en pingle par les entreprises, les experts et
les mdias.

249
Cf Le mythe de lIA surhumaine de Rmi Sussan, mai 2017. Kevin Kelly dcrit cela lui-mme dans Wired en avril 2017 : The
myth of a superhuman AI.
250
Cf Technologie : peut-on se dfaire des promesses et des mythes ?, une excellente revue de lecture de louvrage de Jean-Gabriel
Ganascia ainsi que de louvrage collectif Pourquoi tant de promesses dirig par Marc Audtat, par Hubert Guillaud, juin 2017.
251
Cf Rocket AI: 2016s Most Notorious AI Launch and the Problem with AI Hype, dcembre 2016. Le site de Rocket AI nest
dailleurs pas moins document que celui de nombreuses startups de lIA.
252
Comme Demystifying Machine Intelligence.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 302 / 362
Selon lui, lHomme a toujours cherch une source dintelligence suprieure, quil
sagisse de Dieux multiples ou unique, de Saints ou dextra-terrestres. La singularit
et les fantasmes autour de lIA seraient lincarnation dune nouvelle forme de
croyance voire mme de religion, une thse aussi partage par Jaron Lanier, un auteur
anticonformiste qui publiait Singularity is a religion just for digital geeks en
2010253.
Piero Scaruffi prend aussi la singularit lenvers en avanant que lordinateur pour-
ra fort bien dpasser lHomme ct intelligence parce que les technologies rendent
Homo Sapiens plus bte254, en le dchargeant de plus en plus de fonctions intellec-
tuelles, la mmoire en premier et le raisonnement en second !
Selon lui, le fait que les mdias numriques entrainent les jeunes lire de moins en
moins de textes longs rduirait leur capacit raisonner. A tel point quil devient im-
possible dexpliquer les effets de la baisse dattention du fait de cette dernire255 !
On peut dailleurs le constater dans les dbats politiques qui vitent la pense com-
plexe et privilgient les simplismes outrance. Jaime bien cet adage selon lequel
lintelligence artificielle se dfinit comme tant le contraire de la btise naturelle.
Cette dernire est souvent confondante et rend le dfi de la cration dune intelligence
artificielle pas si insurmontable que cela dans un bon nombre de domaines.

253
Ici : http://bigthink.com/devils-advocate/singularity-is-a-religion-just-for-digital-geeks.
254
Thse partage par Daniel C. Dennett, pour qui le vritable danger nest pas dans les machines plus intelligentes que lhomme
mais plutt dans le laisser-aller de ce dernier qui abandonne son libre arbitre et confie trop de comptences et dautorit des ma-
chines qui ne lui sont pas suprieures.
255
I am worried that people's attention span is becoming so short that it will soon be impossible to explain the consequences of a
short attention span. I don't see an acceleration in what machines can do, but i do see a deceleration in human attention if not in
human intelligence in general, dans Intelligence is not artificial.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 303 / 362
Pour Piero Scaruffi, en tout cas, lintelligence artificielle est dailleurs une mauvaise
expression. Il prfre voquer la notion dintelligence non humaine. Une bonne ap-
proche qui souligne la complmentarit de lIA et des Hommes.
Il pense aussi quune autre forme dintelligence artificielle pourrait merger : celle
dhommes dont on aura modifi lADN pour rendre leur cerveau plus efficace. Cest
un projet du monde rel, poursuivi en Chine o sont squencs des milliers dADN
humains pour identifier les gnes de lintelligence ! Histoire de raliser une (toute
petite) partie des fantasmes dlirants du film Lucy de Luc Besson !

Lintelligence humaine cumule la capacit crer des thories expliquant le fonc-


tionnement physique du monde et mener des expriences permettant ensuite de les
vrifier. Parfois, cette vrification stale sur un demi-sicle un sicle, comme pour
les ondes gravitationnelles ou lexistence du boson de Higgs. Cette capacit de tho-
risation et dexprimentation de long terme nest pour linstant pas accessible une
machine, quelle quelle soit. Les machines ne se posent pas encore de questions exis-
tentielles sur leur relation au monde qui les entoure.

Transformation des mtiers par lIA


Prenons maintenant un peu de recul sur la robotisation en marche des mtiers lie aux
avances de lintelligence artificielle vues jusqu prsent. Cette robotisation na pas
besoin dAGI ou de singularit pour se poursuivre.

Prvisions de destruction demplois


Elles sont plus quabondantes ! On y trouve aussi bien de sombres prophties sur le
rle mme de lHomme dans lconomie que des prvisions plus optimistes, croyant
fermement la destruction-cration de valeur schumptrienne quilibre positif.
La destruction nette demplois lie lIA lhorizon 2023-2015 se situe selon les
tudes entre 6%256 47%257, avec des prvisions qui suivent une tendance baissire,

256
7% pour lOCDE : OCDE et emplois automatisables, 7%. Dans The Risk of Automation for Jobs in OECD Countries, mai 2016.
257
Cf http://www.liberation.fr/evenements-libe/2016/05/09/dans-20-ans-plus-de-60-des-metiers-sont-amenes-a-disparaitre_1451563.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 304 / 362
la principale prvision de 47% datant de 2013258 et celles de 6% 7% datant de 2016
Ca donne une belle marge derreur et de manuvre !

Cela illustre que les tendances lourdes sur le march de lemploi, si elles auront bien
lieu, interviendront un peu plus tard. Pour que tel ou tel emploi disparaisse dici 5 ans,
il faudrait que les technologies correspondantes soient disponibles aujourdhui
compte-tenu de linertie du march, des parties prenantes, des budgets et des d-
ploiements. Si elles ne sont pas encore disponibles, il faudra alors attendre plus de 5
ans pour quelles aient un impact sur lemploi ! Or nombre de prvisions sappuient
sur des technologies qui ne sont pas encore disponibles, mme en amont de la R&D.
Lconomiste John Maynard Keynes se faisait dj lcho des risques de pertes
demploi lies lautomatisation en 1933, avant mme que les ordinateurs fassent
leur apparition. Les premires prdictions sur les pertes demploi lies lIA sont ar-
rives dans les annes 1960. Au dmarrage des prcdentes rvolutions industrielles,
les mtiers disparus comme les nouveaux mtiers ont rarement t bien anticips.
Pour ce qui est du futur, vrai dire, on nen sait pas grand chose.
La principale leon retenir des prvisions du pass est de conserver un peu
dhumilit ! On peut cependant faire quelques hypothses. Elles sont notamment
utiles pour mener certaines politiques publiques, dans lducation comme dans les
choix de dveloppement infrastructures et de politique industrielle.

258
Ltude 50% est anglaise : The Future of Employment: How susceptible are jobs to computerisation? Publie en 2013, elle
segmente avec plus de prcisions que la moyenne les mtiers et leurs risques dtre remplacs par des machines. Le calcul du risque
sappuie sur trois formes dintelligence cls des mtiers : lintelligence motrice (perception et manipulations), lintelligence crative
et lintelligence sociale. On y constate que la situation est trs polarise : il y a dun ct des mtiers trs faible risque
dautomatisation (<20%) comme les fonctions de management, dans la finance, dans le numrique, lducation et mme la sant, et
de lautre, des mtiers trs fort rique dautomatisation (>60%) et surtout dans les services, la vente et ladministratif.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 305 / 362
Aujourdhui, sont en ligne de mire prioritaire de transformation ou remplacement par
les technologies numriques et par lIA :
Les mtiers du pass : les ouvriers de lignes dassemblage (dj remplacs par
des robots), les caissiers (remplacs en partie par des automates de self-service) et
les centres dappels de taxis (remplacs par des applications mobiles et de la
commande vocale).
Les mtiers en train dtre automatiss : surtout les conducteurs professionnels,
qui seront remplacs moyen terme par des vhicules conduite autonome, suivis
de nombreux mtiers de services, notamment dans les professions librales admi-
nistratives et dans la finance qui est de plus en plus automatise259. Cela concerne
aussi les mtiers de loffshore comme les sous-traitants en Inde de processus
dentreprises qui pourraient tre automatiss par les techniques de Robotic Process
Automation que nous avions voques dans la rubrique sur ce vertical260.

259
Cf How my research in AI put my dad out of a job And what we are doing with the French government to prevent other people
from losing theirs de Rand Hindi, fondateur de Snips.ai. Mai 2017.
260
Cf Introduction to Robotic Process Automation, a primer, de l'IRPA, Institute for Robotic Process Automation

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 306 / 362
Les mtiers qui seront automatiss plus tard, totalement ou partiellement
comme dans la sant, le management, laudit et mme dans la recherche261. Cer-
tains prospectivistes vont jusqu prvoir que le mtier de dveloppeur va lui-
mme tre automatis, ce quoi je ne souscris pas262.

La principale erreur dapprciation de ces prvisions est quelles confondent mtiers


et tches. LIA peut parfois automatiser certaines des dernires mais pas les mtiers
en entier. Cest le cas dun cancrologue ou dun ophtalmologue qui pourra bnfi-
cier de lapport de systmes dimagerie exploitant de la vision artificielle, mais qui
auront toujours un rle dintgrateur des sources dinformation sur le patient, des trai-
tements et de la relation avec le patient dans la dure.

261
Cf Les prochains paradigmes dexploration scientifique seront peupls dIntelligences Artificielles, dabord assistantes, elles de-
viendront collaboratrices, puis chercheuses dAymeric Poulain Maubant, octobre 2016.
262
Ce mtier va voluer comme il a volu sur 50 ans, avec des transformations profondes, des diffrences accrues entre les dvelop-
peurs de solutions utilisateurs assemblant des briques prexistantes et ceux qui les crent. Au mme titre quaujourdhui, la comp-
tence pour faire voluer le noyau de Linux nest pas la mme que pour crer un site en Wordpress avec des templates et des plugins.
Il ny a pas dautomatisation du mtier, mais plutt une stratification entre couches hautes et basses requrant des niveaux de
comptences diffrentes.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 307 / 362
Il faut aussi intgrer la dimension macro-conomique. Sont automatisables en priorit
les mtiers pratiqus de manire homogne sur des marchs larges, qui sont faciles
dcrire et automatiser, o les ressources humaines sont soit rares soit trop chres, soit
au mauvais endroit, avec des startups finances dans leur secteur et une rglementa-
tion favorable aux innovateurs, ce qui nest pas le cas partout. Cela cr un filtre qui
chappe de nombreuses prvisions.
Une analyse sur limpact de la robotisation sur les emplois devrait porter sur leur
structure. Les mtiers sont trs divers et fragments. Rien que dans la sant, on trouve
des dizaines de types demplois et spcialits diffrentes. Il en va de mme dans les
services. Les startups sattaquent en gnral en priorit des cibles la fois faciles et
volumineuses, l o lon peut gnrer une croissance exponentielle et de belles co-
nomies dchelle au niveau mondial. Les kinsithrapeutes seront-ils remplacs par
des robots bipdes ? Probablement moins rapidement que les conducteurs de camions
car ils sont moins nombreux, donc ne prsentant pas les mmes conomies dchelle
potentielles ! Et lautomatisation du travail dun kin est plus complexe que celle
dun conducteur de camion.
Par contre, nombre de mtiers sont relativement protgs : ceux qui sont trs manuels
et difficiles raliser par des robots, les mtiers cratifs et motionnels 263, ceux dont
les tches ne sont pas rptitives, ceux qui ncessitent des sens trs pointus. Et puis
bien sr, ceux qui seront crs entre temps. Le monde des loisirs et du futile est assez
prolixe de ce point de vue-l. Si lon observe les nouveaux mtiers crs depuis la fin
de la seconde guerrre mondiale, ils sont dominants dans ces catgories (tourisme,
transports, mdias, publicit, services divers, boutiques de tatouages, etc).
Il faut aussi adopter une vue globale des mtiers. Certes, certains mtiers seront de
plus en plus automatiss ou rendus plus efficaces via lautomatisation. Dans le cas
des mdecins, lautomatisation ne rduira pas forcment lemploi car le monde
manque de mdecins et notamment dans de nombreuses spcialits comme en oph-
talmologie, en cardiologie ou en diabtologie. Les cancrologues ne sont pas non plus
remplacs par IBM Watson. Ce dernier leur permet daffiner leur diagnostic, leur
prescription, et de les rendre plus personnaliss. Le mtier de cancrologue est plus
menac par les progrs en mdecine prdictive et en immunothrapies que par lIA.
A beaucoup plus long terme, les technologies permettant la prolongation de la vie en
bonne sant pourraient cependant rduire le besoin en nombre de mdecins, surtout si
les maladies dites de longue dure sont radiques, cancers, diabtes et maladies neu-
rodgnratives en premier. Certains actes de chirurgie seront aussi de plus en plus
raliss par des robots264. Des phnomnes de vases communicants peuvent intervenir.
Telle disparition entrane la cration demploi dans des secteurs connexes voire enti-
rement diffrents des mtiers disparus.

263
Apporter de lamour en plus de lIA ! Cf A blueprint for coexistence with artificial intelligence de Kai-Fu Lee, juillet 2017.
264
Exemple : http://www.engadget.com/2016/05/04/autonomous-robot-surgery/.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 308 / 362
Les prvisions saccrochent trop souvent notre vision actuelle des mtiers, sans an-
ticiper la cration de mtiers inconnus aujourdhui, notamment dans le domaine de
lmotionnel et des loisirs. On voit cela dans le rapport Artificial Intelligence and
Robotics and Their Impact on the Workplace265 qui voque comme mtiers du
futur, les data scientists266, les mtiers de cratifs, les freelances et les mtiers ma-
nuels dont les services la personne. Cest aussi lapproche de lconomiste franais
Nicolas Bouzou267, adepte de la prise de recul historique sur les craintes de destruc-
tion de lemploi pour nous rassurer.
Les prospectivistes ne sont dailleurs pas tous daccord sur le sort qui sera rserv au
mtier denseignant et de docteur. Certains les voient entirement remplacs par des
robots et de lIA, dautres au contraire, non, car la relation avec les lves et les pa-
tients devra rester humaine. Cest une question de perspective sur les aspirations hu-
maines ! Or, si lautomatisation des mtiers libre du temps et que le pouvoir dachat
des classes moyennes ne passe pas la trappe (hypothse), alors, elle fera merger
de nouveaux besoins.
Ensuite, on se trompe souvent sur le terme et mme la nature des chamboulements.
Surestims court terme, sous-estims long terme, mais surtout mal apprhends
dans leur ralit technique et conomique.
Ainsi, dans Les robots veulent dj nous piquer notre job268 dEmmanuel Ghes-
quier qui commente une tude dun certain Moshe Vardi de lUniversit Rice du
Texas, il est indiqu que l on a pu voir avec les robots Pepper que certains robots
pouvaient donner des conseils de gastronomie ou dnologie dans les supermarchs
Carrefour ou quune boutique de tlphonie allait fonctionner 100% avec des em-
ploys robotiss au Japon.
Lauteur qui relaie cela na pas du voir Pepper luvre car, au stade actuel de son
dveloppement, il est encore plus que brouillon ! Javais mme pu le constayer en
2014 dans une boutique Softbank dans le quartier Omotesando 269 o ils commen-
aient tre dploys. Et ce nest pas mieux dans toutes les dmonstrations que lon
peut voir de ce robot dans diffrents salons professionnels.

265
Artificial Intelligence and Robotics and Their Impact on the Workplace produit par lIinternational Bar Association Global Em-
ployment Institute en avril 2017, 120 pages.
266
Ce qui constitue une vision trs rductrice des mtiers techniques ncessaires pour faire tourner de lIA !
267
Noramment dans Le travail est lavenir de lHomme , 2017.
268
Cf http://www.presse-citron.net/les-robots-veulent-deja-vous-piquer-votre-job/.
269
Mes photos du robot Pepper dans la boutique Softbank de Tokyo en 2014 sont ici :
http://www.oezratty.net/wordpress/photos/?ws=geECJj.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 309 / 362
Les robots Pepper et Romeo d'Aldebaran Robotics (groupe Softbank) en apparente discussion, pendant l'vnement des
10 ans de Cap Digital Paris fin mars 2016. En fait, ils ne discutent pas vraiment. Et un shutdown avait bloqu le pre-
mier pendant de longues minutes. Work still in progress !

En y regardant de prs, ltude en question est un article publi dans The Conversa-
tion, Are robots taking our jobs270. Il a bien du mal faire le tri dans les volutions
de lemploi aux USA entre ce qui provient de lautomatisation, de la globalisation et
de la concurrence asiatique dans lindustrie manufacturire et mme indienne, dans
les emplois concernant les services informatiques. Lemploi a surtout migr gogra-
phiquement. Les emplois de perdus dans lindustrie aux USA et en Europe se sont
retrouvs en Asie. Cest le monde plat de Thomas Friedman.
Autre exemple lgrement exagr : celui du fonds dinvestissement Deep
Knowledge Venture de Hong Kong et Londres qui a nomm en 2014 un logiciel
dintelligence artificielle son board, dnomm VITAL271 ! Il devait servir identi-
fier les projets les plus prometteurs dans la sant, lune des spcialits de ce fonds
couvrant aussi le big data, les fintechs et lIA en gnral. Evidemment, le relai de
cette annonce a donn lieu quelques exagrations : le logiciel est ainsi facilement
pass de membre du board CEO de lentreprise272. On nest plus une exagration
prs pour forcer le trait ! Mais cest comme si on disait que Excel est la tte des en-
treprises, ce qui nest dailleurs pas si faux que cela dans pas mal de cas dun point de
vue symbolique ! Au passage, on ne peut que nommer des personnes physiques dans
ces rles-l, mme Hong Kong 273! Les effets dannonces de ce genre sont rarement
suivis de preuves et retours dexprience ! On peut par contre observer la rcursivit
du modle. Le fonds a en effet investi dans Transplanetary, une startup spcialise
dans la recommandation dinvestissements dans les industries spatiales, avec son lo-
giciel SPOCK (Space Program Ontologically Computed Knowledge)274.
En tout cas, il ne sera pas ncessaire datteindre un quelconque point de singularit o
lintelligence de la machine dpasserait lhomme pour que les tsunamis de lemploi

270
Cf https://theconversation.com/are-robots-taking-our-jobs-56537.
271
Cf http://www.itbusiness.ca/blog/hong-kong-vc-firm-appoints-ai-to-board-of-directors/48815.
272
Ici donc : https://humanoides.fr/2014/05/une-intelligence-artificielle-a-la-tete-dune-entreprise/.
273
Cf https://en.wikipedia.org/wiki/Deep_Knowledge_Ventures.
274
Mais le site de Transplanetary ne fonctionne pas et la startup na pas de fiche dans la Crunchbase.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 310 / 362
se produisent. Ils peuvent intervenir bien avant ! Et pour cause : bien des mtiers
dexcution relvent de tches trs rptitives qui sont sujettes laugmentation de
lautomatisation dans un premier temps, sans passer par la case de lAGI,
lintelligence artificielle gnrale, celle qui remplacerait totalement lintelligence
humaine, puis la dpasserait rapidement par la force dmultiplicatrice des machines.
Les tudes de cas mises en avant dans les ouvrages sur le futur de lemploi collent
souvent lactualit marketing du secteur de lIA. Les livres parus aprs 2011 com-
mencent presque tous par voquer la victoire dIBM Watson dans Jeopardy. A partir
de 2013, ils passent aux prescriptions en cancrologie, lune des applications com-
merciales de Watson. Depuis environ 2011, nous avons droit aux Google Car et
autres avances dans la conduite automatique. En 2016, ce sont les agents conversa-
tionnels (chatbots) qui sont devenus dactualit, du fait de divers lancements comme
dans Facebook Messenger.
En quelques annes, les tudes de cas brandies en trophes peuvent perdre de leur
substance. Il a t fait beaucoup de cas de la dcision du Tawanais Foxconn en 2011
de dployer un million de robots pour remplacer leurs travailleurs de ses usines en
Chine qui demandaient des augmentations de salaire ou se suicidaient. Quatre ans
plus tard, seulement 50000 robots avaient t dploys275, ce qui ne prsage rien de
leur capacit raliser lobjectif annonc mais illustre la difficult robotiser certains
mtiers manuels, mme rptitifs.
Dans cette abondante littrature sur le futur de lemploi, les fondements scientifiques
et technologiques des prdictions sont rarement analyss. Sy mlent allgrement la
science-fiction, la science et la fiction.
Dans le top de lexagration technique, nous avons par exemple Tomorrowland de
Steven Kotler (2015), qui prdit monts et merveilles singularistes allant de
lintelligence artificielle gnrale (AGI) autorplicable jusquau tlchargement des
cerveaux dans un ordinateur : Yet it is worth noting that Moores Law states that
computers double in power every twelve months []. Biotechnology, meanwhile, the
field where mind uploading most squarely sits, is currently progressing at five times
the speed of Moores Law. [] people alive today will live long enough to see their
selves stored in silicon and thus, by extension, see themselves live forever.. Nous
avons donc une loi de Moore deux fois plus rapide dans les processeurs que dans la
vraie vie (12 vs 24 mois) et des biotechnologies qui voluent cinq fois plus rapide-
ment que la loi de Moore, alors que cette vitesse ne concerne que le cas particulier de
lvolution du cot du squenage de lADN, observe sur la priode courte 2007-
2011. Evolution qui sest plutt calme les 5 annes suivantes 276!
Ces livres oublient un autre phnomne induit par le numrique : le transfert du tra-
vail non pas seulement vers les machines mais aussi vers les clients, que lon observe
avec les distributeurs automatiques et caisses automatiques, le e-commerce, la SDA

275
Cf http://www.generation-nt.com/foxconn-foxbot-robot-assemblage-humain-actualite-1914702.html.
276
Cf http://www.oezratty.net/wordpress/2015/derive-exponentielles-3/.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 311 / 362
(slection directe larrive) des centres dappels, les chatbots (qui peuvent nous
rendre aussi rapidement fous que les SDA), les banques et les assurances en ligne.
Comme la valeur conomique du temps des gens faible revenu est faible, elle est
absorbe en change de services en thorie plus rapides277. Cest un principe gale-
ment courant dans lconomie collaborative, quelle concerne les professionnels (cas
dUber, version VTC) ou les particuliers (Blablacar, Aibnb).
Du ct de la vision macro-conomique, la majorit de ces ouvrages ont une fcheuse
tendance se focaliser sur la situation aux USA et ne pas adopter une approche
mondiale du problme. Ils nvoquent pas non plus des fonctionnaires qui sont sou-
vent les derniers a tre robotiss car protgs par la lenteur de linnovation dans les
administrations et le manque de courage politique.
Ces livres font aussi peu de cas de prdictions sur le devenir du systme financier. Ils
indiquent quil est lorigine de la concentration de la richesse sur les plus fortuns,
quil dtourne la valeur ajoute des salaires vers le capital, et quil pousse
lautomatisation, faisant courir lconomie sa perte. Et pourtant, le systme finan-
cier est bas sur un point cl, bien mis en avant par Yuval Harari dans lexcellent Sa-
piens qui relate de manire trs synthtique les dynamiques de lhistoire de
lhumanit : le systme financier, surtout celui des prts, repose sur la confiance dans
le futur. Cette confiance est la cl de vote du capitalisme et du systme financier. Or
cette confiance est en train de seffondrer pour tout un tas de raisons (emploi, dette,
environnement, ). Cela se retrouve dans les faibles taux dintrts actuellement pra-
tiqus. Si la robotisation met genoux le systme financier et lconomie derrire,
des freins naturels se mettront peut-tre en place. Ou pas, car le pire est toujours pro-
bable !
Autre manque de prdiction : limpact des progrs issus de lIA sur la dmographie !
Si la dure de vie sallonge et le confort samliore, la dmographie pourrait voir sa
croissance ralentir, comme cest le cas au Japon isolationniste depuis quelques d-
cennies. Dans la ralit, elle restera ingale. Les technologies issues de lIA ne se d-
ploient pas la mme vitesse selon les continents et rien ne dit quelles radiqueront
les ingalits sur lensemble de la plante, surtout si le moteur de leur dploiement est
hautement capitalistique278.
Dailleurs, la majorit des tudes sur limpact de lIA sur le futur de lemploi ne
sintressent quaux pays dvelopps. Limpact de lIA sur les pays mergents est
rarement abord et il pourrait tre encore plus sombre que pour les classes moyennes
des pays dvelopps. En effet, si la robotisation se poursuit dans lindustrie, elle sup-
primera des mtiers dexcution dans les pays mergents et transfrera, dans une

277
Le service nest pas vraiment plus rapide mais on conomise le temps de transport vers un point de service ou de vente.
278
Dans The Demographics of Stagnation - Why People Matter for Economic Growth de Ruchir Sharma dans Foreign Affairs,
march-april 2016 selon qui la robotisation arrive temps pour acompagner la baisse de la dmographie dans les pays dvelopps. Le
Japon est un bon exemple : il cherche produire des robots pour prendre en charge les personnes ges car il ny a pas assez de
jeunes (ou dimmigrs) pour sen occuper. Il y a moins de jeunes qui arrivent sur le march du travail avec un effet retard de 18-22
ans sur cette baisse dmographique. Larticle ne le dit pas, mais la France a la particularit davoir une meilleure natalit quailleurs
en Europe. Mais ne la transforme pas pour autant en croissance et en emplois contrairement de nombreux autres pays. Donc, la
France est potentiellement plus vulnrable que dautres pays la robotisation des mtiers.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 312 / 362
moindre mesure, de la valeur vers les pays dvelopps, y compris ceux dAsie (Core,
Japon, Tawan et une partie de la Chine). Lautomatisation des processus administra-
tifs impactera de son ct les mtiers de loffshore, notamment en Inde.
La Ludditisation des mtiers nest gnralement pas voque par les prvisionnistes,
du nom des Luddites qui rsistrent au dbut du 19 ime sicle contre le dveloppement
des machines tisser au Royaume-Uni. Tandis que la Reine Elisabeth I avait refus
loctroi dun brevet William Lee en 1589, aprs son invention de la machine tisser
les bas, craignant de gnrer du chmage chez les ouvriers textiles, le gouvernement
de sa Majest avait dcid denvoyer la troupe contre les ouvriers rcalcitrants au
progrs, entre 1806 et 1811. Un gouvernement lu par un parlement domin par des
entrepreneurs ! Quelles forces pourraient rsister lautomatisation des mtiers ?
Certains mtiers ont-ils une meilleure capacit de rsistance que dautres, notamment
par la voie de la rglementation ? Nous avons peu dexemples rsilients dans le
temps !
Les optimistes de linnovation estiment que, grce lIA, lHomme sera capable de
rsoudre tous ces problmes, presque dun coup de baguette magique. En exagrant
un peu, lIA est devenue en quelque sorte la solution de sous-traitance ultime des so-
cits procrastinatrices et des fainants : ne nous attaquons pas aux problmes qui
fchent et attendons que lIA et la robotique fassent le boulot notre place ! Cen est
presque un loge du laisser-aller.

Deux ouvrages intressants traitent assez bien de ces questions : The beginning of
infinity de David Deutsch, qui dfend un point de vue selon lequel linfini et
linnovation sont intimement lis et quil ne faut pas de mettre des barrires notre
capacit dinnovation. Et puis The infinite resource de Ramez Naam qui fait un bi-
lan circonstanci des dfis qui se prsentent pour grer les ressources en apparence
limites de la plante ct nergie, agriculture et matires premire. Il quilibre bien
ces difficults et les progrs techniques venir qui permettront de les contourner.

Autres lectures et points de vue


Cette revue ditoriale sur la robotisation des mtiers et le futur des emplois nest pas
termine.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 313 / 362
Rise of the robots and the threat of a jobless future (2016) de Martin Ford est un
ouvrage bien document qui voque un bon nombre des mcanismes macro-
conomiques des prcdentes rvolutions et crises industrielles, et de ce qui pourrait
advenir dans le futur.
Sa thse principale est que les rvolutions numriques passes et venir contribuent
rduire lemploi dans les classes moyennes et favoriser dun ct lmergence
demplois de bas niveaux mal pays et de lautre demplois de haut niveau bien pays.
Ctait dj anticip dans le rapport Triple Revolution produit en 1964 279 pour
ladministration de Lyndon B. Johnson. Ses auteurs salarmaient dj sur risques les
risques de lautomatisation, mettant en avant la difficult de remplacer les emplois
supprims par la modernisation un rythme suffisamment rapide. Il tait trs en
avance sur son temps, alors que linformatique nen tait encore qu ses balbutie-
ments. Juste avant la sortie du mythique mainframe IBM 360, en 1965, cest dire !
Aux USA, les 5% des foyers les plus aises reprsentaient 27% de la consommation
en 1992 et 38% en 2012. Les 80% les moins aiss sont passs de 47% 39% dans le
mme temps. Aprs la crise de 2008, le top 5% avait augment ses dpenses de 17%
et le reste navait fait que rester au niveau de 2008. Dou lmergence de business
comme Tesla qui cible, pour linstant, surtout les 5% les plus riches. Les nouvelles
entreprises issues du numrique sont automatises ds le dpart et ont moins de sala-
ris. Elles profitent plein de la productivit issue du numrique. Les exemples un
peu culs et trop gnralisant de Whatsapp et Instagram sont mis en avant pour illus-
trer le point. On nous bassine un peu trop avec les $16B de valeur de Whatsapp
gnrs par 55 employs, alors que lorsquelle a t acquise par Facebook, cette so-
cit navait quasiment pas de revenus.

Contrairement laprs-guerre, les gains de productivit des deux dernires dcen-


nies sont alls non pas dans laugmentation des salaires mais dans la baisse des prix,
dans les salaires de mtiers techniques qualifis, et le capital sorientant vers le finan-

279
Cf http://www.educationanddemocracy.org/FSCfiles/C_CC2a_TripleRevolution.htm.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 314 / 362
cement des nouveaux investissements technologiques. Les technologies sont deve-
nues un facteur dingalit au profit des technologues et des dtenteurs de capital,
tout du moins aux USA. La finance ralloue aussi les profits au bnfice des plus
riches. Plus un pays a un systme financier dvelopp, plus grandes seraient les in-
galits.
Les profits des grandes entreprises ont augment sur 15 ans en proportion du PIB
comme indiqu dans le schma ci-dessus, qui correspond aux donnes US. Cette ral-
location concerne 2,5% du PIB. Je me suis demand o allaient ces profits.
Un tiers alimente les fonds de pension. Un autre tiers va dans les foyers, et probable-
ment avec des ingalits fortes de revenu. Le reste va pour moiti chez des investis-
seurs internationaux, certains, aussi pour alimenter des fonds de retraite. Les m-
chants fonds spculatifs (hedge funds) ne reprsentent que 4% de lactionnariat des
entreprises amricaines 280!
Et si lexplication tait donc toute simple : plus la population vieillit, plus les sys-
tmes de retraites par capitalisation ont besoin de financement, donc de profits des
grandes entreprises !

En France, le rgime gnral des retraites a vu son poids dans le PIB voluer de
11,2% en 1990 13,8% en 2008, soient 2,6% de progression. Concidence ? Ne se-
rait-ce pas finalement une solution diffrente au mme problme ? A sa-
voir, augmenter les charges sociales et taxes pour financer une retraite par rpartition
en lieu et place dune augmentation du profit des grandes entreprises qui rmunrent
un systme de retraite par capitalisation ? Cest probablement moiti vrai et moi-
ti faux car les profits des grandes entreprises franaises ont aussi augment dans la
mme priode. Mais comme les actions du CAC40 sont dtenues par des investis-
seurs trangers, il se trouve quils alimentent aussi les systmes de retraite de pays
trangers, notamment anglo-saxons qui en sont friands !
Le paradoxe est que la pnurie de comptences qualifies ralentit ce phnomne de
concentration de la valeur sur les plus riches ! Si on y pourvoyait plus rapidement,
cela dtruirait encore plus de jobs mal pays, et bien plus que de jobs bien pays de
crs. La limitation des visas de travail pour les cadres qualifis trangers impose

280
Voici la source du schma correspondant.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 315 / 362
par le congrs US crerait une inertie souhaitable pour protger les emplois non qua-
lifis. En mme temps, elle favorise loffshore de mtiers qualifis en plus des m-
tiers faiblement qualifis qui sont dj externaliss ltranger. Et la politique immi-
gatoire encore plus restrictive de Donald Trump ne va pas arranger cela.
Autre point intressant, lauteur fait tat des cueils des MOOCs, prsents comme la
solution miracle pour lenseignement. Deux tudes menes par lUniversit de Penn-
sylvanie en 2013 et quil ne faudrait pas forcment gnraliser montrent que les rsul-
tats dtudiants ayant suivi des MOOCs taient moins bons que ceux dtudiants pas-
sant par des mthodes traditionnels. Il ne faut certainement pas jeter le bb du
MOOC avec leau du bain de ces tudes. Les mthodes mixant MOOCs et enseigne-
ment IRL (in real life) sont probablement favoriser.
Louvrage de Martin Ford met aussi en avant des opinions divergentes sur lavenir de
lIA. Lexpert en sciences cognitives Gary Marcus trouve que les performances r-
centes de lIA sont survendues. Pour Noam Chomsky, qui sest pench sur les
sciences cognitives pendant 60 ans, on est encore des millnaires de la cration de
machines intelligentes comme lhomme et que la singularit reste du domaine de la
science fiction. Mme opinion pour le psychologue cognitiviste Steven Pinker, le
biologiste P. Z. Myers et mme pour Gordon Moore. Il voque aussi lhistoire de la
National Nanotechnology Initiative lance en 2000, qui survendait lide de crer des
nano-machines au niveau des atomes et sest ensuite rabattue sur des objectifs plus
raisonnables.
Martin Ford voque lintrt du revenu minimum qui est souvent prsent comme la
solution pour traiter le problme de la disparition trop rapide demplois lis la robo-
tisation. Cest une sorte dEtat providence gnrique pouss lextrme quand il
nest plus en mesure de crer les conditions dune activit pour tous. Ces dbats
mergent avant mme que la richesse permettant de le financer ne soit cre et que de
nouveaux mtiers soient automatiss. La Finlande est parfois mise en avant comme
validant le principe alors que le revenu minimum ny a t ni vot, ni encore appliqu
fortiori !
Les questions cls sont nombreuses. Quel est le niveau de ce revenu minimum ? Est-
il l juste pour simplifier les systmes existants de redistribution ? Comment est-il
financ sil est plus lev ? Comment est-il diffrenti en fonction de la situation des
foyers ? Comment vite-t-il de dcourager les gens de travailler l o cela reste n-
cessaire ? Quel serait son impact si mis en place dans des pays et pas dans dautres ?
Quel impact sur les flux migratoires qui crent dj une pression certaine ? Il existera
toujours des ingalits marques entre pays, en plus de celles qui existent entre mi-
lieux sociaux. Ce dbat a dmarr il y a plus de 11 millnaires avec les dbuts de
lagriculture. Il sest poursuivi avec toutes les autres rvolutions technologiques et
industrielles suivantes et nest pas prt de se terminer.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 316 / 362
Dans Race against the machine (2012) et The Second Machines Age (2014), Erik
Brynjolfsson et Andrew Mcafee font les mmes constats que le livre prcdent sur la
concentration de la richesse sur les 5% les plus aiss.
Ils rappellent qui, si lon considre aujourdhui encore que les anciennes rvolutions
industrielles ont cr tant demplois, cest parce que lon a enlev de lquation les
chevaux et autres btes de somme qui ont perdu leur utilit et ont disparu au passage,
ou bien, ont t transforms en chair steaks. Ils taient ce que sont aujourdhui les
travailleurs bas salaire dont lactivit est en voie dtre automatise, modulo les
steaks. Le bilan cologique est aussi bien connu : cest la terre qui a pay le prix de la
croissance humaine !
Ils dcrivent le scnario de loffshore qui pourrait menacer lemploi dans les pays
faible cout de main duvre : les mtiers dlocaliss taient les plus codifiables et
donc, automatisables en priorit lorsque la technologie le permettra. Cela protge
pour une part les pays occidentaux. A ceci prs que les mtiers codifiables non dlo-
calisables pour des raisons physiques sont aussi automatisables. A contrario, le dve-
loppement des robots rduit lintrt des dlocalisations dans lindustrie. Il permet en
thorie une relocalisation des usines, et la cration demplois locaux de production,
dinstallation et de maintenance de robots ainsi que dans la supply chain.
Le scnario des auteurs met en avant les mmes gagnants et perdants : les personnes
haut niveau de qualification vs les personnes faiblement qualifies, les entreprises
superstars croissance exponentielle et les autres, et enfin le capital contre le travail.
Il sappuie sur le fait que, ces dernires dcennies, les salaires ont dj augment pour
les personnes les plus qualifies et baiss pour les moins qualifies.
On pourrait ajouter cette analyse la possibilit dun ajustement de la population
mondiale en fonction des glissements de valeur provoqus par la robotisation. Quelle
serait linfluence de la robotisation sur la natalit ? Et surtout de la prolongation de la
dure de la vie, sans mme parler de vie ternelle. Plus la longvit augmente,
comme au Japon, plus la natalit baisse. A court et moyen terme, cela rsout le pro-
blme de lemploi par le vide. Mais une socit vieillissante peut enclencher son d-
clin inexorable. Limpact dun ventuel revenu de base ne serait pas neutre. Avec lui,
la dmographie nirait plus naturellement la baisse.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 317 / 362
Les deux auteurs, qui sont de la MIT Sloan School of Management, proposent un
plan daction en quatre points qui sinspire en partie des propositions du rapport
Triple Revolution de 1964 :
Investir dans lducation, en payant mieux les enseignants, en les rendant respon-
sables, et attirer aux USA les immigrants qualifis. Ct cursus, ils recommandent
dinvestir dans la crativit, dans lidentification de tendances et dans la commu-
nication complexe. Ils font remarquer que lhomme plus la machine sont plus
puissants quune machine seule. Donc, associer la crativit et la maitrise de
lusage des technologies reste une belle protection. Ils considrent que tous les
mtiers qui requirent la fois de la crativit et une forte sensibilit motrice ne
sont pas prts dtre automatiss (cuisiniers, jardiniers, rparateurs, dentistes). Les
auteurs font aussi preuve de bon sens en rappelant que notre imagination est limi-
te pour prdire les emplois du futur. On nanticipe pas assez la nature des pro-
blmes existants et venir qui vont gnrer leurs propres mtiers.
Dvelopper lentrepreneuriat : lenseigner comme une comptence dans
lensemble de lenseignement et pas seulement dans les meilleures business
schools, rduire les rglementations qui ralentissent la cration dentreprise, et
crer un visa pour les entrepreneurs. Ce visa sest retrouv dans linitiative Star-
tup Visa Act lance en 2011 par ladministration Obama mais qui nest toujours
pas valide par le Congrs US et qui nest pas prt de ltre. Ils recommandent
aussi dencourager les innovations dorganisation et du travail collaboratif pour
exploiter ce quil reste dutilisable du temps et des comptences des gens inoccu-
ps.
Dvelopper linvestissement dans linnovation, la recherche et les infrastructures,
notamment dans les tlcommunications. Un grand classique des pays modernes
comme des pays mergents.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 318 / 362
Ct lois et fiscalit, ne pas alourdir la lgislation du travail. Rendre les em-
bauches plus attractives que la robotisation des mtiers au niveau des charges so-
ciales et taxes, ce qui rappelle une bonne partie de la politique de lemploi en
France, qui ne nous russit pas si bien. Ne pas rguler les nouvelles activits. R-
duire les subventions aux emprunts immobiliers et les rallouer lducation et
la recherche. La proprit immobilire a tendance rduire la mobilit gogra-
phique. Rduire les subventions directes et indirectes aux services financiers. R-
former le systme des brevets et rduire la dure dapplication du copyright. Enfin,
ils ne recommandent pas de crer une allocation universelle mais plutt un crdit
dimpt pour les bas revenus (negative income tax) dans la ligne dune proposi-
tion de Thomas Paine qui date de 1797 au Royaume-Uni. Pourquoi valoriser le
travail ? Parce que, quelle que soit sa nature, en plus de pourvoir nos besoins, le
travail traite deux nuisances : lennui et le vice (Voltaire), sans compter les
couches hautes de la pyramide des motivations de Maslow.
Cen est presque un plan la Macron : favorisons lentrepreneuriat et tous les pro-
blmes socitaux se rgleront deux-mmes. Un peu trop classique !
The Second Intelligent Species: How Humans Will Become as Irrelevant as
Cockroaches (2015), de Marshall Brain, grossit le trait en annonant que les scienti-
fiques sont en train de crer une seconde espce intelligente, les robots et lIA, qui va
nous dpasser et supprimer la majorit des emplois. Les premiers touchs seront les
millions de camionneurs, les vendeurs dans la distribution de dtail, dans les fast
foods et le BTP. Cest un darwinisme technologique provoqu par lHomme, qui se
fait dpasser par ses propres crations.
Le reste est de la non-science-fiction, tablant sur une intelligence artificielle qui rgu-
lerait les comportements humains nfastes, comme ceux qui affectent
lenvironnement. Les emplois non qualifis disparaitraient la fin des annes 2030,
ce qui semble un peu rapide au vu de la progression de la robotique.
Au passage, lauteur fournit une explication du fameux paradoxe de Fermi selon le-
quel il est bizarre quaucune civilisation extraterrestre ne nous ait approchs ce jour.
Officiellement, diraient les conspirationnistes. LIA dveloppe par ces civilisa-
tions serait comme la ntre : une fois quelle serait satisfaite par ses ralisations et par
lquilibre ainsi gnr, elle naurait pas besoin dexplorer le reste de lunivers. Faut
voir

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 319 / 362
Jobocalypse (2013) de Ben Way, que je nai pas lu (dsol), part du principe que
nous sommes dj envahis par les robots et que la disparition demplois lie
lautomatisation est une histoire ancienne. Il anticipe que mme les mtiers les plus
qualifis seront remplacs par des robots car ils sautoalimenteront. Les scnarios en-
visags vont de rvolutions provoques par les sans-emplois des initiatives gouver-
nementales de formation massive les concernant. On dira que lon prfrera le second
scnario au premier mme si cest un peu court !
Quand au Rapport Global Catastrophic Risks 2016 de la Global Challenges Foun-
dation281, il intgre lIA dans les risques systmiques que lhumanit et la plante
pourraient rencontrer, au mme niveau que les consquences du rchauffement clima-
tique et les pandmies naturelles ou artificielles. Les risques voqus ne concernent
cependant pas les consquences sur lemploi mais plutt la perte de contrle de lIA
par lHomme.

281
Ici : http://www.globalchallenges.org/reports/Global-Catastrophic-Risk-Annual-Report-2016.pdf.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 320 / 362
Ltude AI, Robotics and the future of jobs du Pew Research Center, parue en
2014282, recense de son ct lavis de divers spcialistes dont certains estiment que la
moiti des emplois sont menacs lhorizon 2025. Ces experts sont trs diviss sur la
question !
Le pessimisme provient du risque dimpact rapide de lautomatisation sur les cols
blancs avec un risque de dclassification pour un grand nombre, qui seront orients
vers des mtiers moins bien pays. Enfin, le systme dducation ne serait pas en me-
sure de sadapter aux nouveaux enjeux.
Certains experts sont optimistes car les mtiers qui disparaissent sont naturellement
remplacs par dautres, au gr de lvolution de la demande. La relation avec le tra-
vail sera aussi redfinie de manire plus positive.
Cest aussi lavis de Darrell M. West de la Brookings Institution dans What hap-
pens if robots take the jobs283 qui prvoit des crations de jobs dans plein de sec-
teurs et des disparitions dans peu de secteurs. On retrouve cette thse dans Toil and
Technology Innovative technology is displacing workers to new jobs rather
than replacing them entirely (2015) de James Bessen 284 , do sont extraits les
schmas ci-dessous qui montreraient que les ordinateurs ne sont pas lorigine de la
suppression demplois.

Enfin, Humans Are Underrated: What high achievers know that brilliant ma-
chines never will (2015) de Geoff Colvin met en avant de son ct lopportunit de
remettre au gout du jour les qualits humaines dans les mtiers : lempathie,
lintuition, la crativit, lhumour, la sensibilit et les relations sociales. Une manire
de diffrentier clairement les machines et lhomme.

282
Ici : http://www.pewinternet.org/files/2014/08/Future-of-AI-Robotics-and-Jobs.pdf.
283
Ici : http://www.brookings.edu/~/media/research/files/papers/2015/10/26-robots-emerging-technologies-public-policy-
west/robotwork.pdf.
284
Ici : http://www.imf.org/external/pubs/ft/fandd/2015/03/bessen.htm.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 321 / 362
Cest aussi lapproche propose par Bruno Teboul dans Robotariat critique de la
robotisation de la socit, paru au printemps 2017, qui associe philosophie, cono-
mie, prospective et humanisme pour envisager un monde quilibr o lIA et les data
sciences ne sont pas mises au pilori, et sont utilises pour faire avancer la socit, et
o la place de lhomme et de la nature sont prserves. Il y propose un revenu univer-
sel de reconversion vie financ par les entreprises qui automatisent, de taxer le tra-
ding haute frquence et de dvelopper une vie plus cologique285.
Elle tait reprise par Dov Seidman dans Harvard Business Review en 2014286 (ci-
dessous). Cest une belle conclusion, mme si frisant quelque peu lutopie287.

Comment viter de se faire robotiser


Maintenant que le problme est pos, comment ne pas tre remplac par de robots et
de lintelligence artificielle ? Aprs luberisation qui intermdie les mtiers de service,
la robotisation peut-elle automatiser ces mmes mtiers ? La robotisation serait-elle la
forme ultime dubrisation ?
Quelques pistes sont bien connues et dj cits dans les livres voqus ci-dessus :
choisir des mtiers o la crativit, linitiative, les motions, lempathie et lhumanit
sont importantes et adopter les nouvelles technologies qui rendent plus productif. Et
ne tombons pas dans le panneau des annonces tonitruantes dIA cratives !
Comme avec toute nouvelle technologie, de nouvelles formes de crativit humaine
verront le jour. Les outils de lIA permettent aux cratifs de tout poil de se poser de
nouvelles questions. Un scientifique peut ou pourra explorer la connaissance et ltat
de lart plus facilement. Un chercheur pourra faire des hypothses et les vrifier plus
facilement. Un ingnieur pourra simuler encore plus aisment ses crations. Un urba-

285
Cet ouvrage trs instructif permet de dcouvrir ou de redcouvrir de nombreux auteurs cls de ces diffrents domaines. Il dcrit
avec recul des phnomnes rcents comme luberisation. Et il partage quelques dfauts avec ce document : des parties de deux trois
pages qui survolent de nombreuses thmatiques, un panorama peu-tre un peu trop large et pas assez profond, et un jargon pas for-
cment accessible comme ces Prolgomnes une hermneutique des NBIC (en langage courant, on dirait peut-tre Prlude
une interprtation des NBIC . !
286
Ici : https://hbr.org/2014/11/from-the-knowledge-economy-to-the-human-economy.
287
Voir aussi cette alerte sur la tendance des outils numriques rduire les vritables interactions humaines Eliminating the human
et limiter notre prise de risques : Limpossible voyage connect, ou comment le numrique a touff le sentiment daventure.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 322 / 362
niste pourra valuer limpact dun projet. Un marketeur pourra faire de mme avec
des hypothses produit et march. LIA permettra de crer de nouveaux outils de
comphension de lexistant et de simulation de nouveaux projets dans tous les do-
maines.
Labondance des donnes exploitable par les IA ne fait pas tout ! Il faut savoir se po-
ser les bonnes questions pour les exploiter !
Cest une constante dans linnovation : dans presque tous les mtiers,
lautomatisation et la robotisation ne sont jamais totales. Elle ncessite une supervi-
sion humaine. Il faut donc sapproprier les outils de cette supervision, voire les crer
soi-mme ! Donc, de prfrence, maitriser la fois des mtiers traditionnels et les
technologies numriques qui peuvent les transformer. Malheureusement, les sciences
et technologies nattirent pas tant que cela les jeunes et notamment en France, comme
une enqute mondiale rcemment ralise par Randstad288 le montre.

A contrario, il faudra de prfrence viter les mtiers rptitifs, routiniers ou faible


degr de crativit et dinitiative et simples dun point de vue moteur. Ce sont ceux
qui prsenteraient le plus grand risque dautomatisation.
Le schma ci-dessus issu du Rapport Economique du Prsident US 2016289 rap-
pelle que les mtiers bas salaire, donc en gnral faible qualification, sont les plus
menacs par lautomatisation.
Dans The Future of Jobs Employment, Skills and Workforce Strategy for the
Fourth Industrial Revolution publi en janvier 2016 par le World Economic Fo-
rum 290 , les auteurs prvoient que les deux tiers des enfants en cole primaire
daujourdhui exerceront un mtier qui nexiste pas encore. Ils y vont un peu fort car
lchance nest pas si lointaine. Ils prvoient que 7,1 millions demplois administra-
tifs disparaitront dici 2020, et que seulement 2 millions demplois seront crs dans

288
Voir http://www.influencia.net/fr/actualites/tendance,etudes,francais-sur-quatre-conscient-etre-remplace-par-robot,6296.html.
289
Cf https://www.whitehouse.gov/sites/default/files/docs/ERP_2016_Book_Complete%20JA.pdf.
290
Voir http://www3.weforum.org/docs/WEF_FOJ_Executive_Summary_Jobs.pdf.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 323 / 362
les technologies (aux USA). Par contre, des emplois devraient tre crs pour com-
bler une partie du trou dans lnergie, les nano-biologies et le divertissement, et ceux
des commerciaux subsisteront. Et oui, les emplois de lavenir seraient surtout ceux
dont le contenu motionnel sera le plus dense, comme expliqu dans Les 10 comp-
tences cls du monde de demain291.
Dun point de vue stratgique, on peut intuitivement privilgier lenseignement sup-
rieur, la recherche et lentrepreneuriat dans les domaines scientifiques et technolo-
giques qui gnrent ces automatisations. Il vaut mieux crer ou adopter les outils de
lautomatisation que de nen subir que les effets, comme dcrit dans How To Avoid
Being Replaced By A Robot paru dans Fast Company en avril 2016292.
On pourra aussi favoriser les enseignements pas trop spcialiss et assez diversifis.
Et enfin, ne pas oublier dexceller dans ce qui fait de nous des Hommes, de belles
machines biologiques doues dmotions.

Politique par lIA


Les mtiers de la sphre marchande ne sont pas les seuls tre impacts par lIA. Ce-
lui de politique lest tout autant, mme sil na pas vocation tre une activit
temps complet dans toutes les dmocraties.
Le cerveau fonctionne trs souvent par analogies et la connaissance de lHistoire in-
flue sur les dcisions des politiques, sauf lorsquils ne connaissent pas du tout
lHistoire comme Donald Trump. LIA et Watson nutilisent pas encore massivement
le raisonnement par analogies. Il rpond surtout en fouillant dans de vastes dpts de
connaissances et pour croiser quelques informations structures. Mais sait-on

Politique fiction
Est-ce que Watson pourrait indiquer : si tu envahis tel pays dans telle et telle circons-
tance, voici ce qui a le plus de chances de se produire en suivant les leons de
lhistoire connue. Et voici ce qui permettrait dviter le pire !
On apprend souvent du pass pour (mieux ?) dcider du futur. Mais de nouveaux
lments complexifient la donne. Par exemple, doit-on faire une analogie entre la
monte des populismes et dmocratures dans le monde et la situation des annes 1930
ou davant la premire guerre mondiale ? Quest-ce qui est similaire et quest-ce qui
est diffrent ? Comment anticiper la dimension motionnelle qui secoue un peuple ?
Quand est-ce que le peuple est au bord dune rvolte ? Comment lanticiper ? Com-
ment des dcisions politiques complexes influencent la sphre conomique qui agit
la fois de manire rationnelle et irrationnelle aux vnements ?
Autre difficult surmonter pour lIA, mais pas insurmontable : comment tenir
compte dun adversaire qui agit de manire non rationnelle ? La plupart des algo-
rithmes dIA sont conus de manire rationnelle. Exemple : comment ragir quand

291
Ici : https://missphilomene.com/2016/03/20/les-10-competences-cles-du-monde-de-demain/.
292
Ici : http://www.fastcompany.com/3058800/the-future-of-work/how-to-avoid-being-replaced-by-a-robot.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 324 / 362
lune des parties agit de manire irrationnelle, tel un Saddam Hussein en 1990/1991,
voire lorsque les deux parties sont irrationnelles avec ce mme Saddam Hussein et
Georges W. Bush en 2003 ?
Je mtais aussi demand en 2013293, pour les 50 ans de lassassinat de JFK, si un
systme de type Watson ne pourrait pas un jour analyser toute la littrature sur le su-
jet et pondre une synthse voire rsoudre lnigme qui est bien plus complexe quune
simple thorie du complot style 9/11 ou sur les chemtrails. Lanalyse des faits et mys-
tres de lhistoire pourrait probablement gagner de ce genre de systme. Mais
lintrt conomique de la chose est plutt marginal !
Est-ce que les organisations politiques et des Etats peuvent se faire eux-mmes di-
srupter par de lIA ? Evitons lexpression uberiser qui est la fois trop prcise et
trop vague. Il y a bien linitiative Watson for President mais elle est un peu lgre
car construite comme une opration de communication dIBM294. Elle visait un peu
la manire de Coluche en 1980, de faire lire Watson comme nouveau prsident am-
ricain en 2016. En indiquant que cela permettrait la Maison Blanche de prendre des
dcisions rationnelles.
Cest confondre un peu rapidement loutil de la prise de dcision (POTUS) et loutil
daide la prise de dcision (Watson et/ou le staff du Prsident et son administration).
Un prsident fait dj appel de nombreux experts pour prendre ses dcisions, en
particulier dans la diplomatie, les ngociations internationales et le pilotage du bras
arm des USA. Il a aussi besoin de pas mal daide et de tacticiens pour faire voter des
lois par le congrs qui est souvent rcalcitrant, mme lorsquil est du mme bord que
lui. On la vu pour lAffordable Care Act (Obamacare) lors du premier mandat de
Barack Obama. Mais avec llection de Trump, on peut songer lavantage quil y
aurait eu lire une IA !
La premire question se poser sur lusage de lIA concerne les lections dans les
dmocraties. Les dernires grandes lections, notamment amricaines, ont montr la
force la fois des rseaux sociaux et de la propagation dides vhiculant du rve
(Obama, Sanders) ou des peurs et angoisses, et les fameuses fake news (Trump).
Llection de Trump a montr comment la manipulation des opinions pouvait faire
basculer de peu une lection295.
Que ferait lIA pour amliorer un tel processus ? Elle collecterait des volumes gigan-
tesques dinformations ouvertes sur ce qui se dit et scrit, sur ce que font les lec-
teurs, sur leurs ractions des discours antrieurs, sur les analyses biomtriques (de
la captation de pouls avec une montre, des mouvements oculaires avec des capteurs
de Tobii, de lEEG pour la mesure de lactivit crbrale, etc), sur lconomie ou sur
les mdias.

293
Cf http://www.oezratty.net/wordpress/2013/technologies-et-assassinat-jfk/.
294
Cf http://watson2016.com/.
295
Hillary Clinton a devanc Donald Trump en vote populaire de 2,8 millions de voix mais a perdu le college des grands lecteurs
pour 78 000 lecteurs dans quatre swing states, qui avaient fait lobjet dun ciblage particulier de fake news dans les rseaux sociaux.
Javais fait une analyse chiffre de cette lection ici : http://www.oezratty.net/wordpress/2016/origine-consequences-trump/.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 325 / 362
Elle les analyserait alors au point de permettre la cration de programme politiques
appliquant soit la dmagogie ultime (celle qui fait gagner les lections mais qui est
inapplicable ou qui, si applique, mne une catastrophe) soit la dmagogie
utile (celle qui fait la fois gagner les lections et aller dans un chemin non catastro-
phique et responsable). Le tout en tant conforme une idologie de base dun parti
politique donn, avec son systme de valeur (partage, social, conomie, croissance,
environnement, fiscalit, justice, cole, selon les cas). Voil de beaux dfis
doptimisation sous contraintes !
Des tentatives de ce genre ont dj t vaguement lances. Valentin Kassarnig, cher-
cheur lUniversit Amherst du Massachusetts, a prsent dbut 2016 un pre-
mier gnrateur de discours politique bas sur de lIA296, et qui dpasse les gnra-
teurs de pipeau dj bien connus. Le rsultat reste assez rustique et focalis sur le
langage, pas sur la construction dun programme politique qui se tienne.
La solution est mme diffuse en open source 297 ! Malheureusement, en politique
plus quailleurs, ladage selon lequel le contraire de lIA est la btise naturelle
sapplique parfaitement. Cette dernire est mme plutt efficace lectoralement !

Aprs les lections se pose la question de la gestion. Est-ce que lIA permettrait de
prparer des choix censs mis ensuite dans les mains dlecteurs dans le cadre de d-
mocraties plus participatives ? Est-ce que lIA permettrait de btir des politiques co-
nomiques dignes de ce nom ? Est-ce lIA permet dintgrer les complexes relations
sociales dans la socit ? Danticiper les ractions des citoyens aux nouvelles lois et
rglementations, notamment fiscales ? Est-ce quelle permettra de grer les conflits ?
Est-ce quelle pourrait permettre dacclrer la justice ? Dviter les erreurs judi-
ciaires ? De rformer les systmes de sant au fil de leau des progrs technolo-
giques ? Je nen sais rien. Il ny a pas beaucoup de chercheurs qui planchent sur ces

296
Cf Political Speech Generation de Valentin Kassarnig.
297
Ici : https://github.com/valentin012/conspeech.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 326 / 362
questions ! Certains indiquent toutefois quune IA implique dans le processus appor-
terait un peu de rationalit et serait capable de prendre des dcisions non bases sur le
ct obscur des motions298.
Les systmes daide la dcision politique pourraient-ils faire appel de lIA inten-
sive ? Y compris lorsquil sagit dvaluer la position et lattitude des autres parties
prenantes, des agents conomiques ou des chefs dEtat ? Est-ce quune IA permettrait
un POTUS299 de grer de manire optimale la relation conflictuelle avec Vladimir
Poutine, les bras de fer avec les Chinois, ou de rsoudre pacifiquement les divers con-
flits du Moyen-Orient ? Ou un successeur de Franois Hollande de se dpatouiller
de la situation en France ?
On a bien vu des films de Science Fiction mettant en scne des personnages lis
lIA comme dans Her et Ex Machina, mais pas encore dans de la politique fiction.
Ca ne saurait tarder vue limagination dbride des scnaristes ! Un House of
Card avec un Special Assistant to the President qui soit une IA commande
vocale ferait son effet !
On en est encore loin. Ce qui dmontre par labsurde que lAGI (Artificial General
Intelligence) nest pas pour tout de suite. Mais gare vos fesses les politiques ! La
dmocratie participative pourrait prendre un visage inattendu !

Politique ralit
Dans la pratique, lIA est en fait dj utilise en politique dans quelques con-
textes sporadiques :
Le ciblage de prospection terrain ralis lors de la campagne de Barack Obama en
2012.
Pour la segmentation et le ciblage daudience cls pour une lection comme ce
que langlais Cambridge Analytica300 a permis de faire en analysant les profils
dlecteurs sur Facebook dans les swing states lors de la prsidentielle amricaine
de novembre 2016. Cela a permis ensuite dautres quipes priphriques la
campagne de Trump de cibler des populations de swing states avec des fakes news
fabriques par des sites conspirationnistes alt-right , sans compter leffet de re-
lai des bots cres par des quipes finances directement ou indirectement par la
Russie poutinienne et mafieuse. Si on allait plus loin, on pourrait imaginer
lutilisation de rseaux de neurones gnratifs fabriquant de fausses vidos de per-
sonnalits, pour influencer lopinion quen ont les lecteurs. Pas besoin dAGI

298
Cf Should Politicians be Replaced by Artificial Intelligence? Interview with Mark Waser, 2015.
299
POTUS = President Of The United States.
300
Lorigine, lhistoire et les mthodes de Cambridge Analytica sont bien documentes dans la prsentation Uses and abuses of AI in
election campaigns de Alistair Knott (https://ai-and-society.wiki.otago.ac.nz/images/0/0f/Ai-and-elections.pdf). La socit a t cre
en 2013 et finance par linvestisseur Bob Mercer, un ultra-conservateur, cofondateur du site dinformation Breitbart. Cambridge
Analytica avait comme VP un certain Steve Bannon, pass pendant 7 mois la Maison Blanche comme conseiller spcial de Donald
Trump. Pour la prsidentielle 2016, la socit exploitait diverses sources de donnes acquises, notamment auprs dAcxiom et Expe-
rian. Cela leur a permis de constituer une base nominative de plus de 200 millions damricains adultes avec 5000 donnes associes.
Ils ont mme fait des expriences dA/B Testing sur des messages TV sappuyant sur leurs donnes de profiling. Voir aussi Cam-
bridge Analytica, the shady data firm that might be a key Trump-Russia link, explained de Sean Illing, octobre 2017.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 327 / 362
pour y arriver ! Il suffit dexploiter les technologies existantes et davoir de mau-
vaises intentions. Le mal, cest lHomme !
Lexploitation smantique des analyses terrains ralises par les volontaires de En
Marche, par la startup franaise Proxem. Proxem avait produit juste aprs
lannonce de la candidature dEmmanuel Macron une longue prsentation mon-
trant quels mots cls ressortaient des enqutes terrain. Cela avait lair dexploiter
des techniques assez basiques de traitement du langage.
La tentative de prdiction de ce que le Congrs US pourrait voter, par un profeseur
de luniversit de Vanderbilt, J.B. Ruhl et le dveloppeur John Nay dans Pre-
dictGov301. Le site nest plus en ligne et na probablement pas prvu le vote de
John McCain au Snat amricain contre la suppression dObamacare fin juillet et
fin septembre 2017.
Tout cela reste encore artisanal. Mais ce nest peut-tre que la face visible dun gros
iceberg mconnu.

Politiques de lIA
Lagitation des peurs autour de lIA en a fait un vritable sujet politique. Le phno-
mne nest pas nouveau en soi mais lest par son ampleur. Dhabitude, les pouvoirs
publics semparent de sujets technologiques avec un retard de phase chronique. Ici,
ils sont quasiment en avance de phase, en tout cas, relativement diverses menaces
encore hypothtiques.
La posture politique suit une gradation relativement classique entre tenants dune in-
novation Schumptrienne librale quil ne faut pas tenter de ralentir et ceux dun
Etat rgulateur et protecteur cadrant les usages, lthique des affaires et lconomie
en gnral. La premire est dominante aux USA tandis que la seconde lest en Europe
et surtout en France o ltatisme ne faiblit jamais, et rsiste fort bien aux alternances
politiques.
Mais lIA est aussi une rvolution industrielle et les Etats ont compris quil ne fallait
pas louper le coche, sans forcment disposer de recettes miracles.
Des deux cts de lAtlantique, les Etats sont des plus prolixes en rapports et plans
autour de lIA.
Barack Obama a t interview par Joi Ito dans Wired en aot 2016 et articulait dj
une vision claire des enjeux autour de lIA302. Juste aprs, son administration a pro-
duit deux rapports en fin de mandat, le premier The Administrations Report on the
Future of Artificial Intelligence, publi en octobre 2016 aprs une consultation pu-
blique faisait quelques recommandations lmentaires : lIA devrait servir amlio-
rer le bien public, les gouvernements devraient lutiliser, lIA devrait complter et

301
Cf http://mashable.com/2017/04/04/predictgov-artificial-intelligence-congress.
302
Cf https://www.wired.com/2016/10/president-obama-mit-joi-ito-interview/. Sa position est bien documente et articule. On se
met fantasmer sur une interview comprenant exactement les mmes questions, mais poses lactuel POTUS, Donald Trump.
LA/B testing de POTUS serait saisissant !

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 328 / 362
non pas remplacer les hommes, et lusage des vhicules autonomes devrait tre rgul.
Sen suivit Artificial Intelligence, Automation, and the Economy en dcembre 2016,
qui anticipe des bouleversements sur le march de lemploi qui peuvent tre absorbs
pour peu que les efforts adquats soient lancs ct formation et quune rflexion sur
la rpartition de la valeur ait lieu.
Un comit juridique du Parlement Europen publiait en fvrier 2017, un court rapport
European civil law rules in robotics, plaidant pour la cration dun cadre juridique
encadrant lusage des robots mais en sopposant une taxe sur les robots.
La France a suivi de peu avec la publiction par le gouvernement dun rapport et de
linitiative France IA en mars 2017, produits en deux mois concommitamment avec
un rapport des assembles portant principalement sur les questions socitales et
dducation souleves par lIA.
Au Royaume-Uni, le Parlement a lanc un appel consultation sur ces mmes sujets
en juillet 2017 alors que sa Commission Science et Technologie avait dj publi un
premier rapport en octobre 2016, assez succinct avec 44 pages, Robotics and artificial
intelligence.
Dautres rapports ont t produits par divers groupes de pression sur les Etats, comme
en Australie, o le cabinet de conseil AlphaBeta publiait en aot 2017 The automa-
tion advantage qui dnonce le retard des entreprises australiennes dans ladoption de
lIA et fait miroiter un potentiel conomique de $2,2T (trillions = 1000 milliards).

Le plan France IA
Je faisais un tour dhorizon de ce plan et rapport de 350 pages dans un article publi
en mars 2017303 et dont voici un rsum lgrement actualis.
Le diagnostic densemble de ce plan faisait tat dune recherche fondamentale assez
disperse et centre sur la recherche publique et dun manque de transferts technolo-
giques, ce qui nest pas une spcificit de lintelligence artificielle. Il voquait le rle
stratgique des donnes qui alimentent lIA.
On y trouve surtout un tat des lieux trs fouill, largement exploit dans ce docu-
ment, qui comprend une cartographie de la recherche franaise en intelligence artifi-
cielle, complt par celle des entreprises lutilisant. Il comprend des propositions
dorientation de cette recherche, notamment dans lIA symbolique sous toutes ses
formes qui complte lIA connexionniste qui domine lunivers du deep learning pour
la vision et le traitement du langage.
Le rapport dtaille aussi les stratgies de grands acteurs amricains et chinois ainsi
que les plans lancs par diffrents gouvernements dans le monde. Cest un inventaire
trs utile pour se faire une ide de la concurrence mondiale.
Le plan se focalise sur sept secteurs dactivit : la construction automobile, la relation
client, la finance, la sant, les nergies renouvelables, la robotique et lducation nu-

303
Que jai comment ici au moment de sa publication : http://www.oezratty.net/wordpress/2017/les-hauts-et-les-bas-du-plan-france-
intelligence-artificielle/.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 329 / 362
mrique. Il comprend des dizaines de recommandations gnriques, ou dans certains
seulement de ces secteurs dactivit comme pour les vhicules autonomes.
Le plan daction prvoyait notamment :
La prparation dune candidature un projet phare de technologie mergente
de lUnion Europenne ( FET flagship ) du type du Human Brain Project, sur
lIA, pouvant tre financ hauteur de 1Md.
Le lancement dun programme IA dans le cadre du Plan pour les Investissements
dAvenir (PIA 3).
Le financement dune infrastructure mutualise de calcul de puissance en IA pour
la recherche qui nest pas sans rappeler lquivalent propos dans le cadre du plan
France Gnomique 2025 annonc en juin 2016.
La cration dun consortium public-priv sur lintelligence artificielle.
Le plan oubliait, semble-t-il volontairement, les composants lectroniques, qui sont
un domaine o les opportunits autour de lIA sont significatives avec au moins deux
technologies cls : les processeurs neuromorphiques et les processeurs quantiques
gnralistes qui pourraient transformer radicalement le paysage informatique autour
de lIA dans les deux dcennies venir.
Ce plan avait t ralis en seulement deux mois, ce qui est un record de rapidit. Il
ntait quune premire tape dun processus qui sera probablement itratif. Il avait le
mrite davoir rassembl autour de plusieurs tables un bel chantillon des acteurs
franais impliqus de prs ou de loin dans lIA. Il se poursuivra notamment dans le
cadre de linitiative France IA.
Une mise jour de ce plan a t confie Cdric Villani de lAssemble Nationale,
par Mounir Mahjoubi, lactuel Secrtaire dEtat en charge du numrique. Cdric Vil-
lani est lactuel prsident de lOffice Parlementaire dEvaluation des Choix Scienti-
fiques et Technologiques qui est une entit commune entre le Snat et lAssemble
Nationale.

Le rapport des assembles


Publi quasiment simultanment au plan France IA en mars 2017, le rapport de
lOffice Parlementaire dEvaluation des Choix Scientifiques et Technologiques 304
Pour une intelligence artificielle matrise, utile et dmystifie compltait le
plan France IA de lexcutif en abordant surtout la dimension socitale et rglemen-
taire.
Nourri par des dplacements ltranger (USA, Royaume Uni, Suisse) et de nom-
breuses rencontres, le rapport dmarre avec un trs bon panorama de lhistoire de
lintelligence artificielle qui remet pas mal de pendules lheure, mme sil com-
prend quelques perles. On y dcouvre aussi les 12 laboratoires impliqus dans lIA au

304
Qui associe dputs et snateurs. Le mathmaticien Cdric Villani a pris la prsidence de cet office depuis son lection comme
dput LREM en juin 2017.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 330 / 362
CNRS (GREYC, IRIT, LAAS, LAMSADE, LATTICE, LIF, LIG, LIMSI, LIPN,
LIRMM, LORIA, LRI, TIMC) totalisant environ 300 chercheurs permanents. Cest
peu prs leffectif de DeepMind, la filiale de Google, mais dont les quipes ne font
pas que de la recherche. Sur les nombreuses questions dthique et juridiques, le rap-
port fait le rsum dun grand nombre dautres rapports, notamment trangers.
Le rapport est en tout cas agrable lire et fort bien document avec de nombreux
renvois sur des crits de rfrence, quils viennent de rapports divers ou douvrages
de rfrence dans le domaine de lIA.
Il comprend surtout une quinzaine de propositions regroupes en trois parties repre-
nant les lments du titre du rapport :
Ct maitrise, on sent poindre de relents de principe de prcaution avec des oxy-
mores tels que la volont dviter une rgulation de la recherche en intelligence artifi-
cielle tout en voulant favoriser une IA sre, transparente et juste via des chartes, de la
formation lthique de lIA, la cration dassurances spcifiques aux robots et la
cration dun Institut National de lEthique de lIA et de la Robotique. Bref, une IA
morale comme un capitalisme moral, qui nexiste dj pas ?
La maitrise se veut aussi sociale avec de la formation continue pour adapter le mar-
ch du travail aux mutations de lIA (on pourrait dans pas mal de cas y caser le num-
rique en gnral).
Ct utile, il est question de valorisation de la recherche fondamentale, et de la
rendre plus transversale, dencouragement la cration de champions europens de
lIA, dorientation des investissements vers des applications socitalement utiles, de
cration de cursus de formation sur lIA305 et aussi de promotion de la diversit et de
la place des femmes dans la recherche en IA306 (il faudrait ajouter, dans lensemble de
son cosystme). Bref, des propositions tout fait censes. Le rapport prconise, sans
prcision, la cration de projets de recherche transversaux structurants, en confondant
peut-tre ce qui ressort de la recherche fondamentale qui est par nature parpille de
la recherche applique et de la cration de solutions technologiques qui est naturelle-
ment plus transdisciplinaire. De tels projets doivent rpondre des dfis en mode
top bottom comme ceux de la DARPA sur la conduite autonome en 2004. Le rap-
port prconise la cration de champions europens sans laborer de scnario : top-
bottom la Airbus/Ariane ou bottom-up par le dveloppement du tissu des startups.

305
Je remarque que les cursus franais ne donnent pas toujours lieu, comme dans les principaux cursus anglo-saxons, la publication
des supports de cours en ligne en libre accs. Voil une belle zone de progrs ! Comme Stanford pour ce cours de traitement du
langage : http://web.stanford.edu/class/cs224n/syllabus.html, le cours de Stanford de reconnaissance dimages dAndrej Karpathy :
http://cs231n.stanford.edu/syllabus.html, ou ce cours gnraliste sur lIA de lUniversit dAmsterdam dont les supports de prsenta-
tion sont trs bien faits : http://uvadlc.github.io. Heureusement, certaines universits font de beaux efforts. Comme lUniversit de
Lyon 2 qui publie tous les supports de son cours de data mining et data science.
306
Un cueil qui est aussi soulev dans le rapport AIReport de linitiative ArtificialIntelligenceNow qui voque le manque de diver-
sit des chercheurs et dveloppeurs de lIA. Non seulement, les femmes sont sous-reprsente mais aussi les minorits : Like all
technologies before it, AI systems reflect the values of their creators, and there is hope that increased diversity among those develop-
ing, deploying, and maintaining AI systems may help create a future in which these technologies promote equality. Currently, how-
ever, women and minorities continue to be under-represented in the field of AI particularly, and in computer science overall .

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 331 / 362
Et ct dmystification, re-formation, mais dans le primaire et le secondaire, de la
sensibilisation du grand public, la cration dun salon international de lIA et de la
robotique (qui pourrait dj exister avec VivaTechnologie).
Dans le dtail et sans surprise, la rapporteuse Dominique Gillot (PS) prconisait la
cration dune cotisation sociale assise sur les agents autonomes et les robots, sans
prciser le salaire de rfrence, et lautre rapporteur, Claude De Ganay (LR) y tait
oppos.

Economie et social
Les gouvernements font face une perfect storm en perspective : une rvolution
technologique en acclr qui pourrait rapidement bouleverser lquilibre bancal ac-
tuel du march de lemploi. Mme avec les prvisions les plus optimistes qui antici-
pent un dficit net de 6% demplois dici une demi-douzaine dannes, cela donnerait
du grain moudre. Supporter une augmentation moyenne de 50% du chmage nest
pas facile absorber, mme si des pays comme la Grce et lEspagne sont dj passs
par l pour dautres raisons.
Quelles politiques conomiques adopter ? Elles tournent toujours autour du dvelop-
pement conomique avec les moyens conomiques disposition des tats pour ac-
compagner les entreprises, en gnral par le financement de lamont de linnovation
et de la recherche, et aussi en dveloppant le tissus conomique des startups.
Lun des points cls est dtre exportateur de technologies plutt que simple con-
sommateur. Si la valeur ajoute de lIA et les robots viennent dun nombre rduit de
pays, les autres seront toujours dsavantags comme nous le sommes dj au-
jourdhui dans de nombreux pans du numrique, surtout grand public.
Dans Economic Report or The President307, le rapport annuel 2016 sur lconomie
de la Maison Blanche publi en janvier 2017 la fin de ladministration Obama, on
dcouvre quaux USA et en 2013, les startups ont cr 2 millions demploi et les en-
treprises traditionnelles 8 millions. Donc 20% ! Une proportion norme sachant que
dans le mme temps, lconomie franaise a plutt dtruit des emplois et les startups
nen ont probablement cr que quelques dizaines de milliers tout au plus. Et surtout :
la moiti de la R&D fdrale est ddie la dfense ! Et au milieu des annes Reagan,
elle en reprsentait les deux tiers ! Cela explique pourquoi tant de projets autour de
lIA sont financs par la DARPA. Y compris trois dfis lancs en 2004, 2005 et 2007
sur la conduite automatique, qui ont dynamis les quipes de recherche de nom-
breuses universits sur le sujet. Nombre de ces quipes ont t ensuite recrutes par
Google pour ses diffrents projets de voitures automatiques.
En avril 2017, le Secrtaire du Trsor de Donald Trump, Steve Mnuchin, ancien de
Golman Sachs, affichait un optimisme tonnant308, affirmant dans un dbat quil ne
voyait pas de menace sur lemploi cause par lIA avant 50 ou 100 ans. Cela lui a va-

307
Ici : http://www.presidency.ucsb.edu/economic_reports/2017.pdf.
308
Cf le transcript exact de son intervention : https://www.cnbc.com/2017/05/23/read-the-full-transcript-of-cnbcs-interview-with-
treasury-secretary-steve-mnuchin.html.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 332 / 362
lu le sobriquet dAI denier, comme un climate change denier. On est pass dun souci
mesur une insouciance coupable, mais la hauteur des comptences de lactuelle
administration amricaine.

En France, le dbat politique autour de lIA a connu un tournant social pendant la


prsidentielle 2017. Il a contribu la mise en avant de propositions de revenu mini-
mum ou de base309. Benoit Hamon et Jean-Luc Mlanchon le justifiaient avec les
risques de robotisation des mtiers. Une charrue mise avant avant les boeux, mme si
les politiques sont parfois des bufs et sont bien devant. Llection de Donald Trump
par les fameux blancs de la middle class de la rust belt doit aussi la dsindustrialisa-
tion ce ces Etats et un dcalage mal vcu entre ces Etats qui sappauvrissent et la
Silicon Valley qui senrichit sans discontinuer.
Se pose aussi la question de la politique fiscale, notamment vis--vis des GAFAMI
qui sont dj accuss dvasion fiscale, avec leur statut dagent commercial appliqu
leurs filiales. LIA pourrait accentuer le phnomne de migration de valeur sur les
plateformes que ces GAFAMI contrlent. Cela relance aussi les procdures antitrust
en cours, pilotes par lUnion Europenne.
Autre sujet de dbat, celui de la taxation des robots, propose notamment par Bill
Gates310. Pourtant, la taxation des robots est un systme bien compliqu, inadapt et
na pas de sens sans une fiscalit internationale htrogne. Ce nest pas plus malin
de que de taxer des machines tisser ou les tableurs Excel ! Si on taxait les robots, il
faudrait alors taxer tous les outils matriels et immatriels qui ont amlior la produc-
tivit du travail depuis quatre millnaires : les tracteurs qui ont permis lagriculture

309
Cf https://www.technologyreview.com/s/602747/todays-artificial-intelligence-does-not-justify-basic-income/ et
https://medium.com/france/les-secrets-bien-gard%C3%A9s-du-revenu-universel-9f8e2cb6a841#.jwc20flg9.
310
Ici : http://fortune.com/2017/02/25/bill-gates-robot-tax-automation-jobs/. Voir diverses ractions :
https://www.bloomberg.com/view/articles/2017-02-28/what-s-wrong-with-bill-gates-robot-tax, http://www.businessinsider.com/bill-
gates-robot-tax-brighter-future-2017-3?IR=T.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 333 / 362
intensive et de passer, pour prendre la France en exemple, dune population agraire
de 36% des salaris en 1946 moins de 2% aprs les annes 2000, les logiciels qui
ont permis de se passer de secrtaires dans nombre dentreprises, les machines outils
dans les usines, les tableurs qui ont rduit les besoins en comptables, les moteurs de
recherche et linformation en ligne qui ont rduit lattrait des bibliothques et plein
dautres volutions du mme genre.
Et puis, pourquoi donc taxer les robots physiques alors que lIA immatrielle pourrait
supprimer encore plus demplois que les robots logiciels, tout du moins dans les pays
dvelopps ? Et si on taxait les robots, cela rduirait lintrt conomique de rapatrier
des usines dans les pays dvelopps, le contraire dune rindustrialisation. Faudrait-il
faire la distinction entre les robots dusines et les robots humanodes ? La question ne
se pose pas pour linstant. Plutt quinventer une taxe spcifique pour les robots, les
Etats pourraient commencer par appliquer srieusement les taxes gnriques qui con-
cernent les entreprises.
Si un Etat met en place une taxation des robots immatriels qui dtruisent des em-
plois, il y en aura toujours dautres pour accueillir les entreprises concernes et leur
servir de paradis fiscal. Il est donc plus important dhomogniser la fiscalit que
den inventer une nouvelle. Si des robots suppriment massivement des emplois, cela
amliorera la profitabilit des entreprises et il suffit alors de les taxer correctement
sur leurs bnfices plutt que sur leur outil de travail qui est une structure de cot et
pas de profit. En taxant simplement les profits, comme on le fait aujourdhui, on taxe
lensemble des sources dconomies dchelle et pas seulement la robotisation. Sans
compter le fait quaujourdhui, diverses tudes montrent que les pays les plus roboti-
ss sont ceux qui se dveloppent le mieux !
Une taxe sur les robots applique uniquement en France ne ferait que pnaliser
lindustrie franaise par rapport aux autres pays qui font appel la robotisation, y
compris en Asie.
Il est plus simple de bien taxer les profits des entreprises. Les entreprises qui sont et
seront les plus robotises auront les meilleurs profits, cest tout. Il suffit de taxer leau
qui coule la fin du circuit conomique que dans les multiples robinets qui font tour-
ner lentreprise.
Il vaut mieux investir dans la formation et les comptences des gens pour les aider
crer des robots, les installer, les maintenir, les piloter, les superviser, grer des
projets les intgrant. On ne rsiste pas linnovation. On sy adapte et on aide les
gens sy adapter.
Qui plus est, le risque de pertes demplois li lautomatisation est plus fort dans les
mtiers non physiques que dans les mtiers physiques. Un expert-comptable est plus
menac par lIA quun kinsithrapeute ou une sage-femme ne le sont par des robots.
Dans le cas de la robotisation dmatrialise, que faudrait-il taxer ? Les logiciels et le
cloud ? Ils sont de moins en moins chers. Bref, on tourne en rond.
Enfin, dernier point : limpact des outils de traduction automatique sur la construction
europenne. Lun des cueils de lUnion Europenne est sa grande diversit linguis-

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 334 / 362
tique qui complique la communication. Est-ce que la traduction automatique va per-
mettre de passer outre ces barrires ? Cest possible. Mais la fragmentation du mar-
ch europen nest pas que linguistique. Elle est aussi forte dans presque tous les sec-
teurs dactivit. Les effets de levier comique varient dun pays lautre : les mdias,
les banques, les tlcoms, les retailers et les services en gnral sont le plus souvent
locaux. Les USA sont beaucoup plus homognes de ce point de vue-l et ils sont les
principaux pourvoyeurs de produits et services qui sont communs toute lEurope, de
Google Amazon.

Education
Le Rapport France IA fait un inventaire des formations dans lIA. Les Masters Sp-
cialiss ne produisent que 1087 tudiants par an, comparer avec environ 30 000 d-
veloppeurs forms par an et qui ne seraient dj pas suffisants pour rpondre la de-
mande. Et nous avons vu quIDC prvoit que dans deux ans, plus de la moit des d-
veloppeurs devront maitriser lIA.

Le dcalage est videmment norme et irraliste, mais il montre que la situation va


tre rapidement tendue. Les progrs de lIA pourraient tre ralentis dans certains pays
par le manque de comptences. On ne paramtre par un rseau de neurones convolu-
tionnel ou rcurrent en claquent des doigts.
Do les propositions visant augmenter le nombre dtudiants forms lIA dans
lenseignement suprieur dans les divers plans gouvernementaux, qui insistent juste
titre sur le besoin de croiser ces formations avec des cursus non informatiques (sant,
transports, etc).
La question de lducation porte aussi sur toutes les autres filires denseignement
professionnelles. Comment les rendre plus rsilientes la transformation ou
lautomatisation complte des mtiers par lIA. Cest ce que traite Laurent Alexandre

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 335 / 362
dans son ouvrage rcent La guerre des intelligences o il prne un enseignement
non spcialis favorisant la crativit.
Les formations professionnelles (CAP et BAC Pro) ou suprieures forment des sp-
cialistes plus ou moins spcialiss. Ces spcialits n'ont pas empch des tas de
BAC+n de se rorienter dans divers chemins lors de leur vie professionnelle. Les en-
treprises ont la fois besoin de spcialistes prts l'emploi et de salaris qui s'adap-
tent rapidement au changement. C'est une attitude schizophrnique difficile grer.
Il faut donc des spcialistes-gnralistes... ! C'est--dire, des formations suffisamment
gnralistes et avec une spcialisation permettant quand mme de dmarrer quelque
part. Nombre d'coles d'ingnieur et de commerce ont ainsi un tronc commun gnra-
liste et une anne de spcialisation. Cest un bon compromis qui mriterait dtre ap-
pliqu aux formations professionnelles. Mais pas du jour au lendemain.

Recherche
Dans The Entrepreneurial State (2013), Mariana Manzzacuto se bat contre lide
selon laquelle le secteur priv prend des risques et lEtat est conservateur et lent. Elle
montre quau contraire, lEtat notamment amricain prend bien plus de risques et
investit plus sur le long terme que toute entreprise prive. Cest particulrement vrai
avec lIA.
La recherche est lorigine des grands progrs techniques dans lIA, matrialises
ensuite par les offres des entreprises de toutes tailles. Geoff Hinton chez Google tout
comme Yann LeCun sont danciens chercheurs du secteur public (au Canada et en
France). Idem pour les fondateurs de DeepMind et de nombre de startups pointues
dans le domaine. De nombreux frameworks open source ont t crs par des cher-
cheurs du secteur public comme Scikit-Learn qui a bnfici de contributions de
lINRIA.
Au-del de la recherche fondamentale, on a aussi besoin de plus de recherche appli-
que dans tous les domaines et pas seulement dans le numrique horizontal , ce
qui explique par exemple limplication de lINRIA dans la sant.

Souverainet
Les usages de lIA posent videmment des questions cls de ce ct-l.
Sans lIA, de nombreux services Internet jouent dj le rle de rgulateurs privs de
lInternet, quil sagisse de Google Search ou de lalgorithme dalimentation de votre
timeline sur Facebook. Avec lIA, la situation va se corser car les rsultats de ces ou-
tils vont de moins en moins dpendre dalgorithmes qui peuvent tre dcortiqus par
rtro-ingnierie et de plus en plus de solutions base de deep learning qui ne sont pas
facilement auditables. Les pouvoirs publics en sont rclamer des solutions tech-
niques permettant dexpliquer les algorithmes. Pourtant, ceux-ci sont comprhen-
sibles par les spcialistes ! Cest le caractre automatis de la cration des feature
maps intermdiaires des rseaux de neurones convolutionnels qui droute.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 336 / 362
Second enjeu, lmergence de nouvelles fragilits en termes de scurit avec la capa-
cit de tromper les techniques de deep learning, notamment dans la reconnaissance
dimages ou via les donnes issues des objets connectes. Cela entraine un besoin de
scurisation encore plus pousse des infrastructures stratgiques, de dfense et de cy-
berscurit des Etats.
Les Etats devront se doter de leurs propres solutions dIA spcifiques pour prparer
leurs dcisions stratgiques et anticiper celle des autres Etats. Cela relve encore de la
bordure de la science fiction mais beaucoup moins que les thses de la singularit.
Les outils du renseignement et de la socit de surveillance exploiteront de plus en
plus lIA, notamment pour faire des recoupements dinformation pour identifier des
profils suspects dIntenautes.
Lancien Directeur de la NSA et de la CIA pendant la prsidence Bush 43, Michael
Hayden, voquait en 2016 la sparation juridique sur la vie prive et de la scurit en
Europe311. Elle est gre de manire globale aux USA, tandis que dans lUnion Euro-
penne, la vie prive est rglemente au niveau communautaire et la scurit au ni-
veau des pays. Ce qui cr un handicap pour les Etats.
La souverainet des Etats sera aussi remise en cause en cas de transformation trs ra-
dicale de certains mtiers. Limpact pourrait tre grand dans certains pays o des ac-
tivits sont dlocalises, comme en Inde. Ces pays seront probablement affects par
la robotisation de ces activits, comme celles qui seront affectes par la RPA (Robo-
tic Process Automation). Dans le mme temps, ils pourraient bnficier des technolo-
gies de traduction automatique pour couvrir plus de marchs !

Rglementation
LIA soulve de nombreuses questions juridiques qui font lobjet de dbats depuis
plusieurs annes.
La personnalit juridique des robots a
dj t voque au niveau de lUnion
Europenne. Lavocat Alain Bensoussan
(ci-contre) suggre, avec enthou-
siasme312, de crer un vritable droit des
robots, situ entre le droit des biens et
des personnes313.
Sy ajouterait la cration de rfrentiels
robotiques aux niveaux thiques, cultu-
rels et normatifs.

311
Il me semble que ctait dans cette intervention : Inside the NSA: An Evening with General Michael Hayden , datant de 2014.
312
Cf son intervention TEDx Paris en octobre 2015 : De lurgence dun droit des robots. Alain Bensoussan a mme cr une Asso-
ciation pour le Droit des Robots en 2014.
313
Alain Bensoussan a aussi lanc divers servcies juridiques en ligne bass sur de lIA avec sa propre quipe de dveloppeurs. Cf
https://www.alain-bensoussan.com/avocat-intelligence-artificielle/. Il propose notamment une solution de justice prdictive.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 337 / 362
Ce droit comprendrait les rgles gnrales applicables tous les types de robots, les
rgles applicables des robots spcifiques comme les vhicules autonomes, les ro-
bots chirugiens autonomes ou les robots de services humanodes.
Un robot aurait une identit constitue dun numro314 et mme une assurance. Avec
lambiguit lie au fait que le robot et le logiciel qui laniment ne sont pas troitement
associs comme dans les tres humains ou les animaux, le dernier pouvant tourner
dans le cloud et servir plusieurs robots la fois, pouvant aussi tre hack et mis jour.
Qui plus est, la responsabilit dun robot en cas daccident associe son concepteur, le
logiciel, les donnes qui lalimentent et linfluencent, dont les actions des humains
qui lentourent et les donnes environnementales. Les responsabilits ne sont plus
individuelles, mais des chaines complexes de responsabilits.
Le second point cl concerne la protection de la vie prive, qui risque dtre encore
plus mise mal avec lIA qui va accumuler et croiser de nombreuses donnes trs
personnelles. Avec lapplication du GDPR, la nouvelle rglementation europenne,
dici mai 2018, les entreprises europennes vont devoir se conformer des rgles
plus strictes sur la protection des donnes prives. Cela pourrait gner le dploiement
de solutions dIA grand public et favoriser les GAFA, mme si ces derniers devront
respecter la mme rglementation en Europe.
Le droit loubli qui est inscrit dans la loi Rpublique numrique doctobre 2016
(dite loi Lemaire ) devra donc sappliquer aussi aux robots de services qui ont
devrait pouvoir demander de ne pas se souvenir dvnements. On peut se demander
comment pourrait fonctionner le droit loubli dans un rseau de neurones complexe
dont les paramtres ont t affects par le comportement dun utilisateur donn !
Faudrait-il rentrainer tout le rseau partir de zro pour viter que celui-ci recon-
naisse un utilisateur en fonction de son comportement ?
Se pose aussi une question cornlienne de stratgie conomique. Les entreprises eu-
ropennes ne peuvent pas facilement collecter les donnes personnelles alors que
leurs concurrentes amricaines et chinoises nont pas les mmes limitations.
Lconomie europenne est donc handicapte dans la qute de la dominance dans les
applications de lIA.
Sy ajoute la rglementation de lusage des vhicules autonomes, surtout pendant
leur longue phase de cohabitation avec les vhicules traditionnels.Va-t-on faire passer
leur permis des IA et comment ? Et se pose la question de la fameuse gestion des
dilemmes lorsquun vhicule autonome doit choisir entre deux formes daccidents et
de dommages corporels.
Quid sinon de lapplication du Premier Amendement qui rgit la libert dexpression
aux USA, des robots logiciels ?

314
Mais peut-tre aussi accompagn de la version des logiciels qui laniment, de ses capteurs, de leur tat, et des donnes qui ali-
mentent ses logiciels et peuvent affecter son comportement ! Le robot ne sera pas Skynet mais sa connexion de nombreux services
crra un systme fortement maill difficile isoler.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 338 / 362
Le droit case law des USA est trs diffrent du droit romain qui svit en Europe.
Aux USA, une bonne partie du droit provient de la jurisprudence. Il prempte peu
linnovation. En Europe et en France, le droit romain domine et cherche parfois
prcder linnovation. Cette diffrence dapproche a un impact sur la rglementation
applicable aux innovations technologiques. Elle favorise plutt les Amricains !

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 339 / 362
LIA dans lentreprise

Les entreprises de toutes tailles sont sous le feu de lincantation de linvitabilit de


lIA. Une fois quelles ont dcid de faire quelque chose, reste dterminer quoi,
pourquoi, comment, avec qui et pour obtenir quels rsultats.
Contrairement de nombreux projets numriques, ladoption de lIA passe encore
plus par des ttonnements et de lexprimentation. Les comptences en IA tant rares,
les entreprises vont se tourner naturellement vers des spcialistes, de grandes entre-
prises, des startups et/ou des prestataires de services.

Discours
En peine deux ans, lIA est devenue la tendance numro 1 du numrique, alimente
par les performances mdiatiques de Google, DeepMind et IBM Watson. Leffet de
suivisme est patent chez tous les cabinets de conseils et danalystes qui ont tous leurs
livres blancs sur lIA, gnrique ou sectorielle.
Nombre de ces livres blancs sont lnifiants, rappelant les dfinitions de lIA (machine
learning, deep learning, vision, langage, ) et prsentant quelques vagues tudes de
cas marginales. Cet exemplaire ci-dessous issu dInfosys en Inde est difiant, no-
tamment du ct dune prsentation qui aurait bien pu tenir sur deux pages au lieu de
14315, et qui ne dit donc pas grand-chose de bien original.

315
Cf More power to the energy and utilities, from AI, Infosys, 2017.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 340 / 362
Selon le Gartner, lIA tait la premire des trois grosses tendances en 2017316, avec
la ralit mixte et les plate-formes digitales , cest--dire le reste, avec dans le
mme sac, la 5G (2020), les plateformes dobjets connects, la BlockChain et les
ordinateurs quantiques (qui sont loin dtre adoptables par les entreprises en ltat
actuel).

Quelques analystes font des prvisions de chiffre daffaire pour le secteur de lIA.
Certaines se focalisent sur les industries numriques. Dautres, comme sur les objets
connects, portent sur le chiffre daffaire de lensemble des industriels intgrant de
lIA dans leur offre. PwC prvoit ainsi que lIA devrait faire croitre le PIB mondial
de $15,7T (trillions, mille milliards) entre 2016 et 2030, soit 14% du PIB actuel317.
En 2015, General Electric prvoyait que les objets connects gnreraient $15T de
croissance en 20 ans. Cisco valuait cette croissance $14 ,4T318 en moins de 10 ans.
On flaire un peu de double booking dans ces prvisions mirobolantes !
Voici un exemple de propos marketing bolo-bolo issu dun acteur des technolo-
gies que je ne nommerai pas :
LIntelligence Artificielle se dveloppe un rythme particulirement soutenu et les entreprises ne peuvent
plus ignorer son existence
Lautomatisation de tches simples va permettre aux employs de consacrer plus de temps des tches de
plus en plus complexes.
Le futur approche grands pas et les entreprises ne peuvent dsormais plus ignorer lIntelligence Artifi-
cielle. Cest aussi simple que cela. LIA obligera sans cesse les entreprises se rorganiser, quel que soit le
secteur. Il est crucial que les entreprises se penchent sur la question sans attendre. Elles doivent devenir

316
Cf Top Trends in the Gartner Hype Cycle for Emerging Technologies, 2017, aot 2017.
317
Cf AI to drive GDP gains of $15.7 trillion with productivity, personalisation improvements, juin 2017.
318
Cf The Internet of Everything is the New Economy, septembre 2015.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 341 / 362
matures sur le plan digital ds maintenant, car elles ne pourront tirer profit de lIA que si elles ont dj ac-
compli ces progrs pralables.
Les bnfices potentiels sur le plan financier sont vidents. LIntelligence Artificielle ne permettra pas seu-
lement de gagner du temps, elle permettra aussi de dcupler les potentialits des entreprises. En amliorant
la qualit de vie et la satisfaction au travail des employs, lIA permettra ces derniers dtre plus productif
et de se focaliser sur linnovation.
Pour prosprer, les entreprises doivent se prparer lIntelligence Artificielle ds maintenant. Le personnel
doit tre form en consquence, des investissements doivent tre raliss et une collaboration rapproche
avec des experts doit tre initie. Les entreprises devront imprativement comprendre comment, o et pour-
quoi faire appel lIA. LIntelligence Artificielle na rien dune technologie cl-en-main. Elle requiert des
spcialistes comptents, la fois en Intelligence Artificielle et dans le champ dactivit propre lentreprise.
Vous remplacer lIA par les objets connects ou le cloud et le discours serait quasi-
ment le mme !
Vous avez aussi Avanade dont le rapport Technology Vision 2017319 conseille aux
entreprises d'intgrer ds maintenant l'intelligence artificielle (IA) pour rester com-
ptitives . En prcisant que les entreprises disposent dune petite fentre de tir
pour exprimenter et se familiariser avec les stratgies et les technologies qui prpa-
rent larrive de lIA dans les pays industrialiss . Tout en recommandant aux en-
treprises d'agir avec responsabilit et d'adopter une thique numrique .
Sensuivent des recommandations qui correspondent probablement aux projets que
lESN peut mener comme crer des applications avec des interfaces utilisateurs natu-
relles (vocales, tactiles, VR), des quipes de travail augmentes par lIA et dadopter
ou de crer des plateformes.
Bref, tous les analystes saccordent pour dire il faut y aller . Mais o, avec qui,
comment et pour combien, cest une autre histoire !
Dans 7 AI myths , Robin Bordoli de la startup CrowdFlower320 (vido), synth-
tise bien les lieux communs sur lIA que les entreprises doivent comprendre et vi-
ter :
LAI est magique et le deep learning peut rsoudre tous les problmes. Non.
LIA, ce sont des donnes dentrainement, des mathmatiques, des patterns et
beaucoup ditration avec de lintervention humaine.
LAI est rserve une lite technologique et pour les GAFA. Dans la pratique,
lIA est exploitable par toutes les entreprises, notamment via les nombreuses res-
sources disponibles dans le cloud.
LIA est ddie la rsolution de gros problmes valant des milliards dEuros.
Ce document montre quil nen est rien et que les entreprises de tous les secteurs
dactivit sont concernes.

319
Cf Get ready for the AI first world, 2017.
320
CrowdFlower (2007, $58M) est une startup qui propose des outils dexploitation des donnes pour alimenter des solutions de
machine learning. Il automatise les business process amont et aval et met les utilisateurs dans la boucle pour affiner les donnes et les
modles.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 342 / 362
Les algorithmes sont plus importants que les donnes. Lexprience montre
que le contraire est plutt vrai. Ceci tant, la performance des algorithmes joue un
rle cl dans la qualit des rsultats dans le deep learning, et surtout dans leur per-
formance, notamment la rapidit de la phase dentrainement des modles.
Les machines sont meilleures que les Hommes. Non, car les machines ont
presque toujours besoin dinterventions humaines. Leur intelligence est alimente
par lexprience et lintelligence humaines. Qui plus est, lexprience montre que
des IA couples des hommes sont suprieures aux IA seules. Et enfin, les
hommes et les machines nont pas les mmes capacits et se compltent.
Les machines vont remplacer les Hommes. Dans la pratique, les machines aug-
mentent les capacits humaines et rciproquement.
LIA, cest du machine learning ou du deep learning. Non. Il existe plein de
techniques pour faire de lIA, notamment autour de lIA symbolique et des mo-
teurs de rgles. Lactualit les a mis de ct cause du rafus autour du deep lear-
ning. Mais celui-ci a des limites. Les meilleures solutions dIA intgrent et assem-
blent plusieurs techniques diffrentes.

Mthodes
Dans lIA comme dans de nombreux nouveaux vagues technologiques, linnovation
va passer par le croisement dune analyse de besoins mal traits, des attentes clients,
des inefficiences connues de lorganisation, et des potentialits technologiques. Il faut
donc avoir comme bagage de dpart une certaine comprhension de ce que les diff-
rentes briques et outils de lIA pourraient apporter. Il faut aussi en connaitre les con-
traintes actuelles, techniques et conomiques.

Il faut ensuite valuer les donnes disponibles qui pourraient alimenter des solutions
dIA. Leur volume, leur origine et leur qualit jouent un rle important dans la qualit
dune solution dIA btie avec.
Le tout peut tre touill dans des runions didation, sur paper boards et autres Post-
it avec les parties prenantes. Il vaut mieux avoir dabord mis les participants niveau
sur ce que lIA permet de faire.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 343 / 362
La stratgie donnes de lentreprise sera affecte par lIA. Les applications de
lIA impacteront la stratgie et les mthodes dacquisition de donnes via lIOT ou
dautres moyens et mme sur la stratgie dopen data de lorganisation.
Enfin, on fera le tri des projets potentiels pour choisir ceux qui sont les plus perti-
nents en fonction de grilles de choix classiques (quick win, cot modr, avantage
concurrentiel, ) puis on passera en phase dexprimentation. La notion de preuve
de concept (PoC) est particulirement valable dans lIA mme si on ne passe pas
par une startup pour le mener. La raison est que la majeure partie des solutions dIA
ne gnrent pas un rsultat dterministe. Il faut les exprimenter pour en valuer la
qualit. Les solutions dIA gnrent un taux derreur quil faut faire descendre aussi
bas que la technique et lquation conomique le permettent, et dans la mesure du
possible, en-dessous du taux derreurs humaines habituelles.
A la suite des exprimentations, il y aura du dchet. Sinon, il ny aurait pas de pro-
cessus dinnovation proprement parler. Seuls les PoC russis donneront lieu un
dploiement. Et il faudra alors reboucler la boucle pour amliorer les projets dploys
et dcouvrir la potentialit de nouvelles technologies dIA apparues depuis le dbut
du cycle.
Les cycles de dveloppement vont aussi voluer. Dans lIA, la mise au point des mo-
dles dentrainement de machine learning et de deep learning gnre des allers et re-
tours plus long que la correction de bugs classiques. Lentrainement dun modle
peut tre trs long, mme avec les batteries de serveurs les plus puissantes. On ne d-
bogue pas de tels modles de manire aussi interactive que les langages interprts du
web et mme que ceux qui sont compils.
Dun autre ct, lexpression de ces modles avec les langages de programmation
courants tels que Pythoon et R, coupls des SDK comme TensorFlow est plus con-
cise. Il ny a rien dautomatique dans tout cela malgr les lieux communs sur lIA.
La mise en uvre de solutions de machine learning requiert dexprimenter divers
modles de reprsentation des donnes, de segmentation, de prdiction. Celui du deep
learning passe par la dfinition de modles en couches empils dont la forme et le
dimensionnement dpend des donnes analyser : images, voix et textes321.
Dans son rapport Gouvernance de l'intelligence artificielle dans les grandes entre-
prises de septembre 2016, le CIGREF prodigue quelques recommandations sur la m-
thode employer pour adopter lIA dans son organisation et que je vais commenter :
Affecter un budget ddi lIA : cela peut avoir du sens pour mettre en place les
outils gnriques utiliss par les premiers projets. Cest donc une optique de mu-
tualisation a priori. Faut-il des budgets pour les projets eux-mmes ? Je ne le
pense pas. Cest le business qui dcide des priorits et lIA est une technique par-
mi dautres techniques avec lIOT, la BlockChain, la mobilit ou le cloud pour r-
aliser ces projets.

321
Voir cet inventaire des changements qui affectent le dveloppement logiciel dans les entreprises : How AI Will Change Software
Development And Applications, par Diego Lo Giudice de Forrester, octobre 2016.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 344 / 362
Passer linternet 4.0 : IA, algorithmes prdictifs : ce sont des buzzwords. Les
algorithmes prdictifs font partie des diffrentes techniques utilisables mais ne
sont pas les seules.
Engager un roboticien dans des quipes IT pour passer en 4.0 : si on est dans des
mtiers physiques . Pour la banque, cela a peu de sens, moins que cela
sapplique aux notions de Robotic Process Automation qui sont lies
lautomatisation de processus mtiers de cols blancs.
Dvelopper des systmes de Machine Learning : il faut sapproprier les outils
du machine learning et du deep learning pour en tirer le meilleur parti selon les
besoins.
Suivre les tutoriels de TensorFlow : OK car cest loutil gnrique le plus utilis
pour crer des solutions de machine learning et de deep learning. Et il fonctionne
en embarqu ou sur serveurs, on premise ou dans le cloud. Mais ce nest pas le
seul. Il y a aussi des outils plus flexibles comme PyTorch.
Dvelopper la culture des APIs en interne : oui, et indpendamment de lIA,
histoire de bien dcomposer le systme dinformation en services interoprant, de
favoriser la publication et lusage dopen data, de transformer son activit en pla-
teforme ouverte aux autres entreprises.
Sensibiliser les Mtiers et Fonctions aux enjeux de lIA : en effet, et en leur fai-
sant des propositions, en croisant les capacits dusage et les besoins des mtiers.
Dvelopper une communaut autour de lIA et changer : idem, comme sur
tous les sujets technologiues du moment (IOT, VR, BlockChain), lIA tant
dailleurs souvent un outil associ ces diffrents domaines.
Supprimer les points de douleur dans lentreprise : ce nest pas spcifique
lIA. Cest une approche dinnovation passant par lidentification de problmes
rsoudre.
Crer des botes noires logiques qui gardent en mmoire lIA et avoir la possi-
bilit de la dtruire (deffacer lensemble des parcs) dans un souci de droit
loubli. Effacer les donnes dun SI nest jamais un vritable problme. Les con-
server en est un ! La mmoire des IA, notamment base de deep learning, est si-
tue dans les donnes dentrainement et dans les paramtres des rseaux de neu-
rones entrains. Il est important de bien conserver les jeux de donnes
dentrainement, ne serait-ce que pour pouvoir auditer les systmes qui devien-
draient dfaillants.
En octobre 2017, le Cercle de lIA du CIGREF compltait ce premier rapport avec un
nouveau document de 36 pages, Intelligence artificielle dans les grandes entreprises,
enjeux de mise en uvre oprationnelle. Il donne la part belle aux leons tires de
lexprience de la mise en uvre de chatbots clients, avec deux exemples : ceux
dOrange et le cas dusage dans la RH. Il fait de nombreuses recommandations sur
leur mise en uvre, autour des questions pratique des donnes qui lalimentent et de
lthique.
Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 345 / 362
Le document se fait aussi lavocat dune IA ouverte, permettant aux entreprises de
faire dialoguer leurs IA entre elles, dans une approche voisine de celle de lopen data.
Larchitecture propose est voisine de celle de lopen data accessible via des APIs
avec des IA grant leurs propres ilots de donnes, qui sont exposes via des services
daccs. Reste dterminer au cas par cas les donnes transmises entre IA, dans le
respect de la vie prive des utilisateurs et des atouts stratgiques des entreprises. La
manire dont larchitecture des SI base dIAs semble assez traditionnelle dans
lapproche. Le principe mme dun agent dans lIA est dtre relativement ind-
pendant et dvoluer en fonction de son environnement.
Le Rapport du CIGREF voque aussi la question cl de la collaboration entre les en-
treprises et la recherche, en la confondant quelque peu avec les startups dont
lobjectif est plutt de crer des produits qui exploitent de la recherche existante. La
vitesse de transfert des travaux des chercheurs vers les applications dIA est plus ra-
pide quauparavant, ne serait-ce que parce que nombre de travaux de recherche
sappuient sur la publication de code exploitant des jeux de donnes standards
(MNIST, ImageNet, WordNet), faciles reproduire par dautres dveloppeurs.

Projets
Supposons quun besoin soit bien identifi, que les donnes soient disponibles et que
les technologies de lIA puissent apporter une solution. Une fois ceci qualifi, on peut
rentrer en mode projet.
Va-t-on mener plusieurs proof of concepts en parallle avec diffrents frameworks
dIA tels que ceux qui sont cits auparavant, et comparer ensuite les rsultats ? Ce ne
serait pas raisonnable et surtout, ce serait trop coteux. Il vaut mieux se faire conseil-
ler pour choisir les bons outils et ensuite mener son exprimentation.
Un projet dIA dentreprise a un petit ct recherche applicative, quil sagisse dun
chatbot, dune application industrielle, dun systme de vision artificielle ou dun ou-
til danalyse de donnes pour faire du prdictif.
Pour prendre ce dernier exemple, on ne va pas juste alimenter une bbte de machine
learning ou de deep learning avec un tombereau de donnes et attendre un beau rsul-
tat la sortie dun tuyau. Il va falloir dabord extraire et prparer les donnes, les net-
toyer, les filtrer, savoir ne conserver que ce qui est pertinent.
On va ensuite paramtrer les outils de machine learning ou deep learning en fonction
des algorithmes utiliser. Comme nous lavons vu dans ce document, il nexiste pas
une technique unifie de machine learning ou de deep learning, mais des dizaines de
variantes ! Puis on va observer les rsultats. Ils ne seront pas forcment probants du
premier coup. Il faudra reboucler sur les donnes et le paramtrage pour affiner le
modle. Et il faudra aussi bien visualiser les rsultats pour quils soient comprhen-
sibles. La partie dataviz dune application dIA est aussi importante que les algo-
rithmes retenus.
On apprciera alors la qualit des rsultats. Les techniques de machine learning et de
deep learning gnrent rarement des rsultats exacts 100%. Il y a toujours un taux

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 346 / 362
derreur, que lon minimise avec lexprience et que lon cherche faire descendre
en-dessous dun niveau acceptable. Comme la varit des changes typiques accep-
tables dans un chatbot, le taux derreurs dun systme de reconnaissance vocale, ou
celui de lidentification de pathologies dans de limagerie mdicale. A ce jour, les
solutions les plus avances dans ce dernier domaine gnrent un taux derreur plus
faible que celui des spcialistes ! Cest donc acceptable !
Un benchmark pourra ventuellement avoir lieu pour comparer un projet men en
mode IA et un projet men avec des outils traditionnels de data mining. Si ceux-ci
peuvent donner des rsultats convenables sur des donnes chiffres, ils ne sont main-
tenant pas du tout la hauteur pour traiter des donnes images/vido/audio, l o le
deep learning est devenu indispensable.

Benchmarks
Le premier lment dun benchmark consiste analyser les tudes de cas du march
qui sont voisines des projets que lon souhaite lancer. En matire dIA, il faut tre
particulirement vigilant. Nombre dtudes de cas mises en avant par des fournisseurs
de technologies exagrent les rsultats voire travestissent entirement la ralit des
projets.
Quelques points de vigilance sont observer : qualifier et quantifier les donnes qui
alimentent les systmes ainsi que leur origine et leur fiabilit, dcortiquer les outils
logiques, logiciels et matriels utiliss, et analyser les rsultats. Enfin, la structure de
cot et la dure du projet sont intgrer dans lvaluation. Il faut aussi avoir une vi-
sion globale dun projet. Par exemple, un chatbot marketing utilis dans la relation
client doit tre valu sur son impact global sur la satisfaction client et pas seulement
sur son impact sur le cot du support commercial ou technique.
Dans le contexte dun projet dentreprise, un projet dIA dmarre souvent avec des
donnes et si possible avec de gros volumes de donnes. Le volume et la qualit des
donnes sont cls pour bien entrainer un moteur de deep learning. Cest lune des rai-
sons de la force des GAFA : ils ont naturellement accs dimmenses volumes de
donnes lies aux actions des utilisateurs de Google Search, Facebook, iOS, Android,
SIRI, Amazon Alexa, etc. Les socits qui dploient de gros volumes dobjets con-
nects ont aussi accs des donnes intressantes exploiter.
Un benchmark dentreprise doit donc partir dun ou de jeux de donnes dont on veut
extraire quelque chose.
Il faut bien videmment se poser la question de ce que lon veut en faire. Au dpart,
on ne sait pas trop. Lentreprise dispose par exemple dune base de donnes du com-
portement de ses clients et voudrait lutiliser pour identifier les clients potentiel
dupsell ou de cross-sell (ventes additionnelles), ou au contraire, ceux qui peuvent
gnrer du churn (abandonner loffre). Elle peut aussi vouloir dterminer les actions
mener pour optimiser un systme complexe : client, production, autre.
LIA peut aussi servir dans tout un tas de domaines : dans la robotique (qui intgre
gnralement tout un tas de briques technologiques : vision artificielle, mcanique,

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 347 / 362
systmes experts, etc), dans la relation client, pour crer des solutions de recomman-
dation, pour analyser des tendances, pour analyser limage de lentreprise dans les
mdias et les rseaux sociaux. Etc. Et la gradation est forte entre gnrique et spci-
fique dans ces diffrentes solutions.
Des projets dIA peuvent se passer de machine learning et de deep learning et
sappuyer sur des connaissances structures et des moteurs de rgles. Cest par
exemple le cas pour crer des systmes dassistance la maintenance industrielle.
Ds lors que lon manipule des donnes trs structures et une architecture de con-
cepts, les outils de deep learning sont inadapts. On se retrouve ici dans un domaine
ancien, qui a connu ses heures de gloire pendant les annes 1980, avec LISP et Prolog.
Il nest pas prim pour autant, malgr tout le tintouin autour du deep learning, pr-
sent tors comme une sorte de solution universelle des besoins de lIA. On va alors
faire appel des BRMS, des Business Rules Management Systems.
Conceptuellement, pour les entreprises qui disposent de gros volumes de donnes,
lIA constitue souvent un ensemble de techniques qui complte une longue ligne de
technologies : les bases de donnes, la business intelligence, le big data, les data ana-
lytics et la data intelligence. Cest donc une volution plus quune rvolution pour
elles.

Outils
Lentreprise ou ses partenaires devront faire des choix doutils pour mener leurs pro-
jets dIA. Dans tous les domaines de lIA, il y a dj un norme embarras du choix.
Et la majorit des solutions logicielles sont open source.
Les acteurs se rmunrent avec du service, des solutions mtiers payantes, des res-
sources en cloud, voir du matriel spcialis.
Il va falloir dterminer o excuter ses solutions. Si elles sont demandeuses de res-
sources machine importantes, avec des serveurs base de GPU, il sera cens de faire
appel des fournisseurs de telles ressources en cloud. Et des fournisseurs qui sont
videmment mme de protger les donnes de lentreprise, mme les jeux de tests.
Ils existent et fournissent des cloud privs adapts ce genre de besoins.
On fera aussi des choix de topologie dIA, par exemple, en dterminant o sont rali-
ss les traitements. Dans certains cas, on les fera raliser au niveau des capteurs,
comme pour certains types de camras de surveillance qui intgrent leur propres ou-
tils de dtection dintrusion et remontent des alertes via le rseau. Certains outils
comme la bibliothque TensorFlow sont conus pour tre excuts indiffremment
sur des objets ou sur des serveurs. Des architectures matrielles comme les GPU de
Nvidia le sont tout autant.
Nanmoins, les applications de lIA ne vont pas rvolutionner la totalit des systmes
dinformation. Elles en exploiteront des briques existantes comme illustr dans le
schma ci-dessous. Ainsi, en amont des outils de machine learning et de deep lear-
ning se trouvent des bases de donnes et des serveurs dinfrastructure traditionnels.
La qualit des donnes alimentant les outils de lIA. En aval, les applications propo-

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 348 / 362
ses aux utilisateurs sappuient toujours sur des interfaces, en gnral graphiques,
adaptes aux micro-ordinateurs, mobiles ou systmes industriels. Lun des impacts de
lIA est de dvelopper lusage de la commande vocale.
Il fait mme merger la notion de VUI pour Vocal User Interface qui dcrit les
techniques et bonnes pratiques de gestion de linteraction vocale avec les utilisateurs.
Au passage, les applications vocales intgres dans les plateformes telles quAmazon
Alexa sont utilises de manire transparente par les utilisateurs, faisant disparatre la
notion mme dapplication.

Comptences
Comme pour toute nouvelle technologie, les entreprises font gnralement appel
des spcialistes de lIA qui connaissent la diversit de ses nombreuses techniques et
mthodes.
Daprs le plan France IA du gouvernement publi en mars 2017, les principaux m-
tiers (et comptence) qui devraient apparatre ou se gnraliser autour de lIA se-
raient :
Architecte en conception dIA : une fonction dans la ligne des architectes de
systsmes dinformation, qui requiert une vue globale des techniques dIA et une
capacit les composer, autant dans les architectures logicielles, matrielles que
cloud.
Intgrateurs dIA : il sagit de dveloppeurs ayant une bonne comprhension et
pratique des techniques de machine et de deep learning qui adapteront ces briques
technologiques aux usages mtiers.
Spcialistes mtier : que lon retrouve habituellement dans les fonctions de MOA
(Maitrise douvrage), qui ont une comprhension dun mtier et des donnes asso-
cies, et font le lien entre le besoin mtier et les quipes techniques existantes, ai-
dent slectionner et utiliser les nouveaux outils embarquant une IA.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 349 / 362
Concepteurs dinteractions avec les IA et robots : qui maitrisent lutilisation de
donnes comportementale et lergonomie pour concevoir et spcialiser les inter-
faces avec les utilisateurs moins qualifis et les clients. Ils ont des comptences en
design !
Entraineurs dIA : moins ou pas qualifis sur les techniques dIA mais ayant une
haute spcialit de leur mtier et qui alimenteront en donnes de rfrence divers
systmes dIA. Cest le cas par exemple des systmes de traitement du langage ou
de chatbots qui ont besoin de donnes textuelles types pour fonctionner.
Dans les petites structures telles que les startups, lensemble de ces activits sera con-
centre sur un nombre rduit de spcialistes, et mme parfois, un seul.
Le march sattend galement une forte demande de chefs de projets intervenant de
manire transversale sur le dveloppement, lintgration, et la maintenance des sys-
tmes dIA, notamment dans les domaines du machine learning, des systmes experts,
du traitement du langage naturel et de la programmation robotique.
Un projet dIA est comme un projet dobjets connects : il va devoir runir des talents
et comptences trs divers, certaines internes aux entreprises, dautres externes. La
comptence mtier prime. Suit la comptence IT plus traditionnelle, pour la collecte
et lexploitation des donnes. Le paramtrage des moteurs dIA passe par des spcia-
listes dun nouveau genre qui ont de bonnes bases en IA sachant que la France en
forme peine un millier par an actuellement. Ils sont complts par des data scien-
tists qui jouent parfois tous les rles.

Aprs avoir rencontr les pires des difficults recruter de bons dveloppeurs, les
entreprises de services, les diteurs de logiciels, les entreprises utilisatrices tout
comme les startups vont rencontrer de grandes difficults identifier les bons talents
mme de paramtrer un moteur de deep learning322 !

322
LAmricaine Kaggle (2010, $16m), acquise par Google en mars 2017, gre une communaut de data scientists qui lance des
dfis aux participants. Elle gnre des classements qui permettent ensuite didentifier les meilleurs talents du march.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 350 / 362
Combien de temps faut-il pour apprendre paramtrer un rseau de neurones de deep
learning ou un systme de machine learning ? Il nexiste pas de rponse prcise
cette question. Les cursus de formation actuels correspondent des profils scienti-
fiques BAC+5 avec au moins une deux annes de spcialisation.
On doit pouvoir mettre niveau de bons profils de dveloppeurs en moins de temps.
Ceux-ci ont lhabitude de sapproprier par eux-mmes de nouvelles techniques et ou-
tils. Les plus dous doivent pouvoir sy mettre de manire exprimentale en quelques
mois.

Il faut aussi pouvoir intresser les salaris des entreprises qui ont t forms initiale-
ment lIA mais ne lont pas mise en uvre en pratique car ce ntait pas la mode
au moment de leur arrive sur le march du travail.
Les entreprises de services numriques qui matrisent ce genre de projet ne sont pas
encore nombreuses. Elles sont en train de sy mettre. De leur ct, les startups ne sont
pas forcment adaptes la conduite de projets, sauf pour gagner les premiers clients
en entreprise. Pour les reprer, on peut commencer par visiter leurs sites web et in-
ventorier leurs reprsentants, chefs de projets et ingnieurs, qui sexpriment dans les
confrences sur lIA. Dans les mois et annes venir, les grands acteurs du service
vont probablement faire lacquisition de petits acteurs spcialiss dans lIA.
Les projets peuvent tre vite couteux sil faut mettre en branle une arme de consul-
tants, data scientists, dveloppeurs et aussi designers. Mme si le cur du racteur
dun projet dIA est spcifique lIA, autour, il faudra aussi faire tourner des briques
plus classiques, tant ct back-end (prparation des donnes, bases de donnes,
stockage, infrastructure, cloud) que du front-end (crer de belles interfaces pour les
utilisateurs).

Organisation
La tentation est grande de crer de nouvelles fonctions de direction autour de lIA.
Aprs le Chief Digital Officer, le Chief AI Officer ? Pas forcment323 ! Les quipes
existantes peuvent et doivent semparer de lIA :

323
Point de vue partag dans Qui doit grer la stratgie en entreprise, de Robin Ferrire, Orange Business Services, septembre 2017.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 351 / 362
Les DSI pour intgrer leur dimention technique, lurbanisation du systme
dinformation, le lien entre les applications de lIA et le legacy, les donnes et les
infrastructures.
Les quipes de maitrise douvrage, o quelles soient, pour faire le croisement
des potentialits technologiques de lIA avec les besoins et priorits de lentreprise.
Les CDO car lIA est trs utile dans les outils associs leur mission, en particu-
lier dans tout ce qui touche au marketing et la relation clients.
Les business units, qui doivent tre sensibilises aux bonnes pratiques autour de
lIA dans leur secteur dactivit.
Les quipes dinnovation ouverte qui doivent faire de la veille sur les applica-
tions et techniques de lIA comme dautres domaines et identifier notamment des
startups intressantes pour les mtiers de lentreprise.
Les quipes juridiques qui doivent tre mises dans la boucle lorsque des donnes
personnelles sont en jeu dans les applications de lIA.
Nommer un Directeur de lIA serait lquivalent de nommer un Directeur du Logi-
ciel tant lIA va devenir omniprsente.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 352 / 362
Epilogue

Nous voici au terme de ce petit voyage dans lIA qui se voulait aussi pratique et
pragmatique que possible et destin avant tout aux entreprises qui se demandent par
quel bout prendre le sujet de lintelligence artificielle.
Il est en effet difficile de faire le tri entre la mode, les effets de manche, les annonces
tonitruantes et les applications pratiques de lIA. Des gnralisations et des extrapola-
tions abusives sont souvent construites autour de performances mdiatises comme la
victoire dAlphaGo au jeu de Go ou celle de Watson Jeopardy. Le phnomne enfle,
maintenant que lIA est devenue un argument marketing gnrique pour les startups
comme pour les grands groupes du numrique. Et les prdictions vont bon train, de la
fin des mtiers la fin de lHomme lui-mme.
Aprs ce tour, vous aurez saisi que les prouesses rcentes de lIA sont lie des pro-
grs parallles : dans les mthodes et algorithmes qui samliorent continument, dans
le matriel et dans les donnes qui les alimentent. La puissance brute des machines ne
fait pas tout, mme si elle peut avoir tendance rendre les dveloppeurs moins astu-
cieux dans leur manire daborder les problmes. Cette impression vient de la diffi-
cult apprhender la nature mme des progrs raliss dans les algorithmes de lIA
car leur vulgarisation est trs difficile. Si vous avez bien saisi comment fonctionnait
un rseau de neurones convolutionnel et ses applications, vous avez dj franchi une
belle tape !
Malgr ces nombreux cueils et la bulle mdiatique qui laccompagne, la vague de
lIA est srieuse et semble aussi importante que les vagues technologiques prc-
dentes quont t le cloud, le big data ou les objets connects. Il faut videmment se
garder de faire des gnralits, comme lorsque lon prsente la BlockChain comme la
poudre de perlimpinpin universelle de lconomie de la confiance.
Nous avons pu dcouvrir de nombreuses startups franaises dans le domaine de lIA,
aussi bien au niveau des techniques horizontales que des applications mtiers. Nous
avons aussi des talents franais galement tablis aux USA ou dans des entreprises
amricaines, comme Yann LeCun qui a cr le laboratoire dintelligence artificielle
de Facebook Paris. Reste transformer cela en avantage stratgique et en emplois !
Btir une Startup Nation de lIA, voil un beau dfi qui sannonce ! Les questions qui
se posent sont les mmes que dhabitude : comment faire en sorte que ces startups
grandissent vite, soient bien finances et se dveloppent linternational.
Une opportunit existe pour bien positionner la French Tech sur ce crneau porteur
qui structurera vraisemblablement les plateformes numriques des annes venir.
Comme dhabitude, il sagit dtre les premiers crer des plateformes mondiales de
grande ampleur, pas juste de crer des myriades dapplications mtiers disparates.
Lexcellence en R&D ne se traduit pas ncessairement en innovations et russites
conomiques sinon, la France serait championne du monde des industries numriques
depuis des dcennies !

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 353 / 362
Enfin, mme avec une IA un peu faiblarde et lourdingue, la marche vers
lautomatisation partielle de nombreux mtiers est dj en route et va dans le sens
dune histoire qui a dmarr avant linvention de la roue. Il faut sy prparer ds
maintenant, ne pas y rsister futilement, sy adapter en se modernisant, en faisant
voluer notre systme denseignement et en produisant des outils comptitifs.
Les civilisations qui ont vit les progrs techniques et les outils de communication
dans lhistoire ont systmatiquement priclit ou, au mieux, dclin. Les deux
exemples les plus connus sont lempire Ottoman qui a mis trois sicles adopter
limprimerie caractres mobiles aprs son invention par Guttenberg ou la Chine qui
a brutalement bloqu ses changes maritimes aux dbuts du 15ime sicle.
Qui plus est, les prvisions des prvisionnistes nengagent que ceux qui y croient.
Elles sont souvent ct de la plaque. Le futur nest pas crit lavance, il scrit au
fur et mesure par les innovateurs. Cest la socit qui adopte ou pas les innovations
en fonction de motivations complexes.
Aux entreprises donc de crer des solutions qui, certes, rpondent des besoins et
exploitent lIA, mais aussi de le faire avec responsabilit, avec les bons garde-fous
pour viter des drives que lon commence dj sentir, que ce soit au niveau du res-
pect de la vie prive ou du simple besoin de relations humaines que nous pouvons
toujours ressentir. Rduire outrance les relations humaines sous couvert defficacit
capitalistique nest pas ce quoi lHomme aspire naturellement.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 354 / 362
Mdias spcialiss

Lintelligence artificielle est devenue un thme couramment couvert par lensemble


de la presse technologique, scientifique et conomique gnraliste. Il nexiste pas
beaucoup de mdias spcialiss sur lIA en dehors de revues pointues destines aux
chercheurs.
En voici quelques exemples.
A.I. Magazine : un site dinformation en anglais sur lIA. http://ai-magazine.com.
AI Magazine : un magazine US sur la recherche en IA dit par lAssociation for the
Advancement of Artificial Intelligence. http://www.aaai.org/Magazine/magazine.php.
AI Playbook : un site du fonds dinvestissement Andreesseen Horowitz qui dfriche
le champ dapplication de lIA dans les entreprises. http://aiplaybook.a16z.com/
Chatbot Magazine : un site US sur les chatbot. https://chatbotsmagazine.com/.
Journal of Intelligence Artificial Research : qui comment son nom lindique
couvre lactualit de la recherche en IA. http://www.jair.org/.
Journal of Machine Learning Research, http://www.jmlr.org
Mais o va le web : qui commente lactualit du numrique, dont celle de lIA, avec
une vision critique et caustique. http://maisouvaleweb.fr/.
Nanalyze est un bon site web faisant le tour de lactualit autour des startups de lIA.
http://www.nanalyze.com.
Singularity Hub : magazine de lactualit scientifique teint par les technologies
dites exponentielle, https://singularityhub.com/
Voicebot : un autre magazine US sur les chatbots. https://www.voicebot.ai/.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 355 / 362
Dictionnaire anglais/franais de lIA

Anglais Franais Commentaire


Back propagation Rtro-propagation Technique dapprentissage de
rseau de neurones
Convolutional networks Rseaux de convolution, r- Type de rseau de neurones
seaux convolutionnels pour le deep learning.
Deep learning Apprentissage profond Machine learning avec rseaux
de neurones grand nombre de
couches.
Feature map Utilise dans les convnets
GDPR : General Data Protec- RGPD : Rglement Gnral de Nouvelle rgulation euro-
tion Regulation Protection des Donnes penne de protection des don-
nes personnelles applicable
partir de mai 2018.
Filters Filtres Utilise dans les convnets
Machine learning Apprentissage machine
Neuromorphic chipsets Composants neuromorphiques Processeurs spcialiss pour
les rseaux de neurones.
Neuronal networks Rseaux de neurones Rseaux de neurones artificiels
utiliss dans le machine lear-
ning et le deep learning.
Optical Characters Recognition Reconnaissance de caractres
Principal Components Analysis Analyse en composantes prin- Une technique utilise dans le
cipales machine learning.
Quantum computing Informatique quantique Pourrait avoir des applications
futures dans le deep learning.
Recurrent neuronal networks Rseaux de neurones rcur- Type de rseau de neurones
rents pour le deep learning.
Stockastic Gradient Descent Descente stockastique de gra- Utilise dans la back-
dient propagation
Shallow networks Rseaux faible profondeur Utilis dans le machine lear-
ning.
Sparse Parcimonieux Type de rseaux de neurones.
Spiking neurons Neurones impulsions, neu- Utiliss notamment dans le
rones impulsionnels traitement du langage et dans
certains processeurs neuromor-
phiques.
Stacked autoencoders Autoencodeurs empils Rseaux de neurones gnrant
des contenus partir de des-
cripteurs.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 356 / 362
SVM : support vector ma- Machine vecteurs de support, Technique de segmentation du
chines sparateurs vastes marges machine learning.
Uncanny valley Valle de ltrange Phnomne se manifestant
lorsque lon est mal laise
face un robot humanoide trop
raliste.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 357 / 362
Glossaire

AGI : Artificial General Intelligence, IA de CNN : Convolutional Neuronal Networks, ou


niveau quivalent celle de lhomme. Tout du rseaux de neurones convolutionnels.
moins dans la capacit de raisonnement. Connexionnisme : mthode et techniques de
Alexa : service en ligne dagent conversation- lIA mettant en uvre une modlisation bas
nel dAmazon, fonctionnant par reconnaissance niveau base de rseaux de neurones artificiels.
vocale et intgr dans son objet connect Echo. ConvNet : Convolutional Neuronal Networks,
Algorithmes gntiques : algorithmes ou rseaux de neurones convolutionnels.
samliorant deux-mmes par un processus Cortana : agent conversationnel de Microsoft.
dvolution voisin de celui du vivant, avec
techniques de croisements. DARPA : agence amricaine de financement
de la R&D pour le Pentagone. Lun des plus
ANI : Artificial Narrow Intelligence, IA utilise grands financeurs de projets de R&D dans lIA
dans un champ prcis de rsolution de pro- au monde.
blmes. Cest ltat de lart actuel.
DBN : machines restrictives de Boltzmann, des
ASI : Artificiel Super Intelligence, IA de ni- rseaux de neurones datant de 1986 utilisant
veau suprieur celle de lhomme. une seule couche de neurones source et cible et
ASIC : curcuits intgrs intgrant des portes sans connexions entre les neurones dune mme
logiques graves en dur. Les chipsets de mo- couche. Cest le modle le plus simple de r-
biles et les microprocesseurs sont des ASIC. Ils seau de neurones qui est ensuite exploit dans
prsentent lavantage de consommer moins dautres assemblages, comme les Deep Belief
dnergie et dtre plus rapides que les FPGA Networks (DBN) crs en 2006.
mais ne sont intressants conomiquement que Decision Management Systems : concept
sils sont produits en grand volume. Technique marketing de systme doptimisation des dci-
utilise par Google pour ses processeurs neu- sions des entreprises qui englobe les moteurs de
romorphiques TPU. rgles pour codifier les connaissances humaines
Back propagation : rtro-propagation, tech- et pratiques de lentreprise, des modles prdic-
nique dentrainement de rseau de neurones tifs qui utilisent le machine learning pour re-
consistant comparer le rsultat du rseau sur commander les actions, et des outils danalytics
un objet type avec la bonne classe de lobjet et de reporting.
de rtropropager lerreur en remontant dans le Deep Blue : nom de lordinateur qui a gagn
rseau de neurones. Cela utilise des gradients, aux checs contre Gary Kasparov en 2007. Il
des fonctions de couts et plein de concepts di- sagissait en fait dun modle avanc, dnomm
vers et varis. Cette rtropropagation est rali- Deeper Blue.
se pour tous les objets de la base
dentrainement. Cest un traitement trs cou- Deep learning (apprentissage profond) : exten-
teux en ressources machines. Il est possible de sion du machine learning intgrant des fonc-
lautomatiser pour le parallliser sur des archi- tions dapprentissage supervis et dauto-
tectures multi-curs ou multi-processeurs. Il apprentissage sappuyant sur des modles de
est encore plus efficace dans les processeurs reprsentation de donnes complexes et multi-
neuromorphiques. dimensionnels.
Baysien : technique dIA sappuyant sur des Deep Mind : filiale de Google acquise au
modles probabilistes et statistiques. Royaume-Uni en 2014. Est lorigine de la
victoire contre le champion mondial de Go d-
BRMS : Business Rules Management Systems, but 2016.
les logiciels de gestion de rgles permettant de
crer des systmes experts. Feature map : composante des rseaux de neu-
rones convolutionnels. Il sagit dune matrice
Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 358 / 362
qui contient des valeurs dcrivant la pondra- IA intgrative : technique de cration de solu-
tion de lapparition dun filtre dans une image tions dIA associant plusieurs techniques diff-
dorigine. Un filtre contient une forme donne. rentes (agents, moteurs de rgles, rseaux neu-
Si celle forme est dtecte, cela va donner un 1, ronaux, machine learning, deep learning,
si elle nest pas dtecte, cela donne un 0. Et baysien, ).
toute une gradation entre zro et un pour les Kill switch : mtaphore du bouton darrt
valeurs intermdiaires. durgence dun ordinateur dou dIA de niveau
Filtre : utilis dans un rseau de neurones con- AGI ou ASI au cas o celui-ci ne serait plus
volutionnel, sert identifier des formes avec sous contrle.
des niveaux dabstration plus ou moins levs. LISP : langage de programmation dIA utilis
Ils sont dabord initialiss de manire alatoire dans les annes 80 et 90 et notamment dans la
puis ajusts progressivement par entrainement cration de systmes experts.
du rseau de neurones avec rtro-propagation
des erreurs. Logique floue : technique dIA cr par Lofti
Zadeh dans les annes 1960 et reprsentant
Force brute : technique de rsolution de pro- linformation non pas sous forme binaire mais
blme utilisant surtout la puissance des ma- sous forme floue comprise entre 0 et 1. Elle est
chines et des algorithmes traditionnels, quelle parfois utilise dans les moteurs de rgles de
que soit leur efficacit. Souvent associe des systmes experts.
algorithmes dits exponentiels, dont le temps de
calcul volue de manire exponentielle avec la LSTM : long short term memory, modle de
taille du problme traiter. rseaux de neurones rcurrents qui intgrent
bien le contexte dans lequel les lments appa-
FPGA : circuits intgrs intgrant des portes raissent de manire squentielle. Aussi appels
logiques qui sont dfinies par programmation.
rseaux de neurones mmoire. Ils servent en
Ils sont adapts la fabrication de petites sries particulier interprter le langage et faire de
et au prototypage. Ils consomment plus la traduction automatique.
dnergie et sont plus lents que les ASIC.
Machine learning (apprentissage automa-
GAN : Generative Adversarial Networks, tech- tique) : technique dIA permettant de rsoudre
nique de rseaux de neurones convolutionnels des problmes de perception de
inverss qui gnrent des contenus partir lenvironnement (visuel, audio, ) de manire
dautres contenus ou dinformations lmen- plus efficace quavec les algorithmes procdu-
taires. Voir la partie: la partie qui en dcrit des raux traditionnels. Elle sappuie souvent sur
usages. lusage de rseaux de neurones artificiels.
GOFAI : Good Old-Fashioned Artificial In- Markov, modle de : mthode dIA sappuyant
telligence qui dnomme les mthodes dIA sur des mthodes probabilistes.
sappuyant sur les mthodes symboliques
comme dans les systmes experts, en vogue Moteurs de rgles : solutions techniques per-
jusque dans les annes 1980. mettant de mettre en uvre des systmes ex-
perts et exploitant des bases de prdicats
Google Now : agent conversationnel de Google, (rgles).
fonctionnant sous la forme dune application
mobile. Neuromorphique : se dit des processeurs neu-
romorphiques qui prsentent la particularit
GRU : Gated Recurrent Units, technique intro- dintgrer dans leur conception des modules de
duite dans les rseaux de neurones rcurrents en calcul qui collent avec les besoins des princi-
2014 qui simplifie les traitements par rapport au paux rseaux de neurones et en particulier les
LSTM.
rseaux de neurones convolutionnels. En pra-
Hivers de lIA : priodes de creu et de dsa- tique, ils comprennent des multiplicateurs de
voeu dans lhistoire de lIA. Le premier hiver matrices et des matrices de synapses connectant
date de la fin des annes 1970 et le second de des vecteurs de neurones, plus de la mmoire
celle des annes 1980 et dbut 1990. locale rapide.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 359 / 362
Pooling : technique de rduction de rsolution Symbolisme : mthodes et techniques de lIA
des feature maps dans les rseaux de neurones visant reprsenter linformation et la savoir
convolutionnels. Ils permettent de rduire les par des concepts organiss hirarchiquement et
temps dentrainement et de traitements dans ces par relations fonctionnelles et haut niveau.
rseaux. Synapses : liaisons entre neurones au niveau de
Rapport Lighthill : rapport anglais ayant con- la liaison entre axones et dendrites.
duit au premier hiver de lIA en 1973 aprs Synaptique : autre appellation des processeurs
avoir constat les progrs trop lents de lIA neuromorphiques.
faisant suite des promesses trop ambitieuses.
Systmes experts : systmes dIA sappuyant
Rseaux de neurones : technique dIA visant sur la modlisation du savoir haut niveau avec
simuler le fonctionnement des cellules neuro- des logiques de prdicat (si ceci alors cela, ceci
nales pour reproduire le fonctionnement du
est dans cela, ) et des moteurs de rgles.
cerveau humain. Est surtout utilise dans la
reconnaissance de la parole et des images. Peut- TPU : Tensor Processor Unit, les processeurs
tre simul en logiciel ou avec des circuits lec- neuromorphiques de Google, utiliss dans leurs
troniques spcialiss. data centers et aussi par DeepMind pour Al-
phaGo.
RNN : Recurrent Neuronal Networks ou r-
seaux de neurones rcurrents. Ce sont des r- Transhumanisme : courant de pense ambi-
seaux de neurones adapts lanalyse de si- tionnant de fusionner lhomme et la machine
gnaux temporels comme la voix, du texte, un pour lui permettre de dpasser ses capacits
lectro-cardiogramme ou le bruit dune ma- intellectuelles et datteindre limmortalit.
chine. TrueNorth : processeurs neuromorphique
Sciences cognitives : disciplines scientifiques dIBM.
ddies la description, l'explication et la simu- Vie artificielle : simulation de la vie un ni-
lation des mcanismes de la pense humaine, veau dabstraction arbitraire, via des logiciels.
animale ou artificielle. Les progrs dans ces
domaines permettent damliorer les techniques VUI : Vocal User Interface, linterface vocale
utilises dans lIA. dun agent conversationnel audio. Cela com-
prend lensemble des interactions avec
Seq2seq : sequence to sequence, technique uti- lutilisateur et leur qualit.
lise dans le traitement du langage dans les
rseaux de neurones LSTM. Watson : nom de lordinateur dIBM ayant
gagn au jeu Jeopardy en 2011 et mettant en jeu
SGD : stockastic gradient descent, technique des agents conversationnels volus, appliqus
utilise dans les rseaux de neurones pour d- dans diffrents mtiers comme dans la cancro-
terminer le poids optimal des synapes. logie. Watson est depuis devenu une plateforme
Singularit de lIA : moment symbolique o logicielle avec un ensemble dinterfaces de
lIA dpassera le niveau dintelligence humaine. programmation pour crer des services utilisant
Mais est-ce que cela sera un moment prcis ou lIA (chatbot, reconnaissance dimages, etc) qui
un continuum ? sont notamment disponibles en cloud.
SVM : support vector machines, technique de
segmentation utilise dans le machine learning.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 360 / 362
Historique des rvisions du document

Numro de version Date Modifications


1.0 19 octobre 2017 Premire version publie sur http://www.oezratty.net.

Vous tes lecteur, expert, fournisseur et avez dtect des erreurs dans ce document ?
Il y en a srement ! Nhsitez alors pas me contacter (olivier@oezratty.net) pour me
les signaler. Jeffectuerai alors des mises jour de ce rapport tout en mettant jour le
chrono dans le tableau ci-dessus.
Ce document est tlchargeable partir de http://www.oezratty.net/wordpress/2018/
usages-intelligence-artificielle-ebook.

Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 361 / 362
Les usages de lintelligence artificielle Olivier Ezratty Octobre 2017 - Page 362 / 362