"ve#oppement et $romotion
Ricco %
Ensei&nant c'erc'eur (C)U*2+, En poste - #.Universit Lyon 2 / 0acu#t 1e Sciences Eco* Rec'erc'e 2 Spcia#isation "ata Minin& 3 Arbres45rap'es 1.in1uction 3 S#ection 1e variab#es 3 Autres aspects t'ori6ues 3 App#ications "ve#oppement et 1i usion 1e #o&icie#s #ibres "i usion 1e supports 1e cours
$LA)
7* "ata Minin& 2* Lo&icie# #ibre pour 6ue# pub#ic 8* Avant TA)A5RA 9* TA)A5RA a* Spci ications b* "ve#oppement c* $romotion :* ;ue#6ues scnarios 1e traitements <* Et #es autres #o&icie#s #ibres % +* A posteriori=
CRIS$>"M 7*?! Step>by>step "ata Minin& 5ui1e! S$SS $ub#ication Le processus EC" 2 E@traction 1e connaissances - partir 1e 1onnes K"" > KnoA#e1&e "iscovery in "atabases
3 S#ectionner #es 1onnes (par rapport - un suGet et4ou une prio1e, 3 Trier! re&rouper ou rpartir ces 1onnes se#on certains critres 3 H#aborer 1es ca#cu#s rcapitu#ati s I simp#es J (totau@! moyennes con1itionne##es! etc*, 3 $rsenter #es rsu#tats 1e manire synt'ti6ue (&rap'i6ue et4ou tab#eau@ 1e bor1, RE$ORTI)5
La notion 1e mo1#isation I statisti6ue J (apprentissa&e! e@p#oration 1e 1onnes, est mise 1e cKt "ata Minin&
http://www.commentcamarche.net/entreprise/business-intelligence.php3
In ormati6ue I Mac'ine Learnin& J Apprentissa&e symbo#i6ue Reconnaissance 1e ormes Une tape 1e #.inte##i&ence arti icie##e Rseau@ 1e neurones! a#&orit'mes &nti6ues=
In ormati6ue (Dase 1e 1onnes, E@p#oration 1es bases 1e 1onnes Mo#umtrie R&#es 1.association! moti s r6uents! =
Trs souvent! ces mt'o1es reviennent - optimiser #es mNmes critres! mais avec 1es approc'es 4 ormu#ations 1i rentes
Structuration : 0aire ressur&ir 1es &roupes IOnature#sOJ 6ui reprsentent 1es entits particu#ires 3 classification (c#usterin&! apprentissa&e non>supervis,
Ex : dcouvrir une typologie de comportement des clients dun magasin
Explication : $r1ire #es va#eurs 1.un attribut (en1o&ne, - partir 1.autres attributs (e@o&nes, 3 r&ression 3 apprentissage supervis
Ex : prdire la qualit dun client (rembourse ou non son crdit en !onction de ses caractristiques (revenus, statut marital, nombre den!ants, etc"
Association : Trouver #es ensemb#es 6ui reviennent souvent ensemb#e 3 rgles dassociation 3 motifs frquents
Ex : rayonnage de magasins, les personnes qui ac#$tent du poivre ac#$tent galement du sel
Les applications Filtrage automatique des e-mails (spams, ) Reconnaissance de la langue une centrale tlp onique Anal!se des mammograp ies "tc#
;ue# espace pour #es #o&icie#s #ibres % Aspects 1u "ata Minin& pro#i i6ues en 1ve#oppement
SI$I)A / Une #on&ue #i&ne 1e #o&icie#s 11ies au@ 5rap'es 1.In1uction I1e initia#e 2 imp#menter #es 5rap'es 1.In1uction (5rap'es Latticie#s, $icar1 (7T<:,! Terrenoire! Tounissou@!=! Ui&'e1 (7TV:,
Ui&'e1 (7TV:=, $i#ot par interprteur 1e comman1es 0ormat spci i6ue 1e ic'iers Mt'o1e SI$I)A $as 1e 1i usion institutionne##e Mersion 7*? - 2*: / 7< bits (S8*? et W, Ui&'e1 (7TT9>7TT+, $onsar1! Dac (7TT9>7TT:, / RaBotoma#a#a (7TT< / 7TT+, $i#ot par menu 0ormat spci i6ue 1e ic'iers 5nra#isation au@ arbres 1e 1cision "i use sur Internet Mersion IORec'erc'eOJ (ou version 8*?, / 82 bits (ST: et W, RaBotoma#a#a (7TTV > 2???,= $i#ot par menu 5estion IOper ormanteOJ 1es 1onnes! accs - 1i rents ormats 5nra#isation au@ autres mt'o1es supervises (R)A! L"A! R&#es! etc*, "i use sur Internet Mersion 9*? (MCubiX, Socit "ia&nos (2??7=, "ia&ramme 1e traitements (&nra#isation 1e #a IO i#ireOJ, Inter ace avec une S5D" (Interbase, 5nra#isation - toutes #es tec'ni6ues statisti6ues (mt'o1es actorie##es! c#usterin&! etc*, "i usion commercia#e
SI$I)A I Mersion Rec'erc'e J Un outi# per ormant mais comp#i6u! qui na pas vraiment c#oisi son camp
I# n.y a pas 1.6uiva#ent &ratuit au mon1e CCC I# aut avoir #.esprit tortueu@ 1.un in ormaticien pour compren1re son onctionnement $rob#me 1e mmoire sur &ran1es bases - cause 1u c'oi@ 1e #.interactivit
TA)A5RA (2??8, / )ouveau 1part ou recommencement % " inir un ca'ier 1e c'ar&es #e p#us prcis possib#e
Miser sur #a simp#icit 1e onctionnement
7* 2* 8* 9* :* Insta##ation simp#i ie / $as 1e serveurs #our1s - insta##er 5estion simp#i ie 1es 1onnes >> 0ormat te@te et accs au ormat tab#eur 0onctionnement par 1ia&ramme 1e traitements Couvrir #es statisti6ues! #.ana#yse 1e 1onnes et #e 1ata minin&* "e manire uni ie* Rsu#tats #isib#es! en a16uation avec #es IOstan1ar1sOJ! possibi#it 1e #es repren1re 1ans un traitement 1e te@te ou un tab#eur par copier4co##er
Mettre 1 initivement 1e cKt #es aspects IOpro essionne#sOJ 1es #o&icie#s 1e "*M*
7* 2* 8* 9* Inter aYa&e ort avec #es S5D" "p#oiement et mise en pro1uction 1es rsu#tats Reportin& 1ynami6ue et per ormant E@p#oration &rap'i6ue vo#ue et interactive 1es 1onnes
Lan&a&e 1e pro&rammation
Toute #a puissance 1.un #an&a&e 1e pro&rammation L.accs au #an&a&e est une barrire - #.entre 6ui rebute certains L.int&ration 1ans R est certainement #a mei##eure so#ution 1ans ce cas
"ia&ramme 1e traitements
IO$ro&rammationOJ visue##e > Enc'aQner #es traitements Mise - Gour aci#ite 1u #o&icie# par a1Gonction 1e composants 5ar1er #a trace 1.une ana#yse comp#te et pouvoir #a repro1uire aci#ement $ossibi#it 1e ra&menter #a 1ocumentation par composants 7est un standard (ex" 2+&8, 2&29EM, 2+2297'EM -E(&, 1R&):E,
Inter ace et onctionna#its 0enNtres interactives et personna#ises vs* sorties te@tes &nra#ises
0enNtre 1e visua#isation
Enre&istrer #a mt'o1e
La &estion 1es versions 1evenait cauc'emar1es6ue au i# 1u temps
0enNtre 1e paramtra&e
Enre&istrement 2 ic'ier e@terne 1e con i&uration L.a1Gonction 1.une tec'ni6ue est trs peu contrai&nante 7:: mt'o1es - ce Gour (7*9*2+,
La so#ution i1a#e %
L.app#ication mre est une matrice 6ui &re et transmet #es 1onnes Les tec'ni6ues sont 1es proc1ures pro&rammes sous orme 1e bib#iot'6ues e@ternes
Dre =
Souvent r1'ibitoire! a#ors 6ue #.obGecti tait 1.o rir un outi# mo1u#aire Intressant si #es p#u&ins sont essentie##ement 1es proc1ures 1e ca#cu#s 6ui renvoient 1es obGets stan1ar1iss (e@* pacBa&e R, Et 6u.une vraie communaut s.or&anise autour 1u #o&icie#
Spci ications
Outi# #ibre (;a co<te moins c#er, Lar&ement 1i us (pour avoir des programmeurs, Avec une #ar&e bib#iot'6ue 1e c#asses (calculs, conteneurs, etc", ;ui permet 1e aire 1es inter aces a&rab#es! simp#ement! rapi1ement
"ocumenter #e #o&icie#
Les mt'o1es 6ui sont int&res Leur mise en Puvre (sous orme 1e tutorie#, Attention au 1an&er 1u I manue# 1e r rence / manue# 1e #.uti#isateur J touGours en retar1 1.une version
SI$I)A > Une 1ocumentation c#assi6ue 1i ici#e - aire vivre 0asti1ieuses mises - Gour Copies 1.cran - re aire avec #es nouveau@ menus
TA)A5RA / "i1acticie#s I tu1es 1e cas J 0onctionnement4Or&anisation 1u #o&icie# Gamais remis en cause )e Gamais avoir - re aire #es anciennes 1oc* Se oca#iser sur #es mt'o1es et #es aspects p1a&o&i6ues (#ecture 1es rsu#tats! #es #ments 1e r #e@ion! etc*,
$#usieurs possibi#its 1.in1e@ation (et 1onc 1e rec'erc'e, 3 Cat&ories 3 Mots>c#s 3 R rences en #i&ne (cours, etc" 3 R rences bib#io&rap'i6ues
(ouvrages, articles de r!rence, etc"
"escription appro on1ie 1es tec'ni6ues 0ic'iers 1e 1onnes Liens e@ternes! autres 1escriptions
"i1acticie# TA)A5RA
"but 1u 1ve#oppement
\ui##et 2??8 Moteur interne i& 1epuis in ao]t 2??8
"ocumentation
_7?? 1i1acticie#s en ranYais! +? en an&#ais
;ue##es pa&es %
Arbre 1e 1cision Traitement 1u ic'ier Save 1e Dreiman Scorin& "tection 1es c#ients I iab#es J en Dan6ue Mesures 1.association pour #es variab#es nomina#es Consommation 1e v'icu#es
SEKA La r rence
R rence mon1ia#e Dib#iot'6ue 1e mt'o1es trs ric'e Essentie##ement mac'ine #earnin& AGout 1e mt'o1es AGout 1e c#asses W recompi#ation Accs comp#i6u - #.inter ace Atout 2 appe# 1es c#asses en e@terne
Mo1e e@p#orer
Inter ace a&rab#e et per ormante Outi#s &rap'i6ues Essentie##ement mac'ine #earnin& Atout (7, 2 mt'o1e R p#u&ins Atout (2, 2 interprteur pyt'on
Inter ace a&rab#e et per ormante Outi#s &rap'i6ues Outi#s 1e manipu#ation 1e 1onnes $as 1e pro&rammation possib#e Atout (7, 2 mt'o1e R p#u&ins (A$I, Atout (2, 2 accs au@ mt'o1es SEKA et R (C,
Communaut 1e 1ve#oppeurs
I# aut une or&anisation trs ri&oureuse (et Gouer #e rK#e 1e I c'e 1e proGet J %, c.est un travai# - p#ein temps