Vous êtes sur la page 1sur 16

RAPPORT

DE PROJET


14-12-2016

BALLON DOR PREDICTION

Sehra ABARHRIR
Mohamed EL HAMDANI
Zakariyae HADDINI

SOMMAIRE

INTRODUCTION ------------------------------------------------------------------------------- 3
METHODES ------------------------------------------------------------------------------- 3
Difficults ------------------------------------------------------------------------------- 3

Base de donnes -------------------------------------------------------------------- 4


ARBRE DECISIONNEL ----------------------------------------------------------------------- 6
WEKA ------------------------------------------------------------------------------------------------- 7
COMMENT A MARCHE ? ----------------------------------------------------------------- 8
SCIKIT-LEARN --------------------------------------------------------------------------------- 11
COMMENT A MARCHE ? --------------------------------------------------------------- 11
IMPLEMENTATION ------------------------------------------------------------------------ 14
Outils de dveloppement ---------------------------------------------------- 14
CONCLUSION ----------------------------------------------------------------------------------- 16

INTRODUCTION

La FIFA Ballon d'or est une rcompense attribue


au meilleur joueur de football de l'anne. Lide de
Ballon dor prediction est dessayer de prdire la
liste des joueur slectionns par la FIFA, dont le
gagnant du ballon dor de lanne courante et
slectionn par le vote des 208 slectionneurs des
pays membres de la FIFA, en se basant sur les rsultats
des annes prcdentes.

METHODES

Difficults

Comme la collecte des donnes, nous avons


essay de trouver une api qui nous permettra
dextraire les donnes dtailles des joueurs de
plusieurs saisons, la chose qui tait impossible (
part les services payants), ce qui nous a oblig
collecter les donnes nous-mme.

Base de donnes

La premire tape tait de collecter les


donnes, et trouver une base de donnes avec les
informations des joueurs durant les annes
prcdentes ntait pas vident. Et pour
surmonter le problme, nous avons construit
notre propre base de donnes, on se basant sur
le site whoscored.com , en inspectant le
rsultat des requtes, qui tait en JSON , et le
transformer en CSV, afin de linjecter dans la base
de donnes, en utilisant un Bash.

Figure1 : CSV files

Figure1 : Code Bash

Figure1 : Bash excution

Et pour automatiser la procdure, nous avons


utilis Automator (sur MacOs).

ARBRE
DECISIONNEL

Un arbre de dcision est un outil d'aide la


dcision reprsentant un ensemble de choix sous
la forme graphique d'un arbre. Les diffrentes
dcisions possibles sont situes aux extrmits
des branches (les feuilles de l'arbre), et sont
atteints en fonction de dcisions prises chaque
tape.
Dans notre cas, nous utilisons larbre de
dcision pour prdire la premire slection des
joueurs pour le titre du Ballon dor.


WEKA

Waikato Environment for Knowledge


Analysis, Weka, est une suite de logiciels
d'apprentissage automatique. crite en Java,
dveloppe l'universit de Waikato en
Nouvelle-Zlande. Weka est un logiciel libre
disponible sous la Licence publique gnrale
GNU (GPL), portable car il est entirement
implment en Java et donc fonctionne sur
quasiment toutes les plateformes modernes, et
en particulier sur quasiment tous les systmes
d'exploitation actuels, et contient une collection
complte de prprocesseurs de donnes et de
techniques de modlisation.





Figure1 : Weka GUI Chooser

COMMENT A
MARCHE ?

Initialement,

lide

tait

dalimenter

lapplication Weka, (la version graphique), avec


la base de donnes exporte en CSV, ces
donnes-l qui sont des joueurs des anciens
saisons, avec une colonne qui diffrencie ceux
qui ont taient slectionns.

Aprs nous spcifions cet attribut qui fera la

diffrence a la sortie, pour que le programme


puisse gnrer larbre de dcision.

Pour gnrer larbre, nous indiquons


lalgorithme que le programme utilisera, et
lattribut sur lequel il se basera.

Aprs la gnration de larbre, nous mettons


en uvre le code quivalent larbre, et nous
lappliquons sur la base de donnes des joueurs
de lanne courante, afin de recevoir la liste des
joueurs qui pourraient tre slectionns pour
gagner le Ballon dor.
10

SCIKIT-LEARN

Scikit-learn1 est une bibliothque Python


ddie l'apprentissage automatique. Elle est
dveloppe par de nombreux contributeurs
notamment dans le monde acadmique par des
instituts franais d'enseignement suprieur et de
recherche comme Inria et Telecom ParisTech.
Elle comprend notamment des fonctions pour
estimer des forts alatoires et des rgressions
logistiques.

COMMENT A
MARCHE ?

En effet, cette bibliothque a le mme


objectif que lapplication WEKA , elle nous a
aid construire larbre dcisionnel partir de
notre fichier de donnes CSV . Dans un
premier temps, on doit avoir la bibliothque

1 Rf : https://fr.wikipedia.org/wiki/Scikit-learn

11

Pandas qui nous permet de charger les


donnes depuis le fichier CSV . Aprs avoir
russi charger ces donnes on les transmettre
lalgorithme de gnration de larbre
dcisionnel afin dobtenir le pseudo code
reprsentant cet dernier dans le langage
dimplmentation de notre choix.

Figure1 : Chargement de fichier CSV avec Pandas


12

Figure1 : Gnration du pseudo code PHP de larbre dcisionnel



13

IMPLEMENTATION

Outils de dveloppement

1. PYTHON-PHP5 - HTML5 CSS3


2. Twitter Bootstrap
BootStrap2 est un Framework qui facilite
et acclre le dveloppement Front-End. Il
inclue une base CSS trs complte (au format
LESS) configure partir dun fichier de
variables un ensemble de conventions de
structure HTML et de nommage de classes des
librairies JavaScripts simples pour les
fonctions les plus courantes.
3. MySQL
MySQL3 est un serveur de bases de
donnes relationnelles SQL, dvelopp dans
un souci de performances leves en lecture,
ce qui signifie qu'il est davantage orient vers
le service de donnes dj en place que vers

2 Rf : http://spipr.nursit.com/bootstrap
3 Rf : http://fr.wikipedia.org/wiki/MySQL

14

celui de mises jour frquentes et fortement


scurises. Il est multithread et multiutilisateur. C'est un logiciel libre dvelopp
sous double licence en fonction de l'utilisation
qui en est faite : dans un produit libre ou dans
un produit propritaire.
4. PhpMyAdmin
PhpMyAdmin4

est

une

interface

d'administration pour le SGBD MySQL. Il est


crit en langage PHP et s'appuie sur le serveur
HTTP Apache. Il permet d'administrer les
lments suivants :
o Les bases de donnes.
o Les tables et leurs champs (ajout,
suppression, dfinition du type).
o Les index, les cls primaires et trangres.
o Les utilisateurs de la base et leurs
permissions.
o Exporter les donnes dans divers formats
(CSV, XML, PDF, OpenDocument, Word,
Excel et LaTeX).

4 Rf : http://doc.ubuntu-fr.org/phpmyadmin

15

CONCLUSION

Notre projet consistait en le dveloppement


dune application de prdiction de la liste des
joueur slectionns par la FIFA.
Pour la mise en uvre dun tel projet nous
avons choisi dadopter un arbre dcisionnel et
nous avons commenc par la collecte des
donnes. Ensuite, nous avons gnrer notre
arbre dcisionnel afin daborder enfin la phase
de la ralisation qui consiste en la mise en uvre
de lapplication propose.

16