Vous êtes sur la page 1sur 6

CONSTRUCTION DE COTE :

L'EXEMPLE DU PARI A HANDICAP AU TOP 14


Loc Champagne1, Lo Gerville-Rache2 & Sebastio Tiarks3
1

Universit de Bordeaux, LACES, France, loic.champagne@etude.u-bordeaux2.fr


Universit de Bordeaux, CNRS, UMR 5251, France, leo.gerville-reache@u-bordeaux.fr
3
xStand SAS, Bordeaux, France, sebastiao@rugbystand.com

Rsum : Prvoir l'issue d'une rencontre sportive est un exercice qui mobilise un nombre de
plus en plus grand de chercheurs et de parieurs. Un des dfis est que chaque type de pari ncessite
une modlisation spcifique. Au rugby, il existe 3 paris (marchs) principaux, le joueur pourra
prdire le vainqueur/perdant, le nombre de points dans le match ou encore le vainqueur affect d'un
handicap. C'est ce dernier type de pari, le pari handicap, qui fait l'objet de cette communication.
Mots cl : Pari sportif, rugby, modle polytomique ordonn, qualit de prvision
Abstract : Forecasting in sports is showing a growing interest not only from the sports
specialists but also from the scientific community. One of the challenges is that each proposed
market need a specific modelisation. In Rugby, there are 3 main types of markets: the winner/loser
market, the total points market and the handicap market. This paper analyses the handicap market.
Key words : Sports betting, rugby, ordered polytomic model, forecast quality

1 Introduction
La prvision de lissue dune rencontre sportive prsente un intrt pour tous les amateurs de sports,
les spcialistes ou encore les pratiquants eux-mmes. Chaque individu peut baser sa rflexion sur
les informations quil possde.
Les victoires, les dfaites, les compositions dquipes, le score, les blessures, le temps de jeu des
joueurs, les conditions mtorologiques, etc, sont autant dinformations devenues publiques et
disponibles grce la professionnalisation et la mdiatisation du sport.
Ainsi, chacun peut aujourdhui baser sa rflexion par rapport aux statistiques de lquipe ou du
joueur qui lintresse et induire une vision personnelle de lissue dune rencontre. Ensuite, il suffit
de se rendre sur un site de paris sportifs et parier. Depuis 2010 en France, des professionnels du
sport et de la Statistique se sont intresss de plus prs la rflexion autour de la prvision des
rsultats sportifs. En effet, cette anne-l, l'Autorit de Rgulation des Jeux En Ligne (ARJEL) a
dlivr ses premiers agrments aux acteurs du pari sportif sur internet, lgifrant et dmocratisant
ainsi cette pratique. Aussi, afin dobtenir les meilleures prvisions possibles, la rflexion pure et
simple, mme dun spcialiste, est le plus souvent insuffisante. Les premires tudes ralises sur ce
sujet (Moroney en 1956 pour le football par exemple) montrent que la modlisation statistique
permet dobtenir de bons rsultats. Ainsi, depuis de nombreuses annes, les chercheurs et les
parieurs essaient de modliser les diffrents paramtres dune partie, dun match de football ou
encore dun combat en boxe. Seulement, il nexiste pas de rgle quant aux paramtres modliser.
Quels paramtres influencent le rsultat dun match ? Les paramtres du match en lui-mme
(rsultats passs des deux quipes, classement actuel, etc)? Les paramtres internes lquipe
(blessure, ambiance, tat desprit, motivation, etc) ? Les paramtres externes (pression des
mdias, mtorologie, public, etc) ? Les paramtres personnels de chaque joueur dune quipe
(performances, intgration, vie prive, etc) ?

Dans cette communication, nous prsentons quelques rsultats d'une collaboration entre lIMB,
l'AMIES et la socit xStand sur la prvision de l'cart de points des rencontres du Top 14. Cette
tude avait pour but de construire pour chaque rencontre la valeur du pari Handicap.

2 Paris sur Handicap et l'historique des rencontres


Le pari Handicap : Un handicap est un nombre que l'on va retrancher au favori d'une rencontre
venir afin de modliser un "50-50" thorique. Ainsi un handicap de -10,5 signifie que le bookmaker
(ou oprateur de paris sportifs) estime une chance sur deux que l'quipe domicile gagnera avec
plus de 10,5 points d'avance et une chance sur deux que l'quipe domicile aura moins de 10,5
points de plus que l'quipe adverse.
Ainsi, les parieurs effectuent un pari au dessus ou en dessous du handicap du bookmaker.
Qualit de la prvision : Afin de permettre la critique des rsultats (prvisions du bookmaker ou
autre modle statistique) nous avons intgr 9 classes d'cart de points dfinies comme suivant:
-

Classe 1, 2, 3, 4: Victoire de l'quipe domicile par respectivement [+ de 21]; [de 15 21];


[de 8 14] et [de 1 7] points.
Classe 5: Match Nul [0].
Classe 6, 7, 8 et 9: Victoire de l'quipe l'extrieur par respectivement [de 1 7]; [de 8 14];
[de 15 21] et [+ de 21] points.

L'intrt de ces diffrentes classes est non seulement de pouvoir rsumer le spectre "cart de points"
sur 9 intervalles mais aussi d'introduire un aspect sportif propre au rugby (on remarque que pour
basculer d'une classe l'autre, l'cart de point ncessaire est d'au maximum 7 points soit un essai
transform). Aussi, on value la prvision comme tant :
-

Excellente : le handicap (avant match) est dans la mme classe que l'cart de point rel. En
cas de match nul (classe 5), les classes 4 et 6 sont des prvisions galement excellentes.
Bonne: le handicap (avant match) est dans la classe directement en-dessus ou en-dessous de la
classe correspondant l'cart de points rel.
Mauvaise: les autres cas.

Donnes disposition : Le tableau dont nous disposons regroupe les informations de 264 matchs
conscutifs, du Top 14, du dbut de la saison 2012 au 2 novembre 2013. Ce sont les rencontres pour
lesquelles nous disposons de l'ensemble des variables (en particulier les variables subjectives qui
suivent).
Variables subjectives : Afin de proposer un nouveau modle de prdiction, ont t intgrs pour
chaque match, 3 nouveaux paramtres. Il s'agit:
-

De la motivation quipe "domicile" :


o 0 pour un match important (motivation normale, etc)
o 1 pour un match trs important (grande motivation, quipe type, etc)
De la motivation quipe "visiteuse" :
o 0 et 1 : comme prcdemment
o -1 : pour une impasse (moins-value de motivation, quipe remanie, etc)
De la mto :
o Groupe 1: "Temps clair" et "Partiellement couvert" (favorise le jeu ouvert)
o Groupe 2: "Nuageux avec risque d'averses" (peut nuire au droulement du jeu)

o Groupe 3: "Pluie fine continue" et "brouillard" (complexifie la maniabilit/visibilit)


o Groupe 4: "Grosse pluie", "orage" et "neige" (conditions extrmes)
Pour chaque modle, l'estimation des paramtres est ralise laide du logiciel R.

3 Le modle de rgression linaire


Le modle qui vient naturellement l'esprit est celui de la rgression linaire multiple (avec un mlange de
covariables qualitatives et quantitatives. Le principe est de modliser directement l'cart de point entre les
deux quipes. L'estimation des paramtres du modle est ralise par la mthode du maximum de
vraisemblance.
Le handicap d'une rencontre entre l'quipe i ( domicile) et l'quipe j ( l'extrieur) est la prvision obtenue
directement par utilisation du modle selon l'quation suivante :

Ici, la prvision est un cart de points qui sera catgorise pour comparer les diffrents modles.

4 Le modle "attaque-dfense"
Dans ce modle, une dimension sportive entre en jeu avec l'intgration dun potentiel offensif et
dun potentiel dfensif dfensif pour les deux quipes qui se rencontrent. Ils viennent sajouter
aux variables subjectives. Ce modle permet d'estimer simultanment le nombre de points marqus
par chacune des deux quipes. Les estimations des scores de chaque quipe sont obtenues aprs
l'estimation des coefficients du modle par maximum de vraisemblance via la procdure de
rgression linaire de R. Il faut noter ici que le tableau de donnes permettant les estimations est
particulier. En effet, une rencontre constitue deux lignes du tableau (deux individus statistiques).
Les scores de la rencontre entre l'quipe i et l'quipe j sont les prvisions obtenues directement par
utilisation du modle selon l'quation suivante :

Ici, le paramtre Domicile(i) sera gal 1 si i est lquipe qui reoit, et -1 si i lquipe en
dplacement (idem pour l'quipe j).
La prvision de l'cart de score est alors obtenue par diffrence de la prvision du score de l'quipe
l'extrieur et de l'quipe domicile. Si i joue domicile, on a :

Ici, la prvision est un cart de point qui sera catgorise pour comparer les diffrents modles.

5 Le modle polytomique ordonn (MPO)


Le MPO est une gnralisation de la rgression logistique pour laquelle la variable expliquer est
multinomiale ordonne. Pour notre tude, ce sont les catgories "carts de score" des rencontres qui
sont modlises. Les diffrentes catgories sont celles qui ont t prsentes en partie 2. Ainsi, dans
le tableau de donnes, chaque cart de points observ est class dans lune des 9 classes
correspondante.
Le MPO modlise une variable expliquer Y prenant ici k modalits ordonnes (ici, la classe
dcart de points entre les 2 quipes).
Pour prsenter ce modle, on se place dans un premier temps dans le cas dune seule variable
explicative X, et on introduit plusieurs seuils 1, . . . , k1 tels que :

avec

Le choix de la fonction de rpartition logistique conduit au modle :

Si on est en prsence de p variables explicatives (ici quipe domicile, quipe extrieure, motivation
domicile, motivation lextrieur et mto), le modle devient :

Ou encore

A travers une telle modlisation, seule la constante diffre suivant les diffrents niveaux de Y.
L'estimation par maximum de vraisemblance des paramtres du modle a t ralise avec le
logiciel R. Le tableau de donnes est ici le tableau standard o chaque rencontre constitue une ligne
(un individu statistique).
Le rsultat de la fonction ci-dessus donne l'estimation de la probabilit que lcart de points
corresponde une classe infrieure ou gale la classe 1, la classe 2, 3, 4 [] 9. L'estimation de
la probabilit que lcart de points corresponde une classe infrieure ou gale la classe 9 est de 1
car cest la dernire classe possible.
Afin d'estimer la probabilit d'appartenir une classe, on travaille de la manire suivante :
-

Classe 1 : nous reportons le rsultat trouv au calcul prcdent (car il ny a aucune classe
infrieure 1). Nous obtenons l'estimation de la probabilit que lcart de points se situe dans
la classe 1.
Classe 2 : on soustrait l'estimation de la probabilit que lcart rel soit infrieur ou gal la

classe 1 la probabilit quil soit infrieur ou gal la classe 2. On obtient l'estimation de la


probabilit que lcart se situe dans la classe 2.
On ritre cette opration pour toutes les classes.
Parmi ces probabilits, le maximum correspondra la meilleure prvision que nous pouvons obtenir
avec ce modle. Ce maximum pourrait tre l'estimation de la classe de l'issue du match. Cependant,
ce maximum est relativement volatile. Nous prfrons dfinir la prvision via l'estimation de
"l'esprance de la classe". Le principe est de calculer la somme pondre par les probabilits
estimes des classes (c). La prvision de la classe est alors l'entier le plus proche de cette
"esprance". Pour rsumer, on a :

,
puis,

enfin,

6 Discussion
Les diffrents modles prsents dans les sections prcdentes ont fait l'objet d'une estimation avec
le logiciel R sur les 264 rencontres de la base de donnes. La qualit des diffrents modles est
rsume dans le tableau ci-aprs, selon la rgle d'valuation prcise dans la partie 2.

Modles
Rsultats
Nombre de
matchs observs
Prvisions
excellentes
Prvisions
bonnes
TOTAL
prvisions
acceptables

Bookmakers

MPO sans
Subjectif

Modle AttaqueDfense Subjectif

Modle
Linaire
Subjectif

MPO
Subjectif

264

264

264

264

264

82

73

78

112

124

31%

28%

30%

42%

47%

101

103

75

80

90

38%

39%

28%

30%

34%

183

176

153

192

214

69%

67%

58%

73%

81%

Le modle polytomique ordonn subjectif (MPOS) est celui, parmi les modles construits, qui
donne la meilleure qualit globale. Avec 81% de prvisions acceptables, ce modle purement
statistique, fait bien mieux que le modle "Attaque-Dfense". En effet, bien que le modle
"Attaque-Dfense" se fonde sur une thorie sportive base sur les notions de potentiel offensif et

dfensif, ce modle souffre ici de deux cueils. Dans un premier temps, la modlisation n'est pas
base sur l'cart de point mais sur les points marqus de chaque quipe. De plus l'indicateur de
qualit utilis est bas sur la proportion de bonne prvision dans les classes d'cart. Il est donc
normal que le MPOS soit ici meilleur. Cela met en vidence que l'objectif de la modlisation est un
lment essentiel du choix et de la pertinence de la modlisation
La comparaison MPO - MPOS montre galement que l'inclusion de variables subjectives amliore
grandement les performances de la prdiction. En effet, l'issue des rencontres est trs dpendante de
la situation des quipes dans le championnat au moment de la rencontre. Ces variables traduisent,
d'une certaine manire, cette dpendance temporelle.
La comparaison avec la qualit du handicap bookmakers (notre rfrence) est plus dlicate. En
effet, les handicaps bookmakers sont raliss avant la rencontre alors que ceux raliss par les
autres modles le sont a posteriori (l'ensemble des rencontres a t utilis pour l'estimation de ces
modles). Une validation sur de futures rencontres sera ncessaire pour comparer honntement ces
modles aux handicaps proposs par le bookmaker.

Bibliographie
[1] Bradley & Terry (1952). Rank analysis of incomplete block designs. Biometrika, Vol. 39,
pages 324-345.
[2] Caron F. & Doucet A. (2010). Efficient Bayesian Inference for Generalized Bradley-Terry
Models. Journal of Computational and Graphical Statistics, Vol. 21, Issue 1, 2012.
[3] Coulom R. (2010). Jeux et sports : le problme des classements. Pour la Science n393,
pages 20-27.
[4] Foulley JL. (2012). Tentative dvaluation et de classement des 16 quipes de lEuro 2012.
w3.jouy.inra.fr/unites/miaj/public/.../applibugs.12_12_20.jlfoulley.pdf.
[5] Hbert BP. (1998). Rgression avec une variable dpendante ordinale : comparaison de la
performance de deux modles logistiques ordinaux et du modle linaire classique l'aide de
donnes simules. Thse, Bibliothque nationale du Canada.
[6] Karlis D. & Ntzoufras I. (2003). Analysis of sports data by using bivariate Poisson models.
Journal of the Royal Statistical Society: Series D (The Statistician), Vol. 52, Issue 3, pages 381
393.
[7] Langville A. & Meyer CD. (2012). Whos one ? : The Science of Rating and Ranking.
Princeton University Press.
[8] Louvire L. (2008). Rgression sur variables catgorielles. Support de cours, Universit de
Rennes2.
[9] Massey K. (1997). Statistical Models Applied to the Rating of Sports Teams. Bluefield
College, 1997 - 74.207.231.132.

Vous aimerez peut-être aussi