Vous êtes sur la page 1sur 5

ANALYTIQUE PROBABILITÉS

STATISTIQUE DESCRIPTIVE Probabilité simple :


Variables qualitatives: (caractéristiques ou attributs, nombres choisis
nombre d'unités pour lesquelles A est vrai
arbitrairement) P ( A )=
- Nominales : valeur  étiquettes pour catégories, pas d’ordre. Ex : marque taille du groupe de référence
d’un item (…% ont …)
- Ordinales : catégories avec ordre défini, échelle (valeur a pas de Probabilité conjointe : P( A et B) = # total de A et B/ total (…% ont A et B)
signification). Ex : 1-en désaccord, 2-plutôt en désaccord, etc
P( A et B)
Variables quantitatives : ou numérique (valeurs, #) Probabilité conditionnelle : P ( A∨B )= (prob de que A
- Discrètes : les valeurs possibles sont isolées (# entiers). Compter des P(B)
gens/objets. Ex : # d’appels, # de likes survienne sachant que B s’est réalisé) (sachant B, …% de chance que A)
- Continues : les valeurs possibles couvrent un intervalle. Valeurs arrondies, Indépendance : indépendants si et seulement si l’occurrence de l’un n’affecte pas
avec virgules. Ex : temps de traitement, taille d’une personne, …
Représentation graphique des données
la probabilité que l’autre se produise. Si P( A∨B)=P ( A ). Si pas égal il y
Diagramme en pointe de tarte/circulaire : =100% a un lien
- Variables qualitatives (nominale or ordinale) en % Règles d’association : (variables doivent être binaire (1 ou 0), nominale)
Diagramme en bâtonnets : (valeurs isolées) Règle X => Y : L’effet de l’item X (antécédent) sur l’item Y (conséquent) X= > Y est
- Variable ordinale, nominale (ou discrète n’ayant pas un grand nombre de différent de Y => X
valeurs possibles) Support(x)=P(x) : prob simple. Support élevépopulaire. « support individuel Mesure
de de
Histogramme : classes de même longueur l’item x ». popularité
- Variables continues (ou discrètes avec bcp de valeurs possibles) Support(X=>Y) = P(XetY) = Support(Y=>X) : symétrique, prob conjointe. Si X et(x100
Y pour %)
- Regroupé en classes/intervalles. Bâtons collés souvent observé ensemble
Confiance(X=>Y)=
- Axe vertical : fréquence d’observation
P(X et Y=)Support (X=>Y)/ Support(Y)
- Axe horizontal : intervalle de valeur de la variable P ( Y X ¿=
|
Mesures numériques : P( X)
Les mesures de tendance centrale :(centre des données) Pas symétrique : Confiance(X => Y)= P(Y|X) ≠ P(X|Y)= Confiance(Y => X)
Moyenne  x́ =somme des observations/nb d’observations(n) Lift (X=>Y)=
¿ P( X et Y )en %, multiplie la probabilité
# pas
P ( Y |X ¿ =
- Quantitative (discrète ou continue) P(Y ) P(=Xconfiance
= Support (X=>Y)/ (Support(X)*Support(Y)) )× P (Y )
(X=>Y)/Support (Y)
- Si var indicatrice/binaire (1 ou 0) (var qualitatif)  moyenne correspond à la
Symétrique : Lift (X=>Y)= Lift (Y=>X)
proportion des unités ou individus possédant la caractéristique d’intérêt.
- Sensible aux valeurs extrêmes (effet Bill Gates) Lift ( X  => Y )=1 ⇔ P ( Y |X )=P (Y ) ⇔ indépendance (P
Médiane : séparer en 2 parties égales (au plus 1/2 valeurs supérieure et ½ inchangée)
inférieur)
- peu sensible aux valeurs extrêmes
Lift ( X  => Y ) >1 ⇔ P ( Y |X ) > P(Y ) ⇔ association positive (P

- Si nombre pair : moyenne des 2 numéros du centre augmentée)


Mode : valeur la plus fréquente dans les données Lift ( X  => Y ) <1 ⇔ P ( Y |X ) < P(Y ) ⇔ association négative (P
- variables continues : regrouper les valeurs en classes et le mode est le diminué)
milieu de la classe la plus fréquemment observée. Cherche un # élevé pour le recommander aux clients. =1.34x plus de chance de
- Variable unimodale : 1 point de concentration des données (une seule regarder l’autre
bosse), qui correspond au mode Interprétations :
Support(BBT => MF) : Big Bang Theory et Modern Family se retrouvent
simultanément dans la liste d’écoute de 8.9% des étudiants. La probabilité qu’un
client achète les 2 item est estimé à ..
Confiance(BBT => MF) : Lorsqu’un étudiant a Big Bang Theory dans sa liste
d’écoute, alors il y a 29.4% de chances que Modern Family s’y trouve également.
Prob que l’item Y se trouve dans le panier sachant que l’item X s’y trouve. (pour
conseiller quel autre choix mettre de l’avant)
- variable multimodale : plus d’un point de concentration des données. (2= Lift (BBT => MF) : Le fait qu’un étudiant écoute BBT multiplie la probabilité qu’il
variable bimodale) écoute MF par 1.79. symétrique : le fait de savoir que le client a acheté un des
Les mesures de dispersion : (les écarts / leur variabilité) deux items fait … la probabilité qu’il achète l’autre
L’étendue : plage de valeurs couvertes par les données Étendue = MAX –MIN Cela signifie que quand un usager a acheté l'un de ces deux items, ses chances
(seulement variables quantitatives) d'acheter aussi l'autre est multipliée par 26. La valeur de 1.25 indique pour la
L’écart-type : (STDEV.S) l’écart moyen qui sépare les valeurs observées de la règle (Beurre => Pain) que la probabilité d’acheter du pain augmente d’un facteur
valeur moyenne. tjrs valeur positive. Grand écart-type ↔ Grande dispersion; de 1.25 lorsque le client achète du beurre. Lift (X=>Y) : Facteur par lequel la
Petit écart-type ↔ Petite dispersion probabilité que l’item Y se retrouve dans un panier est multipliée sachant que
- l’unité de mesure de l’écart-type est la même que celle de la variable l’item X est dans le panier.
étudiée. Sensible aux valeurs extrêmes. + écart interquartile
MODÉLISATION
Les mesures de position : (le rang) de différentes valeurs par rapport à l’ensemble
Un modèle est une représentation simplifiée de la réalité (simple &reproduire au
des valeurs observées. variables ordinales et quantitatives.
mieux la réalité). Sert à prendre une décision informée, la meilleure décision
Les quantiles : (centile/percentile) quantile d’ordre 𝒑𝒑% est une valeur qui
Intrants(info fournie) modèleextrants (ce qui sort)
marque la frontière entre ces deux groupes. peu sensible aux valeurs extrêmes
On utilise généralement la modélisation quand on poursuit les objectifs suivants :
Médiane : 2 parties égales; Quartiles : 4 parties égales (Q1=25%, Q3=75%);
- Comprendre notre environnement : modèles descriptifs (servent souvent à
Quintiles : 5 parties égales; Déciles : 10 parties égales; Centiles : 100 parties
décrire un phénomène passé)
égales.
- Prédire ce qui va se passer : modèle prédictifs (servent à prédire une
Les quartiles et le diagramme à moustaches (boxplots) 
situation future)
- La longueur de la boîte est appelée écart interquartile (IQR = Q3 – Q1).
- Optimiser nos décisions : modèle prescriptifs (servent à prescrire une
(valeur du 0.75-valeur du 0.25)
décision optimale/ pour atteindre un certain objectif)
- L = plus petite valeur dans les données n’étant pas plus petite que Q1 – 1.5
Fonctions : variable explicative/ indépendante (x) et variable réponse/résultat /
* IQR (la plus petite valeur non considérée comme extrême)
dépendante (y) (y dép de x)(domaine c’est les x)
- U = plus grande valeur dans les données n’étant pas plus grande que Q3 +
Propriétés des fonctions :
1.5 * IQR (la plus grande valeur non considérée comme extrême)
- continuité
- informe sur : 1) la symétrie de la distribution. Un diagramme à moustaches
- convexité/ concavité
symétrique est compatible avec une distribution symétrique, tandis qu’un
convexe : taux de variation augmente quand x augmente
diagramme asymétrique permet de détecter une distribution asymétrique.
concave : pente diminue quand x augmente
2)la dispersion des données. L’écart interquartile
Une droite : convexe et concave
IQR = Q3 - Q1 est une mesure de dispersion des
- Monotonie : sens de la variation ne change pas (croissante ou
données (variables quantitatives seulement). Un
décroissante)
grand IQR est associé à une grande dispersion.
Fonction linéaire y=ax+b Fonction logarithmique y=a ln(x)

Ou  +
Et  x (si indep)

Fonction exponentielle y=ebx Fonction puissance


Forme générale : y= axb, x>0.
Fonction polynômiale de Région admissible convexe : Un domaine (ou région admissible) est
degré 2/ fonction quadratique convexe si le segment de droite reliant toute paire de points de ce domaine
Forme générale : y=ax2+bx+c se situe entièrement à l’intérieur du domaine (pas une demie lune qd 2 var
de décision)
Cas particulier : Si les contraintes se présentent sous la forme d’un intervalle
Fonction polynômiale de de valeurs permises (de longueur finie ou infinie) pour chaque variable de
degré n décision, alors la région admissible est convexe.
Forme générale : y=¿ 2. Cas général : Si fonction pas convexe, utiliser multi-start sur excel pour
anxn + an-1xn-1 +…+ a1x + a0 trouver l’optimum. Changer le point de départ pour augmenter les
chances de trouver l’optimum global
Pour trouver une relation Pour solveur : Préparer feuille excel avec variable de décision,
entre 2 variables : 1. Dire fonction-objectif et contraintes (région admission / non nég si besoin)
quoi x et y; 2. Nuage de GRG non linear  pas tjrs optimum global (parfois juste local)
points sur excel; 3. Tracer Multi-start : solveur optionGRG non linearcocher multi-start
courbe et trouver la (100 essais). Aucune garantie de succès en général (mais augmente les
formule; 4. Fait du sens? chances)
OPTIMISATION OPTIMISATION LINÉAIRE
3 étapes pour un modèle d’optimisation linéaire : si fonction-objectif et contraintes sont linéaires
problème alors modèle linéaire
d’optimisation : fct linéaire : constante * variable de décision + constante * variable de décision=
1. Identifier le problème c1xx+c2x2.Fonction-objectif : min ou max a1x1+a2x2 si exposant ou qqch pas linéaire
et collecter les données pertinentes. Les deux propriétés fondamentales des fonctions linéaires sont :
2. Modéliser la situation. - Proportionnalité : Ex : si on double la production, on double le profit.
3. Calculer la décision optimale et s’assurer qu’elle a du sens. - Additivité. Ex : le profit total obtenu sur deux biens s’obtient par la somme
Étape 2 : modélisation du profit obtenu sur chacun des deux biens.
L’objectif d’un modèle d’optimisation est de prescrire la « meilleure » décision. Quand modèle d’optimisation linéaire, alors; 1) si un optimum est trouvé, alors
1) Variable de décision : Ce sont les variables contrôlées par décideur c’est un optimum global (Ceci découle du fait que lorsqu’un modèle
(faire attention au type de variable) (continue ou discrète ou d’optimisation est linéaire, alors c’est en particulier un problème convexe. (Car
qualitative si binaire) dans problèmes convexes l’optimum est un optimum global)) 2)peut utiliser
2) Fonction-objectif : Qu’est ce qu’on veut maximiser ou minimiser?: l’algorithme du simplexe
mesure de performance qu’on veut min ou max Spécificités du cas linéaire :
3) Contraintes : Quelles sont nos limitations ou obligations? - Les valeurs auxquelles sont initialisées les variables de décision sont sans
Étape 3 : la solution optimale importance.
1) Méthodes analytiques (pas nous) - Quand le modèle d’optimisation à résoudre est linéaire, alors si le Solveur
2) Énumération / inspection (pour problèmes simple, 1 (max 2) nous dit qu’il a trouvé une solution qui satisfait toutes les contraintes, on
variables) sait que cette solution est un optimum global
Énumération : Énumérer l’ensemble des solutions admissibles, puis Contraintes de nombres entiers : ajouter une contrainte que les variables de
trouver l’optimum. (si peu de valeurs possibles, pas bon pour var décision doivent être des integer sur excel (Arrondir la solution optimale trouvée
continues) pour la rendre entière ne donne pas nécessairement la solution optimale) Cela
Inspection : Représenter graphiquement l’ensemble des solutions veut alors pas toujours dire qu’on va trouver l’optimum global puisque c’est juste
admissibles, puis inspecter pour trouver l’optimum. (1 var de décision) les nombres entiers
3) Méthodes numériques / informatiques (Solveur d’Excel) (complexe, Dans un modèle d’optimisation linéaire avec contraintes pour # entiers :
plusieurs variables) multi-start sur solveur d’Excel, pas de garantie de - Dans les options, ajuster la case « Optimalité des nombres entiers (%) »
succès. Il fait 100 essais. Augmente les chances de succès de trouver (C’est l’écart maximal entre la vraie solution optimale et la solution
un optimum global mais ne le garantie pas (peut-être juste un proposée par excel, exprimé en pourcentage de la valeur de la fonction-
optimum local) objectif) Commencer par mettre 0 (si trouve c’est l’optimum global) et si
Solution admissible : valeurs pour les variables de décisions qui respectent trouve pas de solution rapidement, augmenter progressivement la valeur
toutes les contraintes du problème. (Les points possibles dans la région Par défaut 1% donc faut le changer manuellement
admissible)
Région admissible est le domaine (x) des solutions admissibles. Seule la LES PROBABILITÉS
région admissible doit être investiguée lors de la résolution du problème Règle du contraire : P ( A c )=¿ 1 -
d’optimisation.
P (A)
Optimum local max ou min dans une petite fenêtre autour de lui
Optimum local et global est une solution admissible telle qu’aucune autre
solution admissible, dans l’ensemble de la région admissible, ne produit une
La règle générale de l’addition :
valeur de la fonction objective plus avantageuse. Ex : considérer tous les
minimums locaux et garder le plus petit (parfois + que une) P ( A ou B )=P ( A ) + P ( B ) −P ( A et B)
Un grand défi en optimisation : S’assurer que l’optimum trouvé est bien
l’optimum global recherché. Événements mutuellement exclusifs lorsqu’ils sont disjoints
1. Problèmes convexes : Si le problème d’optimisation est convexe, alors et ne peuvent se produire simultanément. P(A et B)=0
on est certain que l’optimum trouvé est global. Il existe deux types de Si A1 , A 2 ,… , Ak sont des événements mutuellement
problèmes dits convexes :
exclusifs, alors la règle de l’addition se simplifie à
P ( A ou B )=P ( A ) + P ( B )
Règle de l’inclusion : Si A ⊆ (inclus) B, alors P(A) ≤ P(B)
Règle de multiplication : Si A 1 , A 2 ,… , A k sont des événements
indépendants (indépendants si l’occurrence des uns n’a aucun impact sur
l’occurrence des autres), alors P ( A 1   et   A 2 et A3 et … et   A k )=¿
P(A1) x P(A2) x … x P(Ak)
Pour savoir si indep : Vérifier si P(A et B) = P(A) * P(B)= chance des 2
Ni l’un ni l’autre; P((H ou A)c ) = 1- (P(H ou A)) = 1- (P(H) + P(A) – P(H et A))= 1-
0.95
Ex : qu’au moins un don soit recueilli= c’est le contraire d’aucune des trois
personnes ne fait un don
Spécifier la distribution d’une variable aléatoire implique de préciser deux
éléments :
1. Les valeurs possibles
2. Répartition des observations entre ces valeur
- Données, recueillies dans la pratique  distribution empirique
- Modèle théorique Distribution de probabilités (dont l’objectif est
d’expliquer le comportement des observations d’une variable)
- Si distribution empirique = distribution de probabilités, alors c’est un très
bon modèle. Mieux le modèle s’ajuste aux données, le meilleur il est
- Distribution de probabilités est un modèle théorique qui vise à traduire le
mieux possible la répartition réelle des données
Cas d’une variable quantitative discrète (# entiers)
présenter la distribution au moyen soit d’un diagramme à bâtonnets, soit d’un
tableau des fréquences d’observation.
Présenter les valeurs de la variable à l’étude et d’autre part a) La fréquence
d’observation dans le cas de la distribution empirique; b) Les probabilités (à
accorder à chaque valeur possible de la variable sont présentés) dans le cas
d’une distribution de probabilités.
Décrire var aléatoire discrète : valeurs possibles+ probabilités respectives
Pour être discrète : la somme des prob doit =1 et les prob doivent être positives

Si c’est une cloche symétrique loi normale


Cest un modèle théorique qui est souvent
approprié pour décrire le comportement
Valeur espérée (ou espérance) pour variable quantitative discrète empirique de variables continues dont la majorité
E[X] : Valeur espérée de la variable X se définit comme la valeur moyenne que des proportions se trouvent autour de la
l’on obtient si on observe X un très grand nombre de fois (en fait infini), de moyenne. Moyenne=mode=médiane
façon indépendante d’une fois à l’autre. = valeur moyenne
Loi normale : 2 paramètres : Valeur moyenne (le centre) (mu) et l’écart-type
E [ X ] =¿ x p 1 1 + x2p2 + x3p3 + … + xkpk qd var discrète (sigma)  X ~N(μ,σ)
Ex : E[X]=1.14; L’an prochain, le très grand nombre de patients de la clinique Grand écart-typeGrande dispersioncourbe évasée
effectueront en moyenne 1.14 visite chacun. Petit écart-typePetite dispersioncourbe pointue
Espérance sur Excel : E [ X ] =¿ SOMMEPROD/SUMPRODUCT( valeurs de X ,
probabilités )
Pcq sa donne x1*p1 + x2*p2 + etc
Si var binaire : E [ X ] = p. Pour une variable indicatrice de type 0-1, la
moyenne d’un grand nombre d’observations coïncide avec la proportion du
temps où la caractéristique à l’étude est observée.
Définir X; μ=70, σ=10;
Plus le nombre de lancé est haut (un très grand nombre, nb infini), plus on 95.5% : μ- 2σ=50 et μ+ 2σ=90; donc 95.5% des
s’approche de la valeur théorique. étudiants ont une note entre 50 et 90%
Plus on observe d’observations (plus l’échantillon est grand), plus la moyenne de Si X obéit à la loi normale : P(a<X<b) = aire sous la
l’échantillon va se rapprocher de la valeur espérée. portion de la courbe vis-à-vis cet intervalle.
Dans le tableau, ou nommé distribution de probabilités, Calcul de probabilités :
x 1 représente une valeur de la variable, alors que p1 Excel LOI.NORMALE.N(x; μ; σ; 1) NORM.DIST eng.
juste valeur inférieur à X donc P(X<x). Mettre 1
correspond à la probabilité du temps où cette valeur
dans le champ logique « cumulative », toujours
surviendra si la variable est observée un très grand
inscrire 1
nombre de fois (infini en théorie).
Si on a P(X>x) faire 1- P(X<x) sur excel pour avoir la
probabilité (règle du contraire)
La loi binomiale
1. P(X<x) = P(X≤x)
Une expérience de Bernoulli est une
2. P(X>x) = P(X≥x)
expérience aléatoire à laquelle il y a
Attention : P(X≥7) = 1- P(X≤7)
exactement 2 issues/résultats possibles :

Quatre ingrédients sont essentiels pour garantir que la variable X soit de loi
binomiale, avec paramètres n et p :
1. n : un nombre prédéterminé d’épreuves de Bernoulli est réalisé;
2. p : la probabilité d’obtenir un succès est la même à chaque épreuve;
3. les épreuves de Bernoulli sont indépendantes entre elles;
4. X =¿ nombre total de succès parmi les n épreuves (de 0 à n)
Souvent pour calculer le nombre de fois de quelque chose
On utilise alors la notation : X Bin(n , p) où la valeur de X est le nombre Calcul d’un quantile :
de succès et est entre 0 et n. Mettre la prob pas en %, mettre genre 0.57
Ex : quel rendement a-t-on 90% de chance
Si obéit à la loi binomiale : Utile car la moyenne et l’écart-type de la variable
de surpasser? Trouver la valeur de x qui lui
X sont facilement calculés avec ces formules :
binomiale est associée
Moyenne : E [ X ] =¿ np écart-type : Excel LOI.NORMALE.INVERSE.N (p, μ, σ)
(NORM.INV en anglais) permet d’obtenir la
σ =√ np(1−p) réponse : P(X<x)=p (à gauche du x sur
Loi binomiale sur excel : fr : LOI.BINOMIALE.N=BINOM.DIST ( x, n, p, 1 ou 0 ) excel) mettre 0.1 pas 10%
0 pour calculer P(X = x) (X>2)=1-P(X≤2)
1 pour calculer P(X ≤ x) P(X≥8)=1-P(X≤7) Combinaisons linéaires de variables normales
LA LOI NORMALE Règle 1 : (une seule variable normale)
Distribution variable continue : (a et c sont des constantes)
1.Pour présenter la distribution empirique d’une variable aléatoire continue, on
utilise un histogramme :
a) Les valeurs possibles de la variable, regroupées par classes, se
trouvent sur l’axe des x.
Règle 2 : (somme de variables normales)
b) La hauteur des rectangles correspond à la répartition des
observations entre les classes (axe des y)
2.Pour les distributions de probabilités (modèle théorique) sont communiquées
sous la forme de courbe. Choisir une distribution de probabilités dont la courbe
(modèle) épouse bien la forme de l’histogramme des données recueillies.
(pas oublier
les carrés)

Distribution et nombre d’observations


Grand principe : pour une variable aléatoire obéissant à une distribution de
probabilités donnée, plus on l’observe (indépendamment) un grand nombre de
fois, alors meilleur est l’accord entre la répartition des données (distribution
empirique) et la distribution théorique. S’il était possible d’observer la variable un
nombre infini de fois, alors l’accord serait parfait (possible juste en théorie).
Plus grand nombre d’observations  meilleur accord entre distribution
empirique et théorique
Cueillette d’un grand nombre de données  meilleure visualisation de la simulation aléatoire de scénarios :
distribution Les résultats sont approximatifs, varient, mais meilleur q est le même
Remarque : Peu importe que ce soit le nombre d’observations ou la fréquence (en
%) d’observation exprimée en % qui soit rapportée dans un histogramme ou un CORRÉLATION
diagramme à bâtonnets, on y perçoit tout aussi bien la distribution. Le coefficient de corrélation est une mesure de l’association linéaire entre une
SIMULATION scénarios aléatoires plausibles paire de variables de type quantitative
Simulation Monte Carlo
But : trouver la valeur de la variable de performance Y
Difficulté rencontrée : sa valeur est inconnue a priori, c’est-à-dire que c’est une
variable aléatoire (on trouve alors la moyenne, espéré) des estimations
- Examiner un grand nombre de scénarios réalistes. (simulateur pour
observations
générer des nombres aléatoires, liste de scénarios possibles)
- en fait bcp pour que leur distribution empirique soit proche de leur
distribution de probabilités (du modèle théorique) connue.
- Puisque les scénarios générés pour X 1 , X 2 , … , X k dressent alors un
portrait fiable de leur distribution, alors les scénarios de

Y =f ( X 1 , X 2 , … , X k ) qui en découlent dressent un portrait fiable Direction de l’association : Corrélation négative : pente descendante (variables
varient en direction inverse)
des valeurs de Y qui pourraient réellement être observées Corrélation positive : pense ascendante (variables varient dans la même direction)
Force de l’association : Plus le coefficient est près de 1 ou -1, plus il est fort. Près
de 0, association linéaire faible (pas nécessairement indep, peut être juste pas
linéaire)
Coeff de corré n’a de sens que si la relation sous étude est de nature linéaire
(faire un nuage de points pour s’en assurer : ligne qui fit le mieux?)
Excel : =COEFFICIENT.CORRELATION( plage variable 1 ; plage variable 2 ) english :
CORREL; or use the data analysis toolpack
Ingrédients nécessaires à la résolution du problème
ESPÉRANCE D’UNE COMBINAISON LINÉAIRE
combinaison linéaire: T =aX + bY + c , où a, b, c sont des constantes

Valeur espéré : même coefficients et remplacer variables aléatoires par leurs

valeurs moyenne : E [ T ]=aE [ X ] + bE [ Y ] + c ; E [ X ] = moyenne loi


normale, u
Plus de scénarios = estimations plus précises/fiables ÉCART-TYPE D’UNE COMBINAISON LINÉAIRE
Afin de calculer l’écart-type de la variable T, à partir des écarts-types de
X 1 , X 2 , … , X k , on doit absolument passer par le calcul de la variance:
2 méthodes V ( X)=σ 2 et σ X = √ v ( x )
1.Usage direct des règles du calcul des probabilités :
+ : fournit la distribution exacte de Y;
- : permet que de résoudre des problèmes simples, fonctionne
rarement en pratique
2.Simulation Monte-Carlo :
+ : tjrs applicable L’écart-type et la variance : deux mesures de la dispersion d’une variable
- : une erreur est commise lors de la détermination de la distribution écart-type : même unité que la variable X
de Y variance : unité2
S’applique toujours mais /!\ on admet qu’une erreur est commise : on trouve une Calculs de variance : 0.0662 si 6.6%
approximation. (Plus le nombre de scénario est grand plus l’erreur est faible)
- Si indépendant : La variance de T =a 1 X 1 +a 2 X 2 + …+ ak X k + c
Étapes d’une simulation Monte Carlo
est :
Où a1=a2=…=ak=1
V ( T ) =a21 V ( X 1 ) +a22 V ( X 2 ) +…+ a2k V ( X k )
- Cas particuliers : Si T =X 1 + X 2 alors V ( T ) =V ( X 1 ) +V ( X 2 )
Où a = 1 1
Si T =X −Y , alors et a = -12
2 2
V ( T ) =( 1 ) V ( X 1 ) + (−1 ) V ( X 2 )=V ( X 1) + V ( X 2 )
- Cas général pour deux variables : (combi linéaire de 2 variables
possiblement corrélées entre elles). Même formule que variance mais
ajoute un terme de corrélation : La variance de T =aX + bY + c , est :

V ( T ) =a2 V ( X )+ b2 V ( Y ) +2 a b ρ x , y σ x σ y
où ρ X ,Y est le coefficient de corrélation entre les variables X et Y . En
Avec gabarit sur la stat descriptive ou fct excel particulier, lorsque X et Y sont indépendantes, alors ρ X ,Y =¿ 0 et on
Variables primaires : Incertaine, X1, X2 … Xn, on connait leur distribution
Conséquences : Découle des variables Primaires, Y en est une, les exprimer retombe sur V ( T ) =a2 V ( X ) + b2 V ( Y )
mathématiquement (𝑄=min(𝐷, 3500)) - Cas général pour trois variables : La variance de
SIMULATION ET OPTIMISATION T =a 1 X 1 +a 2 X 2 + a3 X 3+ c , est :
Quand une simulation est nécessaire pour au moins une variable de la fonction-
objectif. pas calculée exactement, mais plutôt espérée V ( T ) =a21 V ( X 1 ) +a22 V ( X 2 ) +a32 V ( X 3 )
faire la moyenne de tous les profits simulés pour avoir E(profit) estimé
fct-objectif : MAX profit espéré = E[profit] = f(q) estimée= 𝐸[coût] estimé
+2∗¿ paire (1,2)
Fct objectif d’une valeur espéré n’est pas linéaire +a 1 a 3 ρ x 1 , x 3 σ x σ x 3
1
paire (1,3)
Profit = 50*min(q,D) + 25*(q-min(q,D)) – 30*q
Modéliser le problème
+a 2 a 3 ρ x 2 , x 3 σ x σ x 3 ¿
2
paire (2,3)
Garder la même liste de scénarios : comparer les différentes valeurs des variables  Cas général pour k variables La variance de
de q (variable de décision), toute autre chose étant maintenue constante
EXEMPLE
T =a 1 X 1 +a 2 X 2 + …+ ak X k + c, est
La variable de décision est la variable qui indique l’option retenue : V ( T ) =a21 V ( X 1 ) +a22 V ( X 2 ) +⋯ +a2k V ( X k )
+2∗( somme des termesde corrélation)
(corrélation*coefficient*écart-type)
PORTEFEUILLES

O= 1 si on opte pour l'option 1


{
2 si on opte pour l'option 2
V t−V t −1 V t
Rendement d’une action (d’un titre en bourse) ¿ = −1=
V t −1 V t−1
new-old/old
V t =V t−1 (1+ Rt )
Rendement espéré d’un portefeuille = poids* rendement moyen A +…+… (pas en
% en 0.01)
(rendement effectif= (1+prob)*(1+prob)*… -1 )
Écart-type élevé = grande volatilité; fluctue plus, plus risqué
plus la volatilité est élevée, plus les rendements d’un titre sont en moyenne
éloignés du rendement moyen. + d’incertitude
Des poids négatifs c’est possible en finance: vend à découvert
Vend a découvert le titre amazon, et utilise l’argent en plus pour financer l’achat
des autres titres
Solution dominante: En optimisation multi-objectifs, on dit qu’une solution en
domine une autre si elle est au moins aussi bonne que l’autre solution par rapport
à tous les objectifs d’optimisation et meilleure que l’autre solution par rapport à
au moins un de ces objectifs.
Frontière efficace/ efficiente : points de la courbe risque-retour au-dessus du
point associé au portefeuille à volatilité minimale sans contrainte de rendement
Les portefeuilles sur cette frontière sont dits « efficaces » car dominés par aucun
autre portefeuille. Le choix entre ces portefeuilles revient à l’investisseur en
fonction de ses préférences. Si pas sur cette frontière, pas efficace
Au bout à gauche : min risque sans contrainte de rendement
Si une option sans risque : frontière efficace est une droite passant par le point et
tangente à l’ancienne frontière efficace
Courbe de Pareto : Dans le cas où il y a deux objectifs, on peut représenter
l’ensemble des solutions Pareto optimales par une courbe dans un graphique, où
les axes mesurent les deux objectifs. Ex : frontière efficace
Solution Pareto optimale : En optimisation multi-objectifs, une solution
admissible qui n’est dominée par aucune autre solution admissible.
La probabilité que le capital investi soit préservé= que le portefeuille ait un
rendement positif
EXEMPLES opti linéaire
Variable de décision :
x i : quantité (en tonne) de produit i utilisée pour produire l’engrais,
i=1,2 , … , 6.
x i : nb. d’unités du produit Piproduites au cours de la prochaine année; i = 1, 2,
3.
X ij = nombre de machines produites à l’usine i et livrées au client j, pour i=1, 2, 3
et j =1, 2, 3, 4.

Fonction-objectif :
min 110 x 1+ 125 x 2 +95 x 3+155 x 4 +160 x 5 +175 x 6
Contraintes :
Teneurs minimum :
Azote : 25 x 1+10 x 2 +5 x 3 +35 x 4 +5 x 5+ 0 x 6 ≥ 15
Phosphore : 10 x 1+5 x 2+ 10 x 3 +0 x 4 +20 x 5+ 5 x 6 ≥5
Potasse : 5 x 1+10 x 2+ 5 x 3 +5 x 4 +0 x 5+ 30 x 6 ≥7
Contrainte de quantité :
x 1+ x2 + x 3 + x 4 + x 5+ x 6 =1
Non-négativité des variables  :
xi ≥ 0 pour i=1,2 , … , 6.
Demande :
Écouteurs : P E +S E =180
P : qu’au moins un don soit recueilli : le contraire d’aucune des trois personnes ne
fait un don. Ainsi, la probabilité est 1-(0.85)3
Prob pas faire le même choix : contraire de (D1 et D2 et D3) ou (N1 et N2 et N3).