Cours Mathématiques Appliquées PDF

COURS DE
MATHEMATIQUES
APPLIQUEES
(MASTER EN MAINTENANCE
INDUSTRIELLE)
Abdoulaye SYLLA
SOMMAIRE
Introduction…………………………………………………………………………………………………………….P5
1ère PARTIE : ANALYSES STATISTIQUES

CHAPITRE I : GENERALITES SUR LES STATISTIQUES ET LES PROBABILITES
I – Généralités sur la statistique descriptive………………………………………………………………P5
1) Données statistiques………………………………………………………………………………………P5
2) Inférence statistique………………………………………………………………………………………P5
3) Quelques formules…………………………………………………………………………………………P5
II – Généralités sur la probabilité ……………………………………………………………………………P6
1) Langage de probabilité………………………………………………………………………………….P6
2) Définition……………………………………………………………………………………………………..P6
3) Propriétés…………………………………………………………………………………………………….P6
4) Equiprobabilité…………………………………………………………………………………………….P6
5) Probabilité conditionnelle……………………………………………………………………………..P7
6) Indépendance de deux évènements……………………………………………………………….P7
7) Variable aléatoire………………………………………………………………………………………….P7
a) Définition………………………………………………………………………………………………...P7
b) La loi de probabilité…………………………………………………………………………………P7
c) Espérance mathématique…………………………………………………………………………P7
d) Variance…………………………………………………………………………………………………..P7
CHAPITRE II : ECHANTILLONNAGE
Introduction……………………………………………………………………………………………………………P8
I – Définitions………………………………………………………………………………………………………….P8
II – Les différents types d’échantillonnage ……………………………………………………………....P8
1) L’échantillonnage non-probabiliste………………………………………………………………P8
a) Les échantillons de convenance………………………………………………………………..P8
b) Les échantillons volontaires……………………………………………………………………..P8
c) Les méthodes de quotas…………………………………………………………………………...P9
2) L’échantillonnage probabiliste………………………………………………………………………P9
a) L’échantillonnage à un degré ……………………………………………………………….P9
a-1) L’échantillonnage aléatoire simple ……………………………………………….…….P9
a-2) L’échantillonnage stratifié ……………………………………………………………….P9
a-3) L’échantillonnage aléatoire en grappe………………………………………………..P10
b) L’échantillonnage à plusieurs degrés………………………………………………………...P10
CHAPITRE III : ESTIMATION

Introduction………………………………………………………………………………………………………….P11
I – Définitions ……………………………………………………………………………………………………….P11
II - Estimation ponctuelle………………………………………………………………………………………P11
1) Estimation de m…………………………………………………………………………………………P11
2) Estimation de σ2 en supposant m connu………………………………………………………P12
3) Estimation de σ2 en supposant m inconnu……………………………………………………P12
III - Estimation par intervalle………………………………………………………………………………….P12
1
Cours de mathématiques appliquées (Master en maintenance industrielle)
1) Définitions d’une région de confiance…………………………………………………………P12
2) Construction de la région de confiance……………………………………………………….P13
3) Exemples classiques d’estimation par intervalle………………………………………….P13
a) Estimation de la moyenne quand la variance est connue………………………….P13
b) Estimation de la moyenne quand la variance est inconnue………………………P14
c) Estimation de la variance quand la moyenne est connue……………………...….P14
d) Estimation de la variance quand la moyenne est inconnue………………………P14
CHAPITRE IV : TESTS STATISTIQUES

I – Introduction aux tests statistiques…………………………………………………………………….P15
II – Tests d’hypothèse……………………………………………………………………………………………P15
1) Définition…………………………………………………………………………………………………..P15
2) Catégories de tests d’hypothèse…………………………………………………………………..P15
3) Principe du test d’hypothèse……………………………………………………………………….P15
4) Test unilatéral ou test bilatéral……………………………………………………………………P16
a) Test bilatéral…………………………………………………………………………………………..P16
b) Test unilatéral…………………………………………………………………………………………P16
5) Tests permettant de déterminer si un échantillon appartient à une population
donnée………………………………………………………………………………………………………..P16
a) Test sur une moyenne : comparaison d’une moyenne expérimentale à une
moyenne théorique……………………………………………………………………………………..P16
b) Test sur une proportion ………………………………………………………………………..P17
6) Risque de 1ère espèce - risque de 2ème espèce…………………………………………………P18
7) Test du Khi²…………………………………………………………………………………………………P18
a) Test sur une moyenne : comparaison d’une moyenne expérimentale à une
moyenne théorique………………………………………………………………………………...P18
b) Test d’indépendance …………………………………………………………………………...P19
III – Analyse de la variance (ANOVA)………………………………………………………………………P21
1) Principe de l’analyse de variance ………………………………………………………………..P21
2) ANOVA : méthode de calculs…………………………………………………………………………P22
3) Exécution du test ……………………………………………………………………………………….P23
2ème PARTIE : RECHERCHE OPERATIONNELLE

CHAPITRE I : PROGRAMMATION LINEAIRE : SOLUTION GRAPHIQUE
I – Définition…………………………………………………………………………………………………………..P24
II - Forme canonique d’un programme linéaire ……………………………………………………..P24
III - Méthode graphique : problème à 2 inconnues ………………………………………………...P24
1) Régionnenement du plan……………………………………………………………………………...P24
2) Résolution graphique du problème……………………………………………………………….P24
CHAPITRE II : PROGRAMMATION LINEAIRE : METHODE SIMPLEXE

Introduction………………………………………………………………………...…………………………………P28
I - Forme standard ………………………………………………………………………………………………...P28
II - Algorithme du simplexe……………………………………………………………………………………..P28
III - Analyse post-optimale de la fonction objectif ………………………………………………….P33
2
CHAPITRE III : PROGRAMMATION LINEAIRE EN NOMBRES ENTIERS
Introduction……………………………………………………………………………………………………….P37
I – Définition……………………………………………………………………………………………………….P37
II – Uni modularité d’une matrice…………………………………………………………………………P37
1) Définition 1……………………………………………………………………………………………………P37
2) Définition 2……………………………………………………………………………………………………P37
3) Théorèmes………………………………………………………………………………………………….…P37
IV – Application : problème d’affectation……………………………………………………………….P38
3ème PARTIE : PROCESSUS STOCHASTIQUES

CHAPITRE I : PROBABILITES : VARIABLES ALEATOIRES
I - Variables aléatoires discrètes……………………..……………………………………………………..P40
1) Définition…………………………………………………………………………………………………..P40
2) Loi de probabilité d’une variable aléatoire discrète …………………………………P40
3) Fonction de répartition……………………………………………………………………………….P40
a) Définition………………………………………………………………………………………………..P40
b) Théorème……………………………………………………………………………………………….P40
4) Espérance mathématique…………………………………………………………………………….P40
a) Définition………………………………………………………………………………………………..P40
b) Propositions……………………………………………………………………………………………P40
5) Variance………………………………………………………………………………………………………P41
a) Définition………………………………………………………………………………………………...P41
b) Propositions……………………………………………………………………………………………P41
c) Théorème (inégalité de Tchebycheff)……………………………………………………...P41
6) Lois discrètes classiques ………………………………………………………………………….P41
a) Loi de Bernoulli …………………………………………………………………………………..P41
b) Loi uniforme sur un ensemble fini…………………………………………………………….P41
II- Variables aléatoires continues …………………………………………………………………………P42
1) Définition…………………………………………………………………………………………………….P42
2) Loi de probabilité ………………………………………………………………………………………P42
3) Fonction de répartition………………………………………….……………………………………..P43
a) Définition ………………………………………………………………………………………………P43
b) Théorème ………………………………………………………………………………………………P43
c) Espérance mathématique…………………………………………………………………………P43
d) Variance………………………………………………………………………………………………….P43
4) Variables à densité……………………………………………………………………………………….P43
a) Définitions ……………………………………………………………………………………………..P43
b) Proposition ……………………………………………………………………………………………P43
5) Quelques lois à densité classiques ………………………………………………………………P43
a) Lois uniformes………………………………………………………………………………………..P43
b) Lois exponentielles…………………………………………………………………………………P44
CHAPITRE II : PROCESSUS STOCHASTIQUES

I – Définitions…………………………………………………………………………………………………………P45
II- Chaines de Markov……………………………………………………………………………………………..P45
3
1) Définition…………………………………………………………………………………………………...P45
2) Proposition ………………………………………………………………………………………………..P46
3) Noyau de transition…………………………………………………………………………………….P46
4) Graphe de transition……………………………………………………………………………………P46
5) Distribution ………………………………………………………………………………………………P46
6) Lois invariantes …………………………………………………………………………………………P47
7) Chaines de Markov et temps d’arrêt ……………………………………………………………P47
8) Classification des états ………………………………………………………………………………..P48
a) Communication……………………………………………………………………………………….P48
b) Récurrence – transcience ………………………………………………………………………..P49
c) Espérance du temps du retour…………………………………………………………………P49
d) Périodicité………………………………………………………………………………………………P49
CHAPITRE III : FILES D’ATTENTE

I – Introduction……………………………………………………………………………………………………..P50
II – Définition………………………………………………………………………………………………………..P50
III – Modèles de file d’attente…………………………………………………………………………………P50
1) Modèles M/M/1………………………………………………………………………………………….P50
a) Définition………………………………………………………………………………………………P50
b) Arrivée avant un départ et départ avant une arrivée………………………………...P50
c) Analyse en régime stationnaire………………………………………………………………..P51
d) Notations et formules ……………………………………………………………………………..P51
2) Modèle M/M/1/K………………………………………………………………………………………..P52
IV – Travaux pratiques……………………………………………………………………………………………P52
4
INTRODUCTION
Les mathématiques appliquées constituent un outil très utilisé dans des domaines
aussi variés que la production industrielle, l’économie, la politique ou le marketing.
Ce cours de mathématiques appliquées devrait vous permettre de découvrir en
profondeur la démarche des mathématiques appliquées, notamment les étapes de
modélisation, de simulation numérique et d’interprétation des résultats.
1ère PARTIE : ANALYSES STATISTIQUES

CHAPITRE I : GENERALITES SUR LES STATISTIQUES ET LES PROBABILITES
I – Généralités sur la statistique descriptive

1) Données statistiques
Les données statistiques sont des éléments d’information, souvent numériques, qui
servent de point de départ à une étude statistique.
Les données statistiques peuvent être des données numériques ou alphanumériques. On
distingue :
- Les données brutes qui sont des données non encore traitées
- Les données aberrantes qui sont des données qui s’écartent significativement du
groupe de données.
Les données peuvent être obtenues grâce à un sondage, une enquête ou même grâce aux
archives etc…
L’analyse des données est une branche de la statistique développée depuis plusieurs
années grâce aux progrès de l’informatique et de certains logiciels tes que SPSS,
STATISCAL et MINI TAB.
2) Inférence statistique
L’inférence statistique consiste à induire les caractéristiques inconnues d’une
population à partir d’un échantillon issu de la population. Les caractéristiques de
l’échantillon une fois connues, reflètent une certaine marge d’erreur possible par
rapport à celles de la population.
3) Quelques formules
On considère une variable statistique X (représentant une caractéristique de la
population) observée sur n individus. On dispose alors d’une série statistique
unidimensionnelle X=(x1 , x1 ,… xn ) que l’on peut mettre V(sou forme de tableau de
données.
Individu 1 2 ……………… i …………….. n
Valeurs x1 x2 ……………… xi …………….. xn
de X
xi = valeur de X pour l’individu i de la série.

 Effectif d’une valeur xi de X : nombre d’individus ayant cette valeur ni .
ni
 Fréquence de la valeur xi de X : xi =
n
 Effectif cumulé de la i-ème valeur de X :
5
Ni =∑ij=1 nj =n1 +n2 +….nj +….+ni
 Fréquence cumulée de la i-ème valeur de X :
Fi =∑ij=1 fj =f1 +f2 +….fj +….+fi
 La moyenne arithmétique de X est :
1
̅
X = N ∑ni=1 ni xi où N est l’effectif total de la population
= ∑ni=1 fi xi
 La variance de X notée V(X) est :
1
V(X)=N ∑ni=1 ni(x̅ − xi )²= ∑ni=1 fi (x̅ − xi )²
1
=N ∑ni=1 ni xi ²−x̅²
II – Généralités sur la probabilité

1) Langage de probabilité
Une expérience aléatoire ou une épreuve est une expérience qui peut être répétée dans
des conditions dans des conditions apparemment identiques dont le résultat n’est pas
connu à priori.
Une éventualité est un résultat de l’expérience.
L’ensemble des éventualités est appelé l’univers et est noté Ω.
Toute partie de l’univers est appelé évènement.
Un évènement élémentaire est un singleton de Ω.
Un évènement impossible est un évènement qui n’est jamais réalisé. Il est noté ∅.
Un évènement certain est un évènement qui est toujours réalisé.
L’évènement A ∩ B est l’évènement « A et B » qui est réalisé lorsque A et B sont réalisés
en même temps.
L’évènement A ∪ B est l’évènement « A ou B » qui est réalisé lorsque l’un au moins des 2
évènements est réalisé.
L’évènement contraire de A est noté A ̅.
2) Définition
Une probabilité P est une application de ℙ(Ω) vers [0, 1] tel que :
- P(∅)=0
- La somme des probabilités des évènements élémentaires est 1.
- La probabilité d’un évènement A est égale à la somme des probabilités des
évènements élémentaires qui le constituent.
3) Propriétés
(P1 ) P(Ω)=1
(P2 ) Si A ∩ B=∅ alors P(A ∪ B)=P(A)+P(B)
(P3 ) Si A et B sont quelconques : P(A ∪ B)=P(A) + P(B) –P(A ∩ B)
(P4 ) Si A ∁ B alors P(A) ≤ P(B).
4) Equiprobabilité
On est dans un cas d’équiprobabilité si tous les évènements élémentaires ont la même
probabilité.
6
Card A
Si A est un évènement alors P(A)= .
Card Ω
5) Probabilité conditionnelle
Soit B un évènement et A un évènement de probabilité non nulle. On appelle probabilité
B par rapport à A ou probabilité de B sachant A la quantité notée PA (B) ou P(B/A) tel
P(B ∩ A)
que P(B/A)= .
P(A)
6) Indépendance de deux évènements

A et B sont indépendants si et seulement si P(A ∩ B) = P(A) × P(B).
A et B sont indépendants si et seulement si P(A/B) = P(A).
L’indépendance de deux évènements traduit le fait que la réalisation d’un des
évènements n’influe pas sur la réalisation ou la non réalisation de l’autre.
7) Variable aléatoire
a) Définition
Une variable aléatoire discrète notée X est une application de Ω dans IR.
b) La loi de probabilité
Soit X une variable aléatoire prenant les valeurs x1 , x2 ,… xn . La loi de probabilité de X est
la donnée des probabilités P(X=xi ) ; i ∈ {1, 2….n}.
NB : (X=xi ) est l’ensemble des évènements tel que X=xi .
(X=xi )={ω ∈ Ω / X(ω)= xi }.
c) Espérance mathématique
Soit X, une variable aléatoire prenant les valeurs x1 , x2 ,… xn . On appelle espérance
mathématique de X la quantité notée E(X) tel que E(X) : ∑ni=1 xi P(x=xi ).
d) Variance
Soit X une variable aléatoire prenant les valeurs x1 , x2 ,… xn . On appelle variance de X, le
réel noté V(X) et défini par :
V(X)= ∑ni=1(xi −E(X))²P(X=xi )
= ∑ni=1 xi ²P(X = xi ) −[E(X)]².
L’écart type noté σ(X)=√V(X).
7
CHAPITRE II : ECHANTILLONNAGE
Introduction
Pour multiples raisons, on a besoin d’un échantillonnage pour décrire les propriétés
d’une population. Le but suprême de cet échantillonnage est l’atteinte d’une
représentativité impartiale de la population étudiée pour que toute estimation basée sur
l’échantillon soit sans biais et inférée à la population.
I – Définitions
Définition 1 : l’échantillon est un sous-groupe représentatif extrait d’un grand groupe
qui est la population.
Définition 2 : l’échantillonnage est le processus par lequel on détermine l’échantillon.
II – Les différents types d’échantillonnage

Il existe deux types d’échantillonnage qui sont l’échantillonnage non-probabiliste et
l’échantillonnage probabiliste.
1) L’échantillonnage non-probabiliste
Ce type d’échantillonnage est aussi appelé méthode empirique. Le choix des individus
n’y obéit pas au hasard mais plutôt au choix des enquêteurs.
Les méthodes d’échantillonnage non-probabiliste les plus couramment utilisées sont :
- Les échantillons de convenance
- Les échantillons volontaires
- Les méthodes de quotas.
a) Les échantillons de convenance

Ce sont des échantillons d’individus facilement interrogeables, par exemple les études
d’opinion réalisées dans la rue.
Les avantages sont :
- La facilité d’application
- L’absence d’influence de l’investigateur
Les inconvénients sont :
- Lan non-représentativité de la population
- L’impossibilité d’associer un biais.
b) Les échantillons volontaires

Les individus se présentent volontairement.
Exemple : appel à participation par annonce dans des journaux.
- L’attractivité d’un point de vue de l’éthique
- Type d’échantillonnage utile pour une phase exploratoire.
- La non-représentativité de la population
- L’impossibilité d’évaluer le biais associé.
8
c) Les méthodes de quotas
Dans ce type d’échantillonnage, l’échantillon est construit selon un modèle réduit de la
population étudiée, incluant les mêmes proportions sociodémographiques.
- La non nécessité de base de sondage
- Un coût plus faible.
- La non-représentativité de la population
- L’impossibilité d’évaluer le biais associé.
2) L’échantillonnage probabiliste
Dans ce type d’échantillonnage, tous les individus de la population source ont une
probabilité connue et non-nulle d’être sélectionnés pour faire partie de l’échantillon ; il
n’y a pas d’intervention du chercheur ; seul le hasard régit donc l’inclusion ou non d’un
individu dans l’échantillon.
On distingue l’échantillonnage à un degré et celui à deux degrés.
a) L’échantillonnage à un degré
Il peut être simple, stratifié ou en grappe.
a-1) L’échantillonnage aléatoire simple

Cette méthode donne une chance à tous les individus d’une population d’être
sélectionnés. C’est une méthode conseillée lorsque la population est nombreuse et
relativement homogène.
Procédure à suivre
 Définir clairement la nature de la population
 Attribuer un numéro à chaque individu de la population
 Sélectionner l’échantillon en choisissant n’importe quelle méthode qui donne la
même chance à tous les numéros d’être tirés.
a-2) L’échantillonnage stratifié

Cette méthode permet de représenter les sous-groupes d’une population hétérogène.
L’échantillon peut être réparti de façon proportionnelle à la taille de ces sous-groupes et
aussi tous les individus possèdent une même chance d’être sélectionnés comme dans
l’échantillonnage aléatoire simple.
Procédure à suivre pour l’échantillonnage :

 Définir clairement la nature de la population
 Déterminer les sous-groupes à représenter dans l’échantillon
 Assigner un numéro à chaque individu de chaque sous-groupe
 Déterminer le pourcentage que représente chaque sous-groupe dans la population
 Sélectionner l’échantillon en choisissant n’importe quelle méthode qui donne la
même chance à tous les numéros d’être tirés à l’intérieur d’un sous-groupe. Du
coup, il faut s’assurer que chaque sous-groupe est représenté proportionnellement
dans la population.
9
a-3) L’échantillonnage aléatoire en grappe
Des sondages sont réalisés sur des groupes complets d’individus. La population source
est subdivisée naturellement en groupes (la composition des grappes est antérieure au
sondage). Un certain nombre de groupes va être sélectionné aléatoirement pour
composer l’échantillon.
- L’échantillonnage aléatoire malgré l’absence de liste
- La réduction des coûts.
- Les grappes risquent de ne pas représenter correctement la variabilité de la
population
- Les grappes doivent être de tailles à peu près équivalentes.
b) L’échantillonnage à plusieurs degrés

Plusieurs sélections aléatoires emboitées sont réalisées pour le sondage.
Conclusion
L’échantillonnage est un processus qui permet d’étudier les propriétés et
caractéristiques d’une population. Il existe plusieurs méthodes d’échantillonnages. Il
faut donc utiliser la méthode appropriée à chaque type de population.
10
CHAPITRE III : ESTIMATION
Introduction
En statistique comme dans la théorie des probabilités, le hasard intervient fortement.
Mais dans la théorie des probabilités on suppose la loi comme précisément et on
cherche à donner les caractéristiques de la variable qui suit cette loi.
L’objectif en statistique est le contraire. A partir de la connaissance de la variable, que
peut-on dire de la loi de cette variable ?
L’estimation est un outil beaucoup utilisé en statistique. Son but est d’estimer la valeur
d’un paramètre de la population.
I – Définitions
Soit X une variable aléatoire dont la densité de probabilité f (x, θ) dépend d’un
paramètre θ appartenant à I ∁ IR. A l’aide d’un échantillon issu de X, il s’agit de
déterminer la vraie valeur Ɵ0 de θ. On pourra utiliser deux méthodes :
- L’estimation ponctuelle : on calcule une valeur vraisemblable θ̂ de θ0
- L’estimation par intervalle : on cherche un intervalle dans lequel θ0 se trouve
avec une probabilité élevée.
Définition 1 : un n-échantillon de X est un n-uplet (X1 , X2 , …, Xn ) tel que les Xk ont la

même loi que X et sont indépendants. Une réalisation de l’échantillon est donc un n-
uplet (x1 , x2 , …, xn ) de valeurs prises par l’échantillon.
Définition 2 : une statistique de l’échantillon est une variable aléatoire ρ (X1 , X2 , …, Xn )

où ρ est application de IRn dans IR.
Un estimateur T de θ est une statistique à valeurs dans I.
Une estimation est la valeur de l’estimateur correspondant à une réalisation de
l’échantillon.
Exemple : ̅ Xn = ∑nk=1 X k est un estimateur de l’espérance mathématique.
Définition 3 : le biais de l’estimateur T de θ est E(T)- θ0 .

S’il est nul, on dit que T est un estimateur sans biais.
Si lim E(Tn ) = θ0 , on dit que l’estimateur Tn est asymptotiquement sans biais.
Définition 4 : l’estimateur est dit convergent si la suite (Tn ) converge en probabilité vers
θ0 si ꓯε> 0, P(|Tn – θ0 | ≥ ε) → 0.
n→+∞
On parle d’estimateur fortement convergent lorsqu’on a une convergence presque sûre.
II - Estimation ponctuelle
Exemples d’estimation :
Soit X une variable aléatoire telle que E(X) = m et V(X) = σ.
1) Estimation de m
Théorème 1
̅n = 1 ∑nk=1 X k est un estimateur sans biais et convergent de
La moyenne empirique X
n
m.
11
Proposition 1
Si n est assez grand, on peut utiliser l’approximation normale (lorsque X admet un
2
̅ n ~ N (m , σ )
moment d’ordre 2). X
n
̅ n − m) →
Comme conséquence, on peut dire que √n(X 𝑁(0, σ2 ).
n→+∞
2) Estimation de 𝛔𝟐 en supposant m connu

Théorème 2
1 n
Lorsque m est connu, Sn2 = n ∑k=1(Xk − m)2 est un estimateur sans biais et convergent
de σ2 .
1 n 1 n
On a E (Sn2 ) = E [ n ∑k=1(Xk − m)2 ] = n ∑k=1 Var (Xk ) = σ2 .
Par ailleurs, les variables (Xk − m)2 sont indépendantes.
1
Var (Sn2 ) = n ∑nk=1 Var ((Xk − m))2
1
= n ( E[(X − m)4 ] − E[(X − m)2 ] ²)
1
= n (u4 − σ4 ) avec u4 = E((X − m)4 ).
Donc Sn2 est un estimateur convergent. La loi forte des grands nombres appliquée aux
variables (Xk − m)2 entraine la convergence presque sûre vers σ2 .
u4 −σ4
On a lorsque n est très grand Sn2 ~ N (σ2 , ( )).
n
Dans la suite du chapitre, nous nous épargnerons les démonstrations fastidieuses qui ne
feront qu’alourdir le chapitre.
3) Estimation de 𝛔𝟐 en supposant m inconnu

En général, on ne connait pas m ; on le remplace par un estimateur et on introduit la
1 n
variance empirique associée S̅n2 = n ∑k=1(Xk − ̅Xn )² .
Théorème 3
La variance empirique S̅n2 est un estimateur biaisé et convergent de σ². Il est
asymptotiquement sans biais.
u4 −σ4
On a S̅n2 ~ N (σ2 , ( )) lorsque n est très grand.
n
Théorème 4
1 n
La variance empirique corrigée Ŝn2 = ̅n )² est un estimateur sans biais
∑k=1(X k − X
n−1
et convergent de σ².
III - Estimation par intervalle

1) Définitions d’une région de confiance
Soit α ∈ ]0 ; 1[ un niveau de risque fixé par le statisticien.
Définition 1 : une région de confiance de θ de niveau de confiance 1−α est un ensemble
(dépend de l’observation et non du paramètre inconnu θ) C(X) ∁ Ɵ tel que ∀θ ∈ Ɵ,
Pθ (θ ∈ C(X)) ≥ 1−α.
On dit alors qu’on a une région par excès. Dans le cas où on a égalité, on parle de niveau
exactement égal à 1−α.
12
Lorsqu’on a X = (X1 , …, Xn ), on parle de région de confiance asymptotique de niveau
1−α si ∀θ ∈ Ɵ, lim Pθ (θ ∈ C(X)) ≥ 1−α.
n→+∞
Les valeurs usuelles de α sont 1%, 5% ou 10%. Dans le cas unidimensionnel, la plupart
du temps, une région de confiance s’écrit sous forme d’intervalle (unilatère ou bilatère).
Un intervalle de confiance de niveau de confiance 0,95 a une probabilité au moins égale
à 0,95 de contenir la vraie valeur inconnue de θ.
Définition 2 : Soit α ∈ ]0 ; 1[ , On appelle quartile d’ordre α d’une loi de probabilité P,

la quantité zα = inf (x , P(]−∞, x]) ≥ 𝛼).
Exemple : pour la loi N (0,1), la quartile d’ordre 97,5% est 1,96 et celle d’ordre 95% est
1,645.
2) Construction de la région de confiance

Rappel : Inégalité de Bienaymé-Tchebychev
Soit x une variable aléatoire ayant un moment d’ordre 2.
Var(x)
Alors ꓯε> 0, P(|X – 𝐸(X)|> 𝜀 ) ≤ .
ε
Appliquons cette inégalité dans le cas de variables aléatoires indépendantes 𝑋1,….𝑋n
identiquement distribuées, de loi de Bernoulli B(θ), où l’on souhaite estimer θ à l’aide de
̅
Xn . On a :
̅ – θ| > ε) ≤ θ(1−θ) ≤ 1
ꓯε> 0, P(|X
nε² 4nε²
On obtient ainsi une région de confiance de niveau 1−α en considérant :
̅n − 1 , X
[X ̅ n + 1 ].
2√nα 2√nα
Pour α=5% et n=100, la précision de l’intervalle est 0,22. Il faut noter que la majoration
obtenue à partir de l’inégalité de Bienaymé-Tchebychev n’est pas précise. On peut
obtenir un meilleur résultat en utilisant l’inégalité de Hoeffing. On obtient ainsi un
intervalle de confiance de niveau 1−α suivant :
̅ n − √ 1 ln(2 ) , ̅Xn + √ 1 ln(2 ) ]
[X 2n α 2n α
Pour α=5% et n=100, la précision de l’intervalle est 0,14 et 0,23 avec la première
méthode.
3) Exemples classiques d’estimation par intervalle

Soit X une variable aléatoire de loi normale N (m, σ²).
a) Estimation de la moyenne quand la variance est connue

Théorème 1
Lorsque σ est connu, un intervalle de confiance au niveau 1−α de m est :
̅n − q α σ , X
[X ̅ n + q α σ² ] où q α est le quartile d’ordre 1 − 𝛼 de la loi normale
1−
2 n 1−
2 n 1− 2
2
centrée réduite.
Exemple : comme 𝑞0,975 = 1,96 , l’intervalle de confiance de m au niveau 95% est :
̅ n − 1,96 σ , X
[X ̅ n + 1,96 σ ] ; ce qui signifie que sur un grand nombre d’expériences cet
n √ n √
intervalle contiendra effectivement m à 95% des cas en moyenne.
13
b) Estimation de la moyenne quand la variance est inconnue
Théorème 2
Lorsque σ² est inconnu, un intervalle de confiance au niveau 1−α de m est :
√ Ŝ2n √ Ŝ2n
𝛼
̅n − t
[X α ,̅
Xn + t n−1, 1−α ] où t n−1, 1−α est le quartile d’ordre 1 − 2 de la loi
n−1, 1− √n √n
2 2 2
de Student à n−1 degré de liberté.
Exemple : pour n=10 avec un niveau de confiance de 95% on obtient :
√ Ŝ2n √ Ŝ2n
̅ n − 2,26
[X ̅ n + 2,26
,X ].
√n √n
c) Estimation de la variance quand la moyenne est connue

Lorsque m est connu, un intervalle de confiance au niveau 1−α de σ² est :
1 n 1 n α α
[ u ∑k=1(Xk − m)2 , u ∑k=1(Xk − m)2 ] où u1 et u2 sont les quartiles d’ordre 2 et 1− 2
2 1
de la loi χ ² à n degré de liberté.
d) Estimation de la variance quand la moyenne est inconnue

Lorsque m est inconnue, un intervalle de confiance au niveau 1−α de σ² est :
n
1
[ u ∑k=1(Xk − X ̅ n )2 , 1 ∑n (Xk − X ̅ n )2 ] où 𝑢1 et 𝑢2 sont les quartiles d’ordre α et
2 u k=1 1 2
α
1− 2 de la loi χ ² à n−1 degré de liberté.
14
CHAPITRE IV : TESTS STATISTIQUES
I – Introduction aux tests statistiques

Un test qu’il soit statistique ou non consiste à vérifier une information hypothétique. On
parle de tests d’hypothèses.
Un test statistique peut être utilisé pour vérifier le succès (ou l’échec) d’une action
entreprise pour modifier la valeur d’une statistique de la population ; par exemple on
cherche à augmenter le nombre de clients servis à l’heure qui est actuellement de 10.
 Une hypothèse statistique est un énoncé (une affirmation) concernant les
caractéristiques (valeurs des paramètres, forme de la distribution des
observations…) d’une population.
 Une statistique de test est une variable d’échantillonnage servant d’estimateur au
paramètre de la population.
II – Tests d’hypothèse
1) Définition
Un test d’hypothèse est un procédé d’inférence permettant de se décider entre deux
hypothèses notées H0 et H1 concernant une ou plusieurs populations à partir d’un ou
plusieurs échantillons.
 H0 est l’hypothèse nulle de type « pas d’effets » ou bien « R.A.S » que l’on admet à
priori et à laquelle on ne renoncera que si les observations ne semblent pas trop
la contredire.
 H1 est l’autre hypothèse ou contre-hypothèse (alternative) que l’on souhaite
démontrer en rejetant H0 .
En fait un test d’hypothèse s’apparente à un raisonnement par l’absurde de type :
Démontrer H1 en supposant H0 vraie et en prouvant l’absurdité de H0 .
2) Catégories de tests d’hypothèse

Il existe une multitude de tests d’hypothèse que l’on peut classer en deux catégories.
 Les tests paramétriques (étude de la moyenne, variance ou de la fréquence des
observations issues d’une distribution à priori paramétrée). On distingue :
- Les tests de comparaison (étude d’une variable et de ses différences sur 1, 2
ou plus de 2 échantillons).
- Les tests d’association (étude des associations entre deux variables).
 Les tests non paramétriques (étude des rangs des observations et leurs
différences sur 1, 2 ou plus de 2 échantillons). On a :
- Les tests de comparaison
- Les tests d’association
3) Principe du test d’hypothèse

Un test d’hypothèse se résume à :
1° Définir l’hypothèse nulle (notée H0 ) à contrôler
2° Choisir un test statistique ou une statistique pour contrôler H0
3° Définir la distribution de la statistique sous l’hypothèse « H0 est réalisée »
4° Définir le niveau de signification du test ou région critique notée α
15
5° Calculer à partir des données fournies par l’échantillon la valeur de la statistique
6° Prendre une décision concernant l’hypothèse posée.
4) Test unilatéral ou test bilatéral

La nature de H0 détermine la manière de formuler H1 et par conséquence la nature
unilatérale ou bilatérale du test.
a) Test bilatéral
Si H0 consiste à dire que la population estudiantine avec une fréquence de fumeurs « P »
est représentative de la population avec une fréquence de fumeurs « P0 », on pose alors :
H0 : P=P0 et H1 : P≠ P0 .
b) Test unilatéral
Si l’on fait l’hypothèse que la fréquence de fumeurs dans la population estudiantine P est
supérieure à la fréquence de fumeurs dans la population P0, on pose alors :
H0 : P=P0 et H1 : P> P0 .
5) Tests permettant de déterminer si un échantillon appartient à une population

donnée
a) Test sur une moyenne : comparaison d’une moyenne expérimentale à une moyenne
théorique
Nous voulons déterminer si l’échantillon de taille n dont nous disposons appartient à
une population de moyenne m0 au seuil de signification α. Nous allons procéder en
quatre étapes.
1ère étape : formulation des hypothèses.
L’échantillon dont nous disposons provient d’une population de moyenne m. Nous
voulons savoir si m=m0 .
H : m = m0
On va donc tester H0 contre H1 : { 0
H1 : m ≠ m0
2 étape : détermination de la fonction discriminante du test et de sa distribution de
ème
probabilité.
 On détermine la statistique qui convient pour ce test. Ici l’estimateur de la
moyenne m c’est-à-dire X ̅ semble indiquée.
 On détermine la loi de probabilité de X ̅ en se plaçant sous l’hypothèse H0 .
Deux cas peuvent se produire :
1er cas : l’échantillon est de grande taille ou bien la population est normale de
variance σ2pop connue.
̅ suit la loi normale de moyenne m0 et d’écart-type σpop ; X
X ̅ ~ N (m0 , σpop ).
√n √n
̅ −m0
X
On pose T= σpop ; T est appelée fonction discriminante et suit la loi T ~ N (0,1).
⁄
√n
2ème cas : l’échantillon est de petite taille (n <30), prélevé au hasard d’une
population normale de variance inconnue.
̅ −m0
X ̅ −u0
X
Dans ce cas, la fonction discriminante sera : S = .
⁄ ̂
√n−1 √σ²
n
16
Ici T ~ Tn−1 (Loi de Student à (n-1) degrés de liberté).
n
En fait la variance inconnue est estimée par : σ
̂² = n−1 S².
3ème étape : détermination des valeurs critiques de T délimitant les zones d’acceptation
et de rejet.
On impose toujours à la zone d’acceptation de H0 concernant l’écart réduit, d’être centré
autour de 0. Il nous faut déterminer dans la table la valeur maximale t α⁄2 de l’écart
réduit imputable aux variations d’échantillonnage au seuil de signification α c’est-à-dire
vérifiant P(−t α⁄2 < T < t α⁄2 )=1−𝛼.
4ème étape : calcul de la valeur de T prise dans l’échantillon et conclusion du test.
On calcule la valeur t 0 prise par T dans l’échantillon.
 Si la valeur t 0 se trouve dans la zone de rejet, on dira que l’écart réduit observé
est statistiquement significatif au seuil α. Cet écart est anormalement élevé et ne
permet pas d’accepter H0 . On rejette H0 .
 Si la valeur t 0 se trouve dans la zone d’acceptation, on dira que l’écart-réduit
observé n’est pas significatif au seuil α. Cet écart est imputable aux fluctuations
d’échantillonnage. On accepte H0 .
b) Test sur une proportion

Nous nous proposons de tester si la proportion P d’éléments dans la population
présentant un certain caractère qualificatif peut être ou non considérée comme égale à
une valeur hypothétique P0. Nous disposons pour ce faire de la proportion d’éléments
possédant ce caractère dans un échantillon de taille n. Nous allons procéder comme
avec la partie a) en quatre étapes :
1ère étape :
L’échantillon dont nous disposons provient d’une population dont la proportion
d’éléments présentant le caractère qualitatif est P. Nous voulons savoir si P=P0.
H : P = P0
On va donc tester l’hypothèse H0 contre l’hypothèse H1 : { 0 .
H1 : P ≠ P0
2ème étape :
 On détermine la statistique qui convient pour ce test. Ici, l’estimateur de la
proportion P, c’est-à-dire F(fréquence), semble tout indiqué.
 On détermine la loi de probabilité de F en se plaçant sous l’hypothèse H0 .
On suppose que l’on dispose d’un grand échantillon (n≥30) et que « P » n’est pas trop
petit (de telle sorte qu’on ait nP≥15 et n(1−P)≥15.
P0 (1−P0 )
F suit alors la loi normale de moyenne P0 et d’écart-type √ .
n
F−P0
On pose T= ; T mesure l’écart réduit.
P (1−P0 )
√ 0
n
T est appelé fonction discriminante du test. T ~ N (0,1).
3ème étape :
On impose toujours à la zone d’acceptation de H0 concernant l’écart réduit, d’être
centrée autour de 0. Il nous faut donc déterminer dans la table, la valeur maximale t α⁄2
17
de l’écart réduit imputable aux variations d’échantillonnage au seuil de signification α,
c’est-à-dire P(−t α⁄2 < T < t α⁄2 )=1−𝛼.
4ème étape :
On calcule t 0 prise par T dans l’échantillon.
 Si t 0 se trouve dans la zone de rejet, on rejette H0 .
 Si t 0 se trouve dans la zone d’acceptation, on accepte H0 .
6) Risque de 1ère espèce - risque de 2ème espèce

Toutes les règles de décision que nous avons déterminées acceptaient un risque α qui
était le risque de rejeter à tort H0 . Donc α=P (rejeter H0 /H0 vraie) ; α est aussi appelé
risque de 1ère espèce.
La règle de décision comporte également un 2ème risque, à savoir celui de ne pas rejeter
H0 alors que H1 est vraie. β =P (ne pas rejeter H0 /H1 vraie) ; β est aussi appelé risque
de 2ème espèce.
La probabilité complémentaire du risque de 2ème espèce 1−β définit la puissance du test
à l’égard du paramètre dans H1 . 1−β=P (rejeter H0 /H1 vraie).
7) Test du Khi²
Le test du khi² (khi deux ou khi carré) fournit une méthode pour déterminer la nature
d’une répartition, qui peut être continue ou discrète.
Domaine d’application du test :
 Données qualitatives
 2 ou plusieurs échantillons
 Dépendants et indépendants
 Comparaison d’échantillons
 Recherche de liaison entre données
 Recherche de l’influence d’une donnée autre que celle étudiée.
Démarche à suivre :
 Formuler H0 (la distribution observée n’est pas différente de la distribution
supposée d’après la loi qu’on souhaite tester)
 Répartir les données en classes
 Déterminer le nombre de degré de liberté à partir du nombre de classes
 Fixer un risque de se tromper (la valeur 5% est souvent choisie)
 Calculer algébriquement la distance entre les ensembles d’informations à
comparer
 Déterminer khi² théorique (déduire la distance critique à l’aide de la table khi²)
 Conclure si cette distance est supérieure à la distance critique (on conclut que le
résultat n’est pas dû seulement aux fluctuations d’échantillonnage).
a) Test d’ajustement
Objectif : les observations faites sur les échantillons conduisent à une certaine
distribution de fréquence. Peut-on modéliser cette distribution par un modèle théorique
connu ?
18
Méthode : la méthode consiste à composer l’histogramme des fréquences et la
distribution de la loi de probabilité servant de modèle théorique.
Après avoir découpé l’intervalle d’observation en k classes, on construit un indice d
mesurant l’écart constaté entre les effectifs réels et les effectifs théoriques.
(ni −nPi )²
d=∑ki=1 où ni est l’effectif observé dans la classe i ;
nPi
n : effectif total ;
Pi : probabilité d’obtenir une observation de la loi de probabilité dans la classe i ;
nPi : effectif théorique dans la classe.
Hypothèses :
H0 (la distribution observée n’est pas significativement différente de la distribution
théorique) contre H1 (la distribution observée est significativement différente de la
distribution théorique).
(Ni −nPi )²
Statistique du test : D=∑ki=1 .
nPi
Remarques :
Le choix et le nombre de classes est arbitraire. Cependant pour que l’approximation par
la loi du χ² soit bonne, il est nécessaire que les effectifs théoriques dans chacune des
classes soit au moins égal à 5. Si ce n’est pas le cas, il faut au préalable regrouper les
classes contiguës afin d’avoir un effectif suffisant. La valeur de k intervenant dans le
nombre de degrés de liberté de la loi de χ² est celle obtenue après les éventuels
regroupement.
b) Test d’indépendance
Lorsqu’on considère plusieurs populations auxquelles on associe le même ensemble de
critères qualitatifs, l’hypothèse à tester est l’indépendance entre la population
d’appartenance de l’individu et la valeur des critères.
But du test : le test d’indépendance du khi² vise à déterminer si deux variables observées
sur un échantillon sont indépendants ou non.
Les variables étudiées sont des variables quantitatives catégorielles. Ce test s’applique
lorsque l’on souhaite démontrer l’indépendance ou la dépendance de deux critères dans
une expérience.
Ce test s’effectue sur la base d’une table de contingence : plusieurs échantillons pouvant
être classés selon un certain nombre de colonnes (critère 1) et de lignes (critère 2).
Objectif : les observations des deux variables qualitatives faites sur un échantillon
permettent de juger l’indépendance de ces variables.
Méthode : la méthode consiste à comparer les effectifs réels des croisements des
modalités des deux variables qualitatives avec les effectifs théoriques qu’on devrait
obtenir dans le cas d’indépendance de ces deux variables.
On construit un indice d mesurant l’écart constaté entre les effectifs réels et les effectifs
théoriques.
19
(nij −nPij )²
d=∑ij ; nij : effectif des individus possédant la modalité i de la première
nPij
variable et la modalité j de la deuxième variable ;
n : effectif total observé ;
Pij : probabilité d’obtenir une observation possédant la modalité i de la première
variable et la modalité j de la deuxième variable lorsqu’elles sont indépendantes.
nPij : effectif théorique des individus possédant la modalité i de la première variable et la
modalité j de la deuxième variable.
(Nij −nPij )²
D=∑ki,j
nPij
Statistique du test :
on utilise la statistique D ~ χ2(l−1)(c−1) où l est le nombre de modalités de la première
variable (nombre de lignes du tableau de contingence) et c, le nombre de modalités de
la deuxième variable (nombre de colonnes du tableau de contingence).
Remarque :
(∑j nij )(∑i nij ) ni nj
nPij = = où ni est l’effectif des individus possédant la modalité i de la
n n
première variable et nj l’effectif des individus possédant la modalité j de la deuxième
variable.
Exemple : la distribution du revenu des hommes est-elle différente de celle des femmes ?
Une représentation sur une table de contingence des occurrences des variables permet
d’illustrer la question.
Salaires 1000-2000 2000-3000 3000-4000 4000-5000 Total
Hommes 50 70 110 60 290
Femmes 60 75 100 50 285
Total 110 145 210 110 575
On remarque que les femmes sont plus nombreuses dans les classes à bas salaires et
moins nombreuses dans celles à haut salaire que les hommes. Cette différences (c’est-à-
dire) cette dépendance entre les variables) est-elle statistiquement significative ?
Le test χ² aide à répondre à cette question :
l −1=4−1=3 ; c−1=2−1=1 donc ddl =3×1=3. Pour α=5%, la valeur critique (X²
théorique) trouvée dans les tabes de χ² est 7,81.
Hypothèse : on suppose qu’il n’y a pas de différence entre les salaires des hommes et des
femmes.
Tableau des fréquences théoriques

Hypothèse 1000-2000 2000-3000 3000-4000 4000-5000 Total
Hommes 55,5 73,5 115,9 55,5 290,0
Femmes 54,5 71,9 104,1 54,5 285,0
Total 110,0 145,0 210,0 110,0 575,0
20
Le calcul du χ²
X² 1000-2000 2000-3000 3000-4000 4000-5000 Total
Hommes 0,54 0,13 0,16 0,37 1,20
Femmes 0,55 0,13 0,16 0,38 1,23
Total 1,09 0,26 0,32 0,75 2,42
La distance calculée 2,43 étant inférieure à la distance critique (7,81), il n’y a pas lieu de
mettre en cause l’égalité des salaires, avec un risque de se tromper égal à 5%.
Remarque : il existe également des tests d’homogénéité qui déterminent si deux

échantillons appartiennent à la population (comparaison de deux moyennes
d’échantillon « test T » et comparaison de deux variances d’échantillon « test F »).
III – Analyse de la variance (ANOVA)

L’analyse de la variance a pour objectif d’étudier l’influence d’un ou plusieurs facteurs
sur une variable quantitative. Nous nous placerons ici dans le cas où dans les niveaux ou
modalités, des facteurs sont fixés par l’expérimentateur. On parle de modèle fixe.
L’ANOVA se résume en une comparaison multiple de moyenne de différents échantillons
constitués par les différentes modalités des facteurs.
L’analyse de la variance peut être considérée comme une généralisation du test de
Student.
1) Principe de l’analyse de variance

 La dispersion totale σ2T a 2 composantes :
- Fluctuations individuelles : σ² qui est la variance interne à chaque groupe ou
échantillon (variance intra groupe)
- Fluctuations entre les groupes : variation entre les moyennes ui qui
correspond à la variabilité entre les groupes (variance inter groupe).
 Si la variabilité inter groupe > la variabilité intra groupe => 2 moyennes au
moins sont différentes.
 Principe général :
- Décomposer σ2T en ses 2 parties
- Tester si σ2T est différent de σ².
 Hypothèses :
- Echantillons (groupes) indépendants
- Distribution normale du critère au sein des groupes
- Variances identiques d’un groupe à un autre
 L’ANOVA est un test robuste (résultats assez peu affectés par des légers écarts à
ces hypothèses).
H0 : u1 =u2 =……=uk (k groupes)
H1 : au moins l’une des moyennes diffère des autres.
Posons :
X : variable à laquelle on s’intéresse ;
k : nombre de groupes ;
nj : taille du groupe j ;
21
Xij : i-ème observation du groupe j.
 Mesure de la dispersion totale : SCET
̅)²
Somme des carrés des écarts à la moyenne générale : ∑( Xi − X
 Mesure de la dispersion intra groupe : SCER
̅ j )²
Somme des carrés des écarts à la moyenne d’un groupe : ∑( Xij − X
 Mesure de la dispersion inter groupe : SCEA
Somme des carrés des écarts de la moyenne d’un groupe à la moyenne générale :
̅) ².
∑ nj ( X j − X
On a : SCET = SCER + SCEA
2) ANOVA : méthode de calculs

Estimation de la variance inter groupe :
 Elle ne dépend que de la dispersion des moyennes des groupes comparés.
 SCEA a k−1 degré de liberté.
 Sa variance σ2A est estimé par :
SCEA ̅ j −X
nj (X ̅)
SA2 = = ∑kj=1
k−1 k−1
T2j T2G
 Pour les calculs, on montre que SCEA s’écrit : SCEA =∑j −
nj n
- Tj =total des valeurs de X du groupe
- TG =total général (somme globale des valeurs de X).
-
Estimation de SCER :
 Elle ne dépend que de la dispersion des valeurs Xij au sein de chaque groupe.
 SCER a n−k degrés de liberté.
 Sa variance SCER est estimée par :
nj
SCE ∑k ̅
j=1 ∑i=1(Xij −Xj )²
SR2 = R =
n−k n−k
 On montre que SCER s’écrit :

T2
SCER =∑ij Xij2 − ∑j nj ; Tj = total des valeurs de x du groupe
j
 Après avoir décomposé la variance totale, le principe consiste à comparer SA2 /SR2 :
- Tester si SA2 /SR2 est proche de 1

- Statistique du test distribué selon une loi dite de Fisher à v1 =k−1 et
v2 =n−k degrés de liberté.
 Test unilatéral dans tous les cas
 Si H0 vraie : SA2 = SR2 et donc F0=1.
 Si H1 vraie : SA2 > SR2 et donc F0 > 1.
22
3) Exécution du test
H0 : σ2A = σ2R ; H1 : σ2A > σ2R
S2A
 Calculer F0 = à partir des observation sur l’échantillon.
S2R
k−1
 Comparer F0 à la valeur seuil Fn−1 :
k−1
F0 ≥ Fn−1 (α) : rejet de H0 d’indépendance (au risque α).
k−1
F0 < Fn−1 (α) : non rejet de H0 .
23
2ème PARTIE : RECHERCHE OPERATIONNELLE
CHAPITRE I : PROGRAMMATION LINEAIRE : SOLUTION GRAPHIQUE
I - Définition
La modélisation recouvre un ensemble de techniques d’optimisation sous contraintes
qui permet de déterminer dans quelles conditions on peut rendre maximum ou
minimum une fonction objectif Z (Xj ) de n variables Xj liées par m relations en
contraintes : Hi (Xj ) ≤ 0.
II - Forme canonique d’un programme linéaire

Elle se caractérise par des contraintes présentées sous forme d’inéquations telles que :
x1 ≥ 0, x2 ≥ 0, … . , xn ≥ 0
{ a11 x1 + a12 x2 + a1n xn ≤ ou ≥ ou = b1
am1 x1 + am2 x2 + amn xn ≤ ou ≥ ou = bm
Avec (aij )1≤ i ≤m et (bi )1 ≤ i ≤n sont des réels et par une forme linéaire,
1≤ j ≤n
Z (x1 , x2 ,…., xn ) = C1 x1 +C2 x2 +…..+Cn xn appelé fonction objectif.

- On appelle solution réalisable, tout n-uplet (x1 , x2 ,…., xn ) vérifiant le système
d’inéquations précédent.
- On appelle solution optimale, toute solution réalisable qui vérifie Z.
- L’ensemble des domaines réalisables du programme linéaire P est appelé
domaine de solutions réalisables. Lorsque ce domaine est non vide, on dit que P
est réalisable.
III - Méthode graphique : problème à 2 inconnues

1) Régionnenement du plan
Le régionnement du plan revient à étudier le signe de ax+by+c avec (a, b)≠0.
Si on considère la droite D dont une équation est ax+by+c=0 avec a≠0 ou b≠0, cette
droite partage le plan en deux demi plans de frontière D.
- Pour tout point M (x, y) situé sur D, on a ax+by+c=0
- Pour tout point M (x, y) situé dans un des demi plans, on a ax+by+c ≥ 0 ou
ax+by+c ≤ 0.
2) Résolution graphique du problème

 (1) On représente tous les demis plans vérifiant les contraintes. L’intersection de
ces demis plans forme un polyèdre convexe qui est l’ensemble des solutions
réalisables. Une solution est réalisable si les valeurs satisfont à l’ensemble des
contraintes. Les sommets du polyèdre convexe sont appelés des points extrêmes.
24
 (2) Il s’agit maintenant de déterminer parmi tous les points celui ou ceux qui
correspondent à la plus grande valeur possible de la fonction objectif C1 x1 +C2 x2 .
 (3) Considérons la droite d’équation C1 x1 +C2 x2 =k où k est une constante.
Tous les points situés sur cette droite donne à l’expression C1 x1 +C2 x2 la même valeur de
k. Ils sont donc équivalents du point de vue profit. Si on déplace cette droite vers la
droite, k augmente et cette droite passe par un point extrême K qui maximise k. Les
coordonnées de ce point définissent donc la solution du problème appelée solution
optimale.
Une solution optimale est donc une solution réalisable qui donne à la fonction objectif la
plus grande valeur possible (ou la plus petite) sur l’ensemble des solutions réalisables.
Exemple :
L’entreprise « STAT » spécialisée dans la fabrication de matériels informatiques,
propose à son catalogue d’ordinateurs des centaines de références. Pour simplifier, on
ne s’intéresse qu’à deux types d’ordinateurs, le IM4 et le IM5.
Chacun d’eux comporte un processeur – le même- mais les deux modèles diffèrent en
particulier par le nombre de barrettes mémoires. Plus précisément, le IM4 comporte 2
barrettes alors que le IM5 en comporte 6.
Le marché pour ces composants est tel qu’on ne peut espérer acheter auprès des
fournisseurs habituels plus de 10000 processeurs pour le trimestre à venir et à plus de
48000 barrettes, une autre limitation risque d’intervenir sur la production.
L’assemblage est caractérisé en particulier par une opération délicate qui pour IM4 est
de 3 minutes alors qu’elle n’est que d’une minute pour IM5. On ne dispose à priori pour
l’assemblage de ces deux types de machines que de 24000 minutes pour le trimestre à
venir.
Enfin, compte tenu des conditions actuelles du marché, on peut espérer tirer un profit de
400 $ sur l’IM4 et de 800 $ sur l’IM5.
Le problème est de déterminer les quantités de chacun des deux types d’ordinateurs à
fabriquer de manière à obtenir le plus grand profit.
Modélisation du problème
Les quantités fabriquées peuvent être représentées par deux variables x1 pour l’IM4 et
x2 pour l’IM5.
L’ensemble des décisions possibles est représenté par l’ensemble des x1 et x2 vérifiant :
x1 + x2 ≤ 10000
2x1 + 6x2 ≤ 48000
3x1 + x2 ≤ 24000
x1 ≥ 0 , x2 ≥ 0.
On souhaite maximiser le profit représenté par 400x1 + 800x2 .
Le problème initial est donc modélisé par le problème de programmation mathématique
suivant :
25
max(400x1 + 800x2 )
x1 + x2 ≤ 10000
2x1 + 6x2 ≤ 48000
3x1 + x2 ≤ 24000
{ x1 ≥ 0 , x2 ≥ 0
A chaque couple de variables (x1 , x2 ) on associe un point du plan dont les coordonnées
correspondent aux valeurs des variables.
Les variables étant positives, ces ponts sont situés dans le quart de plan nord-est.
Chaque contrainte permet de délimiter une partie du plan.
Par exemple, la droite x1 + x2 =10000 définit deux demis plans. Au-dessus de cette
droite, les coordonnées des points du plan vérifient x1 + x2 >10000. On est donc
conduit à exclure ces points.
On fait de même pour les deux autres contraintes.
On considère la droite d’équation 400x1 + 800x2 =k où k est la constante. Si on déplace

cette droite vers la droite, la valeur limite pour k est obtenue pour la droite passant par
le point B.
26
La solution optimale du problème est : x1 = 3000 , x2 = 7000.
La valeur maximale de la fonction objectif est 6800000. Pour l’entreprise, ceci signifie
que la répartition optimale entre les deux types d’ordinateurs est de 3000 ordinateurs
de type IM4 et 7000 ordinateurs de type IM5 avec un profit maximal de 6800000.
27
CHAPITRE II : PROGRAMMATION LINEAIRE : METHODE SIMPLEXE
Introduction
L’algorithme du simplexe fut proposé en 1947 par G. B. Dantzig comme méthode de
résolution générale des programmes. La solution optimale est approchée par itérations
successives. Chaque étape correspond au calcul de la valeur objectif d’une solution.
Comme il existe une infinité de solutions réalisables, la méthode propose de n’explorer
qu’un nombre limité de solutions parmi lesquelles se trouve à coup sûr la solution
optimale.
La méthode du simplexe
L’algorithme du simplexe consiste à :
 (1) Déterminer une solution de base,
 (2) Faire subir un test d’optimalité à cette solution de base pour déterminer s’il
s’agit ou non de la solution optimale :
- S’il s’agit de la solution optimale, le problème est terminé,
- S’il ne s’agit pas de la solution optimale, on passe à l’étape (3).
 (3) Afin de réaliser les opérations successives de l’algorithme simplexe, il
convient de mettre le programme sous une forme standard.
I - Forme standard
Soit un PL(programme linéaire) à n variables, on remplace chaque inégalité
a1 x1 +a2 x2 +….+an xn ≤ b1 par l’égalité a1 x1 +a2 x2 +….+an xn +e1 =b1 avec e1 ≥ 0 et
l’inégalité a1 x1 +a2 x2 +….+an xn ≥ b1 par a1 x1 +a2 x2 +….+an xn − e1=b1 avec e1 ≥ 0.
La forme du PL obtenu est le programme linéaire standard et e1 est la variable d’écart.
x1 ≥ 0, x2 ≥ 0, x3 ≥ 0
x1 + 2x2 ≤ 1
Exemple : on se donne le PL {
x1 − 2x3 ≤ 5
x1 + x2 −x3 ≤ 2
x1 ≥ 0, x2 ≥ 0, x3 ≥ 0, e1 ≥ 0, e2 ≥ 0, e3 ≥ 0
x1 + 2x2 + e1 = 1
La forme standard de ce PL est : x1 − 2x3 + e2 = 5
x1 + x2 −x3 + e3 = 2
{ Z(x1 , x2 , x3 ) = 2x1 + x2 + x3 à optimiser
II - Algorithme du simplexe
Exemple : un ébéniste fabrique des bureaux sous forme standard ou luxe. Des études de
marché ont montré que pour l’année à venir, les possibilités de ventes s’élèvent à 300
unités pour le modèle luxe et à 400 unités pour le modèle standard. L’approvisionnement
en bois est suffisant pour fabriquer annuellement 500 bureaux quel que soit le type. Par
ailleurs, le temps de fabrication d’un modèle luxe est le double de celui d’un bureau de
modèle standard.
La capacité annuelle de fabrication est telle que si tous les bureaux fabriqués étaient du
type standard, on pourrait en fabriquer 700 au maximum. La vente d’un bureau sous
modèle luxe conduit à une marge unitaire sur coût variable égale à 7 ; celle d’un bureau
28
de type standard, une marge égale à 5. On se propose de rechercher le programme annuel
de fabrication conduisant au profit global.
 Mise en équation :
Soient x1 le nombre de bureaux de type luxe et x2 le nombre de bureaux de type standard.
x1 ≥ 0, x2 ≥ 0
x1 ≤ 300
x2 ≤ 400
Le programme linéaire est :
x1 + x2 ≤ 500
2x1 + x2 ≤ 700
{Z(x1 + x2 ) = 7x1 + 5x2 à maximiser
 Forme standard :
On introduit les variables d’écart x3 , x4 , x5 , x6 .
x1 + x3 = 300
x2 + x4 = 400
x1 + x2 + x5 = 500
2x1 + x2 + x6 = 700
{Z(x1 , x2 ) = 7x1 + 5x2 à maximiser
 Variable hors base, variable dans la base
Une solution de base est avant tout une solution réalisable qui satisfait à l’ensemble des
contraintes et conditions de signe. Il y a deux catégories de variable de base :
- Des variables ayant une valeur prédéterminée nulle (ce sont des variables hors
base)
- Des variables ayant une valeur non nulle (ce sont les variables dans la base).
La solution de base de départ de l’ébéniste consiste à ne rien produire : x1 =x2 =0. Les
variables x1 et x2 qui sont nulles sont hors base. Dans ce cas, x3 =300, x4 =400, x5 =500,
x6 =700.
Les variables x3 , x4 , x5 et x6 non nulles, sont dans la base. La valeur de la fonction objectif
est Z(0,0)=7× 0 −5×0=0.
 1ère itération
La solution de base de départ consiste à ne rien produire, soit x1 =x2 =0. On étudie ensuite
à partir de cette solution, jusqu’à quel niveau on peut porter x1 ou x2 conformément aux
contraintes de façon à accroître au maximum le profit. Il se pose le problème du choix de
x1 et x2 qui va passer de la valeur 0 à une valeur strictement positive. La variable choisie
est la variable entrante.
La sélection ici se portera sur x1 qui par unité rapporte plus, car le coefficient de x1 est le
plus élevé dans la fonction objectif Z(x1 , x2 )=7x1 +5x2 .
On exprime ensuite x3 , x4 , x5 et x6 et Z en fonction de x1 et x2 :
x3 = 300 − x1
x4 = 400 − x2
x5 = 500 − x1 − x2
x6 = 700 − 2x1 − x2
{ Z = 7x1 + 5x2
x2 reste hors base donc nulle ; x1 entre dans la base. On reporte x2 = 0 dans ce système et
on obtient :
29
x3 = 300 − x1
x4 = 400
x5 = 500 − x1
x6 = 700 − 2x1
{ Z = 7x1
On cherche jusqu’à quel niveau il est possible de porter x1 . On a :
x3 ≥ 0, x4 ≥ 0, x5 ≥ 0, x6 ≥ 0 donc x1 ≤ 300, x1 ≤ 500, x1 ≤ 350.
La valeur maximale prise par x1 est 300. On remplace x1 par 300 dans le système et on
obtient : x3 =0, x4 =400, x5 =200, x6 =100 et Z(300,0)=2100.
x3 est nulle ; elle sort de la base et est appelée variable sortante. Les variables x1 et x3 sont
permutées.
On exprime le programme standard en fonction des nouvelles variables hors base x2 , x3 .
Le programme standard donne :
x1 = 300 − x3 x1 + x2 = 300
x4 = 400 − x2 x2 + x4 = 400
x5 = 500 − (300 − x3 ) − x2 <=> x2 − x3 + x5 = 400
x6 = 700 − 2(300 − x3 ) − x2 x2 − 2x3 + x6 = 100
{ Z = 7(300 − x3 ) + 5x2 {Z = 5x2 − 7x3 + 2100
 2ème itération
Z=5x2 − 7x3 +2100
La variable entrante est x2 car 5 est le coefficient positif (l’autre est négatif).
x3 reste hors base donc nulle. En remplaçant x3 par 0 dans le système précédent, on
obtient : x1 =300, x4 =400−x2 ≥ 0, x5 =200−x2 ≥ 0 et x6 =100−x2 ≥ 0 ; donc x2 ≤400,
x2 ≤200 et x2 ≤100.
La valeur maximale prise par x2 est 100. Dans ce cas, x1 =300, x4 =300, x5 =100 et x6 =0.
La variable sortante est x6 , les valeurs hors base sont donc x3 et x6 .
Pour x1 =300 et x2 =100, on a Z=2600. x2 et x6 sont donc permutés.
On exprime les variables dans la base en fonction des nouvelles variables hors base x3 et
x6 . On obtient :
x1 = 300 − x3
x1 + x3 = 300
x2 = 700 − 2(300 − x3 ) − x6
x2 + x4 = 400
{ <=> x4 = 400 − (100 + 2x3 − x6 )
x1 + x2 + x5 = 500
x5 = 500 − (300 − x3 ) − (100 + 2x3 − x6 )
Z = 7x1 + 5x2
{ Z = 7(300 − x3 ) + 5(100 + 2x3 − x6 )
On obtient finalement :
x1 + x3 = 300
x2 − 2x3 + x6 = 100
2x3 + x4 − x6 = 300
x3 + x5 − x6 = 100
{Z = 2600 + 3x3 − 5x6
 3ème itération
Z=3x3 − 5x6 + 2600
x3 sera la variable entrante car toute augmentation entraine une diminution de la fonction
objectif Z. On exprime les variables dans la base en fonction des variables hors base x3 et
x6 .
30
x1 = 300 − x3
x2 = 100 + 2x3 − x6
{
x4 = 300 − 2x3 + x6
x5 = 100 − x3 + x6
x6 reste hors base donc nulle ; on remplace x6 par 0. On obtient x1 =300−x3 ≥ 0,
x2 =100+2x3 ≥ 0, x4 − 2x3 ≥ 0 et x5 =100−x3 ≥ 0. Les contraintes de positivité donnent
x3 ≤ 300, x3 ≥ −50, x3 ≤ 150 et x3 ≤ 100. On obtient x1 =200, x2 =300, x4 =100 et x5 =0.
La variable qui sort est x3 . Cette itération conduit à x1 =200 et x2 =300. La valeur de la
fonction économique est Z=2900.
Les variables x3 et x5 permutent. On exprime les variables dans la base en fonction des
variables hors base x5 et x6 .
x3 = 100 − x5 + x6 x3 + x5 − x6 = 100
x1 = 300 − (100 − x5 + x6 ) = 200 + x5 − x6 x1 − x5 + x6 = 200
x2 = 100 + 2(100 − x5 + x6 ) = 300 − 2x5 + x6 <=> x2 + 2x5 − x6 = 300
x4 = 300 − 2(100 − x5 + x6 ) = 100 + 2x5 − x6 x4 + 2x5 + x6 = 100
{Z = 2600 + 3(100 − x5 + x6 ) = 2900 − 3x5 − 2x6 {Z = 2900 − 3x5 − 2x6
Conclusion : Z=2900−3x5 − 2x6 .

x5 et x6 sont hors base donc nulles. Toute augmentation de x5 ou x6 entraine une
diminution de Z. Il n’est plus possible d’améliorer la fonction objectif ; la solution
(x1 =200, x2 =300) est la solution optimale.
On interprète les résultats de la manière suivante :
 x1 =200 bureaux de modèle luxe.
 x2 =300 bureaux de modèle standard.
 x3 =100 ; il reste une possibilité de fabriquer 100 bureaux de modèle luxe.
 x4 =100 ; il reste une possibilité de fabriquer 100 bureaux de modèle standard.
 x5 =0 ; tout le bois disponible est utilisé.
 x6 =0 ; tout le temps a été utilisé.
Z est maximum pour x1 =200, x2 =300 et vaut 2900.
Afin de systématiser et de simplifier les calculs, ceux-ci peuvent être présentés sous forme
de tableaux correspondant à une solution de base et une itération représente une
modification du tableau.
1er tableau :
x1 x2 x3 x4 x5 x6 Cste C
x3 1 0 1 0 0 0 300 300
x4 0 1 0 1 0 0 400 00
x5 1 1 0 0 1 0 500 500
x6 2 1 0 0 0 1 700 350
Z 7 5 0 0 0 0 0
C’est la colonne obtenue en divisant les coefficients constants par la colonne des
coefficients de la variable qui entre dans la base x1 .
On sélectionne dans cette colonne le plus petit entier strictement positif (300). La
variable x3 sort de la base. Les deux variables x1 et x3 sont permutées. Le pivot est situé
à l’intersection de la colonne de x1 et de la ligne de x3 (x3 variable sortante).
31
2ème tableau :
Impérativement dans la colonne des variables dans la base, on remplace x3 qui sort par
x1 qui rentre. Ensuite on recopie la ligne du pivot LP :
LP 1 0 1 0 0 0 300
On doit exprimer le programme en fonction des nouvelles variables hors base x2 et x3 .

 Pour la ligne Lx4 , on recopie car x4 est déjà en fonction de x2 et x4 .
 Par combinaison linéaire des autres lignes et de la ligne pivot LP , on élimine la
variable x1 qui est entrante.
Exemple :
- la nouvelle linge Lx5 s’obtient en effectuant Lx5 − LP .
- La nouvelle ligne Lx6 s’obtient en effectuant l’opération Lx6 − 2LP .
- La nouvelle ligne LZ s’obtient en effectuant LZ − 7LP .
On obtient le second tableau suivant :
x1 1 0 1 0 0 0 300 300
= −∞
0
400
x4 0 1 0 1 0 0 400 = 400
1
x5 0 1 −1 0 1 0 200 200
= 200
1
x6 0 1 −2 0 0 1 100 100
= 100
1
Z 0 5 −7 0 0 0 −2100
Z s’écrit Z=5x2 − 7x3 +2100.

Dans la colonne C, le coefficient strictement positif le plus petit est 100. x6 sort donc de
la base. Les variables x2 et x6 sont permutées. Le pivot est situé à l’intersection de la
ligne Lx6 et de la colonne x2 . Le pivot est 1.
On remplace la variable x6 qui sort de la base par la variable x2 qui rentre en base. On
recopie la ligne pivot avec le pivot 1.
On élimine ensuite la variable x2 qui est entrée en base.
Pour la nouvelle ligne Lx4 , on effectue Lx4 − LP .
Pour la nouvelle ligne LZ , on effectue LZ − 5LP .
Le 3ème tableau devient :
x1 1 0 1 0 0 0 300 300
x4 0 0 2 1 0 −1 30 150
x5 0 0 1 0 1 −1 100 100
x6 0 1 −2 0 0 1 100 −50
Z 0 0 3 0 0 −5 −2600
On obtient Z=3x3 − 5x6 +2600.

La variable entrante devient x3 car le coefficient de x6 est négatif.
32
Pour obtenir C, les coefficients de la colonne Cste sont divisés par ceux de la valeur
entrante x3 . Dans cette colonne, le coefficient strictement positif est 100. Les variables
x3 et x5 permutent. Le pivot est 1. Dans ce tableau, on remplace x5 qui sort par x3 qui
rentre. La ligne pivot est LP : x3 +x5 − x6 =100. On exprime le système en fonction de x5
et x6 , c’est-à-dire qu’on élimine x3 qui est entrée en base.
Pour la nouvelle ligne Lx4 , on effectue Lx4 − 2LP .
Pour la nouvelle ligne LZ , on effectue LZ − 3LP .
On obtient le 4ème tableau suivant :
x1 x2 x3 x4 x5 x6 Cste
x1 1 0 0 0 −1 1 200
x4 0 0 0 1 −2 1 100
x5 0 0 1 0 1 −1 100
x2 0 1 0 0 2 −1 300
Z 0 0 0 0 −2 −2 −2900
Conclusion : la fonction objectif s’écrit : Z=3x5 − 2x6 +2900. On s’arrête puisque les
coefficients de x5 et x6 sont négatifs.
Donc x1 =200, x2 =300, x3 =100, x4 =100 et Z=2900. La fonction objectif atteint son
maximum pour x1 =100 et x2 =300 vaut 2900.
NB : toutes les explications entre les tableaux ne sont pas obligatoires. Elles visent
seulement à montrer clairement leur remplissage. Vous pourrez donc directement
dresser les quatre tableaux afin de résoudre le problème.
III - Analyse post-optimale de la fonction objectif

On veut étudier la sensibilité des coefficients de Z sur la solution optimale (x*) d’un PL
sous forme standard c’est-à-dire Ax=b, x≥0.
A est une matrice de taille m×n (m contraintes et n inconnues).
x ∈ IRn , x ≥ 0 <=> x1 ≥ 0 ….. xn ≥ 0.
On suppose qu’on a obtenu une base b* avec la décomposition.
A = (AB∗ /AH∗) où AB∗ est une matrice carrée et m×n inversible.
Le système AB∗ z = b admet une et une seule solution z ∈ IRm .
AH∗ matrice m(n−m).
x
La solution de base est x=(x B )
H
 xB variable de base ∈ IRm .
 xH variable de base ∈ IRn−m
Les systèmes Ax=b admettent en général une infinité de solutions (n ≥ m).
Solution de base réalisable :

x
x=(x B∗ ) ; Ax=b, x ≥ 0
H∗
x
.
Ax=b <=> (AB∗ /AH∗ ) (x B∗ ) <=> AB∗ xB∗ +AH∗ xH∗ = b
H∗
.
<=> xB∗ = A−1
B∗ (b −AH∗ xH∗ )
33
Car AB∗ est inversible et xH∗ = 0.
On a xB∗ = A−1 −1
B∗ b − AB∗ AH∗ xH∗ ;
On note A−1 ∗ ∗
B∗ AH∗ = AH∗ . La matrice AH∗ est obtenue avec le dernier tableau de la
méthode du simplexe.
Condition d’optimalité :
La condition LTH∗ = CH∗
T
− CBT A∗H∗ ≤ 0 est une condition pour qu’une solution de base
réalisable soit optimale.
x1
Z(x)=C1 x1 +C2 x2 +…..+Cn xn = (C1 ……Cn )( ... )
xn
C
=CT x avec C=(CB∗ ).
H∗
Exemple 1 :
3x1 + 9x2 ≤ 81
4x1 + 5x2 ≤ 55
On a le problème suivant : 2x1 + x2 ≤ 20
x1 ≥ 0, x2 ≥ 0
{Z(x1 , x2 ) = 6x1 + 4x2
15
x∗1
La solution optimale est x*=( ∗ )=( 2 ).
x2 5
On se pose la question suivante : comment se comporte la solution optimale si on
81
modifie un des coefficients dans Z ou un des coefficients du second membre b=(55) ?
20
On regarde la sensibilité des coefficients devant x1 dans Z. On remplace 6 par C1 . La
Ck C1 −C1
droite a une équation de la forme x2 = − x → λ1 =
4 4 1 4
x2 = 20 − 2x1 → λ2 = −2
55 4 −4
x2 = − x1 → λ3 = 5
5 5
λ1 , λ2 et λ3 représentent le coefficient directeur des différentes droites.
16
Si λ2 ≤ λ1 ≤ λ3 alors x* reste la solution ; donc pour ≤ C1 ≤ 8, la solution x* est
5
optimale.
La méthode qu’on vient d’utiliser se base sur la méthode graphique.
Utilisons maintenant la méthode énoncée en début du 3) pour trouver un critère
algébrique de la sensibilité.
Si on utilise la méthode du simplexe pour résoudre le problème, le dernier tableau nous
permet d’écrire :
1 2
x 2 = 5 − e2 + e3 ;
3 3
15 1 5
x1 = + e2 − e3 ;
2 6 6
27 5 7
e1 = + e2 − e3 ;
2 2 2
34
27 1 7
Z= − e2 − e3 où e1 , e2 , e3 sont des variables d’écart.
2 3 3
1 −2
5 3 3
x2 e2 15 −1 5
xB∗ =(x1 ) ; A−1 ∗
B∗ = ( 2 ) ; xH∗ =(e ) et AH∗ =( 6 6 ).
27 3
C1 2
−5 7
2 2
−1
3
Le vecteur coût réduit LH∗ = (−7 ).
2
4
(00)
−1
On a CB∗ =(6) ; C∗ = donc LTH∗ = CH∗
T T ∗
− CB∗ AH∗ = (0, 0) – (4, 6, 0) A∗H∗ = ( 3 ; −7
3
).
0
4 0
On remplace 6 par C1 : CB∗ = (C1) , CH∗ = (0).
0
4 C1 −8 5C1
LTH∗ = T
CH∗ − T ∗
CB∗ AH∗ = −( − ; + );
3 6 3 6
4 C1
− ≥0 C1 ≤ 8
LTH∗ ≤ 0 <=> {−83 6
5C1 <=> {
C1 ≥
15
+ ≥0 6
3 8
16 x
Conclusion : Si ≤ C1 ≤ 8, alors le problème admet comme solution optimale x* (xB∗ );
5 H∗
x1 5
15 0
xB∗ = (xe2 ) = ( 2 ) ; xH∗ = (ee2) = (0).
1 27 1
2
15
La solution optimale x* n’a pas changé mais Z a changé. Z(x*) = C1 x1 + 4x2∗ = C1 +20.
2
Exemple 2 : reprenons l’application du chapitre I sur les ordinateurs IM4 et IM5.

max(400x1 + 800x2 )
x1 + x2 ≤ 10000
2x1 + 6x2 ≤ 48000
3x1 + x2 ≤ 24000
{ x1 ≥ 0, x2 ≥ 0
La modélisation du problème a été faite en supposant que le profit sur l’IM4 était de 400
$. En fait, cette machine est très bien accueillie sur le marché et les coûts de fabrication
sont moins élevés que prévus. On peut donc espérer un profit plus important sur l’IM4.
La question qu’on peut poser est donc : faut-il en produire davantage quitte à diminuer
la fabrication de l’IM5 ?
Le profit P1 sur l’IM5 devient un paramètre du problème et s’écrit maintenant :
max(P1 x1 + 800x2 )
x1 + x2 ≤ 10000 (1)
2x1 + 6x2 ≤ 48000 (2)
3x1 + x2 ≤ 24000 (3)
{ x1 ≥ 0, x2 ≥ 0
Analysons graphiquement le problème.
La droite représentative du profit a pour équation 400x1 + 800x2 = Cste.
La variation du profit sur l’IM4 implique que le coefficient x1 dans cette équation varie et
donc que la pente de la droite représentative du profit varie. Tant que la pente de la
droite est comprise entre celle de (1) et (2), le raisonnement fait lors de la résolution
35
graphique conduit à la conclusion que la solution associée au point B est toujours
1 P1 800
optimale. Ainsi ≤ ≤ 1 soit ≤ P1 ≤ 800.
3 800 3
On a donc mis en évidence un intervalle de variation du coefficient de x1 dans la fonction
objectif sur lequel la solution optimale n’est pas changé.
800
Conclusion : tant que le profit sur l’IM4 reste entre et 800, il faut continuer à
3
produire 3000 unités de l’IM4 et 7000 de l’IM5.
36
CHAPITRE III : PROGRAMMATION LINEAIRE EN NOMBRES ENTIERS
Introduction
Conduisons le programme linéaire suivant : Max Z = Ct x.
Sujet à Ax=b où A est une matrice et x et b des matrices colonnes. On s’intéresse à un
programme linéaire où les variables sont entières, A et b aussi
I – Définition
Un programme linéaire entier est un programme qui fournit toujours une solution
optimale entière.
On peut donc se demander sous quelles conditions un programme linéaire est entier.
A chaque itération quelconque de la méthode du simplexe, xB =B−1 b (xB solution de
base réalisable). Pour que cette solution soit entière, il est nécessaire que xB soit entier.
Comme b est entier, il suffit que B−1 soit une matrice entière (une matrice entière est
une matrice dont tous coefficients sont entiers).
(B∗ )t
Nous savons que B−1 = où B∗ désigne la matrice des cofacteurs. Vu que A est
det B
entière, alors B∗ est entier. Ainsi pour que B−1 soit entière, il suffit que det B ∈ {−1, 1}.
II – Uni modularité d’une matrice

1) Définition 1
Soit B une matrice d’ordre n ; si det B ∈ {0, −1, 1}, alors B est uni modulaire.
0 1 0
2 0
Exemple : | | ; |0 0 −1|
0 1
1 0 1
Si B est uni modulaire, nous sommes assurés que la solution de base réalisable est
entière, mais cela ne nous dit pas que la solution optimale est entière. Par contre si B est
uni modulaire pour toutes les bases réalisables, toute solution réalisable sera entière et
il en sera de même de la solution optimale.
2) Définition 2
Soit A une matrice m×n ; A est totalement uni modulaire si toute sous matrice carrée B
d’ordre k (1 ≤ k≤ min(m, n)) extraite de A est uni modulaire.
3) Théorèmes
 Théorème 1
Soit le programme linéaire entier (PLE) Max Z = Ct x.
Sujet à Ax ≤ b, x entier, x ≥ 0 admet une solution optimale entière qui est aussi solution
optimale la PLE.
Exemple : Soit à résoudre :
Min z = x1 +x2 + 5x3
Sujet à x1 +x2 +x3 =3
−x1 +x2 =5
x1 , x2 , x3 ≥ 0 entiers.
37
1 −1 1
Vu que la matrice | | est totalement uni modulaire, la solution optimale de ce
−1 1 0
problème est celle du programme linéaire obtenu en oubliant les contraintes d’intégrité
du problème à résoudre.
Après application de la méthode du simplexe, on obtient x1 =0, x2 =5, x3 =8 et zmin =45.
 Théorème 2 (conditions suffisantes pour qu’une matrice soit uni modulaire)

Soit A une matrice m×n n’ayant que les coefficients 0, −1 ou 1. A est uni modulaire s’il
existe une partition de ses lignes (resp de ses colonnes) I, J vérifiant I ∪ J égal à
l’ensemble de ses lignes (resp de ses colonnes) et I ∩ J = ∅ telle que :
- Il y a au plus deux éléments non nuls dans chaque colonne de A (resp ligne A).
- S’il y a deux +1 ou deux −1 dans une colonne (resp ligne), alors les deux lignes
(resp colonne) de A qui contiennent ces +1 ou ces −1 ne sont pas dans le même
sous ensemble d’indice.
- S’il y a un +1 ou un −1 dans une colonne (resp ligne) de A, alors les deux lignes
(resp colonnes) de A qui contiennent ce +1 et ce −1 sont dans le même sous
ensemble d’indice soit I ou J.
1 1 0 0 1
Exemple : la matrice | 0 1 1 1 0 | est totalement uni modulaire.
−1 0 0 0 −1
0 0 −1 0 0
On prend comme partition I = {ligne 1, ligne 3} et J = {ligne 2, ligne 4}.
IV – Application : problème d’affectation

Il s’agit par exemple d’affecter des équipages à des vols d’avions, du personnel à des
machines, des fonds monétaires à des agences gouvernementales.
Par exemple, une compagnie aérienne dispose de N employés et de N machines.
Notons les employés E1 , E2 ,….., EN et les machines M1, M2 ,….., MN .
Cependant chaque employé ne peut pas travailler sur toutes les machines, cela
dépendant de sa propre spécialisation.
On représente les possibilités de travail par le tableau ci-dessous :
1 si Ei travaille sur Mj
aij = { ; i, j =1,2….,n
0 Sinon
M1 M2 ……… Mj … … . MN
E1 a11 a12 ……... a1j … … . a1N
E2 …. a21 a22 ……... a2j … … . a2N
Ei ai1 aI2 ……... aij … … . aiN
EN aN1 aN2……... aNj … … . aNN
De plus si l’employé Ei travaille sur la machine MJ , il coûte Cij dollars à la compagnie.

L’objectif de la compagnie est d’affecter chaque employé à une et une seule machine et
réciproquement en minimisant le coût total de cette affectation.
1 si Ei est affecté à Mj
En posant : xij = { ; i, j=1, 2,…..,N.
0 sinon
38
Si aij = 0, on supposera Cij = +∞ ce qui signifie que xij = 0. En pratique, xij est omise
dans le modèle.
∑N
j=1 aij xij = 1 ; i =1, 2, ....,N.
De même, une machine ne peut recevoir sous les hypothèses qu’un employé, c’est-à-dire
∑N
i=1 aij xij = 1 ; j =1, 2, ....,N.
On a donc le programme linéaire suivant :
Min z = ∑N N
i=1 ∑j=1 Cij x ij
Sujet à ∑N j=1 aij xij = 1 ; i =1, 2,....,N
∑Ni=1 aij xij = 1 ; j =1, 2, ....,N.
xij = 0 ou 1, i=1, 2, …..,N ; j=1, 2,…..,N.
A est totalement uni modulaire.
Dans notre exemple, prenons le cas où on veut affecter 3 employés à 3 machines. On
définit donc le problème suivant :
aij M1 M2 M3
E1 1 1 0
E2 0 1 1
E3 1 0 1
Cij M1 M2 M3
E1 6 8 ∞
E2 ∞ 4 5
E3 3 ∞ 4
Nous obtenons après la mise en équation le programme :

Min z = 6x11 + 8x12 + 4x22 + 5x23 + 3x31 + 4x33
x11 + x12 = 1
x22 + x23 = 1
x31 + x33 = 1
x11 + x31 = 1
x12 + x22 = 1
x23 + x33 = 1
{ aij = 0 ou 1
Remarque : nous considérons les variables x12 , x21 et x32 toujours nulles ; autrement le
coût minimal serait infini.
Comme la matrice est uni nodulaire, on peut remplacer la contrainte xij =0 ou 1 par
xij ≥0. En appliquant la méthode du simplexe, on obtient x11 =x22 =x33 =1 ;
x11 =x23 =x31 =0 avec Zmin =14.
39
3ème PARTIE : PROCESSUS STOCHASTIQUES
CHAPITRE I : PROBABILITES : VARIABLES ALEATOIRES
I – Variables aléatoires discrètes

1) Définition
Soit (Ω, F, P) un espace probabilisé ; on appelle variable aléatoire discrète sur (Ω, F, P)
toute application X : Ω → IR vérifiant :
ω → X (ω)
 L’ensemble des images X (Ω)={ X (ω), ω ∈ Ω} est une partie au plus dénombrable
de IR. On peut donc écrire que X (ω)= {x0, x1 ,… xk ,…)
 Pour tout xk ∈ X (Ω), Ak = { ω ∈ Ω, X(ω)= xk } fait partie de la famille F
d’évènements auxquels on peut attribuer une probabilité par P.
De plus on a ∑xk ∈ X (ω) P( Ak )= ∑xk ∈ X (ω) P( x = xk )=1.
Lorsque X (Ω) est infini, les sommes sont des séries convergentes. Et lorsque X (Ω) est
fini les sommes sont ordinaires.
2) Loi de probabilité d’une variable aléatoire discrète

Soit X une variable aléatoire discrète sur (Ω, F, P). On lui associe la fonction d’ensemble
Px définie sur la famille de toutes les parties de IR en posant :
Pk =Px ({xk })=P(Ak )=P(X=xk ) puis pour tout B ∁ IR Px (B)= ∑xk ∈ B P(X=xk )= ∑xk ∈ B Pk .
La fonction Px ainsi définie est une probabilité sur la famille P(IR) de toutes parties de
IR. On l’appelle loi de la variable aléatoire X.
Remarque : deux variables aléatoires peuvent avoir même loi sans être égales.
3) Fonction de répartition
a) Définition
On appelle fonction de répartition de la variable aléatoire X, la fonction Fx définie sur IR
par : ∀ x ∈ IR, Fx =P(X≤x)= ∑xk ∈ X (Ω) P(X=xk ).
xk ≤x
b) Théorème
La fonction de répartition Fx d’une variable aléatoire est croissante, continue à droite et
limitée à gauche en point.
lim Fx (𝑥) = 0 et lim Fx (𝑥) = 1.
𝑥→−∞ 𝑥→+∞
4) Espérance mathématique
a) Définition
Soit X une variable aléatoire discrète vérifiant ∑xk ∈ X (Ω) |xk |P(X=xk )<+∞.
On appelle espérance mathématique de X le réel E(X) défini par :
E(X)=∑xk ∈ X (Ω) xk P(X = xk ).
E(X) est donc le barycentre des valeurs possibles de X pondérées par leurs probabilités
de réalisation.
b) Propositions
(P1 ) Pour toutes les variables aléatoires X et Y ayant pour espérances mathématiques
respectives E(X) et E(Y) on a :
40
E(X+Y) =E(X) + E(Y)
E(aX) = aE(X) avec a ∈ IR.
On dit que l’espérance mathématique est linéaire.
(P2 ) Soient X une variable aléatoire discrète et f une fonction numérique dont
l’ensemble de définition contient X(Ω). Si E(f(x)) existe alors :
E(f(x)) =∑x ∈X(Ω) f(x)P(X = x).
(P3) Si E(X) existe alors |E(X)| ≤ E|x| < +∞.
(P4) * Si X a une espérance mathématique et si X ≥ 0 alors E(X) ≥ 0.
* Si X et Y ont une espérance mathématique et si X ≤ Y alors E(X)≤E(Y).
(P5) Si Z est une variable aléatoire discrète ayant une espérance mathématique et si pour
tout ω ∈ Ω, |X(ω)| ≤ Z(ω) alors X possède une espérance mathématique.
5) Variance
a) Définition
Soit X une variable aléatoire, on appelle respectivement variance de X et écart type de X
les quantités V(X)= E[(X−E(X)²], σ(x)=√V(X).
Remarque : lorsque X représente une grandeur physique, E(X) et σ(X) ont la même unité
mais pas V(X).
b) Propositions
(P1) ∀ a ∈ IR, ∀ b ∈ IR, V(ax+b)=a²V(X) (translation et changement d’échelle).
(P2) V(X)=0 <=> X=E(X) <=> X est presque sûrement constante.
(P3) V(X)=E(X²)−[E(X)]² (Formule de Koenig).
c) Théorème (inégalité de Tchebycheff)

V(X)
∀ t > 0, P(|X−E(X)|≥ 𝑡) ≤ .
t²
6) Lois discrètes classiques

a) Loi de Bernoulli
Définition
La variable aléatoire X suit la loi de Bernoulli de paramètre P (P ∈ [0,1] si elle ne prend
que deux valeurs 0 et 1 avec P(X=1)=P, P(X=0)=1−P=q.
On note X ~B(P).
Espérance mathématique
SI X ~ B(P) alors E(X)=P.
Variance
La variance d’une loi de Bernoulli de paramètre P est P(1-P) =pq.
En effet V(X)=E(X²)−(E(X))²=p-p²=p(1−p).
b) Loi uniforme sur un ensemble fini
41
Définition : la variable aléatoire X suit la loi uniforme sur l’ensemble de réels {x1 ,…, xn } si
Px est l’équiprobabilité sur cet ensemble. Autrement dit, X(Ω)={x1 ,…, xn } et ∀ k=1,
1
P(X=xk )= .
n
1
E(X)=∑ni=1 xi P(X=xi )=n ∑ni=1 xi .
Si X suit la loi uniforme sur l’ensemble {x1 , x2 ,…, xn }, E(X) est égale à la moyenne
arithmétique de x1 .
Variance
n2 −1
Si X suit la loi uniforme sur {1,…n}, V(X)= .
12
1 1 n(n+1)
En effet E(X)=∑ni=1 kP(X = k) = n ∑ni=1 k = n × 2
n+1
= 2
1 1 n(n+1)(2n+1)
E(X)=∑n 2
i=1 k P(X = k) = ∑n k 2 = ×
n i=1 n 6
(𝑛+1)(2𝑛+1)
=
6
𝑛2 −1
V(X)=[E(X)]²-E(X)²= .
2
Définition
On dit qu’une variable aléatoire suit la loi de Poisson de paramètre λ> 0 si l’ensemble
e−λ λk
des valeurs possibles est X(Ω)=IN et ∀ k ∈ IN, P(X = k) = .
k!
On note X ~P(λ).
Si X suit la loi de Poisson de paramètre λ alors E(X)=λ.
Variance
Si X suit la loi de Poisson de paramètre λ, V(X)=λ.
II - Variables aléatoires continues

1) Définition
Soit (Ω, F, P) un espace probabilisé. On appelle variable aléatoire continue sur (Ω, F, P)
toute application X : Ω→IR, ω→X(ω) vérifiant : pour tout intervalle I de IR, A={ω ∈ Ω /
X(ω) ∈ I} fait partie de la famille F d’évènements auxquels on peut attribuer une
probabilité P.
2) Loi de probabilité
Soit X une variable aléatoire continue sur (Ω, F, P). On lui associe la famille d’ensembles
Px définie sur la famille BIR de parties de IR en posant :
Px (B)=P(X ∈ B)=P{ω ∈ Ω / X(ω) ∈ B}=P(X −1 (B)).
La fonction d’ensemble Px ainsi définie est une probabilité sur BIR . On l’appelle la loi de
la variable aléatoire X.
42
3) Fonction de répartition
a) Définition
Soit X une variable aléatoire continue dont la loi Px est caractérisée par les probabilités
d’intervalle Px (]a, b])=P(X ∈ ]a, b]), a et b ∈ IR.
Sa fonction de répartition Fx est définie par Fx : IR→ [0, 1]
x→ Px (]−∞,x])=P(X ≤ x ), x ∈ IR.
b) Théorème
La fonction de répartition d’une variable aléatoire continue est croissante sur IR,
continue à droite et limitée à gauche en tout point. Elle tend vers 0 en −∞ et vers +1 en
+∞.
4) Variables à densité
a) Définitions
(1) Une fonction f : IR→IR est appelée densité de probabilité si elle est positive(en tout
+∞
point t ∈ IR où elle est définie f(t) ≥ 0), intégrable sur IR et si ∫−∞ f(t)dt = 1.
(2) La variable aléatoire X suit la loi de densité f si : ∀ a ∈ IR, ∀ b ∈ IR,
b
P(X ∈]a, b])=∫a f(t)dt.
Exemple de densités :
1
1
f(t)=b−a⁄ [a, b](t) g(t)=
𝜋(1+𝑡 2 )
1
−𝑡
h(t)=𝑒 ⁄[0, +∞[(t) i(t)=2√𝑡⁄ ]0, 1](t)
b) Proposition
Si la variable aléatoire X a pour densité f, sa fonction de répartition F vérifie :
x
i) ∀ x ∈ IR, F(x) = ∫−∞ f(t)dt
ii) F est continue sur IR
iii) Si f est continue en x0 alors F est dérivable en ce point et F’(x0 )=f(x0 )
c) Espérance mathématique
Si la loi de la variable aléatoire continue X a une densité f telle que l’intégrale
+∞ +∞
∫−∞ |x|f(x)dx converge, on appelle espérance de X le réel E(X)=∫−∞ xf(x)dx.
d) Variance
+∞ 2
Si la loi de la variable aléatoire X a une densité f telle que ∫−∞ (x − E(X)) f(x)dx
+∞ 2
converge, on appelle variable de X le réel ∫−∞ (x − E(X)) f(x)dx.
5) Quelques lois à densité classiques

a) Lois uniformes
Définition : La variable aléatoire continue X suit la loi uniforme sur l’intervalle [a, b] si
elle a une densité f constante sur cet intervalle et nulle en dehors. On a alors :
1 1
b−a⁄ si t ∈ [a, b]
f(t)= [a, b](t) ={b−a
0 sinon
La fonction de répartition F est affinée par morceaux et définie par :
43
0 si x ∈ ] − ∞, a]
x−a
F(x)={ x−b si a < x ≤ b
1 si x ∈ ]b, +∞[
Propositions :
l([a,b] ∩ I)
(1) Si la loi est uniforme, P(X ∈ I)= où l(J) désigne la longueur de l’intervalle J.
l([a,b])
𝑎+𝑏 (𝑏−𝑎)²
(2) Si X suit la loi uniforme sur [a, b], E(X)= et V(X)= .
2 12
+∞ b x x² a+b
En effet E(X)=∫−∞ xf(x)dx = ∫a dx = [ ]b =
b−a 2(b−a) a 2
+∞ b x² 1 𝑥3 b
E(X²)=∫−∞ x 2 f(x)dx = ∫a 𝑑𝑥 =[ ]
b−a 3 b−a a
1
= (b²+ab+a²).
3
1
V(X)=[E(X)]²−E(X²)= (a²+b²−2ab)
12
(𝑏−𝑎)²
= .
12
b) Lois exponentielles
Définition : soit a une réel strictement positif. La variable aléatoire continue X suit la loi
−at
exponentielle de paramètre a si elle admet pour densité f(t)= ae ⁄[a, +∞[(t).
En pratique, plutôt que travailler avec la fonction de répartition d’une loi exponentielle,
il est plus commode d’utiliser la fonction G :
1 si x ≤ 0
G(X)=P(X > x)=1−F(x)={ −ax
e si x > 0
Théorème
 Si la variable aléatoire X suit une loi exponentielle alors elle vérifie la propriété
d’absence de mémoire :
∀ s ∈ IR+ , ∀ t ∈ IR+ , P(X > t + s/ X > t)=P(X > s).
 Réciproquement si une variable aléatoire X vérifie la propriété d’absence de
mémoire, alors elle suit une loi exponentielle.
44
CHAPITRE II : PROCESSUS STOCHASTIQUES
I - Définitions :
soit (Ω, F, P) un espace probabilisé.
 Un processus stochastique à temps discret est une famille X=(Xn )ntIN de
variables aléatoires. Dans ce cas on note T=IN.
 Un processus à temps continu est une famille X=(Xt )ttIR+ de variables aléatoires.
Dans ce cas on note T=IR+ .
En fait, un processus stochastique X=(Xt )ttIR+ est une famille de variables aléatoires Xt
indexée par un ensemble T.
Un processus dépend de deux paramètres :
Xt (ω) dépend de t (en général le temps) et de l’aléatoire ω ∈ Ω.
- Pour tout t ∈ T, ω ∈ Ω → Xt (ω) est une variable de l’espace probabilisé.
- Pour tout ω ∈ Ω fixé, t ∈ T → Xt (ω) est une fonction à valeurs réelles appelée
trajectoire du processus.
Remarque : dans les définitions précédentes, l’ensemble est muni d’une relation totale
(c’est-à-dire étant donné (s, t) ∈ T², on a s ≤ t ou t ≤ s).
Quelques quantités importantes

Soit X=(Xt )ttT un processus stochastique .
 Fonctionnelle d’espérance (sous réserve d’intégrabilité), c’est la fonction
m : → IR.
t=m(t)=E(Xt )
 Fonctionnelle de covariance (si de carré intégrable)
C : T² → IR
(s, t) → C(s, t)=cov(Xs , Xt ).
 Fonction de répartition unidimensionnelle
∀ t ∈ T, c’est Ft : IR → IR
x→ Ft (x)=P(Xt ≤ x)
 Fonction de répartition bidimensionnelle
Pour tout (s, t) ∈ T², Fs,t ∶ IR² → IR
(x, y) → Fs,t (x, y)=P(Xs ≤ x, Xt ≤ y).
II) Chaines de Markov

1) Définition : une chaine de Markov à valeur dans S (espace d’état) est un
processus stochastique à temps discret noté (Xn )n ∈ IN tel que :
- pour tout entier n ∈ IN, Xn est une variable aléatoire dans S.
- Pour tout n ∈ IN, pour tout (n+1)-uplet à valeurs dans S, (x0 ,… xn ), vérifiant
P(X0 =x0 ,…, xn−1=xn )≠0.
On a :
P(X0 =x0 ,…., Xn−1=xn−1 , Xn =xn )=P(Xn =xn /Xn−1 =xn−1)…P(X1 =x1 /X0 =x0 )P(X0 =x0 )
-De plus, pour tout 1≤ 𝑘 ≤ n, on a :
P(Xk =xk /Xk−1=xk−1 )=P(xk−1 , xk ) ; la fonction P est indépendante de k.
Convention : les états sont notés avec les lettres minuscules et les variables avec des
lettres majuscules.
45
2) Proposition
On dispose d’une formulation équivalente du deuxième point de la définition de la
chaine de Markov.
∀ n ∈ IN, ∀ (n+1)-uplet à valeurs dans S(x0 ,…, xn ), vérifiant P(X0 =x0 ,…, X n1 = xn−1 )≠0
on a : P(Xn =xn /Xn−1=xn−1,…, X0=x0 )=P(Xn =xn /Xn−1=xn−1).
En fait, un processus est une chaine de Markov si la transition d’un état xn−1 à l’instant
n − 1 à un autre xn à un instant n ne dépend que :
 De la position xn−1 à l’instant n − 1 et pas du reste de la trajectoire passée (c’est-
à-dire de x0 ,…, xn−2).
 Du résultat d’une expérience aléatoire distribuée selon la probabilité
conditionnelle sachant que Xn−1=xn−1 (notée P(./Xn−1=xn−1).
3) Noyau de transition
Définitions :
(1) On appelle noyau de transition ℙ, une fonction ℙ : S×S →[0, 1] telle que pour tout x ∈
S, (x, y) → ℙ (x, y).
L’application P(x, .) : S →[0, 1]
y → ℙ (x, y)
est une mesure de probabilité : ∑y ∈ S ℙ(x, y)=1.
(2) On dit que (Xn )n ϵ IN est une chaine de Markov de noyau P et de loi initiale u si :
- c’est une chaine de Markov au sens de la définition précédente,
- la variable aléatoire X0 suit la loi u, c’est-à-dire que ℙ (X0 =x0 )=u(x0 ), ∀ x ∈ S,
- les probabilités conditionnelles sont données par la fonction p= ℙ.
4) Graphe de transition
On représente très souvent une chaine de Markov à l’aide d’un graphe sur l’espace
d’états S, appelé graphe de transition.
Les sommets du graphe sont tous les états x ∈ S.
Les arêtes orientées sont des couples (x, y) telles que ℙ (x, y)> 0.
De plus, sur les arêtes orientées, on indique la probabilité de transition correspondante.
5) Distribution
Soit (Xn )n ϵ IN une chaine de Markov de noyau de transition ℙ sur un espace d’états S et
de la loi initiale u : pour tout état x0 ∈ S on a ℙ (X 0 =x0 )=u(x0 ).
Pour tout état xn ∈ S, on a :
ℙ (Xn =xn )=∑x0 ,...xn−1 ∈ Sn ℙ(Xn =xn , Xn−1=xn−1,…, X1 =x1 , X0 =x0 )
=∑x0 ,...xn−1 ∈ Sn ℙ(Xn =xn /Xn−1=xn−1 )…ℙ(X1=x1 / X0 =x0 ) P(X0=x0 )
ℙ (Xn =xn )=∑x0 ,...xn−1 ∈ Sn 𝑢(x0 )P(x0 , x1 )… ℙ (xn−1, xn ).
On dispose également de la formule de récurrence suivante en conditionnant
uniquement par rapport à la position à l’instant précédent n − 1.
ℙ (Xn =xn )=∑xn−1 ∈ 𝑆 ℙ(Xn = xn , Xn−1=xn−1)
=∑xn−1 ∈ 𝑆 ℙ(X n = xn / Xn−1=xn−1) ℙ (X n−1=xn−1)
=∑xn−1 ∈ 𝑆 ℙ( X n−1=xn−1) ℙ (xn−1=xn ).
46
Grâce à cette dernière formulation, on voit que connaissant la loi initiale u et le noyau de
transition ℙ, on peut calculer de façon simple et itérative la loi xn à n’importe quel
instant n.
Définition : on représente une loi de probabilité P sur S à l’aide d’un vecteur ligne ; si
S={1,….N}, il s’agit du vecteur P=(P(1),…, P(N)). Si S=IN, on a un vecteur infini
(P(1),….,P(N),….).
Les lois de probabilité sont donc identifiées avec les vecteurs lignes vérifiant deux
conditions :
i) Tous les coefficients sont positifs ou nuls
ii) Leur somme est égale à 1.
Théorèmes
(1)Pour tout n ∈ IN, si on note un la loi de xn c’est-à-dire le vecteur ligne tel que un (xn )=
ℙ (Xn =xn ), on a un =x0 ℙn le produit matriciel du vecteur ligne u0 et de la matrice
carrée P n .
(2) Soit f : S→IR, une fonction (supposée bornée si S est infinie). On a E[f(Xn )= u0 ℙn f où
f est vu comme vecteur colonne.
(3) ∀ n ∈ IN ∗ , ℙn est une matrice de transition.
De plus, pour tout x ∈ S, la ligne ℙn est une loi de probabilité, précisément la loi de Xn ,
lorsque la condition initiale est X0 =x ; ℙn (x, y)=P (Xn =y/X0 =x).
C’est une conséquence du théorème (2).
6) Lois invariantes
Définitions
Une chaine de Markov d’espace d’états S est dite stationnaire si pour tout entier m ∈ IN,
la loi du vecteur aléatoire de longueur m+1(Xn ,… Xn+m ) ne dépend pas de n.
Théorème : une chaine de Markov de noyau de transition ℙ est stationnaire si et

seulement si sa loi initiale vérifie u0 ℙ =u0 .
Dans ce cas, pour tout n ∈ IN, on a un =u0 .
(1) Définition : une loi initiale telle que la chaine dont elle est issue est stationnaire,
est appelée loi invariante. En d’autres termes, une loi u est invariante (pour le
noyau de transition ℙ si et seulement si uℙ =u.
(2) Un vecteur ligne non identiquement nul u, tel que uℙ =u à coefficients positifs ne
vérifiant pas nécessairement ∑x ∈ S u(x) = 1 est appelé mesure invariante.
7) Chaines de Markov et temps d’arrêt

Pour commencer, donnons une nouvelle caractérisation de la propriété de Markov.
Soit (Xn )n ∈ IN , un processus à valeurs dans l’espace d’états S. Il s’agit d’une chaine de
Markov si conditionnellement au présent, futur et passé sont indépendants quels que
soient les entiers n, m ≥ 1 et les états x0 ,… xn+m .
P(Xn+m =xn+m ,…. , Xn+1 =xn+1, Xn−1 = xn−1,…, X0 =x0 /Xn =xn
= P(Xn+m =xn+m ,…. , Xn+1=xn+1/Xn =xn ) P(Xn−1 = xn−1,…, X0=x0 /Xn =xn ).
Ici : présent = instant n
Passé = instants 0, 1,2,…. n − 1
Futur = instants n+1,….
47
Proposition
Dans ce cas, conditionnement aux évènements {Xn =xn }, le processus (Xn+m )m ∈ IN est
une chaine de Markov :
 De position initiale xn
 De noya de transition ℙ (ne dépendant pas de n ; c’est le même noyau que la
chaine initiale)
 Indépendante de (X0 ,…. Xn−1).
On peut remplacer l’entier n par un temps aléatoire T à deux conditions :
 On conditionne par rapport aux évènements {T< +∞} ∩ {XT =x}.
 T doit être le temps d’arrêt.
En fait fixons un état a ∈ S. On pose la position initiale X0 =a, si bien qu’on regarde des
trajectoires de la chaine de Markov toutes issues de a.
On pose ∀ k ∈ IN, T0 (a)=0
T1 (a)=inf {n ≤ T0 (a)+1 ; Xn =a}
(a)
Tk+1= inf {n ≤ Tk (a)+1 ; Xn =a}
Avec la convention suivante : si pour un entier k on a {n ≤ Tk (a)+1 ; Xn =a}=∅ alors on
pose Tl (a)=+∞ pour tout l ≥ k+1 ; si à partir d’un moment la chaine ne revient pas en a,
on décide que le temps de retour est +∞.
La suite aléatoire Tk (a)k ∈ IN décrit les temps de retour successifs de la chaine à l’état a.
Ce sont des temps d’arrêt.
La propriété fondamentale est la suivante :
(XT0 (a) =a,…., XT1 (a)−1 ) , (XT1 (a) =a,…., XT2 (a)−1)…. (XTk (a) =a,…., XTk+1 (a)−1 ),….. sont des
morceaux de trajectoires indépendantes et identiquement distribuées, avec la propriété
que chaque début de trajectoire est en a et que a n’est pas visité ensuite. En d’autres
termes, à chaque retour en a, on calcule une nouvelle trajectoire issue de a,
indépendamment de tout le passé et du numéro de retour toujours avec la même
distribution de probabilité. On s’arrête au retour suivant et on enlève a en fin de
trajectoire.
8) Classification des états

a) Communication
Soit ℙ un noyau de transition sur l’ensemble S fini ou dénombrable. ℙ étant fixé, toutes
les notions définies dans cette section dépendent de ℙ.
Définition :
(1) si x et y sont deux états dans S, on dit que x conduit à y s’il existe un entier n ≥ 0 tel
que ℙn (x, y) ≥ 0. On note x → y.
En fait ℙn (x, y) est la probabilité en n étapes de x à y. x conduit à y si cette probabilité est
positive pour un certain entier n. Autrement dit, il existe un entier n ≥ 0 et une suite
d’états x0 =x, x1 ,…. , xn−1 , xn =y tel que pour tout 0 ≤ k ≤ n − 1 on a ℙn (xk , xk+1 ) > 0,
c’est-à-dire l’arête orientée reliant xk à xk+1 est présente dans le graphe.
(2) Si x et y sont deux états dans S on dit que x et y communiquent si x conduit à y et y
conduit à x. On note x ↔ y.
x <=> (x → y et y → x).
La relation ↔ est une relation d’équivalence c’est-à-dire qu’elles est reflexive,
symétrique et transitive.
48
Proposition : l’espace d’états peut se partitionner en classes de communication :
S s’écrit à la manière d’une union d’ensembles Ci deux à deux disjoints de telle sorte que
pour tout i ∈ T et tous x, y ∈ S, (x ∈ Ci et y ∈ Ci ) <=> x ↔ y.
La classe associée à l’état x est l’unique élément Ci de la partition tel que x ∈ Ci . Alors
pour tout y ∈ S, x ↔ y <=> y ∈ Ci .
Définition : le noyau ℙest dit irréductible si tous les états communiquent.
b) Récurrence – transcience
Définition :
Un état x ∈ S est dit récurrent (pour le noyau ℙ ) si ℙ (xn =x pour une infinité d’entiers
n/x0 =x)=1. Dans le cas contraire x est dit transcient.
Si on pose T(x)= inf {n ∈ IN ∗ , Xn =x} et N(x)=card { n ∈ IN ; Xn =x}, la définition devient x
récurrent <=> P (N(x)=∞/X0 =x)=1, avec N(x) et T(x) deux variables aléatoire IN ∪
{+∞}.
Théorème
x récurrent <=> N(x)= +∞ presque surement sachant que X0 =x.
<=> E[N(x)/ X0 =x]= +∞
<=> ∑+∞ n
n=0 ℙ (x, x) = + ∞
<=> P(T(x) < +∞/X0 =x) = 1
x récurrent <=> P(N(x) = +∞/X0 =x) < 1
<=> E[N(x)] < +∞
<=> ∑+∞ n
n=0 ℙ (x, x) < +∞
<=> P(T(x) < +∞/ X0 =x < 1
Proposition : pour toute paire d’états x, y qui communiquent, x est récurrent si et
seulement si y l’est. On dit que la récurrence et la transcience sont des propriétés de
classe.
c) Espérance du temps du retour

Définition : soit x un état.
On dit que x est positif si x est récurrent et si E(T(x)/ X0 =x) < ∞.
On dit que x est récurrent nul si x est récurrent et si E(T(x)/ X0 =x) = ∞.
Proposition : la récurrence positive et la récurrence nulle sont des propriétés de classe.
d) Périodicité
Définition : Soit x ∈ S, un état.
On définit la période de x par :
d(x)=pgcd {n ≥ 1, ℙn (x, y) > 0}. On dit que x est apériodique si d(x)=1.
Proposition : la période et l’apériodicité sont des propriétés de classe : si x ↔ y, alors

d(x) = d(y).
On peut montrer simplement l’apériodicité en prouvant P(x, x) > 0.
49
CHAPITRE III : FILES D’ATTENTE
I – Introduction
La théorie des files d’attente consiste à l’étude de systèmes où des clients se présentent à
dispositif de service appelé serveur. Puisqu’un client occupe le serveur pendant un
certain temps, les autres clients doivent attendre avant d’être servis formant ainsi une
file d’attente.
Exemple : atelier : serveur : machine : client : tâche.
II – Définition
Une file d’attente est constituée de clients, d’une salle d’attente, de guichets et de
serveurs. On va supposer que les temps inter arrivées sont indépendants et de même
type de loi (dépendant d’un ou plusieurs paramètres) et indépendants des temps de
services également indépendants et de même type de loi. On suppose que dès qu’un
guichet se libère, il est utilisé à nouveau s’il y avait un client dans la salle d’attente. On
utilise la notation suivante :
Loi d’inter arrivée / loi de service / nombre de serveurs / longueur maximale.
Le dernier paramètre est facultatif ; par défaut il vaut 00 ; la salle d’attente a une
capacité non limitée
On a la notation de Kendall A/B/C/K/N/D.
 A : processus d’arrivée
 B : processus de service
 C : nombre de serveurs
 K : capacité du système (file + serveurs)
 N : taille de la population (habituellement infinie)
 D : discipline de services (par défaut PAPS : premier arrivé, premier servi mais
aussi RANDOM.
III – Modèles de file d’attente

1) Modèles M/M/1
a) Définition
 Les clients se présentent au système aléatoirement selon un processus de
Poisson de taux λ.
 Le temps de service suit une loi exponentielle de taux u, indépendant d’un client à
un autre. La file d’attente peut s’étendre à l’infini.
Rappel : processus de Poisson :
- Le nombre A(t) d’arrivées dans l’intervalle de temps [0, t[ suit une loi de Poisson
de paramètre C=λt.
- Les arrivées dans deux intervalles de temps disjoints sont indépendantes.
- Le temps qui s’écoule entre les deux arrivées suit une loi exponentielle de taux λ.
b) Arrivée avant un départ et départ avant une arrivée

 Temps pour qu’une nouvelle arrivée se produise :
A ~ Exp (λ)
 Temps pour qu’un nouveau départ se produise avant un départ :
50
D ~ Exp (u) (A et D sont indépendants)
 Probabilité qu’une arrivée se produise avant un départ :
λ
P(A<D)=
λ+u
 Probabilité qu’un départ se produise avant une arrivée :
u
P(D<A)=
λ+u
c) Analyse en régime stationnaire

Il est difficile d’étudier la variable aléatoire N(t) représentant le nombre de clients au
temps t dans le système. On s’intéresse plutôt à N=lim N(t). On parle alors d’analyse en
t→∞
régime stationnaire (ou analyse à l’équilibre).
Pour que la file M/M/1 puisse atteindre l’équilibre, il faut que λ < u (sinon la taille de la
file augmente à l’infini).
λ u
P (N=n)= P(N=n−1)+ P(N=n+1).
λ+u λ+u
λ
représente la probabilité qu’un nouveau client arrive avant que le client en service
λ+u
u
quitte le système et est la probabilité que le client en service quitte le système
λ+u
avant qu’un nouveau client arrive.
Posons πn =P(N=n). On a les équations suivantes :
λ u λ u λ u
π1 = π0 + π2 , π2 = π1 + π3 ……..πn = πn−1+ π et ∑∞
n=0 πn =0.
λ+u λ+u λ+u λ+u λ+u λ+u n+1
λ
On trouve πn =(1−P)P n pour n=0, 1, 2, 3…… ou P= <1 est défini comme l’intensité du
u
trafic.
d) Notations et formules
Notations
 N̅ Q : nombre moyen de clients faisant la queue
 N̅ S : nombre moyen de clients entrain d’être servis
 N̅ =E(N)= N ̅ Q +N
̅ S : nombre total (attente + service) moyen dans le système en
équilibre
 NQ , NS et N sont les variables aléatoires correspondantes.
 On a P(N=k) =πQ
 T̅Q : temps moyen d’attente
 T̅S : temps moyen de service
 T̅=T ̅Q +T
̅S : temps moyen qu’un client passe dans le système.
 TQ , TS et T sont les variables aléatoires correspondantes.
Formules : modèle M/M/1

λ
- P=
u
- ̅= P
N
1−P
- ̅
NS =1−π0 =P
51
- ̅ Q =N
N ̅ S = P²
̅−N
1−P
̅
N P² 1
- ̅= =
T =
λ λ(1−P) u−λ
λ
- ̅Q =T
T ̅−T
̅S =
u(−λ)
0 si N = 0
- Un seul serveur NQ = {
N − 1 si N > 1
- P(NQ =0)=(1−P)(1+P)
- P(NQ =k)=P k+1(1−P) pour k > 0
- N+1=N1 ~Geom(P=1−P)
- T~Exp(u−λ)
- P(TQ =0)= π0 =1−P
TQ
- ⁄{N > 0} ~ Exp(u − λ)
Q
2) Modèle M/M/1/K
Pour un système de capacité K(taille maximale de la file d’attente de K−1) avec
λ
P= ≠1 , on peut montrer que pour n=0, 1,….K :
u
- Si P<1
P(Y=n+1) Pn (1−P)
πn =P(Y=n+1 / Y ≤ K+1)= = avec Y~ Geom(1−P)
P(Y≤K+1) 1−PK+1
- Si P>1
P(Y=K−n+1) Pn (1−P) 1
πn =P(Y=K−n+1 / Y ≤ K+1)= = avec Y~ Geom(1− )
P(Y≤K+1) 1−PK+4 P
- L’équilibre est atteint pour tout P :
1−P
 Si P≠ 1, πn =P n
1−PK+1
1
 Si P=1, on considère les états équiprobables πn = pour n=0, 1,….K.
K+1
- Le système est en pleine capacité avec la probabilité πK .
- Taux d’entrée λe =λ(1−πK ).
IV – Travaux pratiques
Soit une file d’attente (illimitée) avec un serveur unique ; le système d’attente se
trouve une banque ouverte de 9h à 17h sans interruption. Il accueille en moyenne 64
personnes par jour. Le temps moyen passé par une personne est de 2 minutes et
demi. Un statisticien a observé que la loi de probabilité de la durée du service est
exponentielle et que les arrivées des clients forment un processus de Poisson.
1) Quel est le nombre moyen de personnes présentes dans la banque, le temps
moyen à attendre son tour, le temps moyen passé dans la banque ?
2) Quelles sont les probabilités qu’il n’arrive aucun client entre 15h et 16h pour que
six clients arrivent entre 16h et 17h ?
3) Quel est en moyenne par heure, la durée pendant laquelle l’employé d’un guichet
n’est pas occupé avec un client ?
4) Quelle est la probabilité d’avoir 4 personnes dans la file d’attente, derrière le
client qui est occupé avec l’employé du guichet.
52
Solution
60
1) On a le modèle M/M/1/∞ avec λ=8 (clients par heure) et u=24= (nombre de
2,5
clients par heure).
λ 8 1
On pose P= = = . Comme P < 1, le système est à l’équilibre : la probabilité qu’il y ait k
u 24 3
clients à un instant donné est πk =(1−P)P k .
Temps moyen passé à attendre :
λ 1
̅Q =E(TQ )=
T = heures.
u(u−λ) 48
Temps moyen passé dans système :
̅ =E(T)= λ = 1 heures.
T
u−λ 16
2) * Probabilité pour qu’aucun client n’arrive entre 15h et 16h
On sait que le nombre de clients qui arrive dans le système pendant une unité de temps
λk
est une variable aléatoire qui suit la loi de Poisson P(N=k)=e−λ × donc
k!
1
P(N=0)= e−λ =e−8= 8 .
e
1
La Probabilité qu’aucun client n’arrive entre 15h et 16h est P(N=0)= .
e8
*Probabilité pour que six clients arrivent entre 16h et 17h
86
P(N=6)= 𝑒 −8 = . La probabilité pour que six clients arrivent entre 16h et 17h est
6!
e−8 86
P(N=6)= .
6!
3) Durée pendant laquelle l’employé n’est pas occupé par le client
L’employé n’est pas occupé par le client lorsque le système est à l’état 0, ce qui
2
correspond à la probabilité π0 =1−P= soit une moyenne de 40mn par heure.
3
4) Probabilité d’avoir 4 personnes dans la file d’attente
S’il y a 4 personne dans la file d’attente, il y a 5 clients en tout dans le système, ce qui
2
correspond à la probabilité π5 =(1−P)P 5 = 6 .
3
53
54

Cours Mathématiques Appliquées PDF

Transféré par

Informations du document

Titre original

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Cours Mathématiques Appliquées PDF

Transféré par

Droits d'auteur :

Formats disponibles

COURS DE

1ère PARTIE : ANALYSES STATISTIQUES

CHAPITRE III : ESTIMATION

CHAPITRE IV : TESTS STATISTIQUES

2ème PARTIE : RECHERCHE OPERATIONNELLE

CHAPITRE II : PROGRAMMATION LINEAIRE : METHODE SIMPLEXE

3ème PARTIE : PROCESSUS STOCHASTIQUES

CHAPITRE II : PROCESSUS STOCHASTIQUES

CHAPITRE III : FILES D’ATTENTE

1ère PARTIE : ANALYSES STATISTIQUES

I – Généralités sur la statistique descriptive

xi = valeur de X pour l’individu i de la série.

II – Généralités sur la probabilité

6) Indépendance de deux évènements

II – Les différents types d’échantillonnage

a) Les échantillons de convenance

b) Les échantillons volontaires

a-1) L’échantillonnage aléatoire simple

a-2) L’échantillonnage stratifié

Procédure à suivre pour l’échantillonnage :

b) L’échantillonnage à plusieurs degrés

Définition 1 : un n-échantillon de X est un n-uplet (X1 , X2 , …, Xn ) tel que les Xk ont la

Définition 2 : une statistique de l’échantillon est une variable aléatoire ρ (X1 , X2 , …, Xn )

Définition 3 : le biais de l’estimateur T de θ est E(T)- θ0 .

2) Estimation de 𝛔𝟐 en supposant m connu

3) Estimation de 𝛔𝟐 en supposant m inconnu

III - Estimation par intervalle

Définition 2 : Soit α ∈ ]0 ; 1[ , On appelle quartile d’ordre α d’une loi de probabilité P,

2) Construction de la région de confiance

3) Exemples classiques d’estimation par intervalle

a) Estimation de la moyenne quand la variance est connue

c) Estimation de la variance quand la moyenne est connue

d) Estimation de la variance quand la moyenne est inconnue

I – Introduction aux tests statistiques

2) Catégories de tests d’hypothèse

3) Principe du test d’hypothèse

4) Test unilatéral ou test bilatéral

5) Tests permettant de déterminer si un échantillon appartient à une population

b) Test sur une proportion

6) Risque de 1ère espèce - risque de 2ème espèce

Tableau des fréquences théoriques

Remarque : il existe également des tests d’homogénéité qui déterminent si deux

III – Analyse de la variance (ANOVA)

1) Principe de l’analyse de variance

2) ANOVA : méthode de calculs

 On montre que SCER s’écrit :

- Tester si SA2 /SR2 est proche de 1

II - Forme canonique d’un programme linéaire

Z (x1 , x2 ,…., xn ) = C1 x1 +C2 x2 +…..+Cn xn appelé fonction objectif.

III - Méthode graphique : problème à 2 inconnues

2) Résolution graphique du problème

On considère la droite d’équation 400x1 + 800x2 =k où k est la constante. Si on déplace

Conclusion : Z=2900−3x5 − 2x6 .

On doit exprimer le programme en fonction des nouvelles variables hors base x2 et x3 .

Z s’écrit Z=5x2 − 7x3 +2100.

On obtient Z=3x3 − 5x6 +2600.

III - Analyse post-optimale de la fonction objectif

Solution de base réalisable :

Exemple 2 : reprenons l’application du chapitre I sur les ordinateurs IM4 et IM5.

II – Uni modularité d’une matrice

 Théorème 2 (conditions suffisantes pour qu’une matrice soit uni modulaire)

IV – Application : problème d’affectation

De plus si l’employé Ei travaille sur la machine MJ , il coûte Cij dollars à la compagnie.