Académique Documents
Professionnel Documents
Culture Documents
APPLIQUEE
(Outils d’aide à la décision )
Rachid MCHICH
Introduction générale
L'inférence statistique consiste à induire (inférer)
des conclusions (caractéristiques) concernant
un groupe auquel on ne peut pas accéder
directement (grande taille - coûteux) à partir
d'un sous-groupe (petite taille) auquel on a
accès et que l'on considère comme un
échantillon aléatoire provenant de cette
population.
- Estimation ponctuelle
- Distributions d’échantillonnage
V. Test de signification
V. Test de signification
Rachid MCHICH
Chap. 1: Rappels mathématiques
I - Statistique descriptive
(Mesures de tendance centrale et de dispersion,
corrélation, …)
I-1 Exemples et définitions :
La représentation se fait alors grâce à un histogramme dont les rectangles sont de largeur
égale à l’amplitude de la classe.
Exemple : Considérons les données
quantitatives indiquant le temps nécessaire (en
jours) pour effectuer l’audit de 20 clients par le
cabinet d’un expert comptable.
12 14 19 18
15 15 18 17
20 27 22 23
22 21 33 28
14 18 16 13
Effectifs et fréquences cumulées croissants et
décroissants
Statistiques Paramètres de
d’échantillon la population
Moyenne x µ
Variance s2 σ2
Ecart type s σ
Covariance s xy σ xy
Corrélation rxy ρ xy
Mesures de tendance centrale
Moyenne d’échantillon :
x=
∑ x i
Moyenne de la population :
µ=
∑ x i
N
Mesures de tendance centrale
σ2 =
∑ i
(x − µ ) 2
s2 =
∑ i
(x − x ) 2
N n −1
Mesures de dispersion
σ = σ2 s= s2
Ecart type
*100
Moyenne
I-4 Détection des valeurs singulières :
Définition :
Va l e u r s i n g u l i è r e : O b s e r v a t i o n
anormalement grande ou petite
◦ Erreur d’enregistrement : à corriger avant toute
analyse
◦ Observation pas correctement incluse dans
l’ensemble des données : à supprimer
◦ Valeur inhabituelle, correctement enregistrée et
qui appartient à l’ensemble des données: à
conserver.
Forme d’une distribution
x = ?? s = ??
• Théorème de Chebyshev :
Théorème de Chebyshev :
1
« Au moins (1− 2
) des observations doivent se situer au
z
7710 7755 7850 7880 7880 7890 7920 7940 7950 8050
8130 8325
1) 7710
2) Q1= 7865
3) Q2=7905
4) Q3= 8000
5) 8325
A peu près 25% des données sont comprises entre 2 valeurs
adjacentes
II - Statistique bivariée
II-1 Mesures de la relation entre 2 variables
1 n
xG = X = ∑ xi
n i=1
1 n
yG = Y = ∑ yi
n i=1
Ajustement affine :
∑ (x i − µ x )(yi − µ y )
Covariance population : σ xy =
N
Covariance échantillon : s xy =
∑ (x i − x)(yi − y)
n −1
II-3 Mesures par le coefficient de corrélation :
Coefficient de corrélation : Mesure de la
relation linéaire entre deux variables, dont les
valeurs sont comprises entre -1 et +1:
s xy σ xy
rxy = ou ρ xy =
sx sy σ xσ y
◦ Des valeurs proches de +1 indiquent une forte
relation linéaire positive.
◦ Des valeurs proches de -1 indiquent une forte
relation linéaire négative.
◦ Des valeurs proches de 0 indiquent l’absence de
relation linéaire.
Méthode des moindres carrés :
σ xy
où a=
(σ x )2
et b =Y - a X
σ xy
où a' = et b'= X - a'Y
(σ y )2
y = Cx m ou y = Ca x
Rachid MCHICH
I - Introduction et définitions
L’étude des propriétés caractéristiques d’un
ensemble, quand on ne dispose pas encore de
données, nécessite d’examiner et d’observer des
éléments de cet ensemble.
• M é t h o d e d ’ é c h a n t i l l o n n age ( o u d e
sondage) : Procédure par laquelle on choisit dans
une population un sous-groupe représentatif.
x = 52 670 dh p = 0, 70
np ≥ 5 et n(1− p) ≥ 5
Intérêt pratique 1: Supposons que le directeur de la
société considère comme acceptable une différence de
500 dh entre la moyenne d’échantillon et la moyenne de
la population. Autrement dit, quelle est la probabilité que
la différence entre les deux moyennes ne dépasse pas
500 dh?
(zα )2 σ 2
2
n=
E2
(zα )2 p* (1− p* )
2
n=
E2
Exemple : Une étude sur le coût moyen de
location d’une catégorie de voitures était d’environ
550 dh.
Rachid MCHICH
I. Modèle de régression linéaire simple
y = β0 + β1 x + ε
~------------------x L------------------x
2
min ∑ (yi − ŷi )
b =
∑ (x − x )(y − y)
i i
1 b0 = y − b1 x
∑(x − x )
i
2
Exemple : Considérons les données collectées sur les
ventes mensuelles d’un échantillon de 10 restaurants d’une
chaîne de restaurants, par-rapport à la population locale :
yi − ŷi
2
SCres = ∑ (yi − ŷi )
D’autre part, pour estimer les yi sans utiliser les xi,
on utilise y la moyenne des yi. Ainsi, pour la ième
observation, yi − y fournit une mesure de l’erreur
commise en utilisant y pour estimer les ventes.
2
SCT = ∑ (yi − y )
Enfin, pour déterminer dans quelle mesure les
valeurs ŷ de la droite de régression dévient de la
moyenne ,yune autre somme des carrés est calculée.
2
SCreg = ∑ ( ŷi − y )
Ainsi, on a :
rxy = (signe de b1 ) r 2
IV. Hypothèses du modèle :
E(y) = β0 + β1 x
SCres
s = MCres =
n−2
V-1 Test t de Student :
H 0 : β1 = 0
H a : β1 ≠ 0
Espérance : E(b1 ) = β1
σ
Ecart type de b1 : σ b1 =
∑ i
(x − x ) 2
s
Ecart type estimé de b1 : sb1 =
∑ i
(x − x ) 2
Test de signification de Student dans le cadre
d’une régression linéaire simple :
H 0 : β1 = 0
H a : β1 ≠ 0
b1
Statistique de test : t=
sb1
Règle de rejet :
Approche par la valeur p : Rejet de H0 si p ≤ α
Approche par la valeur critique : Rejet de H0 si
t ≤ −tα /2 ou t ≥ tα /2
où tα /2 est basé sur la distribution de Student à (n-2) ddl.
Intervalle de confiance pour β1 :
SCreg SCreg
MCreg = =
Nbr de var. indépendantes 1
Test F de Fisher :
H 0 : β1 = 0
H a : β1 ≠ 0
Règle de rejet :
Approche par la valeur p : Rejet de H0 si p ≤ α
Approche par la valeur critique : Rejet de H0 si
F ≥ Fα
où Fαest basé sur la distribution de Fisher à 1 ddl au
numérateur et (n-2) ddl au dénominateur.
Tableau ANOVA :
SCres
Résidu SCres n-2 MCres =
n−2
+ % ( .
2
+ % 1 x ( .
Régression Linéaire II
b0 N + β0 ;σ + n .
%n 2 (
+
+ % ∑ ( xi − x ) ( .
.
* $ i=1 ' -
Pr. AIT BABRAM Mohamed
b0 − β0
z=
σ ( b0 )
z N (0,1)
Inférence sur b
Remarque : Dans le cas d’un petit échantillon, l’écart réduit suit une loi
de Student :
FSTG Marrakech
b0 − β 0
t= T (n − 2)
s ( b0 )
Régression Linéaire II
1/ 2
# &
% (
%1 x2 (
s (b0 ) = s% + (
n n
Pr. AIT BABRAM Mohamed
2
% ∑ ( xi − x) (
%
$ i =1
(
'
Remarque : Dans le cas où la taille de l échantillon est grande, la
distribution de l écart réduit est
b0 − β 0
t= N ( 0;1)
s ( b0 )
Intervalle de confiance pour β0 :
FSTG Marrakech
f(n-2)
1-α
Pr. AIT BABRAM Mohamed
α/2 α/2
- ta / 2;(n -2 ) t a / 2 ;( n - 2 )
Densité de probabilité de la loi
Student avec (n-2) degré de liberté
Exercice :
Considérons le tableau d’observations suivant:
xi 1 2 3 4 5
yi 3 7 5 11 14
Rachid MCHICH
Le ratio (SCreg/SCT) est utilisé pour évaluer
l’adéquation de l’équation estimée de la régression.
Ce ratio est appelé coefficient de
détermination et est noté :
2 SCreg
r =
SCT
2 SCreg 14200
r = = = 0, 9027
SCT 15730
Cela veut dire que 90,27% de la SCT peut être
expliquée en utilisant l’équation estimée de la
régression :
ŷ = 60 + 5x
rxy = (signe de b1 ) r 2
Rachid MCHICH
Introduction
L’analyse de la régression multiple est
l’étude de la relation entre une variable
dépendante y et au moins deux variables
indépendantes.
y = β0 + β1 x1 + β2 x2 +... + β p x p + ε
E(y) = β0 + β1 x1 + β2 x2 +... + β p x p
En pratique, la valeur des paramètres n’est pas
connue et doit être estimée en utilisant les données
d’un échantillon. D’où l’équation estimée de la
régression multiple :
ŷ = b0 + b1 x1 + b2 x2 +.... + bp x p
2
min ∑ (yi − ŷi )
b0 , b1,..., bp
où : 2
SCT = ∑ (yi − y )
2
SCreg = ∑ ( ŷi − y )
2
SCres = ∑ (yi − ŷi )
Le ratio (SCreg/SCT) est utilisé pour évaluer
l’adéquation de l’équation estimée de la régression.
Ce ratio est appelé coefficient de détermination
multiple et est noté :
2 SCreg
R =
SCT
SCreg 21601
Pour notre exemple : R = 2
= = 0, 904
SCT 23900
Pour une régression multiple, les deux tests n’ont pas le même
objectif:
y = β0 + β1 x1 +... + β p x p + ε
On a :
H0 : β1 = β2 = ... = β p = 0
SCreg
MCreg =
p
SCreg
MCres =
n − p −1
Test de signification globale de Fisher:
H 0 : β1 = β2 = ... = β p = 0
H a : Au moins un des paramètres n'est pas égal à 0
MCreg
Statistique de test : F=
MCres
Règle de rejet :
Approche par la valeur p : Rejet de H0 si p ≤ α
Approche par la valeur critique : Rejet de H0 si
F ≥ Fα
où Fαest basé sur la loide Fisher à p ddl au numérateur et
(n-p-1) ddl au dénominateur.
Dans notre exemple,
MCreg 10,8
F= = = 32, 9
MCres 0, 328
Au seuil de signification :
α = 0, 01
On a :
F0,01 = 9, 55
SCres
Résidu SCres n – p-1 MCres =
n − p −1
Règle de rejet :
Approche par la valeur p : Rejet de H0 si p ≤ α
Approche par la valeur critique : Rejet de H0 si
t ≤ −tα /2 ou t ≥ tα /2
où tα /2 est basé sur la distribution de Student à (n-p-1) ddl.
Remarques :
Rachid MCHICH
Pour faire un test d’hypothèses, on
commence par faire une hypothèse sur un
paramètre de la population considérée.
H 0 : µ ≤ 24
H a : µ > 24
H 0 : µ ≥ 2, 028
H a : µ < 2, 028
H0 : µ = 2
Ha : µ ≠ 2
Test bilatéral
II . Erreurs de 1ère et de 2nde espèce :
Seuil de signification :
σ
σx =
n
Pour effectuer des tests d’hypothèses relatifs à la
moyenne d’une population dans le cas σ connu, nous
utilisons la variable aléatoire centrée réduite z comme
statistique de test pour déterminer si x s’écarte
suffisamment de la valeur hypothétique de µ pour
entraîner le rejet de l’hypothèse nulle :
Statistique de test x − µ0 x − µ0 x − µ0
z= z= z=
σ σ σ
n n n
Règle de rejet : approche Rejet de H0 si Rejet de H0 si Rejet de H0 si
par la valeur p p ≤α p ≤α p ≤α
Statistique de test x − µ0 x − µ0 x − µ0
t= t= t=
s s s
n n n
Règle de rejet : approche Rejet de H0 si Rejet de H0 si Rejet de H0 si
par la valeur p p ≤α p ≤α p ≤α
Statistique de test p − p0 p − p0
z=
p − p0
z= z=
p0 (1− p0 ) p0 (1− p0 ) p0 (1− p0 )
n n n
Règle de rejet : approche Rejet de H0 si Rejet de H0 si Rejet de H0 si
par la valeur p p ≤α p ≤α p ≤α