Cours de Statistique appliquée-S5-ENCG Fès-Pr. Abdessamad OUCHEN-2020 2021

Enseignant: Abdessamad OUCHEN
Année universitaire: 2020-2021
1 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

Introduction générale:
Le mot statistique tire son origine du latin

statisticus relatif à l’état (status).
Il est apparu vers le milieu du XVIIème siècle.

Au pluriel, les « statistiques » signifient un ensemble de
données numériques relatives à un groupe d’individus.
Exemples:
-« Concrétisé en 2006 avec l’achèvement de la première opération, le programme INDH-Inmae a
pu, actuellement, grâce à l’implication et la mobilisation des équipes de Lydec, atteindre un
investissement de 470 millions de DH à fin 2015 –la Vie éco-Du 29 Juillet au 25 Aout
2016» ;
-« Lors du référendum du 23 Juin 2016, les Britanniques ont voté à 51,9% le Brexit, c’est-à-dire
la sortie du Royaume-Uni de l’Union européenne –Economie & Entreprises /Aout-Septembre
2016», etc.
Les chiffres avancés dans les phrases ci-dessus (470 millions de

DH, 51,9%) sont appelés des statistiques.
Au singulier, la « statistique » signifie un ensemble
des méthodes qui permettent de rassembler, de
présenter et d’analyser un ensemble de données
numériques.

Dans un premier temps, la statistique a été employée
dans un sens purement descriptif de recueil ou de
collection de faits chiffrés, les statistiques.
Dans un second temps, elle a été utilisée pour étendre

les résultats et dégager des lois (l’inférence). Elle vise
à dégager, à partir de données observées sur quelques
individus d’une population, des résultats valables pour
l’ensemble de la population.
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
La méthodologie statistique
la statistique descriptive qui consiste à remplacer des données
nombreuses par des indicateurs les plus pertinents possibles ainsi
qu’à les résumer sous forme de tableaux ou de graphiques (objet
du cours de « Statistique descriptive » en 1ère année);
l’inférence statistique qui est l’ensemble des méthodes qui

permettent de tirer des conclusions sur un groupe déterminé à
partir des données provenant d’un échantillon choisi dans cette
population, c’est-à-dire qui permettent la réalisation des
estimations et des tests d’hypothèses sur les caractéristiques
d’une population à partir des données de l’échantillon;
la théorie des probabilités (objet du cours du calcul des

probabilités en 2ème année) qui signifie l’analyse mathématique
des phénomènes dans lesquels le hasard intervient et qui est
utilisée pour déterminer les précisions des estimations de certains
paramètres (la théorie de l’estimation) ou des tests de certaines
hypothèses (la théorie des tests) : l’inférence statistique (objet du
cours de la statistique appliquée en 3ème année). 6
Le présent cours de « Statistique appliquée » se
compose de trois chapitres :
Chapitre 1- Les lois usuelles continues et

l’échantillonnage ;
Chapitre 2- L’estimation ponctuelle et l’estimation par

intervalle de confiance;
Chapitre 3- Les tests statistiques, la régression simple

et la régression multiple.

Références bibliographiques (liste non exhaustive) :
• ELHAFIDI (Mouloud) et TOUIJAR (Driss), Eléments de statistique d’aide à la
décision, cours et exercices résolus, Imp. INFOS-PRINT-FES, Mars 2000.
• GOLDFARB (Bernard) et PARDOUX (Catherine), Introduction à la méthode
statistique, Gestion-Economie, Edition DUNOD, 2000.
• LECOUTRE (Jean-Pierre), Statistique et probabilités-Travaux dirigés-, Edition
DUNOD, 2000.
• LECOUTRE (Jean-Pierre), Statistique et probabilités, Cours et exercices
corrigés, Edition DUNOD, 2012.
• LETHIELLEUX (Maurice), Exercices de statistiques et probabilités avec rappels
de cours en 12 fiches, Edition DUNOD, 2009.
• PUPION (Pierre-Charles), Statistique pour la gestion, Edition DUNOD, 2008.
• Etc.
Chapitre 1 - Les lois continues et
l’échantillonnage

Le sondage
aléatoire simple
Le sondage aléatoire stratifié

(pour une population
Méthodes hétérogène)
d’échantillonnage
probabiliste Le sondage par grappes
(pour une population
homogène)
Méthodes L’échantillonnage
d’échantillonnage systématique
L’échantillonnage
par commodité
Méthodes
d’échantillonnage
non probabiliste
L’échantillonnage
10 subjectif
Section 1- Les lois continues
1- La loi normale ou la loi de Laplace-Gauss
1-1- La loi normale centrée réduite
Définition:
Une gaussienne est une variable aléatoire qui peut prendre
toute valeur réelle et dont la densité de probabilité est donnée par :
1 −𝑥 2
𝑓 𝑥 = exp( ) ∀𝑥 ∈ ℝ.
2𝜋 2
où : 𝜋 ≅ 3,14159 et 𝑒𝑥𝑝 = 𝑒 ≅ 2,71828

La fonction de répartition :
La fonction de répartition d’une loi normale centrée réduite est

la fonction primitive de densité f : 𝐹 𝑥 = 𝑃 𝑋 < 𝑥 = 𝜋(𝑥).
𝑥
𝐹(𝑥) = −∞
𝑓 𝑡 𝑑𝑡
2
−𝑡
1 𝑥 ( )
𝐹(𝑥) = 𝑒 2 𝑑𝑡
2𝜋 −∞

Les caractéristiques :
E(X) = 0 et V(X) = 1.
On écrit X∼N(E(X) ; V(X)), c’est-à-dire X∼N(0 ; 1).

1-2- La loi normale générale 𝑵(𝝁; 𝝈𝟐 )
Définition:
X est une variable aléatoire continue qui suit la loi normale

si X est déduite de Y∼N(0 ; 1) par la transformation
linéaire suivante : X = a + b Y avec a ∈ ℝ et b ∈ ℝ∗ .

Moments :
E(X) = a et V(X) = b2
On pose : 𝑎 = 𝜇 et 𝑏 2 = 𝜎 2 .
Donc : X = 𝜇 + σ Y où E(X) = 𝜇 et V(X) = σ2
On écrit X∼N(𝜇 ; σ2).

Densité de probabilité :
−1 𝑥−𝜇 2
1
Elle est définie par : 𝑓 𝑥 = 𝑒2 ( 𝜎 ) ∀𝑥 ∈ ℝ.
𝜎 2𝜋
Où : 𝜋 ≅ 3,14159 et 𝑒 ≅ 2,71828

Fonction de répartition :
Elle est définie par : 𝐹 𝑥 = 𝑃 𝑋 < 𝑥 .

𝑥
𝐹(𝑥) = −∞
𝑓 𝑡 𝑑𝑡
−1 𝑡−𝜇 2
1 𝑥 ( 𝜎 )
𝐹(𝑥) = 𝑒 2 𝑑𝑡
𝜎 2𝜋 −∞

Remarques :
*Le point le plus élevé de la courbe normale correspond à la

moyenne, qui est également la médiane et le mode de la
distribution.
1
𝜎 2𝜋
𝑥 = 𝜇 = 𝑚𝑂 = 𝑚𝑒
18
*La moyenne de la distribution peut être négative, nulle ou
positive. Le graphique ci-dessous représente trois courbes
normales ayant le même écart-type 𝜎 mais trois moyennes
différentes (𝜇1 = -10, 𝜇2 = 0 et 𝜇3 = 20)
𝜇1 = -10 𝜇2 = 0 𝜇3 = 20

*La distribution normale est symétrique par rapport à la droite
𝑥 = 𝜇. Les queues de la courbe s’étendent à l’infini de chaque côté
et ne touchent jamais à l’axe horizontal.
𝑥=𝜇
*Plus l’écart-type est grand, plus la courbe sera large, aplatie,
traduisant ainsi une plus grande dispersion des données. Le
graphique ci-dessous représente deux distributions normales
de même moyenne 𝜇 mais avec des écarts type différents
(𝜎1 = 5 < 𝜎2 = 10)
1 = 5
2 = 10

*La courbe de la densité de probabilité de la loi normale admet deux points d’inflexion
aux points 𝜇 − 𝜎 et 𝜇 + 𝜎.
𝜇−𝜎 𝜇 𝜇+𝜎

Exemples:
1- Si 𝑋~𝑁(0; 1).
a-Calculer : 𝑃(𝑋 < 0,38) ; 𝑃(𝑋 < −0,38) ; et 𝑃( 𝑋 < 1,96).
b-Calculer la valeur du fractile t, telle que : 𝑃 𝑋 < 𝑡 = 0,8461 ;

et 𝑃 𝑋 < 𝑡 = 0,4483.
2-
a-Pour 𝑋~𝑁(4; 4) , calculer la valeur du réel t, telle que :

𝑃 𝑋 < 𝑡 = 0,8413.
b-Pour 𝑋~𝑁(−4; 25), calculer 𝑃 𝑋 < 1,65 .

2- La loi de Khi-deux
Définition:
Soient 𝑋1 , 𝑋2 , … , 𝑋𝑛 n variables aléatoires telles que :
𝑋𝑖 ~𝑁 0, 1 ∀𝑖 ∈ 1,2, … , 𝑛 .
Alors : 𝑋12 + 𝑋22 + ⋯ + 𝑋𝑛2 ~𝜒𝑛2 (la loi de Khi-deux à n d.d.l.)
Moments :
𝐸 𝜒𝑛2 = 𝑛 et 𝑉 𝜒𝑛2 = 2𝑛

Convergence de la loi de Khi-deux vers la loi
normale :
*Pour n ≥ 30, on peut utiliser :
soit l’approximation de Fisher : 2𝜒𝑛2 − 2𝑛 − 1 ≈ 𝑁 0, 1 , c’est-à-

dire :
𝑃 𝜒𝑛2 ≤ 𝑡 ≅ 𝐹 2𝑡 − 2𝑛 − 1 ∀𝑡 > 0;
*Pour n > 100, on peut utiliser :
2 −𝑛
𝜒𝑛
l'approximation suivante : ≈ 𝑁(0, 1)
2𝑛

Fonctions de densité de la loi de Khi-deux (pour 𝐧 = 𝟏 ;
𝐧 = 𝟓 ; 𝐧 = 𝟏𝟎 et 𝐧 = 𝟑𝟎):
=1
=5
= 10 = 30

3-La loi de Student
Définition :
On peut définir la loi de Student à partir d’une variable

aléatoire U de loi N(0,1) et d’une autre variable aléatoire
𝑈
indépendante Y de loi de 𝜒𝑛2 . Le rapport suit la loi de
𝑌
𝑛
Student à n degrés de liberté, notée 𝑇𝑛 .

Moments :
𝐸 𝑇𝑛 = 0 pour n > 1 ;
𝑛
et 𝑉 𝑇𝑛 = pour n > 2.
𝑛−2

Remarque :
𝑈
Lorsque n = 1, le rapport , qui est un rapport entre deux
𝑌
𝑛
variables normales indépendantes, suit une loi de Cauchy qui

n’admet aucun moment.

Fonctions de densité de la loi de Student (pour n=1 et n=5) :
𝑑𝑑𝑙 = 5
𝑑𝑑𝑙 = 1

4- La loi de Fisher-Snedecor :
Si U et V sont deux variables aléatoires indépendantes de

𝑈
lois respectives 𝜒𝑛2 et 2
𝜒𝑚 , alors le rapport 𝑉
𝑛
suit une loi de
𝑚
Fisher-Snedecor à n et m degrés de liberté, notée F(n, m).

Moments :
𝑚
𝐸 𝐹(𝑛, 𝑚) = pour m >2;
𝑚−2
2𝑚2 (𝑛+𝑚−2)
et 𝑉 𝐹(𝑛, 𝑚) = pour m > 4.
𝑛 𝑚−2 2 (𝑚−4)

Remarque :
𝑇𝑛2 ~𝐹(1, 𝑛)

Propriété de la fonction de répartition :
Pour trouver t tel que 𝑃 𝐹 𝑚, 𝑛 ≤ 𝑡 = 5% 𝑜𝑢 1% , on

utilise la propriété :
1
𝑃 𝐹 𝑚, 𝑛 ≤ 𝑡 = 𝑃 𝐹 𝑛, 𝑚 ≥ ∀𝑡 >0
𝑡
Soit 𝑓𝛼 (𝑚, 𝑛) le fractile t, d’ordre 𝛼, de la loi 𝐹(𝑚, 𝑛)

(avec 𝛼 = 5% 𝑜𝑢 1%).
1
est le fractile 1/t, d’ordre 1 − 𝛼, de la loi 𝐹(𝑛, 𝑚), c’est-à-
𝑓𝛼 (𝑚,𝑛)
1
dire : = 𝑓1−𝛼 (𝑛, 𝑚).
𝑓𝛼 (𝑚,𝑛)
34
5-8-Schéma synthétique des lois continues courantes
Soient : X1, X2, …, Xk gaussiennes centrées réduites ;
Y1, Y2, …, Ym gaussiennes centrées réduites ;
et toutes indépendantes.
La loi de khi-deux : La loi de khi-deux :

𝑘 𝑚
𝑋= 𝑋𝑖2 ~𝜒𝑘2 𝑌= 𝑌𝑗 2 ~𝜒𝑚

2
𝑖=1 𝑗 =1
Khi-deux à k degrés de liberté Khi-deux à m degrés de liberté
loi dissymétrique de moyenne loi dissymétrique de moyenne E(Y)=m et
E(X)=K et de variance V(X)=2k. de variance V(Y)=2m.
U~𝑁(0; 1)
U et X sont
indépendantes
La loi de Student : La loi de Fisher :

𝑈 F = F(k, m) =
𝑋/𝑘
𝑇𝑘 = 𝑌/𝑚
𝑋 Fisher-Snedecor à k et m degrés de liberté
𝑘 𝑚
Loi dissymétrique de moyenne E(F)=
Student à k degrés de liberté 𝑚 −2
loi symétrique de moyenne (pour m>2) et de variance
2𝑚 2 (𝑘+𝑚 −2)
E(𝑇𝑘 )=0 (pour k>1)et de variance V(F)=𝑘 (𝑚 −2)2 (𝑚 −4) (pour m>4).
𝑘
V(𝑇𝑘 )=𝑘−2 (pour k>2).
Section 2- L’échantillonnage
1-Echantillonnage aléatoire simple
Définitions :
*On appelle échantillon aléatoire simple celui où chaque
individu de la population a la même chance d’être choisi chaque
fois que l’on tire une observation. En d’autres termes, c’est un
échantillon dont les n observations 𝑋1 , 𝑋2 , … , 𝑋𝑛 sont
indépendantes. La loi de chaque observation est la même que
celle de la population. Chaque observation a alors même moyenne
et même écart-type que la population.

*(𝑋1 , 𝑋2 , … , 𝑋𝑛 ) sont n variables aléatoires indépendantes et de
même loi que celle de X (iid); il est appelé n-échantillon ou
échantillon de taille n de X.
𝐸 𝑋1 = 𝐸 𝑋2 = ⋯ = 𝐸 𝑋𝑛 = 𝐸 𝑋 = 𝜇
𝑉 𝑋1 = 𝑉 𝑋2 = ⋯ = 𝑉 𝑋𝑛 = 𝑉 𝑋 = 𝜎 2
Après tirage au sort, (𝑋1 , 𝑋2 , … , 𝑋𝑛 ) prennent les valeurs

(𝑥1 , 𝑥2 , … , 𝑥𝑛 ).
*La réalisation de l’échantillon (𝑋1 , 𝑋2 , … , 𝑋𝑛 ) est l’ensemble

des valeurs observées (𝑥1 , 𝑥2 , … , 𝑥𝑛 ).
*Une statistique Y sur un échantillon (𝑋1 , 𝑋2 , … , 𝑋𝑛 ) est une
variable aléatoire qui est une fonction mesurable des 𝑋𝑘 :
𝑌 = 𝑓(𝑋1 , 𝑋2 , … , 𝑋𝑛 ). En d’autres termes, une statistique est une
variable aléatoire fonction d’autres variables aléatoires.
La réalisation de la variable aléatoire Y (de la statistique Y)

est la valeur 𝑦 = 𝑓(𝑥1 , 𝑥2 , … , 𝑥𝑛 ).
Les statistiques sont utilisées pour estimer les

caractéristiques de la population totale. Les statistiques les plus
utilisées sont : la moyenne empirique, la variance empirique et la
fréquence empirique.
2-Caractéristiques de l’échantillonnage
(ou Statistiques d’échantillonnage)
2-1-Moyenne d’échantillonnage 𝑿 (ou moyenne empirique)
Pour estimer la moyenne de la population 𝜇, on utilise la

moyenne d’échantillonnage 𝑋.
Définition :
Soit 𝑋1 , 𝑋2 , … , 𝑋𝑛 un échantillon aléatoire simple de taille n,
on appelle moyenne d’échantillonnage (ou moyenne empirique)
1 𝑛
la statistique 𝑋 = 𝑖=1 𝑋𝑖 .
𝑛
1 𝑛
39
Sa réalisation est 𝑥 = 𝑖=1 𝑥𝑖 .
𝑛 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Moments de la moyenne d’échantillonnage :
*Espérance de la moyenne d’échantillonnage 𝑬 𝑿
Il convient de rappeler que chaque observation de l’échantillon

aléatoire 𝑋1 , 𝑋2 , … , 𝑋𝑛 a la même moyenne 𝜇 et la même variance
𝜎 2 que la population qui suit une loi quelconque notée :
𝑋~𝐿𝑄 𝜇, 𝜎 2 , où 𝜇 est la moyenne de la population et 𝜎 2 est sa
variance. Donc :
1 𝑛 1 𝑛 1 𝑛 𝑛𝜇
𝐸 𝑋 =𝐸 𝑖=1 𝑋𝑖 = 𝐸 𝑖=1 𝑋𝑖 = 𝑖=1 𝐸(𝑋𝑖 ) = =𝜇.
𝑛 𝑛 𝑛 𝑛
Résultat, l’espérance mathématique de 𝑋 est égale à la moyenne

de la population d’où est issu l’échantillon.
*Variance et écart-type de la moyenne
d’échantillonnage :
La variance de la moyenne d’échantillonnage est :
𝑛 𝑛 𝑛
1 1 1 𝑛𝜎 2 𝜎 2
𝑉 𝑋 =𝑉 𝑋𝑖 = 2𝑉 𝑋𝑖 = 2 𝑉(𝑋𝑖 ) = 2 =
𝑛 𝑛 𝑛 𝑛 𝑛
𝑖=1 𝑖=1 𝑖=1
𝜎
L’écart-type de la moyenne d’échantillonnage est : 𝜎𝑥 =
𝑛

Exemple:
On dispose d’une étude statistique où l’écart-type de

la moyenne d’échantillonnage est de 20. L’écart-type de
la population est égal à 500.
Quelle est la taille de l’échantillon utilisé dans cette
étude?

2-2-Variance d’échantillonnage 𝑺𝟐𝒆
(ou variance empirique)
La variance empirique d’un échantillon aléatoire simple

1 𝑛
𝑋1 , 𝑋2 , … , 𝑋𝑛 de X est la statistique : 𝑆𝑒2 = 𝑖=1(𝑋𝑖 − 𝑋 )2 .
𝑛
1 𝑛
Sa réalisation est : 𝑠𝑒2 = 𝑖=1(𝑥𝑖 − 𝑥 )2 .
𝑛

Moments de la variance d’échantillonnage :
*Espérance de la variance d’échantillonnage 𝑬 𝑺𝟐𝒆
𝑛−1 2 1
𝐸 𝑆𝑒2 = 𝜎 = (1 − )𝜎 2
𝑛 𝑛
Puisque la valeur moyenne de la variance empirique n’est pas exactement

égale à la variance de la population, on introduit la variance empirique
modifiée (ou corrigée), appelée la quasi-variance, qui a pour expression :
𝑛
2
1
𝑆 = (𝑋𝑖 − 𝑋)2
𝑛−1
𝑖=1
On aura alors : 𝐸 𝑆 2 = 𝜎 2

*Variance de la variance d’échantillonnage :
La variance de la variance d’échantillonnage est :
𝑛−1 2 𝑛−1 4
𝑉 𝑆𝑒2 = 𝜇4 − 𝜎4 +2 3 𝜎
𝑛3 𝑛
Où : 𝜇4 = 𝐸(𝑋 − 𝜇)4
La variance de la quasi-variance est :
𝜇4 𝑛−3
𝑉 𝑆2 = − 𝜎4
𝑛 𝑛(𝑛 − 1)

Exemple:
Soit X1 , X2 ,…,X25 un échantillon d’une variable aléatoire X

suivant une loi normale de moyenne m et de variance 𝜎 2 . Nous
observons :
25 25
𝑥𝑖 = 50,23 𝑒𝑡 𝑥𝑖2 = 25175,92.

𝑖=1 𝑖=1
Calculer les réalisations de la variance empirique 𝑠𝑒2 et de la
quasi-variance 𝑠 2 .

2-3-Proportion d’échantillonnage F
Si 𝑋1 , 𝑋2 , … , 𝑋𝑛 est un échantillon iid d’une loi de Bernoulli,

c’est-à-dire 𝑋𝑖 prend la valeur 1 si le i-ème élément tiré au hasard
dans la population a le caractère étudié ou 0 dans le cas contraire,
𝑋1 +𝑋2 +⋯+𝑋𝑛
alors la moyenne aléatoire de l’échantillon 𝑋 =
𝑛
correspond en fait à la proportion ou fréquence aléatoire sur

l’échantillon, notée F.
𝑛
1
𝐹= 𝑋𝑖
𝑛
𝑖=1

Moments de la fréquence d’échantillonnage :
*Espérance de la fréquence d’échantillonnage 𝑬 𝑭
Soit 𝑋1 , 𝑋2 , … , 𝑋𝑛 un échantillon iid d’une loi de

Bernoulli, c’est-à-dire 𝑋𝑖 ~𝐵(𝑝).
𝐸 𝐹 =𝑝
*Variance de la fréquence d’échantillonnage :
La variance de la fréquence d’échantillonnage est :
𝑝𝑞
𝑉 𝐹 =
𝑛
48
3-Distributions d’échantillonnage
3-1-Distribution d’échantillonnage de 𝑿
3-1-1- Cas de population normale
Lorsque la distribution de probabilité de la population est

normale, 𝑋~𝑁(𝜇; 𝜎 2 ), et la variance 𝜎 2 est connue, la distribution
d’échantillonnage de 𝑋 a une distribution de probabilité normale,
quelle que soit la taille de l’échantillon, et on écrit :
𝑋−𝜇
𝑈=𝜎 ~𝑁(0; 1)
𝑛
49
Remarque :
Dans le cas où la variance 𝜎 2 est inconnue (et 𝑛 < 30), on aura

également :
𝑋−𝜇
𝑈′ = ~𝑇𝑛−1 (variable de Student à n − 1 degrés de liberté)
𝑆
𝑛
50
Exemple :
En vue de juger si une entreprise est saine, l’économiste W. Beaver introduit
le ratio défini par le quotient de la marge brute d’autofinancement (cash flow)
par des dettes totales. Il démontre que le ratio des entreprises saines suit une loi
normale de moyenne µ=0,7 et d’écart-type égal à 𝜎 = 0,18.
1. Au vu d’un échantillon de 25 entreprises saines, quelle est la probabilité que

la moyenne des ratios de ces entreprises soit supérieure à 0,7484 ?
2. Supposons que le ratio des entreprises saines suit une loi normale de
moyenne µ=0,7 et d’écart-type inconnu. A partir d’un échantillon de 25
entreprises saines, l’écart-type est égal à 0,18 (se = 0,18). Quelle est la
probabilité que la moyenne des ratios des entreprises de cet échantillon soit
supérieure à 0,7484 ?
51
3-1-2- Cas de population quelconque
Théorème central limite
Lorsque n est grand (𝑛 ≥ 30) et la variance 𝜎 2 est connue, en
vertu du théorème de Lioupanoff, la distribution de 𝑋 peut être
𝜎2
approximée par la distribution normale 𝑁(𝜇; ) et l’on en déduit :
𝑛
𝑋−𝜇
𝑈=𝜎 ≈ 𝑁(0; 1)
𝑛
Le théorème central limite constitue la clé pour identifier la
forme de la distribution d’échantillonnage de 𝑋 lorsque la
distribution de la population est inconnue.
Remarque :
Dans le cas où la variance 𝜎 2 est inconnue et n est
𝑋−𝜇
grand (𝑛 ≥ 50), on aura également : 𝑈′ = 𝑆 ≈ 𝑁(0; 1).
𝑛

Exemple:
On dispose d’une étude statistique où l’écart-type de la

moyenne d’échantillonnage est de 20. L’écart-type de la
population est égal à 500.
1-Quelle est la taille de l’échantillon utilisé dans cette étude.
2-Quelle est la probabilité que la moyenne d’échantillonnage
s’écarte de plus ou moins 25 de la moyenne de la population.

3-2-Distribution d’échantillonnage de F
Lorsque 𝑋1 , 𝑋2 , … , 𝑋𝑛 est un échantillon iid d’une loi de

Bernoulli, on a, selon le théorème central limite, pour n grand et p ni
trop voisin de 0 ni trop proche de 1 (dans la pratique, pour
n ≥ 30; np ≥ 5 et nq = n(1 − p) ≥ 5):
𝐹−𝑝
≈ 𝑁(0; 1)
𝑝(1 − 𝑝)
𝑛
Où p est la proportion d’éléments de la population qui ont le
caractère étudié.
Exemple
La proportion des consommateurs du produit « Alpha » est

égale à 0,60 (p=0,60). On se propose prélever un échantillon
aléatoire de 100 consommateurs. Trouver un intervalle, centré en
p, dans lequel se trouve la fréquence des consommateurs dudit
produit de l’échantillon avec une probabilité de 95%.

56
3-3-Distribtion d’échantillonnage de 𝑺𝟐
Lorsque 𝑋1 , 𝑋2 , … , 𝑋𝑛 est un échantillon iid d’une loi

normale 𝑁(𝜇; 𝜎 2 ), où la moyenne 𝜇 est connue, on a quelle
que soit la taille n de l’échantillon :
𝑛 2
𝑋𝑖 − 𝜇
𝜃= ~𝜒𝑛2
𝜎
𝑖=1
Lorsque 𝑋1 , 𝑋2 , … , 𝑋𝑛 est un échantillon iid d’une loi

normale 𝑁(𝜇; 𝜎 2 ), où la moyenne 𝜇 est inconnue, on a quelle
(𝑛−1)𝑆 2 2
que soit la taille n de l’échantillon : 𝜃′ = ~𝜒𝑛−1 .
𝜎2
57
Exemple:
On prélève 25 pièces dans une production industrielle.
Une étude préalable a montré que le diamètre de ces
pièces suivait une loi gaussienne de moyenne 10mm et
d’écart-type 2mm. Entre quelles valeurs a-t-on 90% de
chances de trouver l’écart-type de ces pièces?
(On suppose que l’écart-type de ces pièces est
inférieur à la borne inférieure avec une probabilité
égale à 5%; et supérieur à la borne supérieure avec une
probabilité égale à 5% ) Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
58
Chapitre 2- l’estimation ponctuelle
et l’estimation par intervalle de
confiance

59
« Estimer » consiste, à partir des observations
obtenues sur un échantillon, à attribuer des valeurs
numériques aux paramètres de la population dont cet
échantillon est issu, parce qu’il est en général
impossible d’analyser toute la population.

60
En vue d’estimer les paramètres inconnus (la moyenne
𝜇, la proportion P et la variance 𝜎 2 ) de la population,
on peut faire soit une estimation ponctuelle ou une
estimation par intervalle de confiance.

61
Section 1- Estimation ponctuelle :
1- Définition de l’estimateur :
Soit X une variable aléatoire dont la distribution dépend d’un

paramètre 𝜃 qui appartient à l’espace des paramètres notée Θ. Soit
𝑋1 , 𝑋2 , … , 𝑋𝑛 un échantillon aléatoire de X de taille n et
𝑥1 , 𝑥2 , … , 𝑥𝑛 sa réalisation.
Un estimateur ponctuel de 𝜃 est une statistique 𝑇𝑛 de la forme

𝑇𝑛 = ℎ(𝑋1 , 𝑋2 , … , 𝑋𝑛 ) et sa réalisation est 𝑡𝑛 = ℎ(𝑥1 , 𝑥2 , … , 𝑥𝑛 ).

62
2-Propriétés d’un estimateur
2-1- Biais d’un estimateur :
Soit 𝑋1 , 𝑋2 , … , 𝑋𝑛 un échantillon aléatoire de taille n

relatif à la variable aléatoire parente X de loi qui dépend
du paramètre 𝜃. On appelle le biais 𝐵 d’un estimateur 𝑇𝑛
du paramètre 𝜃 l’écart entre sa moyenne 𝐸 𝑇𝑛 et la
vraie valeur du paramètre : 𝐵 = 𝐸 𝑇𝑛 − 𝜃.

63
Définitions :
Soit 𝑋1 , 𝑋2 , … , 𝑋𝑛 un échantillon aléatoire de taille n relatif à

la variable aléatoire parente X de loi qui dépend du paramètre 𝜃.
On appelle un estimateur sans biais du paramètre 𝜃 toute
statistique 𝑇𝑛 = ℎ(𝑋1 , 𝑋2 , … , 𝑋𝑛 ), telle que : 𝐸(𝑇𝑛 ) = 𝜃.
On appelle un estimateur asymptotiquement sans biais toute
statistique 𝑇𝑛 = ℎ(𝑋1 , 𝑋2 , … , 𝑋𝑛 ), telle que : lim 𝐸 𝑇𝑛 = 𝜃.

𝑛→∞
Exemples :
𝑋, 𝑆 2 et F sont respectivement des estimateurs sans biais des

paramètres : 𝜇, 𝜎 2 et P.
2-2- Convergence d’un estimateur :
Théorème :
Tout estimateur sans biais (𝐸 𝑇𝑛 = 𝜃), ou asymptotiquement
sans biais ( lim 𝐸 𝑇𝑛 = 𝜃 ), dont la variance tend vers zéro,

𝑛→∞
lim 𝑉 𝑇𝑛 = 0, est un estimateur convergent de 𝜃.

𝑛→∞

65
Exemple :
𝑋 est un estimateur convergent de la moyenne de la population

𝜇.
En effet, 𝑋 est un estimateur sans biais de 𝜇, car : 𝐸 𝑋 = 𝜇 ;

𝑉(𝑋)
et lim 𝑉 𝑋 = lim = 0.
𝑛→∞ 𝑛→∞ 𝑛

66
2-3- Efficacité d’un estimateur :
a-Qualité d’un estimateur :
La qualité d’un estimateur se mesure par l’erreur quadratique

moyenne, définie pour tout 𝜃 par :
𝐸𝑄 𝑇𝑛 = 𝑉 𝑇𝑛 + 𝐵2
Dans le cas particulier d’un estimateur sans biais, cette erreur

quadratique se confond avec la variance de l’estimateur.
Soient 𝑇𝑛 et 𝑇′𝑛 deux estimateurs sans biais de 𝜃. 𝑇𝑛 est un

estimateur efficace que 𝑇′𝑛 si :
𝑉 𝑇𝑛 ≤ 𝑉 𝑇′𝑛

b-Inégalité de Fréchet-Darmois-Cramer-Rao (FDCR) :
Théorème :
Soit 𝑋1 , 𝑋2 , … , 𝑋𝑛 un échantillon aléatoire de taille n relatif à la variable aléatoire

parente X de loi qui dépend du paramètre 𝜃 et 𝑇𝑛 une statistique définie sur
1
𝑋1 , 𝑋2 , … , 𝑋𝑛 . Si 𝑇𝑛 est un estimateur sans biais de 𝜃, alors : 𝑉 𝑇𝑛 ≥ = 𝐵𝐹 (𝜃).
𝐼𝑛 𝜃
𝜕𝐿𝑜𝑔𝑓(𝑥,𝜃) 2
Où : 𝐼𝑛 (𝜃) = 𝑛𝐸 est la quantité d’information de Fisher, avec :
𝜕𝜃
𝐿𝑜𝑔𝑓(𝑥, 𝜃) le logarithme népérien de la fonction de densité de X ;
et 𝐵𝐹 (𝜃) est la borne inférieure de FDCR.

68
Remarque :
La quantité d’information de Fisher peut être également calculée par la

𝜕2 𝐿𝑜𝑔𝐿(𝑥,𝜃)
formule suivante : 𝐼𝑛 (𝜃) = 𝐸 − où 𝐿𝑜𝑔𝐿(𝑥, 𝜃 ) est le logarithme
𝜕𝜃 2
népérien de la fonction de vraisemblance (likelihood) de l’échantillon

𝑋1 , 𝑋2 , … , 𝑋𝑛 définie par :
𝑛
𝐿 𝑥1 , 𝑥2 , … , 𝑥𝑛 , 𝜃 = 𝐿 𝑥, 𝜃 = 𝑖=1 𝑓(𝑥𝑖 , 𝜃), où : 𝑥1 , 𝑥2 , … , 𝑥𝑛 sont fixes et 𝜃
est variable.
Pour le cas d’une variable discrète :
𝐿 𝑥1 , 𝑥2 , … , 𝑥𝑛 , 𝜃 = 𝐿 𝑥, 𝜃 = 𝑃(𝑋 = 𝑥𝑖 ) ; 𝑖 = 1, 2, … , 𝑛.
𝑖=1

69
Exemple:
Calculer la quantité d’information de Fisher 𝐼𝑛 𝜇

de la loi normale.

70
c-Estimateur efficace :
Un estimateur sans bais 𝑇𝑛 est efficace si sa variance est

égale à la borne inférieure de FDCR :
1
𝑉 𝑇𝑛 =
𝐼𝑛 𝜃
71
3- Méthode de construction d’un estimateur :
Méthode du maximum de vraisemblance
72
Définition :
On appelle estimateur de maximum de vraisemblance du paramètre 𝜃, la valeur
𝜃, qui vérifie les deux conditions suivantes :
𝜕𝐿𝑜𝑔𝐿(𝑥, 𝜃)
=0
𝜕𝜃
𝜕 2 𝐿𝑜𝑔𝐿(𝑥, 𝜃)
2
<0
𝜕𝜃
où 𝐿𝑜𝑔𝐿(𝑥, 𝜃 ) est le logarithme népérien de la fonction de vraisemblance
(likelihood) de l’échantillon 𝑋1 , 𝑋2 , … , 𝑋𝑛 définie par :
𝑛
𝐿 𝑥1 , 𝑥2 , … , 𝑥𝑛 , 𝜃 = 𝐿 𝑥, 𝜃 = 𝑖=1 𝑓(𝑥𝑖 , 𝜃), où : 𝑥1 , 𝑥2 , … , 𝑥𝑛 sont fixes et 𝜃 est
variable.
Pour le cas d’une variable discrète :

73 𝑛
𝐿 𝑥1 , 𝑥2 , … , 𝑥𝑛 , 𝜃 = 𝐿 𝑥, 𝜃 = 𝑖=1 𝑃(𝑋 = 𝑥𝑖 ) ; 𝑖 = 1, 2, … , 𝑛.
Section 2- Estimation par intervalle de confiance :
Soit X une variable aléatoire dont la loi dépend d’un

paramètre inconnu 𝜃 . L’intervalle de confiance au
niveau de confiance 1 − 𝛼 pour un paramètre 𝜃 est un
intervalle qui contient 𝜃 avec une probabilité 1 − 𝛼.
Autrement dit, 𝑎, 𝑏 est un intervalle de confiance au
niveau de confiance 1 − 𝛼 pour un paramètre 𝜃 signifie
𝑃 𝑎 ≤ 𝜃 ≤ 𝑏 = 1 − 𝛼. Le niveau de confiance le plus
utilisé est 90%, 95% ou 99%.
1- Intervalle de confiance de la moyenne 𝝁 :
1-1- Cas de population normale :
1-1-1-Cas de variance connue :
Lorsque la distribution de probabilité de la population est normale, 𝑋~𝑁(𝜇; 𝜎 2 ), et la

variance 𝜎 2 est connue, la distribution d’échantillonnage de 𝑋 a une distribution de
𝜎2 𝑋−𝜇
probabilité normale (𝑋~𝑁 𝜇; 𝑜𝑢 𝜎 ~𝑁(0; 1)), quelle que soit la taille de l’échantillon,
𝑛 𝑛
et l’intervalle de confiance au niveau de confiance 1 − 𝛼 pour la moyenne 𝜇 admet pour

𝜎 𝜎
bornes : 𝑎 = 𝑥 − 𝑡1−𝛼 et 𝑏 = 𝑥 + 𝑡1−𝛼
2 𝑛 2 𝑛
𝛼
Où : 𝑥 est la réalisation de 𝑋 et 𝑡1−𝛼 est le fractile d’ordre 1 − 2 de la loi normale
2
centrée réduite.

75
1-1-2-Cas de variance inconnue :
Lorsque la distribution de probabilité de la population est normale,

𝑋~𝑁(𝜇; 𝜎 2 ), la variance 𝜎 2 est inconnue et la taille de l’échantillon est inférieure
𝑋−𝜇
à 30 (et 𝑛 < 30), la statistique 𝑆 suit la loi de Student à n-1 degrés de liberté
𝑛
𝑋−𝜇
(𝑆 ~𝑇𝑛−1 ) et l’intervalle de confiance au niveau de confiance 1 − 𝛼 pour la
𝑛
moyenne 𝜇 admet pour bornes :
𝑠 𝑠
𝑎 = 𝑥 − 𝑡1−𝛼 et 𝑏 = 𝑥 + 𝑡1−𝛼
2 𝑛 2 𝑛
𝛼
Où : 𝑥 est la réalisation de 𝑋 et 𝑡1−𝛼 est le fractile d’ordre 1 − de la loi de
2 2
Student à n-1 degrés de liberté.

76
Exemple :
Le chiffre d’affaires moyen d’un commerçant, calculé sur les

vingt-cinq derniers jours, est de 4000 dirhams, avec une quasi-
variance de valeur s2 = 360000 dirhams2 . Si on admet que son
chiffre d’affaires quotidien peut être représenté par une variable
aléatoire X de loi normale, d’espérance m et de variance σ2
inconnues, donnez un intervalle de confiance de niveau 0,95 pour
le paramètre m. Obtient-on le même intervalle si σ2 est connue, de
valeur σ2 = 360000 dirhams 2 ?

77
1-2- Cas de population quelconque
1-2-1-Cas de variance connue :
Lorsque la distribution de probabilité de la population est inconnue,
𝑋~𝐿𝑄(𝜇; 𝜎 2 ), la variance 𝜎 2 est connue et la taille de l’échantillon est grande
(𝑛 ≥ 30), en vertu du théorème central-limite, la distribution de 𝑋 peut être
𝜎2 𝑋−𝜇
approximée par la distribution normale 𝑁(𝜇; ) (ou encore 𝜎 ≈ 𝑁(0; 1)) et
𝑛 𝑛
l’intervalle de confiance au niveau de confiance 1 − 𝛼 pour la moyenne 𝜇 admet

pour bornes :
𝜎 𝜎
𝑎 = 𝑥 − 𝑡1−𝛼 et 𝑏 = 𝑥 + 𝑡1−𝛼
2 𝑛 2 𝑛
𝛼
Où : 𝑥 est la réalisation de 𝑋 et 𝑡1−𝛼 est le fractile d’ordre 1 − de la loi normale
2 2
centrée réduite.
1-2-2-Cas de variance inconnue :
Lorsque la distribution de probabilité de la population est inconnue,

𝑋~𝐿𝑄(𝜇; 𝜎 2 ), la variance 𝜎 2 est inconnue et la taille de l’échantillon est grande
(𝑛 ≥ 50 ou même 𝑛 ≥ 100), la distribution de 𝑋 peut être approximée par la
𝑠2 𝑋−𝜇
distribution normale 𝑁(𝜇; ) (𝑠 ≈ 𝑁(0; 1)) et l’intervalle de confiance au
𝑛 𝑛
niveau de confiance 1 − 𝛼 pour la moyenne 𝜇 admet pour bornes :
𝑠 𝑠
𝑎 = 𝑥 − 𝑡1−𝛼 et 𝑏 = 𝑥 + 𝑡1−𝛼
2 𝑛 2 𝑛
𝛼
Où : 𝑥 est la réalisation de 𝑋 et 𝑡1−𝛼 est le fractile d’ordre 1 − de la loi
2 2
normale centrée réduite.

79
Exemple :
Pour déterminer l’âge moyen de ses clients, une grande

entreprise de confection pour homme prélève un échantillon
aléatoire de 50 clients et trouve x = 36. Si l’on connait σ2 = 144 :
a- Donnez un intervalle de confiance de niveau 95 % pour l’âge

moyen m de l’ensemble des clients.
b- Pour le même seuil de confiance (95%), on veut réduire

l’amplitude de l’intervalle de façon précise, ± 2 années (la marge
d’erreur d’échantillonnage e est égale à e = 2). Quelle doit être alors
la taille de l’échantillon ?
80
2- Intervalle de confiance de la proportion 𝒑 :
Lorsque 𝑋1 , 𝑋2 , … , 𝑋𝑛 est un échantillon iid d’une loi de Bernoulli, la fréquence d’échantillonnage F
peut être approximée, en vertu du théorème central limite, pour n grand et p ni trop voisin de 0 ni trop
proche de 1 (dans la pratique, pour : n ≥ 30 ; np ≥ 5 et nq = n(1 − p) ≥ 5), par la loi normale:
𝑝𝑞 𝐹−𝑝
𝐹 ≈ 𝑁 𝑝; ou encore ≈ 𝑁(0; 1), et l’intervalle de confiance au niveau de confiance 1 − 𝛼
𝑛 𝑝(1−𝑝)
𝑛
𝑝(1−𝑝) 𝑝(1−𝑝)
pour la proportion 𝑝 admet pour bornes : 𝑎 = 𝑓 − 𝑡1−𝛼 et 𝑏 = 𝑓 + 𝑡1−𝛼
2 𝑛 2 𝑛
Puisque p et 1-p sont inconnue, on les remplace respectivement par f et 1-f et les bornes de
l’intervalle de confiance au niveau de confiance 1 − 𝛼 pour la proportion 𝑝 deviennent égales à:
𝑓(1−𝑓) 𝑓(1−𝑓)
𝑎 = 𝑓 − 𝑡1−𝛼 et 𝑏 = 𝑓 + 𝑡1−𝛼
2 𝑛 2 𝑛
Où : f est la proportion d’éléments de l’échantillon qui ont le caractère étudié et 𝑡1−𝛼 est le fractile
2
𝛼
d’ordre 1 − de la loi normale centrée réduite.
2

Exemple :
A la sortie d’une chaine de montage, 80 véhicules

automobiles tirés au sort sont testés de façon approfondie
et 5 d’entre eux présentent des défauts importants.
Donnez un intervalle de confiance de niveau 0,95 pour la
proportion p de véhicules fabriqués qui présentent des
défauts importants.

82
3- Intervalle de confiance de la variance 𝝈𝟐 :
3-1- Cas de moyenne connue
𝑛 𝑋𝑖 −𝜇 2
𝑋~𝑁(𝜇; 𝜎 2 ), et la moyenne 𝜇 est connue, 𝜃 = 𝑖=1 ~𝜒𝑛2 , quelle
𝜎
que soit la taille de l’échantillon, et l’intervalle de confiance au niveau de

confiance 1 − 𝛼 pour la variance 𝜎 2 admet pour bornes :
𝑛 2 𝑛 2
𝑖=1(𝑥𝑖 −𝜇) 𝑖=1(𝑥𝑖 −𝜇)
𝑎= et 𝑏 =
𝑘 𝛼 𝑘 𝛼
𝑛;1− 2 𝑛;
2
𝛼 𝛼
Où : 𝑘𝑛;1−𝛼 et 𝑘𝑛; 𝛼 sont respectivement les fractiles d’ordre 1 − et
2 2 2 2
de loi de khi-deux à n degrés de liberté.

83
3-2- Cas de moyenne inconnue

(𝑛−1)𝑆 2 2
𝑋~𝑁(𝜇; 𝜎 2 ), et la moyenne 𝜇 est inconnue, 𝜃′ = ~𝜒𝑛−1 , quelle
𝜎2
que soit la taille de l’échantillon, et l’intervalle de confiance au niveau

de confiance 1 − 𝛼 pour la variance 𝜎 2 admet pour bornes :
(𝑛−1)𝑆 2 (𝑛−1)𝑆 2
𝑎= et 𝑏 =
𝑘 𝛼 𝑘 𝛼
𝑛−1;1− 2 𝑛−1; 2
𝛼
Où : 𝑘𝑛−1;1−𝛼 et 𝑘𝑛−1; 𝛼 sont respectivement les fractiles d’ordre 1 −
2 2 2
𝛼
et de loi de khi-deux à n-1 degrés de liberté.
2
Chapitre 3- La régression simple, la
régression multiple et les tests
statistiques

*Le modèle de régression simple : une variable endogène (ou variable
expliquée) (𝑦) est expliquée par une seule variable exogène (ou variable
explicative) (𝑥).
*Le modèle de régression multiple, qui est une extension du modèle de régression
simple, où une variable endogène (𝑦) est expliquée par plusieurs variables exogènes (𝑥1 ,
𝑥2 , …, 𝑥𝑘 ).
*La validation statistique d’un modèle de régression simple ou multiple via l’étude de sa
qualité d’ajustement et à l’aide des tests statistiques (test de significativité de chaque
coefficient du modèle estimé (le test de Student), le test de significativité globale du
modèle estimé (le test de Fisher), le test d’autocorrélation des résidus (le test de Durbin-
Watson), etc).
86
Section 1- Rappel sur la régression simple

Section 2- La régression multiple et les tests
statistiques
Une variable endogène ( 𝑦 ) est expliquée par plusieurs

variables exogènes (𝑥1 , 𝑥2 , …, 𝑥𝑘 ):
𝑦𝑡 = 𝑎0 + 𝑎1 𝑥1𝑡 + 𝑎2 𝑥2𝑡 + ⋯ + 𝑎𝑘 𝑥𝑘𝑡 + 𝜀𝑡 pour t=1,…, n

1- Estimation des coefficients du modèle de régression
multiple
Exemple : Une entreprise cherche à déterminer quelles sont

les influences de la promotion auprès des distributeurs 𝑥1 (en
milliers d’unités monétaires) et la promotion auprès des
consommateurs 𝑥2 (en milliers d’unités monétaires) sur les
ventes en tonnes (𝑦). Le tableau ci-dessous présente les données
annuelles de ces 3 variables sur une période de 10 ans.

Tableau-Ventes, promotion auprès des distributions et promotion auprès des
consommateurs
Date 𝑦 𝑥1 𝑥2
1 49 53 200
2 40 53 212
3 41 50 211
4 46 64 212
5 52 70 203
6 59 68 194
7 53 59 194
8 61 73 188
9 55 59 196
10 64 71 190

-La première étape consiste à importer des données Excel. Après
avoir ouvert le logiciel SPSS, on choisit <Fichier> <Ouvrir>
<Données> et on sélectionne l’option Excel dans la fenêtre type
de fichiers.
Dans l’exemple de ce chapitre, on se propose d’expliquer les

ventes en tonnes (𝑦) par la promotion auprès des distributeurs (𝑥1 )
et par la promotion auprès des consommateurs (𝑥2 ). D’où le
modèle linéaire à deux variables explicatives suivant :
𝑦𝑡 = 𝑎0 + 𝑎1 𝑥1𝑡 + 𝑎2 𝑥2𝑡 + 𝜀𝑡

-L’estimation de ce modèle sous SPSS :
On choisit <Analyse> <Régression> <Linéaire>. Dans la

fenêtre « Régression linéaire », insérer 𝑦 (nom de la variable
expliquée 𝑦 (variable endogène)) dans la case « Variable
dépendante » et 𝑥1 et 𝑥2 (les noms des variables explicatives
(variable exogène)) dans la case « Variable indépendantes ».

Dans l’option « statistiques » de cette fenêtre, on coche
« estimations », « qualité d’ajustement », « variation de R-deux »
et « intervalle de confiance », et cliquer sur « poursuivre », puis
sur « ok ». On obtient ainsi les résultats suivants :
Récapitulatif des modèlesb
Erreur Changement dans les statistiques
R-deux standard de Variation

Modèle R R-deux ajusté l'estimation de R-deux Variation de F ddl1 ddl2 Sig. Variation de F Durbin-Watson
1 ,981a ,963 ,952 1,777 ,963 90,603 2 7 ,000 1,713
a. Valeurs prédites : (constantes), X2, X1

b. Variable dépendante : Y
Coefficients non Coefficients 95,0% % intervalles de
standardisés standardisés confiance pour B
Erreur Borne Limite

Modèle B standard Bêta T Sig. inférieure supérieure
1 (Constante) 156,083 20,265 7,702 ,000 108,164 204,002

X1 ,360 ,089 ,370 4,023 ,005 ,148 ,571
X2 -,632 ,082 -,710 -7,711 ,000 -,826 -,438
-le modèle estimé à partir de notre échantillon d’observations est :
𝑦𝑡 = 156,083 + 0,36 𝑥1𝑡 − 0,632 𝑥2𝑡 + 𝑒𝑡

2- Analyse de la variance, qualité d’ajustement et
tests statistiques
*Le coefficient de détermination 𝑹𝟐 et 𝑹𝟐 ajusté 𝑹𝟐 :
𝑅2 = 0,963
𝑛−1 9
𝑅2 =1− 2
1 − 𝑅 = 1 − 1 − 0,963 = 0,952
𝑛−𝑘−1 7
Les coefficients de détermination simple et corrigé 𝑅2 et 𝑅2 sont

assez proche de 1. La part expliquée par le modèle dans la
variance de 𝑦𝑡 est importante 96%. Le modèle permet d’expliquer
96% des variations de 𝑦𝑡 .
95
*Le test de Student : Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
|𝑎𝑖 |
Les « t-Statistics » : les t-statistiques 𝑡𝑐 = 𝑡𝑎𝑖 ,10 =
𝜎𝑎
𝑖
Pour le test de la significativité des variables explicatives de notre modèle estimé, on teste si chaque
coefficient de ces variables explicatives est significativement différent de 0 pour un seuil choisi, en général
𝛼 = 5 %. Le test de Student s’écrit comme suit:
𝐻0 : 𝑎𝑖 = 0
𝐻1 : 𝑎𝑖 ≠ 0
|𝑎𝑖 |
Pour 𝑎 = 0, la statistique = 𝑡𝑎∗ 𝑖 ~𝑇𝑛−𝑘−1 . La valeur donnée par la table de Student à 7 degrés de
𝜎𝑎
𝑖
𝛼/2
liberté et pour α=0,05 est : 𝑡𝑛−𝑘−1 = 𝑡70,025 = 2,365. Les « t-statistics » 𝑡𝑐 lui sont largement supérieurs :
|𝑎0 | |156,083| 𝛼/2

𝑡𝑐 = 𝑡𝑎0 ,10 = = = 7,702 > 𝑡𝑛−𝑘−1 = 2,365 ;
𝜎𝑎0 20,265
|𝑎1 | |0,36| 𝛼/2

𝑡𝑐 = 𝑡𝑎1 ,10 = = = 4,023 > 𝑡𝑛−𝑘−1 = 2,365 ;
𝜎𝑎1 0,089
|𝑎2 | | − 0,632| 𝛼/2

96 𝑡𝑐 = 𝑡𝑎2 ,10 = = = 7,711 > 𝑡𝑛−𝑘−1 = 2,365.
𝜎𝑎2 0,082
𝛼/2
Puisque les 𝑡𝑐 > 𝑡𝑛−𝑘−1 et/ou les p-values du test de
significativité individuelle des coefficients : p-values < α = 0,05,
alors on rejette l’hypothèse 𝐻0 de nullité du coefficient au seuil de
5%. En conséquence, les coefficients du modèle sont, d’une
manière individuelle, significativement différent de zéro.

*Le test de Fisher
La statistique de Fisher (F-statistic) du test de significativité
globale de la régression.
𝑛 2 /𝑘 𝑛 2
𝑡=1(𝑦𝑡
− 𝑦 ) 𝑡=1(𝑦𝑡 − 𝑦) /𝑘 𝑅2 /𝑘
𝐹 ∗ = 𝐹𝛼 𝑘, 𝑛 − 𝑘 − 1 = 𝑛 2 /𝑛 − 𝑘 − 1 = 𝑛 2
=
(𝑦
𝑡=1 𝑡 − 𝑦𝑡 ) 𝑡=1 𝑒𝑡 /𝑛 − 𝑘 − 1 (1 − 𝑅2 )/𝑛 − 𝑘 − 1
La régression est jugé significative si la variabilité expliquée est

significativement différente de 0. Le test de Fisher s’écrit comme
suit :
𝐻0 : 𝑎 = 0 (𝐻0 : 𝑎1 = 𝑎2 = 0)
𝐻1 : 𝑎 ≠ 0

Sous l’hypothèse 𝐻0 , 𝐹 ∗ suit une loi de Fisher au seuil 𝛼 à k et
(n-k-1) degrés de liberté (rapport de deux khi-deux). Nous
comparons donc ce 𝐹 ∗ calculé au F théorique à k et (n-k-1) d.d.l.
La règle de décision est la suivante :
Si 𝐹 ∗ > 𝐹 nous rejetons l’hypothèse 𝐻0 et le modèle est alors

globalement explicatif.
Si 𝐹 ∗ ≤ 𝐹 nous acceptons l’hypothèse 𝐻0 .

99
b
ANOVA
Somme des Moyenne des

Modèle carrés Ddl carrés D Sig.
a
1 Régression 571,907 2 285,954 90,603 ,000
Résidu 22,093 7 3,156
Total 594,000 9
a. Valeurs prédites : (constantes), X2, X1
b. Variable dépendante : Y
571,907/2
𝐹∗ = 𝐹𝛼 𝑘, 𝑛 − 𝑘 − 1 = = 90,602
22,093/7

La valeur donnée par la table de Fisher à (2 ; 7) degrés de
liberté et pour α=0,05 est 𝐹𝛼 = 4,74. Le F-statistic 𝐹𝑐 donné par la
table des résultats lui est aussi largement supérieur :
𝐹𝑐 = 90,602 > 𝐹𝛼 = 𝐹0,05 2; 7 = 4,74.
Puisque 𝐹𝑐 > 𝐹𝛼 et /ou la p-value 0,000<0,05, alors on rejette

l’hypothèse 𝐻0 de nullité de tous les coefficients au seuil de 5%.
Par conséquent, tous les coefficients du modèle sont, d’une
manière globale, significativement différents de zéro.

*Le test d’autocorrélation des résidus :
On utilise la statistique de Durbin Watson du test d’autocorrélation des résidus
(d’ordre 1).
Les valeurs caractéristiques qui découlent de la table de DW pour n=10 et k=2 sont :
0 0,697 1,641 2 2,359 3,303 4
Zone Zone de Zone Zone Zone de Zone

d’autocorrélation doute d’indépendance d’indépendance doute d’autocorrélation
positive
La valeur fournie par la statistique de DW est égale à 1,713. Elle est comprise entre
1,641 et 2. Elle tombe dans la zone d’indépendance des résidus.

Résultats :
𝑦𝑡 = 156,083 + 0,36 𝑥1𝑡 − 0,632 𝑥2𝑡 + 𝑒𝑡
Où 𝑎0 = 156,083 ; 𝑎1 = 0,36 ; 𝑒𝑡 𝑎2 = −0,632
𝑥1 , c’est-à-dire la promotion auprès des distributeurs, agit positivement sur les

ventes en tonnes, alors que 𝑥2 , c’est-à-dire la promotion auprès les
consommateurs agit négativement sur les ventes en tonnes.
Si la variable explicative 𝑥1 augmente d’une unité alors que toutes les autres
variables explicatives sont fixes, la variable expliquée se verra augmenter en
moyenne de 𝑎1 = 0,36 unité.
Si la variable explicative 𝑥2 augmente d’une unité alors que toutes les autres
variables explicatives sont fixes, la variable expliquée se verra diminuer en
moyenne de 𝑎2 = −0,632 unité.
Références bibliographiques :
• BOURBONNAIS, (Régis), et TERRAZA, (Michel), Analyse des séries temporelles, Dunod,

Paris, 2004.
• BOURBONNAIS, (Régis), Econométrie, 7ème édition DUNOD, Janvier 2009.
• ELHAFIDI, (Mouloud), et TOUIJAR, (Driss), Eléments de statistique d’aide à la décision,

cours et exercices résolus, Imp. INFOS-PRINT-FES, Mars 2000.
• GOLDFARB, (Bernard), et PARDOUX, (Catherine), Introduction à la méthode statistique,

Gestion-Economie, Edition DUNOD, 2000.
• LECOUTRE, (Jean-Pierre), Statistique et probabilités-Travaux dirigés-, Edition DUNOD, 2000.
• LECOUTRE, (Jean-Pierre), Statistique et probabilités, Cours et exercices corrigés, Edition

DUNOD, 2012.
• LETHIELLEUX, (Maurice), Exercices de statistiques et probabilités avec rappels de cours en

12 fiches, Edition DUNOD, 2009.
• PUPION, (Pierre-Charles), Statistique pour la gestion, Edition DUNOD, 2008.


Cours de Statistique appliquée-S5-ENCG Fès-Pr. Abdessamad OUCHEN-2020 2021

Transféré par

Informations du document

Copyright

Formats disponibles

Partager ce document

Partager ou intégrer le document

Options de partage

Avez-vous trouvé ce document utile ?

Ce contenu est-il inapproprié ?

Droits d'auteur :

Formats disponibles

Cours de Statistique appliquée-S5-ENCG Fès-Pr. Abdessamad OUCHEN-2020 2021

Transféré par

Droits d'auteur :

Formats disponibles

Enseignant: Abdessamad OUCHEN

Année universitaire: 2020-2021

1 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

Le mot statistique tire son origine du latin

Il est apparu vers le milieu du XVIIème siècle.

2 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

Les chiffres avancés dans les phrases ci-dessus (470 millions de

4 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

Dans un second temps, elle a été utilisée pour étendre

l’inférence statistique qui est l’ensemble des méthodes qui

la théorie des probabilités (objet du cours du calcul des

Chapitre 1- Les lois usuelles continues et

Chapitre 2- L’estimation ponctuelle et l’estimation par

Chapitre 3- Les tests statistiques, la régression simple

7 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

9 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

Le sondage aléatoire stratifié

1- La loi normale ou la loi de Laplace-Gauss

1-1- La loi normale centrée réduite

où : 𝜋 ≅ 3,14159 et 𝑒𝑥𝑝 = 𝑒 ≅ 2,71828

La fonction de répartition d’une loi normale centrée réduite est

12 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

On écrit X∼N(E(X) ; V(X)), c’est-à-dire X∼N(0 ; 1).

13 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

X est une variable aléatoire continue qui suit la loi normale

14 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

Donc : X = 𝜇 + σ Y où E(X) = 𝜇 et V(X) = σ2

On écrit X∼N(𝜇 ; σ2).

15 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

16 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

Elle est définie par : 𝐹 𝑥 = 𝑃 𝑋 < 𝑥 .

17 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

*Le point le plus élevé de la courbe normale correspond à la

19 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

21 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

22 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

a-Calculer : 𝑃(𝑋 < 0,38) ; 𝑃(𝑋 < −0,38) ; et 𝑃( 𝑋 < 1,96).

b-Calculer la valeur du fractile t, telle que : 𝑃 𝑋 < 𝑡 = 0,8461 ;

a-Pour 𝑋~𝑁(4; 4) , calculer la valeur du réel t, telle que :

b-Pour 𝑋~𝑁(−4; 25), calculer 𝑃 𝑋 < 1,65 .

Alors : 𝑋12 + 𝑋22 + ⋯ + 𝑋𝑛2 ~𝜒𝑛2 (la loi de Khi-deux à n d.d.l.)

24 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

soit l’approximation de Fisher : 2𝜒𝑛2 − 2𝑛 − 1 ≈ 𝑁 0, 1 , c’est-à-

*Pour n > 100, on peut utiliser :

25 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

26 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

On peut définir la loi de Student à partir d’une variable

Student à n degrés de liberté, notée 𝑇𝑛 .

27 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

28 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

variables normales indépendantes, suit une loi de Cauchy qui

29 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

30 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

Si U et V sont deux variables aléatoires indépendantes de

Fisher-Snedecor à n et m degrés de liberté, notée F(n, m).

31 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

32 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

33 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès

Pour trouver t tel que 𝑃 𝐹 𝑚, 𝑛 ≤ 𝑡 = 5% 𝑜𝑢 1% , on

Soit 𝑓𝛼 (𝑚, 𝑛) le fractile t, d’ordre 𝛼, de la loi 𝐹(𝑚, 𝑛)

La loi de khi-deux : La loi de khi-deux :

𝑋= 𝑋𝑖2 ~𝜒𝑘2 𝑌= 𝑌𝑗 2 ~𝜒𝑚

La loi de Student : La loi de Fisher :

36 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès