Académique Documents
Professionnel Documents
Culture Documents
-« Lors du référendum du 23 Juin 2016, les Britanniques ont voté à 51,9% le Brexit, c’est-à-dire
la sortie du Royaume-Uni de l’Union européenne –Economie & Entreprises /Aout-Septembre
2016», etc.
Méthodes L’échantillonnage
d’échantillonnage systématique
L’échantillonnage
par commodité
Méthodes
d’échantillonnage
non probabiliste
L’échantillonnage
10 subjectif
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Section 1- Les lois continues
Définition:
Une gaussienne est une variable aléatoire qui peut prendre
toute valeur réelle et dont la densité de probabilité est donnée par :
! $% !
𝑓 𝑥 = exp( ) ∀𝑥 ∈ ℝ.
"# "
E(X) = 0 et V(X) = 1.
Définition:
E(X) = a et V(X) = b2
On pose : 𝑎 = 𝜇 et 𝑏 # = 𝜎 # .
"$ %"& !
! ( ' )
Elle est définie par : 𝑓 𝑥 = ) "#
𝑒 ! ∀𝑥 ∈ ℝ.
Où : 𝜋 ≅ 3,14159 et 𝑒 ≅ 2,71828
1
𝜎 √2𝜋
𝑥 = 𝜇 = 𝑚𝑂 = 𝑚𝑒
18
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
*La moyenne de la distribution peut être négative, nulle ou
positive. Le graphique ci-dessous représente trois courbes
normales ayant le même écart-type 𝜎 mais trois moyennes
différentes (𝜇! = -10, 𝜇" = 0 et 𝜇* = 20)
𝜇1 = -10 𝜇2 = 0 𝜇3 = 20
𝑥=𝜇
20 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
*Plus l’écart-type est grand, plus la courbe sera large, aplatie,
traduisant ainsi une plus grande dispersion des données. Le
graphique ci-dessous représente deux distributions normales
de même moyenne 𝜇 mais avec des écarts type différents
(𝜎! = 5 < 𝜎" = 10)
𝜎! = 5
𝜎$ = 10
𝜇−𝜎 𝜇 𝜇+𝜎
1- Si 𝑋~𝑁(0; 1).
2-
Définition:
Soient 𝑋!, 𝑋", … , 𝑋+ n variables aléatoires telles que :
𝑋, ~𝑁 0, 1 ∀𝑖 ∈ 1,2, … , 𝑛 .
Moments :
𝐸 𝜒+" = 𝑛 et 𝑉 𝜒+" = 2𝑛
𝑃 𝜒!" ≤ 𝑡 ≅ 𝐹 2𝑡 − 2𝑛 − 1 ∀𝑡 >0;
" $!
#!
l'approximation suivante : ≈ 𝑁(0, 1)
"!
𝑑𝑑𝑙 = 1
𝑑𝑑𝑙 = 5
𝑑𝑑𝑙 = 10 𝑑𝑑𝑙 = 30
-
indépendante Y de loi de 𝜒+" . Le rapport suit la loi de
(
)
𝐸 𝑇+ = 0 pour n > 1 ;
+
et 𝑉 𝑇+ = +$"
pour n > 2.
-
Lorsque n = 1, le rapport , qui est un rapport entre deux
(
)
𝑑𝑑𝑙 = 5
𝑑𝑑𝑙 = 1
.
𝐸 𝐹(𝑛, 𝑚) = .$" pour m >2;
".! (+0.$")
et 𝑉 𝐹(𝑛, 𝑚) = pour m > 4.
+ .$" ! (.$1)
𝑇$# ~𝐹(1, 𝑛)
1
𝑃 𝐹 𝑚, 𝑛 ≤ 𝑡 = 𝑃 𝐹 𝑛, 𝑚 ≥ ∀𝑡 >0
𝑡
𝑖=1 𝑗 =1
Khi-deux à k degrés de liberté Khi-deux à m degrés de liberté
loi dissymétrique de moyenne loi dissymétrique de moyenne E(Y)=m et
E(X)=K et de variance V(X)=2k. de variance V(Y)=2m.
U~𝑁(0; 1)
U et X sont
indépendantes
𝐸 𝑋! = 𝐸 𝑋" = ⋯ = 𝐸 𝑋+ = 𝐸 𝑋 = 𝜇
𝑉 𝑋! = 𝑉 𝑋" = ⋯ = 𝑉 𝑋+ = 𝑉 𝑋 = 𝜎 "
Définition :
Soit 𝑋!, 𝑋", … , 𝑋+ un échantillon aléatoire simple de taille n,
on appelle moyenne d’échantillonnage (ou moyenne empirique)
! +
d
la statistique 𝑋 = + ∑,6! 𝑋, .
! +
Sa réalisation est 𝑥̅ = ∑,6! 𝑥, .
39 + Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Moments de la moyenne d’échantillonnage :
b
*Espérance de la moyenne d’échantillonnage 𝑬 𝑿
! + ! ! +7
𝐸 𝑋d = 𝐸 ∑ 𝑋
+ ,6! ,
= + 𝐸 ∑+,6! 𝑋, = + ∑+,6! 𝐸(𝑋, ) = +
=𝜇.
! ! !
1 1 1 𝑛𝜎 " 𝜎 "
𝑉 𝑋4 = 𝑉 7 𝑋* = " 𝑉 7 𝑋* = " 7 𝑉(𝑋* ) = " =
𝑛 𝑛 𝑛 𝑛 𝑛
*+, *+, *+,
/
L’écart-type de la moyenne d’échantillonnage est : 𝜎.̅ =
!
!
Sa réalisation est : 𝑠8" = + ∑+,6!(𝑥, − 𝑥)̅ ".
&
1
"
𝑆 = 1 "
/(𝑋# − 𝑋)
𝑛−1
#$%
Où : 𝜇1 = 𝐸(𝑋 − 𝜇)1
𝜇1 𝑛−3
𝑉 𝑆" = − 𝜎1
𝑛 𝑛(𝑛 − 1)
𝐸 𝐹 =𝑝
𝑝𝑞
𝑉 𝐹 =
𝑛
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
48
3-Distributions d’échantillonnage
b
3-1-Distribution d’échantillonnage de 𝑿
𝑋d − 𝜇
𝑈=𝜎 ~𝑁(0; 1)
s 𝑛
Dans le cas où la variance 𝜎 " est inconnue (et 𝑛 < 30), on aura
également :
d−𝜇
𝑋
𝑈> = ~𝑇+$! (variable de Student à n − 1 degrés de liberté)
𝑆s
𝑛
50
Exemple :
En vue de juger si une entreprise est saine, l’économiste W. Beaver introduit
le ratio défini par le quotient de la marge brute d’autofinancement (cash flow)
par des dettes totales. Il démontre que le ratio des entreprises saines suit une loi
normale de moyenne µ=0,7 et d’écart-type égal à 𝜎 = 0,18.
𝑋d − 𝜇
𝑈=𝜎 ≈ 𝑁(0; 1)
s 𝑛
1
678
grand (𝑛 ≥ 50), on aura également : 𝑈′ = ! ≈ 𝑁(0; 1).
9 "
𝐹−𝑝
≈ 𝑁(0; 1)
𝑝(1 − 𝑝)
𝑛
Où p est la proportion d’éléments de la population qui ont le
caractère étudié.
55 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Exemple
1- Définition de l’estimateur :
Exemples :
Théorème :
+,-./(1,)) "
Où : 𝐼& (𝜃) = 𝑛𝐸 est la quantité d’information de Fisher, avec :
+)
&
𝐿 𝑥% , 𝑥" , … , 𝑥& , 𝜃 = 𝐿 𝑥, 𝜃 = H 𝑃(𝑋 = 𝑥# ) ; 𝑖 = 1, 2, … , 𝑛.
#$%
1
𝑉 𝑇$ =
𝐼$ 𝜃
71
3- Méthode de construction d’un estimateur :
Méthode du maximum de vraisemblance
72
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Définition :
On appelle estimateur de maximum de vraisemblance du paramètre 𝜃, la valeur
N qui vérifie les deux conditions suivantes :
𝜃,
𝜕𝐿𝑜𝑔𝐿(𝑥, 𝜃)
=0
𝜕𝜃
𝜕 " 𝐿𝑜𝑔𝐿(𝑥, 𝜃)
" <0
𝜕𝜃
où 𝐿𝑜𝑔𝐿(𝑥, 𝜃 ) est le logarithme népérien de la fonction de vraisemblance
(likelihood) de l’échantillon 𝑋% , 𝑋" , … , 𝑋& définie par :
𝐿 𝑥% , 𝑥" , … , 𝑥& , 𝜃 = 𝐿 𝑥, 𝜃 = ∏&#$% 𝑓(𝑥# , 𝜃), où : 𝑥% , 𝑥" , … , 𝑥& sont fixes et 𝜃 est
variable.
&! (
)*+
H
probabilité normale (𝑋~𝑁 𝜇; 𝑜𝑢 " ~𝑁(0; 1)), quelle que soit la taille de l’échantillon,
' , #
.
Où : 𝑥̅ est la réalisation de 𝑋H et 𝑡-*$ est le fractile d’ordre 1 − de la loi normale
! %
centrée réduite.
4
567
à 30 (et 𝑛 < 30), la statistique # suit la loi de Student à n-1 degrés de liberté
8 !
4
567
(# ~𝑇&6% ) et l’intervalle de confiance au niveau de confiance 1 − 𝛼 pour la
8 !
9 9
𝑎 = 𝑥̅ − 𝑡%6$ et 𝑏 = 𝑥̅ + 𝑡%6$
" & " &
:
Où : 𝑥̅ est la réalisation de 𝑋1 et 𝑡%6$ est le fractile d’ordre 1 − de la loi de
" "
Student à n-1 degrés de liberté.
;" 4
567
approximée par la distribution normale 𝑁(𝜇; ) (ou encore % ≈ 𝑁(0; 1)) et
& 8 !
; ;
𝑎 = 𝑥̅ − 𝑡%6$ et 𝑏 = 𝑥̅ + 𝑡%6$
" & " &
:
Où : 𝑥̅ est la réalisation de 𝑋1 et 𝑡%6$ est le fractile d’ordre 1 − de la loi normale
" "
centrée réduite.
78 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
1-2-2-Cas de variance inconnue :
9" 4
567
distribution normale 𝑁(𝜇; & ) (& ≈ 𝑁(0; 1)) et l’intervalle de confiance au
8 !
9 9
𝑎 = 𝑥̅ − 𝑡%6$ et 𝑏 = 𝑥̅ + 𝑡%6$
" & " &
:
Où : 𝑥̅ est la réalisation de 𝑋1 et 𝑡%6$ est le fractile d’ordre 1 − de la loi
" "
normale centrée réduite.
*+ ,-*
𝑁 𝑝; )
ou encore ≈ 𝑁(0; 1), et l’intervalle de confiance au niveau de confiance 1 − 𝛼 pour la
!(#$!)
&
*('-*) *('-*)
proportion 𝑝 admet pour bornes : 𝑎 = 𝑓 − 𝑡'-' )
et 𝑏 = 𝑓 + 𝑡'-' )
( (
Puisque p et 1-p sont inconnue, on les remplace respectivement par f et 1-f et les bornes de
l’intervalle de confiance au niveau de confiance 1 − 𝛼 pour la proportion 𝑝 deviennent égales à: 𝑎 = 𝑓 −
0('-0) 0('-0)
𝑡'-' )
et 𝑏 = 𝑓 + 𝑡'-' )
( (
Où : f est la proportion d’éléments de l’échantillon qui ont le caractère étudié et 𝑡'-' est le fractile
(
1
d’ordre 1 − de la loi normale centrée réduite.
(
82
3- Intervalle de confiance de la variance 𝝈𝟐 :
3-1- Cas de moyenne connue
Lorsque la distribution de probabilité de la population est normale,
" ! M/ $N "
𝑋~𝑁(𝜇; 𝜎 ), et la moyenne 𝜇 est connue, 𝜃 = ∑*+, ~𝜒!" , quelle
/
∑!
/01(./ $N)
" ∑!
/01(./ $N)
"
𝑎= et 𝑏 =
P 4 P 4
!;13 !;
" "
Q Q
Où : 𝑘!;,$4 et 𝑘!; 4 sont respectivement les fractiles d’ordre 1 − et
" " " "
(+$!)?! (+$!)?!
𝑎= 5
et 𝑏 = 5
- -
)"$;$" )"$;
! !
2
Où : 𝑘+$!;!$- et 𝑘+$!; - sont respectivement les fractiles d’ordre 1 −
! ! "
2
et "
de loi de khi-deux à n-1 degrés de liberté.
84 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Exemple :
En vue de juger si une entreprise est saine, l’économiste W.
Beaver introduit le ratio défini par le quotient de la marge brute
d’autofinancement (cash flow) par des dettes totales.
Supposons que le ratio des entreprises saines suit une loi
normale de moyenne µ et d’écart-type 𝜎 inconnu. A partir d’un
échantillon de 25 entreprises saines, l’écart-type est égal à 0,18
(s^ = 0,18).
Donner un intervalle de confiance au niveau de confiance 0,95
pour la variance du ratio des entreprises saines.
*Le modèle de régression multiple, qui est une extension du modèle de régression
simple, où une variable endogène (𝑦) est expliquée par plusieurs variables exogènes (𝑥- ,
𝑥% , …, 𝑥5 ).
*La validation statistique d’un modèle de régression simple ou multiple via l’étude de sa
qualité d’ajustement et à l’aide des tests statistiques (test de significativité de chaque
coefficient du modèle estimé (le test de Student), le test de significativité globale du
modèle estimé (le test de Fisher), le test d’autocorrélation des résidus (le test de Durbin-
Watson), etc).
88
Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Section 1- Rappel sur la régression simple
Date 𝑦 𝑥1 𝑥2
1 49 53 200
2 40 53 212
3 41 50 211
4 46 64 212
5 52 70 203
6 59 68 194
7 53 59 194
8 61 73 188
9 55 59 196
10 64 71 190
𝑦W = 𝑎X + 𝑎!𝑥!W + 𝑎"𝑥"W + 𝜀W
Modèle R R-deux ajusté l'estimation de R-deux Variation de F ddl1 ddl2 Sig. Variation de F Durbin-Watson
𝑅" = 0,963
𝑛−1 9
𝑅d " = 1 − "
1 − 𝑅 = 1 − 1 − 0,963 = 0,952
𝑛−𝑘−1 7
Modèle R R-deux R-deux ajusté Erreur standard Changement dans les statistiques
de l'estimation Variation de R- Variation de F ddl1 ddl2 Sig. Variation de
deux F
a
1 ,981 ,963 ,952 1,777 ,963 90,603 2 7 ,000
Pour le test de la significativité des variables explicatives de notre modèle estimé, on teste si chaque
coefficient de ces variables explicatives est significativement différent de 0 pour un seuil choisi, en général
𝛼 = 5 %. Le test de Student s’écrit comme suit:
𝐻6: 𝑎: = 0
S
𝐻': 𝑎: ≠ 0
|43) |
Pour 𝑎W = 0, la statistique 8+
= 𝑡4∗3) ~𝑇)-<-'. La valeur donnée par la table de Student à 7 degrés de
9 * )
1/(
liberté et pour α=0,05 est : 𝑡)-<-' = 𝑡>6,6(? = 2,365. Les « t-statistics » 𝑡2 lui sont largement supérieurs :
∗
∑)DE'(𝑦,D − 𝑦)
. ( /𝑘 ∑)DE'(𝑦,D − 𝑦)
. ( /𝑘 𝑅 ( /𝑘
𝐹 = 𝐹1 𝑘, 𝑛 − 𝑘 − 1 = ) = =
∑DE'(𝑦D − 𝑦,D )( /𝑛 − 𝑘 − 1 ∑)DE' 𝑒D ( /𝑛 − 𝑘 − 1 (1 − 𝑅 ( )/𝑛 − 𝑘 − 1
Total 594,000 9
571,907/2
𝐹∗ = 𝐹: 𝑘, 𝑛 − 𝑘 − 1 = = 90,602
22,093/7
Les valeurs caractéristiques qui découlent de la table de DW pour n=10 et k=2 sont :
La valeur fournie par la statistique de DW est égale à 1,713. Elle est comprise entre
1,641 et 2. Elle tombe dans la zone d’indépendance des résidus.
Si la variable explicative 𝑥% augmente d’une unité alors que toutes les autres
variables explicatives sont fixes, la variable expliquée se verra augmenter en
moyenne de 𝑎% = 0,36 unité.
Si la variable explicative 𝑥" augmente d’une unité alors que toutes les autres
variables explicatives sont fixes, la variable expliquée se verra diminuer en
moyenne de 𝑎" = −0,632 unité.
106 Pr. Abdessamad OUCHEN, ENCG Fès, USMBA Fès
Références bibliographiques :