Vous êtes sur la page 1sur 4

SEMINAIRE DE METHODOLOGIE QUANTITATIVE 2

FORMULAIRE

RAPPELS PREMIERE ANNEE


1
• Variance de la variable X : 𝑉(𝑋) = 𝑁 ∑𝑁 ̄ 2
𝑖=1(𝑋𝑖 − 𝑋) = moyenne du carré des écarts à la
moyenne
1
• Théorème de König : 𝑉(𝑋) = 𝑁 ∑𝑁 2 ̄2
𝑖=1 𝑋𝑖 − 𝑋 = moyenne du carré (des valeurs de la
variable) – carré de la moyenne (de la variable)

• Propriétés de la variance :

Si on ajoute une constante à la série, la variance reste inchangée : V(x + k) = V(x)

Si on multiplie une série par une constante à la série, la variance est multipliée par cette constante au
carré : V(ƛ.x) = ƛ2.V (x)
𝜎𝑋
• Le coefficient de variation : 𝐶𝑉𝑋 = 𝑋̄
(avec 𝜎𝑋 = écart-type de X et 𝑋̄ = moyenne de X)

CHAPITRE 1 : STATISTIQUES DESCRIPTIVES BI-DIMENSIONNELLES

Dans ce qui suit (chapitre 1) : X et Y sont deux variables qualitatives (X : variable en colonne dans le
tableau de contingence ; Y : en ligne ; nombre de modalités ou valeurs de X = J ; nombre de modalités
ou valeurs de Y = I)

1.1 Tableau de contingence

 Effectif conjoint : nij

• Effectif marginal de la variable en ligne Yi (ni.) : 𝑛𝑖. = ∑𝐽𝑗=1 𝑛𝑖𝑗 = ni1 + ni2 + ni3 + … + niJ
(J = nombre de modalités de la variable en colonne)

 Effectif marginal de la variable en colonne Xj (n.j): 𝑛. 𝑗 = ∑𝐼𝑖=1 𝑛𝑖𝑗 =n1j + n2j + … + nIj

(I = nombre de modalités de la variable en ligne)

 Effectif Total : 𝑁 = ∑𝐼𝑖=𝑖 𝑛𝑖 . = ∑𝐽𝑗=1 𝑛.𝑗 = ∑𝐼𝑖=1 ∑𝐽𝑗=1 𝑛𝑖𝑗

1.2 Fréquence de deux variables


𝑛𝑖𝑗
 Fréquence conjointe : fréquence estimée que X= xj ET Y= yi. = 𝑓𝑖𝑗 = 𝑁
𝑛.𝑗
 Fréquence Marginale de X : 𝑓.𝑗 =
𝑁
𝑛𝑖.
 Fréquence Marginale de Y : 𝑓𝑖. = 𝑁

1
𝑛𝑖𝑗
 Fréquence conditionnelle Ligne: 𝑓𝑥=𝑥𝑗⁄𝑦=𝑦𝑖 =
𝑛𝑖.

(fréquence de chaque valeur de la variable en colonne, sachant que la valeur de variable en


ligne est fixée)
𝑛𝑖𝑗
 Fréquence conditionnelle Colonne: 𝑓𝑦=𝑦𝑖 ⁄𝑥=𝑥𝑗 = 𝑛.𝑗

(fréquence de chaque valeur de la variable en ligne, sachant que la valeur de variable en


colonne est fixée)

1.3 Statistiques descriptives pour deux variables

• Moyenne conditionnelle de Y selon X, notée 𝒚𝒋 :


1 1
𝑦𝑗 = 𝑛 ∑𝐼𝑖=1 𝑛𝑖𝑗 𝑦𝑖 = 𝑛 (𝑛1𝑗 𝑦1 + 𝑛2𝑗 𝑦2 + ⋯ + 𝑛𝐼𝑗 𝑦𝐼
.𝑗 .𝑗

(moyenne de la variable en ligne, sachant que la valeur de variable en colonne est fixée)

On le note aussi : 𝑦𝑗 = ∑𝐼𝑖=1 𝑓𝑦=𝑦𝑖 ⁄𝑥=𝑥𝑗 𝑦𝑖 = 𝑓𝑦=𝑦1 ⁄𝑥=𝑥𝑗 𝑦1 + 𝑓𝑦=𝑦2 ⁄𝑥=𝑥𝑗 𝑦2 + … + 𝑓𝑦=𝑦𝐼 ⁄𝑥=𝑥𝑗 𝑦𝐼

• Moyenne Conditionnelle de X selon Y, notée 𝒙𝒊 :


1
𝑥𝑖 = 𝑛 ∑𝐽𝑗=1 𝑛𝑖𝑗 𝑥𝑗 = 𝑛𝑖1 𝑥1+ 𝑛𝑖2 𝑥2 + ⋯ + 𝑛𝑖𝐽 𝑥𝐽
𝑖.

(moyenne de la variable en ligne, sachant que la valeur de variable en colonne est fixée)

On le note aussi : 𝑥𝑖 = ∑𝐽𝑗=1 𝑓𝑥=𝑥𝑗⁄𝑦=𝑦𝑖 𝑥𝑗 = 𝑓𝑥=𝑥1 ⁄𝑦=𝑦𝑖 𝑥1 + 𝑓𝑥=𝑥2 ⁄𝑦=𝑦𝑖 𝑥2 + … + 𝑓𝑥=𝑥𝐽⁄𝑦=𝑦𝑖 𝑥𝐽


1 𝑁
 Covariance : 𝐶𝑜𝑣(𝑋, 𝑌) = ∑ (𝑋 − 𝑋̄) (𝑌𝑖 − 𝑌̄)
𝑁 𝑖=1 𝑖

= (𝑋1 − 𝑋̄)(𝑌1 − 𝑌̄ ) + (𝑋2 − 𝑋̄)(𝑌2 − 𝑌̄) + …. + (𝑋𝑁 − 𝑋̄)(𝑌𝑁 − 𝑌̄)

 Quelques Propriétés de la covariance :

𝐶𝑜𝑣(𝑋, 𝑌) = 𝐶𝑜𝑣(𝑌, 𝑋)
𝐶𝑜𝑣(𝑋, 𝑋) = 𝑉𝑎𝑟(𝑋)
Formule de König-Huygens : 𝐶𝑜𝑣(𝑋, 𝑌) = 𝐸(𝑋𝑌) − 𝐸(𝑋)𝐸(𝑌) = moyenne du produit (des
deux variables) – produit des moyennes (de chaque variable)
𝐶𝑜𝑣(𝑋,𝑌)
• Corrélation de Pearson : 𝜌𝑋𝑌 = 𝜎𝑋 𝜎𝑌
avec 𝜎𝑋 = écart-type de X et 𝜎𝑌 = écart-type de Y

2
CHAPITRE 2 : INDEPENDANCE ENTRE VARIABLES

2.1 Les liaisons entre deux variables

 Indépendance (cas de deux variables qualitatives)

Si 𝑓𝑦=𝑦𝑖/𝑥=𝑥𝑗 = 𝑓𝑖. (fréquence conditionnelle = fréquence marginale)

Si 𝑓𝑖𝑗 = 𝑓𝑖. ∗ 𝑓.𝑗 (fréquence conjointe = produit des fréquences marginales)

2.2 Tester l’indépendance entre deux variables

2.2.1 Brève introduction aux tests d’hypothèse

 Erreurs associées à un test : Quatre cas de figures a posteriori:

Acceptation de H0 Rejet de H0
H0 réalisé Bonne prédiction (1-α) Erreur de première espèce (α)
H0 non réalisé Erreur de seconde espèce (β) Bonne prédiction :  = 1 − 
Avec erreur de première espèce (α), Erreur de seconde espèce (β) et Puissance du test (γ)

2.2.2 Le cas de variables qualitatives : le test du X2

 Effectif observé : 𝑛𝑖.𝑗


𝑡 𝑛𝑖. ×𝑛.𝑗
 Effectif théorique : 𝑛𝑖.𝑗 = 𝑁
= produit des effectifs marginaux / effectif total

 Statistique de test : contributions du Khi2 =


𝑡 2 𝑡
(𝑛𝑖.𝑗 −𝑛𝑖.𝑗 ) 𝑡 𝑛𝑖.𝑗 −𝑛𝑖.𝑗
𝑡
𝑛𝑖.𝑗
= (𝑛𝑖.𝑗 − 𝑛𝑖.𝑗 )× 𝑡
𝑛𝑖.𝑗
= 𝑒𝑐𝑎𝑟𝑡 𝑎𝑏𝑠𝑜𝑙𝑢 × é𝑐𝑎𝑟𝑡 𝑟𝑒𝑙𝑎𝑡𝑖𝑓

 Valeur du Khi2 = somme des contributions du Khi2

3
CHAPITRE 3 : LA REGRESSION LINEAIRE

3.1 Modèle de régression

• Modèle de régression linéaire : 𝒀𝒊 = 𝜷𝟎 + 𝜷𝟏 𝑿𝟏𝒊 + 𝜷𝟐 𝑿𝟐𝒊 + 𝜺𝒊 (cas de deux variables


explicatives)

• ̂ 𝟏 𝑿𝒊 + 𝜷
̂𝒊 = 𝜷
Droite de régression : 𝒀 ̂ 𝟎 (cas d’une seule variable explicative)

• ̂ 𝟏 = 𝑪𝒐𝒗(𝑿,𝒀)
Estimateurs des paramètres : 𝜷 𝑽𝒂𝒓(𝑿)

̂ 𝟎 = 𝒀̄ − 𝜷
𝜷 ̂ 𝟏 𝑿̄ (avec 𝒀̄moyenne de Y et 𝑿̄moyenne de X)

3.2 Qualité d’un modèle de régression

• Décomposition de la variabilité :
Variabilité totale (VT) = variabilité expliquée (VE) + variabilité résiduelle ou non expliquée (VNE)

VT = ∑𝑁 ̄ 2
𝑖=1(𝑌𝑖 − 𝑌 ) = 𝑉(𝑌) × 𝑁
(somme totale des carrés, avec V(Y) = variance de Y)

VE = ∑𝑁 ̂ ̄ 2 ̂2
𝑖=1(𝑌𝑖 − 𝑌 ) = 𝛽1 × 𝑁 × 𝑉(𝑋)
(somme des carrés expliqués, avec V(X) = variance de X)

VNE = ∑𝑁 2
𝑖=1 𝜀̂𝑖
(somme des carrés résiduels)

𝑽𝑬 somme des carrés expliqués 𝑽𝑵𝑬


• Coefficient de détermination : 𝑹𝟐 = 𝑽𝑻 = somme totale des carrés
ou 𝑹𝟐 = 𝟏 − ( 𝑽𝑻 )

𝐶𝑜𝑣²(𝑋,𝑌)
NB : si régression linéaire simple : 𝑅² = (𝜌𝑋𝑌 )² = 𝑉(𝑋)𝑉(𝑌)
(= coefficient de corrélation de Pearson au carré)

∑𝑵 𝟐
𝒊=𝟏 𝜺̂𝒊
moyenne des carrés résiduels
• Le R² ajusté : 𝑹̄𝟐 = 𝟏 − ∑𝑵
𝑵−𝑲−𝟏
̂ ̄ 𝟐
= 1− moyenne des carrés expliqués
𝒊=𝟏(𝒀𝒊 −𝒀)
𝑵−𝟏

avec K = nombre de variables du modèle de régression et N = effectif total de l’échantillon

3.3 Validité d’un modèle de régression


• le test du F (test de Fischer)

∑𝑁 (𝑌̂ −𝑌̄)2⁄𝐾 moyenne des carrés expliqués


Statistique du test : 𝐹 = ∑𝑁𝑖=1 ̂ 2𝑖⁄ =
𝑖=1 𝜀𝑖 𝑁−𝐾−1 moyenne des carrés résiduel

• Le test du t (test de Student)


𝛽 ̂
Statistique du test pour le paramètre 𝛽̂𝑘 : 𝑡𝑘 = 𝜎̂ 𝑘 (avec 𝜎̂𝛽̂𝑘 = écart-type du paramètre 𝛽̂𝑘 )
̂
𝛽 𝑘

Vous aimerez peut-être aussi