Vous êtes sur la page 1sur 11

CM L2 Stats :

Dernier CM

Question de Cours pour l’examen


Le CC2 aura lieu Vendredi 15/04/2022 (Amphi D Droit + SAY) de 13 h 30 à 15 h 30

Programme CC2
Tests de moyennes; de % ; de comparaison de moyennes ou de %
Test d’indépendance du Khi Deux sur tableau croisé
Estimation (exercices type Ex 14 – Ex 16)

Programme Examen = pour le Partiel au mois de Mai


Programme Examen
Même programme que CC2 mais ajouter
Test d’homogénéité du Khi Deux (variance) + Comparaison variance (Test Fisher)
Questions Cours Matrice de corrélation + Régression linéaire Simple (Test Fisher)

Ceux qui ont été absents au CC1 ou auront une absence justifiée au CC2
Passeront le CC1 ou CC2 de Rattrapage le Mardi 26/4/2022 de 8 H à 10 H

Correction du CC2 21-22 et Correction de l’examen 20-21


Via une séance Zoom le Lundi 25/4/2022 de 10 h à 12 h
Thème 1 : 3 applications du Khi Deux

A) Test de Variance : déjà vu permet de mesurer l’homogénéité d’une population, la régularité d’une production
Si on connait l’écart type σ 2 théorique sur l’ensemble de la production, on teste la variance sur un échantillon
de taille n
 2 cal = (n –1) s2 observé / σ 2 théorique

B) Test d’indépendance: déjà vu permet de savoir si 2 variables qualitatives sont dépendantes.


A partir d’un tableau croisé d’observations, on calcule un tableau d’effectifs théoriques, puis on mesure le
degré de dépendance par
 2 cal = ∑ (théorique – observé) 2 / théorique

C) Test du Khi Deux d’ajustement à une loi théorique


Objectif : on veut vérifier si un tableau d’observations est conforme à une loi théorique.
- Pour affirmer qu’une variable est normalement distribuée, on fait le test de normalité = test d’ajustement à
la loi Normale.
- Dans la gestion des files d’attente (formules d’Erlang en G.R.H.), on doit s’assurer que le flux des clients suit
approximativement une loi de Poisson et que la durée de service suit une loi Exponentielle.
- Pour valider un modèle prévisions de ventes pour les prochains mois, on compare les ventes des mois
précédents aux prévisions puis on fait un test de Khi Deux
A) Test de variance (Ex 18 + Ex 52 du TD)

B) test d’indépendance du Khi deux (Ex 19 + Ex 20 du TD)


(entre variables non numériques, à partir d’un tableau croisé d’observations) déjà vus en TD

C) Test du Khi Deux d’ajustement à une loi théorique


Objectif : on veut vérifier si un tableau d’observations est conforme à une loi théorique.
Pour affirmer qu’une variable est normalement distribuée, on fait le test de normalité = test d’ajustement à la loi
Normale.
Dans la gestion des files d’attente (G.R.H.), pour pouvoir utiliser les formules d’Erlang, on doit s’assurer que le flux des
clients suit approximativement une loi de Poisson et que la durée de service suit une loi Exponentielle.

Etape 1 : On calcule moyenne et écart type de l’échantillon de taille N


Etape 2 : - Pour chaque classe [a ; b], on calcule l’effectif théorique : N * P (a ≤ X ≤ b)
On doit éventuellement regrouper des classes pour avoir un effectif (≥ 5 par classe) significatif
On calcule la statistique du test  2 cal =  (Théorique – Observé) 2 / Théorique qui suit la loi du Khi Deux
avec degré de liberté = n nombre de classes significatives – 1 – k nombre paramètres de la loi

Etape 3 : Sur Tableur, la fonction « Test du Khi deux », calcule directement la p-value
Si p-value = Probabilité (H0 = ajustement fiable) > 5 %, on validera l’ajustement à la loi théorique
Ex 1 : Sur une période de N = 50 mois, pour les ventes mensuelles, on a on une moyenne = 170 Kg
et un écart type σ = 40 Kg. Pour gérer les stocks, on voudrait savoir si les ventes mensuelles
suivant approximativement la loi Normale N (170 kg ; 40 kg)

- Pour chaque classe [a ; b], on calcule l’effectif théorique : N * P (a ≤ X ≤ b)


- On doit éventuellement regrouper des classes pour avoir un effectif (≥ 5 par classe) significatif
- On calcule la statistique du test  2 cal =  (Théorique – Observé) 2 / Théorique qui suit la loi du Khi
Deux avec degré de liberté = n nombre de classes significatives – 1 – 2 nombre paramètres de la loi

La statistique du test  2 cal est dans l’intervalle de confiance I.C. 95 % = [0 ; 3,84]


Donc on valide H 0 = ajustement fiable = la répartition est bien normalement distribuée.
On peut donc considérer que les ventes suivent approximativement la loi N (170 ; 40)

N.B : Il serait bien sûr préférable de calculer un plus grand nombre de classes
Dans le cadre de la Gestion Ressources Humaines, pour gérer le nombre de guichets à ouvrir, on
suppose souvent que le flux des clients suit une loi de Poisson et que la durée de service
suit une loi Exponentielle. Mais pour pouvoir utiliser les formules (d’ERLANG), on doit
s’assurer d’être dans les conditions d’application en comparant, par le test d’ajustement du
Khi deux, les observations et le modèle théorique (loi Poisson pour les arrivées et loi
exponentielle pour la durée de service)

Ex 2 : on a observé le nombre de clients qui arrivent par Heure dans une entreprise
Etape 3 : On doit regrouper les effectifs X = 0 et X = 1 pour avoir un effectif > 5 significatif

On fait le test du Khi deux avec degré de liberté = 6 = 8 classes significatives – 1 – 1 1 seul paramètre pour Poisson
Fractile du Khi Deux (degré liberté = 6 ; 95 %) = 12.59
On calcule : 2cal =  (théorique i – observé i) 2 / théorique i = 4,37

Donc : 4,37 I.C. 95 % = [0 ; 12,59] non rejet H0 : Le modèle de Poisson est acceptable

N.B : Méthode utilisée par les logiciels


Par p-value = probabilité (« H 0 : X suit loi de Poisson » soit vraie) = P (2 > 2cal)
Ici, on obtiendrait (par Tableur) p-value = 94 % de chances pour que le modèle de
Poisson avec une moyenne = 4 soit fiable
Thème 2 : Modélisation et Corrélation entre variables Numériques
Régression linéaire simple ou multiple
2 variables sont dites dépendantes (= liées = corrélées) si l’une a de l’influence sur l’autre

1) Pour mesurer la dépendance de 2 variables dites nominales (=non numériques)


On fait le Test du Khi Deux sur Tableau croisé d’observations (déjà vu)
Ex : matrice de corrélation et interprétation
Dans un centre de vacances, On cherche à mesurer l’impact de X2 = satisfaction restauration ;
X3 = satisfaction animation; X 4 = Coût séjour sur X1 = satisfaction globale des clients
H 0 : pas d’influence sur satisfaction globale ↔ Variables indépendantes
H 1 : Variables dépendantes (X2 ou X3 ou X4 a un impact sur la satisfaction globale)
On a interrogé (tableau ci-dessous) 85 clients et l’ordinateur a calculé la matrice R de corrélation
A : Le coefficient de corrélation R = – 0,965 et la droite de régression : Y estimé = – 2,4 pente * X + 96,9
Résidus = Y estimé – Y observé mesure les « défauts » du modèles
Résidus > 0 : le modèle surestime Y et Résidus > 0 : le modèle sous-estime Y

B : On a aussi : σ(Y observé) = σ 2 (Y estimé) + σ 2 (Y résidu) et R 2 = 1 – σ 2 (Y résidu) / σ 2 (Y observé)


2

Variance totale = Variance expliquée + Variance résiduelle


Le modèle sera d’autant plus fiable résidus faibles que R 2 est proche de 100 %

Statistique du test F cal = [(n – k – 1) / k] * [R 2 / (1 – R 2)]


Avec n = taille de l’échantillon et k = nombre de facteurs explicatifs
C: H 0 pas de corrélation (comme tout test d’indépendance) linéaire
H 1 Modèle acceptable, modèle Y = a X + b est fiable

Ici : F cal = (13 – 1 – 1) / 1 * 0,965 / (1 – 0,965 ) = 147


2 2 puis p-value = 1 / 10 7 << risque
Rejet H 0 donc on peut valider le modèle linéaire.

D : Interprétation du modèle linéaire ∆ Y ≈ a pente *∆X

Ici, quand le budget R&D augmente de ∆ X = 5, les coûts de production devrait baisser de
∆ Y ≈ – 2.4 * 5 = – 12

N.B: Pour être plus précis, il faudrait donner un intervalle de confiance pour ∆ Y

N.B: La régression Linéaire Multiple dans le Fichier Test 3 Madoc et dans le Fichier Synthèse CM
est présentée à titre d’information mais sera hors programme en L2

Vous aimerez peut-être aussi