Vous êtes sur la page 1sur 12

21-02-20

STAT0002 – Statistique descriptive

-Correction de l’examen-

Sébastien Fontaine | Patrick Italiano


Janvier 2020

S.Fontaine |

S.Fontaine |

S. Fontaine - P.Italiano 1
21-02-20

X Y Z=1 Z=2
1 1 38 59
1 2 45 33
1 3 33 26
2 1 24 42
2 2 43 46
2 3 19 39
3 1 109 101
3 2 201 167
3 3 222 253
total 734 766

S.Fontaine |

X Z Y=1 Y=2 Y=3


1 1 38 45 33
1 2 59 33 26
2 1 24 43 19
2 2 42 46 39
3 1 109 201 222
3 2 101 167 253
total

S.Fontaine |

S. Fontaine - P.Italiano 2
21-02-20

1. (1,5 pts) Dans la population belge des


25 ans et plus, estimez (sans biais) :

 (a) La proportion de ’Femmes plutôt d’accord’ avec l’affirmation


Q1,a
Cas possibles 1500
Cas favorables 118
PROP 7,87%

S.Fontaine |

1. (1,5 pts) Dans la population belge des


25 ans et plus, estimez (sans biais) :

 (b) La proportion de personnes ’Plutôt pas d’accord’ avec l’affirmation parmi les hommes ;

Q1,b
Cas possibles 734
Cas favorables 532
PROP 72,48%

S.Fontaine |

S. Fontaine - P.Italiano 3
21-02-20

1. (1,5 pts) Dans la population belge des


25 ans et plus, estimez (sans biais) :

 (c) La proportion de personnes qui n’ont pas un diplôme du supérieur parmi les personnes
’Plutôt d’accord’ avec l’affirmation.
Q1,c
Cas possibles 234
Cas favorables 175
PROP 74,79%

S.Fontaine |

2. (1 pt) Expliquez ce que veut dire


l’absence de biais dans l’estimation d’une
proportion.

 Voir cours théorique

S.Fontaine |

S. Fontaine - P.Italiano 4
21-02-20

3. (3 pts) Séparément pour chaque sexe, construisez un


graphique permettant de comprendre l’influence du niveau
de formation sur le positionnement exprimé. Que
suggèrent-ils ?
Z=1 X1 X2 X3 total Z=2 X1 X2 X3 total
Y1 38 24 109 171 Y1 59 42 101 202
Y2 45 43 201 289 Y2 33 46 167 246
Y3 33 19 222 274 Y3 26 39 253 318
734 766

Plutôt Plutôt pas Plutôt Plutôt pas


Hommes d'accord Mitigé d'accord total Femmes d'accord Mitigé d'accord total
Primaire Primaire
ou inf 22,22% 14,04% 63,74% 100,00% ou inf 29,21% 20,79% 50,00% 100,00%
Sec sup 15,57% 14,88% 69,55% 100,00% Sec sup 13,41% 18,70% 67,89% 100,00%
Supérieur 12,04% 6,93% 81,02% 100,00% Supérieur 8,18% 12,26% 79,56% 100,00%

S.Fontaine |

3. (3 pts) Séparément pour chaque sexe, construisez un


graphique permettant de comprendre l’influence du niveau
de formation sur le positionnement exprimé. Que
suggèrent-ils ?
Hommes Femmes
100% 100%

90% 90%

80% 80%
50,00%
70% 70%
63,74%
69,55% 67,89%
60% 81,02% 60% 79,56%

50% 50%

40% 40% 20,79%

30% 14,04% 30%


14,88% 18,70%
20% 20%
6,93% 29,21% 12,26%
10% 22,22% 10%
15,57% 12,04% 13,41%
8,18%
0% 0%
Primaire ou inf Sec sup Supérieur Primaire ou inf Sec sup Supérieur

Plutôt d'accord Mitigé Plutôt pas d'accord Plutôt d'accord Mitigé Plutôt pas d'accord

S.Fontaine |

S. Fontaine - P.Italiano 5
21-02-20

4. (1,5 pts) Calculez un intervalle de confiance 95% pour la


proportion de personnes de 25
ans et plus ’Plutôt d’accord’ avec l’affirmation. Que vaut la marge
d’erreur ?

 Proportion;
 Variance;
 (1-f) ~= 1;
 IC;
 M.E.;

Q4
Cas possibles 1500
Cas favorables 234
p 15,60%
ic bas 13,73%
ic haut 17,47%
MARGE ERREUR 1,87%

S.Fontaine |

5. (1 pt) Comment les enquêteurs pourraient-ils diviser par trois une


telle marge d’erreur ?
Expliquez, avec des arguments théoriques, comment vous
aboutissez à cette proposition.

 Voir cours théorique;


 total fois 9 (racine);
 Nouvelle MARGE ERREUR 0,62%
 Test 33,33% (par rapport à 1,87%)

S.Fontaine |

S. Fontaine - P.Italiano 6
21-02-20

S.Fontaine |

1. (3 pts) À l’aide d’un graphique basé sur les quartiles du score,


visualisez comment la distribution de la réponse se différencie
entre régions wallonne et bruxelloise. Que suggère-t-il ? [Détaillez
vos calculs et votre réponse.]

 « régions wallonne et bruxelloise » = 2 régions (et pas 3…)


 « graphique basé sur les quartiles du score » = « boîte à moustaches » = médiane et quartiles
Effectifs cumulés

Score 0 1 2 3 4 5 6 7 8

Bruxelles 2 8 32 57 89 122 164 195 205


Wallonie 9 17 51 60 82 92 144 192 210

 Détermination des individus représentant les quartiles


individu Q1 Q2 Q3
i= Bruxelles 52 103 154

i= Wallonie 53 µ 105 - 106 158

 Détermination des valeurs des quartiles valeur Q1 Q2 Q3


Bruxelles 3 5 6

Wallonie 3 6 7
S.Fontaine |

S. Fontaine - P.Italiano 7
21-02-20

1. (3 pts) À l’aide d’un graphique basé sur les quartiles du score,


visualisez comment la distribution de la réponse se différencie
entre régions wallonne et bruxelloise. Que suggère-t-il ? [Détaillez
vos calculs et votre réponse.]

 EIQ Bxl: 3 ; 3x1,5=4,5;


 patte sup: 6+4,5=10,5 HORS ECHELLE: Max=8;
 patte inf: 3-4,5=-1,5 !!!! Min=0
 EIQ Wallonie: 4 ; 4x1,5=6;
 patte sup: 7+6=13 HORS ECHELLE: Max=8;
 patte inf: 3-6=-3 !!!! Min=0

S.Fontaine |

1. (3 pts) À l’aide d’un graphique basé sur les quartiles du score,


visualisez comment la distribution de la réponse se différencie
entre régions wallonne et bruxelloise. Que suggère-t-il ? [Détaillez
vos calculs et votre réponse.]
 Interprétation:
 Les Wallons, plus que les Bruxellois, considèrent les inégalités comme injustement grandes
(médiane + haute = 50% des W >6 alors que seulement 25% des BXLois >6 =Q3 à Bxl)
 La dispersion est plus grande en Wallonie qu’à Bxl (EIQ + grand, vers le bas)

S.Fontaine |

S. Fontaine - P.Italiano 8
21-02-20

2. (1 pt) Estimez sans biais le score moyen pour l’ensemble de la


population belge.

 Moyenne pondérée puisque 3 strates (ou sondages) différents


 Calculer la moyenne pour VL : 5,16
 Moy pondérée: 5,16*0,57+4,919*0,32+4,737*0,11 = 5,036

S.Fontaine |

3. (2 pts) Calculez un intervalle de confiance 95% pour le score


moyen chez les populations des régions bruxelloise et wallonne
réunies.

 Moyenne pondérée pour W+Bxl :


 Poids relatif: Bxl= 11/43 ; W= 32/43
 Moy. pondérée: 4,919*(32/43)+4,737*(11/43) = 4,872
 Variance pour stratifié:

 Donc: = [(11/43)²*3,607/205]+[(32/43)²*5,367/210]
 ME= 2*√ = 0,2474
 IC 95% pr (W+Bxl)= [4,625 ; 5,119]

S.Fontaine |

S. Fontaine - P.Italiano 9
21-02-20

4. (3 pts) Le coût de la réalisation d’une interview est évalué à


30 euros par personne à Bruxelles et à
25 euros en Wallonie.
Avec un budget de 25 000 euros et sur base des informations
disponibles dans l’enquête évoquée ci-dessus, combien de
personnes recommanderiez-vous d’interroger dans chacune des 2
régions pour minimiser :

S.Fontaine |

… pour minimiser :
(a) la variance de l’estimation du score moyen pour la population
des 2 régions combinées ?

 Minimiser la variance dans les 2 régions :


 La seule méthode d’allocation qui tient compte des variances est l’optimale de Neyman

 C= 25000 cw=25 cBxl=30 Sw = √5,367=2,316 SBxl = √3,607=1,899 Nw = 3008000 NBxl = 1034000


 Dénominateur du 2°terme=45598932,3 2° terme complet = 0,00054826
 Résultat: nw = 764 ; nbxl = 196
 Vérification: coût total = 24980

S.Fontaine |

S. Fontaine - P.Italiano 10
21-02-20

… pour minimiser :
(b) la variance de l’estimation du score moyen pour la population
de la Région wallonne ?

 Minimiser la variance en Wallonie uniquement Faire l’enquête en Wallonie


uniquement

 La méthode d’allocation est simple:

 C= 25000 cw=25 1000 enquêtes en Wallonie

S.Fontaine |

5. Supposez que le score de population en Wallonie soit assimilable à une


variable continue de distribution Normale de moyenne 4,92 et variance 5,40.
Sous cette hypothèse,
(a) (1,5 pts) Déterminez la proportion d’individus avec un score inférieur à 4,00.

𝟒𝟒,𝟗𝟏𝟗
 = = -0,3959
√𝟓,𝟒
 P(Z<-0,3959) = 1-P(Z<0,3959)
 Table: 0,6654
 1-0,6654 = 0,3346

S.Fontaine |

S. Fontaine - P.Italiano 11
21-02-20

5. Supposez que le score de population en Wallonie soit assimilable à une


variable continue de distribution Normale de moyenne 4,92 et variance 5,40.
Sous cette hypothèse,
(b) (1,5 pts) Dans quel intervalle centré en la moyenne s’attend-on à observer
70% des valeurs du score continu ?

 70 % centré sur la moyenne 15% au dessus et 15% en dessous p=0,85


 Table: 1,04
 Borne sup: µ + σ z = 4,92 + 1,04 * √𝟓, 𝟒 = 7,336
 Borne inf: µ - σ z = 4,92 - 1,04 * √𝟓, 𝟒 = 2,503

S.Fontaine |

S. Fontaine - P.Italiano 12

Vous aimerez peut-être aussi