Vous êtes sur la page 1sur 12

Statistique descriptive – L3, 1er semestre

Examen final, 2h.


(Janvier 2022)

Consignes générales

Vous disposez de 2h pour lire le sujet ci-dessous et répondre aux questions. Répondez de façon
argumentée, claire et précise. Veuillez répondre directement sur le sujet, dans les encadrés ou
tableaux prévus pour chaque question.

Exercice 1

Vous disposez de données sur le revenu annuel, en k€ et arrondi au millier d’€, issu d’un échantillon
tiré aléatoirement de 8 ménages d’Île-de-France : 15 ; 28 ; 40 ; 70 ; 40 ; 22 ; 22 ; 35.

1. Quelle est la population ? Quelle est la variable ? De quel type de variable s’agit-t-il ?

2. Remplir le tableau de distribution suivant.

Total

1
3. Donner la moyenne et le mode ?

4. Quels sont les quartiles ? Donner des valeurs entières même si c’est approximatif.

5. Les déciles 1 et 9 sont 1 = 15 et 9 = 75. Quel est le rapport interdécile ? Interpréter.

2
6. D’après-vous, le graphique le plus approprié pour représenter la distribution est-il un diagramme
en barre ou un histogramme ? Expliquer pourquoi (mais ne pas le tracer) et expliquer la différence
entre les 2.

7. Tracer la courbe de Lorentz ainsi que la bissectrice (pour vous aider vous pouvez complétez le
tableau suivant et arrondir à 2 décimales près à partir de la ligne ).

Total

/∑

3
8. Calculer le coefficient de Gini (arrondir à 2 décimale près). Le tableau suivant vous est fourni pour
vous aider dans vos calculs qui doivent d’appuyer sur la formule du trapèze.

Trapèze Base b Hauteur h Hauteur H Aire

4
Exercice 2

On considère l’ensemble des ventes en fin de mois d’un nouveau produit proposé dans les 100
supermarchés d’une grande entreprise du secteur de la grande distribution. Tous les établissements
ont été livré en début de mois, avec un stock proportionnel à leur taille. Dans certains supermarchés
uniquement, une publicité est affichée devant le rayon du produit. Le tableau suivant présente en
même temps les ventes et le fait que le magasin ait disposé ou non de la présentation d’une publicité
à l’entrée du rayon.

Vente en fin de mois (en % des stocks écoulés par rapport à ceux fournis en début de mois) et
exposition à la publicité

Ventes
< 20% 20 à 60% > 60% Total
Publicité
Oui 10 25 20 50
Non 20 15 10 50
Total 30 40 30 100

1. Pourquoi s’agit-il d’un tableau de contingence ?

5
2. Les 2 variables sont-elles strictement indépendantes ? Inscrivez dans le tableau suivant les effectifs
qui vous permettent de répondre à la question ainsi que les calculs qui vous y ont conduit.

Ventes
< 20% 20 à 60% > 60%
Publicité

Oui

Non

3. Les magasins ayant vendu moins de 20% ont vendu, en moyenne, 10% de leurs stocks ; ceux ayant
vendu entre 20 et 60% ont vendu, en moyenne, 50% ; ceux ayant vendu plus de 60% ont vendu,
en moyenne, 70%. Quelles sont les moyennes conditionnelles des ventes (arrondir à 1 décimale
près) ?

6
4. Commenter les résultats précédents.

5. Peut-on dire que les 2 variables sont liées en ayant au moins 95% de chance de ne pas se tromper ?
Pour vous aider à répondre à la question, compléter le tableau permettant de calculer la statistique
du khi-2 (écrire les calculs et arrondir à 2décimale près). La table du khi-2 figure en dernière page
de ce document.

Ventes
< 20% 20 à 60% > 60%
Publicité

Oui

Non

7
6. Peut-on rejeter l’hypothèse d’indépendance en ayant 1% (ou moins) de chance de se tromper ? La
table du khi-2 figure en dernière page de ce document.

Exercice 3

On considère les salaires mensuels (en k€) de 10 individus tirés au hasard dans la population et le
nombre d’année d’études (supérieurs ou non) qu’ils ont effectués à partir de l’âge de 18 ans :

Salaire études
2 0
6 5
10 10
3 1
1 2
6 7
4 5
2 2
4 4
2 4

8
1. Calculez l’équation de la droite de régression par les moindres carrés ordinaires (MCO) associée à
la prédiction du salaire par le nombre d’années d’études. Compléter le tableau suivant pour vous
aider à répondre. Donner un chiffre à 2 décimales près.

Salaire Etudes
2 0
6 5
10 10
3 1
1 2
6 7
4 5
2 2
4 4
2 4

2. A partir du modèle, quelle variation de salaire peut-on prédire pour une année d’études en plus ?

9
3. A quel niveau de salaire correspond 10 ans d’études d’après le modèle ? Donner un chiffre en k€
arrondi à 1 décimale près. S’il existe une différence avec l’observation, comment la nommer et
l’expliquer ?

4. Placer les 10 points et tracez la droite de régression par les MCO.

10
5. En complétant le tableau suivant calculer le coefficient reflétant la qualité de l’ajustement.
Comment se nomme-t-il ? Donner un chiffre à 2 décimales près et expliquez ce que signifie
concrètement ce chiffre.

Salaire Etudes
2 0
6 5
10 10
3 1
1 2
6 7
4 5
2 2
4 4
2 4

6. On s’aperçoit que la relation est en fait du type : ln( ) = études + ". Sans effectuer de
calcul, proposez une solution pour retrouver une équation affine.

11
7. Le coefficient de détermination correspondant à la question précédente est plus important que
celui correspondant au modèle des questions 1 à 5. Que cela signifie-t-il ?

8. On se rend compte que la variance des résidus augmente avec le nombre d’années d’études. Peut-
on s’attendre au même résultat lorsque l’on évalue la relation linéaire entre le nombre d’années
d’études et ln( ) par les MCO et par l’estimation par maximum de vraisemblance (EMV) ?
Expliquer.

12

Vous aimerez peut-être aussi