Vous êtes sur la page 1sur 8

L1 Économie et Gestion – FSEG – UE Techniques quantitatives (50h CM et 27h TD)

Probabilités et statistiques I (20h CM et 12h TD)


Premier semestre 2021-2022
Travaux dirigés – Deuxième fiche

Chargé de cours magistral : J. Saadaoui (saadaoui@unistra.fr)


Chargés de travaux dirigés : F. Bordot (f.bordot@unistra.fr), R. Hasni (riadh.hasni@unistra.fr), M. Liegey
(mliegey@unistra.fr), A. Simon (agathesimon@unistra.fr) et S. Tung (stung@unistra.fr)

Exercice 1 : Distribution empirique, fréquences et fréquences relatives (1/2)


1. Films sortis en première exclusivité en France en 2017.
2. Nationalité des films, c’est-à-dire le pays de résidence de la société de production.
3. Qualitative nominale.
4. Taille de la population = 693.
Règle de 3 (Cross-multiplication)
88 0,127
88*7,874016 = 692,9133858 ≈ 693 1/0,127 = 7,874016
5. Voir réponse à la question 7.
6. Non : 0,01 % de la population étudiée représente moins d’un dixième de film, un tel degré de précision est
tout à fait inutile ici.
7. Représentez cette distribution sous la forme d’un tableau.
Répartition des films inédits projetés en salle en France en 2017 selon leur nationalité
Films sortis en première exclusivité Proportion
Films français 359 51,8
Films américains 124 17,9
Films européens 122 17,6
Autres films 88 12,7
693 100
Champ : Ensemble des films sortis en première exclusivité en France lors de l’année 2017.
Source : CNC.
8. Le diagramme en bâtons est plus efficace pour comparer les fréquences des modalités, le diagramme
circulaire est plus efficace pour visualiser la répartition de l’ensemble. De façon générale il est préférable
d’utiliser des diagrammes en bâtons.
Films sortis en première exclusivité en 2017
400

300

200

100

0
Films français Films américains Films européens Autres films
Champs : Ensemble des films sortis en première exclusivité en France lors de l’année 2017.
Source : CNC.

Probabilités et statistiques I – Deuxième fiche de TD - Page 1 sur 8


Exercice 2 : Distribution empirique, fréquences et fréquences relatives (2/2)
1. Voir le champ. Voir « ensemble ».
2. La catégorie socioprofessionnelle des individus : variable qualitative nominale.
3. Absence d’informations à la fin de l’enquête.

4.
5. Parmi les personnes en emploi de 15 ans ou plus, il y a 27,2 % + 20,8 % = 48 % d’employés ou ouvriers.
6. 26 880 000 * 0,01 = 268 800 personnes soit 268,8 en milliers de personnes.
7. (1) On calcule d’abord la proportion de femmes dans la population active en utilisant la colonne ensemble et on
obtient une proportion de femme égale à 48% (42,9 × a + 12,6 × (1-a) = 27,2 donc a = 0,48).
(2) Ensuite, on calcule la fréquence des femmes dans la population active : 26 880 × 0,48 = 12 902,4. Ce qui
n’est pas loin de la réalité (12 932, voir ci-dessous).
(3) Puis, on calcule la proportion de femmes employées : 12 902,4 × 42,9% = 5 535,13. Enfin, on rapporte à
l’effectif total des employés : 5 535,13 / 7 304 = 75,8%. Commentaire sur la féminisation de cette catégorie
(tertiarisation).
8. Elle baisse de 10 points de pourcentage (variation = valeur d’arrivée – valeur de départ = 20 - 30 = -10) ou de
33% (taux de variation = ( (valeur d’arrivée – valeur de départ) / valeur d’arrivée) = (20-30) / 30). Absolument
pas de 10%. Commentaire sur la désindustrialisation en France.

Exercice 3 : Construction de la distribution empirique


1. Série brute : aucun traitement statistique n’a été effectué.
2. Échantillon.
3. Les étudiants de l’Université de Strasbourg inscrits en Licences 1ère année - Semestre 1 (L1S1), cette année.
4. N = 712 ; n / N = 64 / 712 = 8,989%. Source :
http://ecogestion.unistra.fr/fileadmin/upload/DUN/fseg/SCOLARITE/2020-
2021/LICENCE/Groupes_TD_A_B_L1S1.pdf
5. Nombre de films visionnés le jour précédent l’enquête. Variable quantitative discrète (dénombrable). Quatre
modalités : {0,1,2,4}.
6. Voir la deuxième colonne du tableau réponse à la question 7.
7. Distribution des étudiants selon le nombre d’épisodes visionnés le jour précédent l’enquête.
Modalité Fréquence Fréq. relative en % Fréq. cumulée Fréq. Rel. cumulée en %
0 43 67,19 43 67,19
1 19 29,69 62 96,88
2 1 1,56 63 98,44
4 1 1,56 64 100,00

Probabilités et statistiques I – Deuxième fiche de TD - Page 2 sur 8


Modalité Fréquence Fréq. relative en % Fréq. cumulée Fréq. Rel. cumulée en %
Total 64 100.00
8. On pourrait par exemple créer une catégorie « deux ou plus » parce que les observations supérieures ou
égales à 2 sont rares.

Exercice 4 : Fréquences cumulées dans le cas d’une variable continue


1. Recalculer les fréquences à partir des effectifs de chaque classe et du total des effectifs diminués des 5400
magasins de surface supérieure ou égale à 400 m².
Distribution empirique des magasins de vêtements et/ou de chaussures selon la surface de vente en France en
2009
Classe Fréquence Fréquence relative
[0 ; 25[ 2,5 0,05
[25 ; 50[ 14,4 0,28
[50 ; 100[ 18,6 0,37
[100 ; 200[ 10,3 0,20
[200 ; 400[ 5 0,10
Ensemble 50,8 1
Champ : magasins de vêtements et/ou de chaussures dont la surface de vente est inférieure à 400 m², exprimé en milliers.
Source : Insee.
2.
Classe Fréq. rel. Cumulées croissantes Cumulées décroissantes
[0 ; 25[ 0,05 0,05 1
[25 ; 50[ 0,28 0,33 0,95
[50 ; 100[ 0,37 0,70 0,67
[100 ; 200[ 0,20 0,90 0,30
[200 ; 400[ 0,10 1 0,10
Ensemble 1 - -
3. Selon l’Insee, 37 % des magasins de vêtements et/ou de chaussures de moins de 400 m² ont une surface de
vente comprise entre 50 et 100 m². 70 % de ces magasins ont une surface inférieure à 100 m² et 30 % une
surface supérieure à 100 m² et inférieure à 400 m².
4. Distribution des magasins d'habillement-chaussures selon la surface de vente en 2009
% cumulés croissants % cumulés décroissants
100% 95% 100%
100% 90%

80% 67% 70%

60%
33% 30%
40%
20% 0% 5% 10%
0%
0%
0 50 100 150 200 250 300 350 400

5. La médiane correspond à la coordonnée d’abscisses du point d’intersection entre les deux courbes. Soit une
surface de vente médiane d’environ 75 m².

Exercice 5 : fréquences cumulées, variété des représentations graphiques

1. Cela revient à calculer la fréquence cumulée décroissante de la modalité « un véhicule » en 2008, soit 81 %.

Probabilités et statistiques I – Deuxième fiche de TD - Page 3 sur 8


2. Diverses possibilités ! Le tableau présente trois répartitions différentes. On pourrait juxtaposer des diagrammes
en bâtons pour les différentes années par exemple. Un diagramme en barres est pertinent : on peut
directement y lire les fréquences cumulées croissantes (ou décroissantes si les modalités sont rangées dans
l’ordre inverse) tout en visualisant les pourcentages de chaque modalité.
Evolution de la répartition des ménages selon le nombre de véhicule
100%
90%
80%
70%
60% Deux véhicules ou plus
50%
Un véhicule
40%
30% Aucun véhicule
20%
10%
0%
1982 1994 2008
Champ : France métropolitaine, population des ménages
Source : Insee, enquêtes nationales transport 1982, 1994 et 2008

Exercice 6 : données groupées, histogramme avec classes de mêmes amplitudes


1. Pays européens appartenant à l’OCDE où existe en 2015 un salaire minimum défini à l’échelle nationale. La
variable principale est le salaire minimum horaire, caractère quantitatif continu.
2.
Pays Salaire minimum
Slovaquie 3.4
Estonie 3.6
Tchéquie 3.8
Hongrie 4.2
Portugal 4.3
Grèce 4.8
Espagne 5
Pologne 5.3
Slovénie 6.8
Royaume-Uni 8.2
Irlande 8.7
Pays-Bas 9.6
Belgique 10
Allemagne 10.2
France 10.9
Luxembourg 11.2

3. Au moins 5 classes, on peut utiliser la règle suivante : prendre la racine carrée du nombre d’observations.
4.
Classe Centre de la classe Fréquence
[3,4 ; 4,96[ 4,18 = (3,4+4,96)/2 6
[4,96 ; 6,52[ 5,74 2

Probabilités et statistiques I – Deuxième fiche de TD - Page 4 sur 8


Classe Centre de la classe Fréquence
[6,52 ; 8,08[ 7,30 1
[8,08 ; 9,64[ 8,86 3
[9,64 ; 11,2[ 10,42 4
Valeur de départ 3,4 16

5.
6. Forte hétérogénéité en Europe due à l’histoire économique (ex-bloc soviétique) mais convergence
économique.

Exercice 7 : Histogramme ou diagramme en bâtons ?

1. Voir le champ.
2. Évolution du salaire net réel de 2002 à 2003.
3. On utilise des classes de valeurs (0 à +5 %, par exemple) comme dans le cas d’une variable
qualitative/catégorielle où l’on utilise un diagramme en barres.
4. Un diagramme en barres comme celui-ci ne devrait pas être utilisé pour représenter la distribution d’une
variable quantitative continue. But de simplification pour la lecture.

Exercice 8 : distribution empirique, diagramme à barre et diagramme en boîte

1. La population est l’ensemble des périodes de 5 minutes qui couvrent les horaires d’ouverture de ce guichet. Le
nombre d’usagers qui se présentent à ce guichet par période de 5 minutes est une variable quantitative
discrète.
2.
Valeur Fréquence Fréq. relative en % Fréq. cumulée Fréq. cumulée en %
1 2 2,00 2 2,00
2 8 8,00 10 10,00

Probabilités et statistiques I – Deuxième fiche de TD - Page 5 sur 8


Valeur Fréquence Fréq. relative en % Fréq. cumulée Fréq. cumulée en %
3 14 14,00 24 24,00
4 20 20,00 44 44,00
5 19 19,00 63 63,00
6 15 15,00 78 78,00
7 9 9,00 87 87,00
8 6 6,00 93 93,00
9 2 2,00 95 95,00
10 3 3,00 98 98,00
11 1 1,00 99 99,00
12 1 1,00 100 100,00
Total 100 100.00 100 100.00
3.

Bien superposer les deux graphiques. Expliquez comment calculer le premier quartile Q1 (valeur pour laquelle le
pourcentage cumulé dépasse 25% soit 4) ; et le troisième quartile Q3 (valeur pour laquelle le pourcentage cumulé
dépasse 75% soit 6) et la médiane (valeur pour laquelle le pourcentage cumulé dépasse 50% soit 5). La moyenne
est égale à 5,07 et représenter par le point en noir dans le diagramme de Tukey. Précisez que les moustaches sont
calculées de cette manière pour la borne inférieure : Q1 - 1,5*EIQ soit 4 - 1,5*(6 - 4) = 1. Et, pour la borne
supérieure : Q3 + 1,5*EIQ soit 6 + 1,5*(6 – 4) = 9. Les valeurs en dehors des moustaches sont considérées comme
aberrantes.

Exercice 9 : diagramme type Pareto


1. Le PIB de la France représente 19,5 % du PIB de la zone euro en 2010.
2. Pour construire ce diagramme il faut :
Étape 1 : Ordonner la série par ordre décroissant de PIB ;
Étape 2 : Calculer les % cumulés de PIB.
Ordre décroissant Fréquence cumulée en %
Allemagne 26,9 26,9
France 19,5 46,4

Probabilités et statistiques I – Deuxième fiche de TD - Page 6 sur 8


Ordre décroissant Fréquence cumulée en %
Italie 17 63,4
Espagne 12,9 76,3
Pays-Bas 6,2 82,5
Belgique 3,6 86,1
Autriche 3 89,1
Grèce 2,8 91,9
Portugal 2,3 94,2
Finlande 1,7 95,9
Irlande 1,6 97,5
Slovaquie 1,1 98,6
Slovénie 0,5 99,1
Luxembourg 0,4 99,5
Chypre 0,2 99,7
Estonie 0,2 99,9
Malte 0,1 100
Étape 3 : comme rappelé dans le chapitre 2 du cours magistral (slide 17), Lorsque les barres sont disposées
en ordre décroissant de hauteur de gauche à droite (la cause la plus fréquente apparaissant en premier),
le diagramme à barres est appelé diagramme de Pareto.

Étape 4 : vous ajoutez une courbe cumulative comme indiqué dans les slides 52 et 53 du chapitre 2 du
cours magistral dans l’exemple du Garage Hudson Auto.

Probabilités et statistiques I – Deuxième fiche de TD - Page 7 sur 8


3. La « loi de Pareto » (« loi des 80-20 ») est à peu près respectée ici puisque 4/17 pays soit 23,5 % des pays sont à
l’origine de 76,3 % de l’activité économique de la zone euro en 2010. Il s’agit d’une loi empirique et les « 80-
20 » ne sont pas toujours exactement respectés. Parfois, c’est un peu plus ou un peu moins de 20% pour les
« causes » et, donc, un peu moins ou un peu plus de 80% pour les « conséquences. »
Remarque : on peut construire un diagramme de Pareto pour une variable qualitative à partir d’un diagramme
en barres. Pour une variable quantitative, il faut regrouper les données dans des modalités comportant des
étiquettes (labels, voir le cours magistral). Ici dans cet exercice, les catégories sont les noms des pays.

Probabilités et statistiques I – Deuxième fiche de TD - Page 8 sur 8

Vous aimerez peut-être aussi