Vous êtes sur la page 1sur 67

Retour sur l’exercice de la semaine

Résumés statistiques des variables qualitatives


Graphiques statistiques

R.1-04 : Statistique descriptive 1


Chapitre 2 : Variables qualitatives

Vincent Brault
Vincent.Brault@univ-grenoble-alpes.fr

UGA/IUT2/SD

BUT SD 1A, 2023-2024

1/24 VB Statistique descriptive 1


Retour sur l’exercice de la semaine
TD1
Résumés statistiques des variables qualitatives
Bonus
Graphiques statistiques

Retour sur le TD1

DATA1 : Informations sur 109 pays membres de l’ONU en 1995


a. Zone (OCDE, Europe de l’Est, Pacifique/Asie, Afrique, Moyen
Orient, Amérique Latine)
b. Superficie (en km²)
c. Densité de population (nombre d’habitants au km²)
d. Climat prédominant (désertique, aride, tropical, méditerranéen,
maritime, tempéré, arctique)
e. Nombre de couleurs (dominantes) dans le drapeau national
f. Taux de scolarisation
g.
Appartient à l’Union Européenne (UE) ?
h. Nombre de cas de SIDA pour 100000 personnes

2/24 VB Statistique descriptive 1


Retour sur l’exercice de la semaine
TD1
Résumés statistiques des variables qualitatives
Bonus
Graphiques statistiques

Retour sur le TD1

DATA2 : Informations sur les 50 états des USA en 1977


a. Taux de meurtres (pour 100000 habitants)
b. Taux de vols de voitures (pour 100000 habitants)
c. Niveau de vie moyen dans l’état (Très élevé, Elevé, Moyen, Faible,
Très faible)
d. Peine de mort en vigueur dans l’état ?

3/24 VB Statistique descriptive 1


Retour sur l’exercice de la semaine
TD1
Résumés statistiques des variables qualitatives
Bonus
Graphiques statistiques

Bonus : quel est le problème avec cette affirmation ?

4/24 VB Statistique descriptive 1


Retour sur l’exercice de la semaine
TD1
Résumés statistiques des variables qualitatives
Bonus
Graphiques statistiques

Plan du cours

1 Résumés statistiques des variables qualitatives

2 Graphiques statistiques
La théorie
Quelques exemples à ne pas faire

5/24 VB Statistique descriptive 1


Retour sur l’exercice de la semaine
TD1
Résumés statistiques des variables qualitatives
Bonus
Graphiques statistiques

Statistique descriptive

La statistique descriptive désigne un ensemble de techniques dont le but


est de
explorer, découvrir l’information contenue dans les données
les représenter graphiquement
détecter des premières tendances
A chacun de ces buts correspond une technique :
explorer, découvrir les données tableaux statistiques
résumer l’information résumés statistiques
représenter graphiquement graphiques
détecter des tendances indicateurs de liaison

6/24 VB Statistique descriptive 1


Retour sur l’exercice de la semaine
TD1
Résumés statistiques des variables qualitatives
Bonus
Graphiques statistiques

Exemple d’appui : rappel

Exemple 1 : fichier data nutri.csv


Enquête sur l’alimentation de 226 personnes âgées de la région de
Bordeaux en 2000.
Source : ”Le logiciel R” P. Lafaye de Micheaux, R. Drouilhet, B. Liquet.

sexe, situation familiale


consommation journalière de thé, de café (en nombre de tasses)

taille (en cm), poids (en kg), âge (en années) le jour de l’enquête

consommation hebdomadaire de viande, poisson, fruits crus, fruits et


légumes cuits, chocolat (0 : jamais, 1 : ¡ 1 fois, 2 : 1 fois, 3 : 2 ou 3,
4 : 4 à 6 fois, 5 : tous les jours)
matière grasse utilisée préférentiellement pour la cuisson

7/24 VB Statistique descriptive 1


Retour sur l’exercice de la semaine
TD1
Résumés statistiques des variables qualitatives
Bonus
Graphiques statistiques

Exemple d’appui : rappel

Exemple 1 : fichier data nutri.csv


Enquête sur l’alimentation de 226 personnes âgées de la région de
Bordeaux en 2000.
Source : ”Le logiciel R” P. Lafaye de Micheaux, R. Drouilhet, B. Liquet.

sexe, situation familiale variables qualitatives nominales


consommation journalière de thé, de café (en nombre de tasses)

taille (en cm), poids (en kg), âge (en années) le jour de l’enquête

consommation hebdomadaire de viande, poisson, fruits crus, fruits et


légumes cuits, chocolat (0 : jamais, 1 : ¡ 1 fois, 2 : 1 fois, 3 : 2 ou 3,
4 : 4 à 6 fois, 5 : tous les jours)
matière grasse utilisée préférentiellement pour la cuisson

7/24 VB Statistique descriptive 1


Retour sur l’exercice de la semaine
TD1
Résumés statistiques des variables qualitatives
Bonus
Graphiques statistiques

Exemple d’appui : rappel

Exemple 1 : fichier data nutri.csv


Enquête sur l’alimentation de 226 personnes âgées de la région de
Bordeaux en 2000.
Source : ”Le logiciel R” P. Lafaye de Micheaux, R. Drouilhet, B. Liquet.

sexe, situation familiale variables qualitatives nominales


consommation journalière de thé, de café (en nombre de tasses)
variables quantitatives discrètes
taille (en cm), poids (en kg), âge (en années) le jour de l’enquête

consommation hebdomadaire de viande, poisson, fruits crus, fruits et


légumes cuits, chocolat (0 : jamais, 1 : ¡ 1 fois, 2 : 1 fois, 3 : 2 ou 3,
4 : 4 à 6 fois, 5 : tous les jours)
matière grasse utilisée préférentiellement pour la cuisson

7/24 VB Statistique descriptive 1


Retour sur l’exercice de la semaine
TD1
Résumés statistiques des variables qualitatives
Bonus
Graphiques statistiques

Exemple d’appui : rappel

Exemple 1 : fichier data nutri.csv


Enquête sur l’alimentation de 226 personnes âgées de la région de
Bordeaux en 2000.
Source : ”Le logiciel R” P. Lafaye de Micheaux, R. Drouilhet, B. Liquet.

sexe, situation familiale variables qualitatives nominales


consommation journalière de thé, de café (en nombre de tasses)
variables quantitatives discrètes
taille (en cm), poids (en kg), âge (en années) le jour de l’enquête
variables quantitatives continues
consommation hebdomadaire de viande, poisson, fruits crus, fruits et
légumes cuits, chocolat (0 : jamais, 1 : ¡ 1 fois, 2 : 1 fois, 3 : 2 ou 3,
4 : 4 à 6 fois, 5 : tous les jours)
matière grasse utilisée préférentiellement pour la cuisson

7/24 VB Statistique descriptive 1


Retour sur l’exercice de la semaine
TD1
Résumés statistiques des variables qualitatives
Bonus
Graphiques statistiques

Exemple d’appui : rappel

Exemple 1 : fichier data nutri.csv


Enquête sur l’alimentation de 226 personnes âgées de la région de
Bordeaux en 2000.
Source : ”Le logiciel R” P. Lafaye de Micheaux, R. Drouilhet, B. Liquet.

sexe, situation familiale variables qualitatives nominales


consommation journalière de thé, de café (en nombre de tasses)
variables quantitatives discrètes
taille (en cm), poids (en kg), âge (en années) le jour de l’enquête
variables quantitatives continues
consommation hebdomadaire de viande, poisson, fruits crus, fruits et
légumes cuits, chocolat (0 : jamais, 1 : ¡ 1 fois, 2 : 1 fois, 3 : 2 ou 3,
4 : 4 à 6 fois, 5 : tous les jours) variables qualitatives ordonnées
matière grasse utilisée préférentiellement pour la cuisson

7/24 VB Statistique descriptive 1


Retour sur l’exercice de la semaine
TD1
Résumés statistiques des variables qualitatives
Bonus
Graphiques statistiques

Exemple d’appui : rappel

Exemple 1 : fichier data nutri.csv


Enquête sur l’alimentation de 226 personnes âgées de la région de
Bordeaux en 2000.
Source : ”Le logiciel R” P. Lafaye de Micheaux, R. Drouilhet, B. Liquet.

sexe, situation familiale variables qualitatives nominales


consommation journalière de thé, de café (en nombre de tasses)
variables quantitatives discrètes
taille (en cm), poids (en kg), âge (en années) le jour de l’enquête
variables quantitatives continues
consommation hebdomadaire de viande, poisson, fruits crus, fruits et
légumes cuits, chocolat (0 : jamais, 1 : ¡ 1 fois, 2 : 1 fois, 3 : 2 ou 3,
4 : 4 à 6 fois, 5 : tous les jours) variables qualitatives ordonnées
matière grasse utilisée préférentiellement pour la cuisson variables
qualitatives nominales

7/24 VB Statistique descriptive 1


Retour sur l’exercice de la semaine
Résumés statistiques des variables qualitatives
Graphiques statistiques

Tableau de données individuelles


Au départ, les données se présentent souvent sous la forme d’un tableau
de données individuelles qui contient :
les individus statistiques en ligne
les variables statistiques en colonne

Figure – Extrait du tableau des données individuelles du fichier data nutri.csv.

8/24 VB Statistique descriptive 1


Retour sur l’exercice de la semaine
Résumés statistiques des variables qualitatives
Graphiques statistiques

Tri à plat

Pour résumer l’information contenue dans les variables qualitatives, on


commence par réaliser un tri à plat.
Tri à plat
Un tri à plat est un tableau qui à chaque modalité ak possible de la
variable qualitative associe un effectif Nk et une fréquence fk ;
l’effectif Nk est le nombre d’individus dans la population observée
pour lesquels la variable a pour valeur ak ;
la fréquence fk est la proportion d’individus dans la population
observée pour lesquels la variable a pour valeur ak .
P
En particulier, si l’effectif total est N = k Nk , fk = Nk /N.

9/24 VB Statistique descriptive 1


Retour sur l’exercice de la semaine
Résumés statistiques des variables qualitatives
Graphiques statistiques

Tri à plat d’une variable qualitative nominale

Figure – Tris à plat des variables Sexe, Situation et Matière grasse du fichier
data nutri.csv.

Par défaut, dans la plupart des logiciels, les modalités sont classées par
ordre alphabétique.
10/24 VB Statistique descriptive 1
Retour sur l’exercice de la semaine
Résumés statistiques des variables qualitatives
Graphiques statistiques

A quoi sert un tri à plat ?


d’abord, à vérifier la qualité des données : on peut facilement voir
s’il y a des problèmes de codages : même modalité codée avec
différentes orthographes ou casses, codage des valeurs manquantes,
etc ⇒ dans ce cas, on essaie de corriger un maximum d’erreurs avant
d’aller plus loin dans l’analyse.
s’il y a beaucoup de valeurs manquantes : si la fréquence des valeurs
manquantes est faible pour certaines variables, l’exploitation de cette
variable sera délicate. ⇒ on calculera les fréquences du tri à plat sur
les données valides, tout en précisant l’effectif sur lequel on calcule
ces fréquences.

Figure – Tri à plat de la variable Situation (base : 212 données, soit 93,8% du
total)

Exercice

11/24 VB Statistique descriptive 1


Retour sur l’exercice de la semaine
Résumés statistiques des variables qualitatives
Graphiques statistiques

A quoi sert un tri à plat ?


ensuite, à examiner la distribution de la variable : la variable est-elle
répartie sur plusieurs modalités ou au contraire concentrée sur un
petit nombre de modalités ? Quelles est les principales modalités
présentes ?
pour faciliter la lecture et l’interprétation du tri à plat, il peut être
utile d’ordonner les modalités par ordre décroissant des fréquences.
La modalité de plus grande fréquence s’appelle le mode de la
distribution.
si beaucoup de variables sont peu représentées, on peut être amené
à agréger certaines modalités.

Figure – Tris à plat de la variable Matière grasse ordonné et agrégé.

12/24 VB Statistique descriptive 1


Retour sur l’exercice de la semaine
Résumés statistiques des variables qualitatives
Graphiques statistiques

Tri à plat d’une variable qualitative ordonnée


Pour résumer l’information contenue dans les variables qualitatives
ordonnées, on commence aussi par un tri à plat, MAIS
on gardera toujours l’ordre naturel des modalités ;
on pourra ajouter au tableau des fréquences cumulées :
X
Fk = fl .
l≤k

Figure – Tris à plat de la variable Viande.

Commentaire : 57% des personnes âgées présentes dans l’échantillon


mangent au moins 4 fois par semaine de la viande.
13/24 VB Statistique descriptive 1
Retour sur l’exercice de la semaine
La théorie
Résumés statistiques des variables qualitatives
Quelques exemples à ne pas faire
Graphiques statistiques

Représenter les variables qualitatives nominatives


Diagramme en tuyaux d’orgue (ou en barres) ou diagramme de Pareto

Figure – Distribution de la variable Matière Grasse.

Quand il y a beaucoup de modalités différentes à représenter, le


diagramme de Pareto est plus lisible.

14/24 VB Statistique descriptive 1


Retour sur l’exercice de la semaine
La théorie
Résumés statistiques des variables qualitatives
Quelques exemples à ne pas faire
Graphiques statistiques

Représenter les variables qualitatives nominatives


Diagramme en tuyaux d’orgue (ou en barres) ou diagramme de Pareto

Figure – Distribution de la variable Matière Grasse.

Quand il y a beaucoup de modalités différentes à représenter, le


diagramme de Pareto est plus lisible.
Éviter les diagrammes en 3D qui sont plus difficiles à lire pour l’œil
humain et n’apporte aucune information supplémentaire.
14/24 VB Statistique descriptive 1
Retour sur l’exercice de la semaine
La théorie
Résumés statistiques des variables qualitatives
Quelques exemples à ne pas faire
Graphiques statistiques

Représenter les variables qualitatives nominatives


Diagramme en tuyaux d’orgue (ou en barres) ou diagramme de Pareto Exercice

Figure – Distribution de la variable Matière Grasse.

Quand il y a beaucoup de modalités différentes à représenter, le


diagramme de Pareto est plus lisible.
Éviter les diagrammes en 3D qui sont plus difficiles à lire pour l’œil
humain et n’apporte aucune information supplémentaire.
14/24 VB Statistique descriptive 1
Retour sur l’exercice de la semaine
La théorie
Résumés statistiques des variables qualitatives
Quelques exemples à ne pas faire
Graphiques statistiques

Représenter les variables qualitatives nominatives


Diagramme empilé

Figure – Distribution de la variable Matière Grasse.

Également plus lisible si les modalités sont ordonnées.


Difficile à lire s’il y a trop de modalités à très faible fréquence.
15/24 VB Statistique descriptive 1
Retour sur l’exercice de la semaine
La théorie
Résumés statistiques des variables qualitatives
Quelques exemples à ne pas faire
Graphiques statistiques

Représenter les variables qualitatives nominatives


Diagramme empilé Exercice

Figure – Distribution de la variable Matière Grasse.

Également plus lisible si les modalités sont ordonnées.


Difficile à lire s’il y a trop de modalités à très faible fréquence.
15/24 VB Statistique descriptive 1
Retour sur l’exercice de la semaine
La théorie
Résumés statistiques des variables qualitatives
Quelques exemples à ne pas faire
Graphiques statistiques

Représenter les variables qualitatives nominatives


Diagramme circulaire

Figure – Distribution de la variable Matière Grasse.

Très difficile à lire s’il y a trop de modalités

16/24 VB Statistique descriptive 1


Retour sur l’exercice de la semaine
La théorie
Résumés statistiques des variables qualitatives
Quelques exemples à ne pas faire
Graphiques statistiques

Représenter les variables qualitatives nominatives


Diagramme circulaire Exercice

Figure – Distribution de la variable Matière Grasse.

Très difficile à lire s’il y a trop de modalités

16/24 VB Statistique descriptive 1


Retour sur l’exercice de la semaine
La théorie
Résumés statistiques des variables qualitatives
Quelques exemples à ne pas faire
Graphiques statistiques

Diagramme circulaire en 3D
Quelle est la tranche la plus grande ?

17/24 VB Statistique descriptive 1


Retour sur l’exercice de la semaine
La théorie
Résumés statistiques des variables qualitatives
Quelques exemples à ne pas faire
Graphiques statistiques

Diagramme circulaire en 3D
Quelle est la tranche la plus grande ? Rouge ?

17/24 VB Statistique descriptive 1


Retour sur l’exercice de la semaine
La théorie
Résumés statistiques des variables qualitatives
Quelques exemples à ne pas faire
Graphiques statistiques

Diagramme circulaire en 3D
Quelle est la tranche la plus grande ? Rouge ?

17/24 VB Statistique descriptive 1


Retour sur l’exercice de la semaine
La théorie
Résumés statistiques des variables qualitatives
Quelques exemples à ne pas faire
Graphiques statistiques

Diagramme circulaire en 3D
Quelle est la tranche la plus grande ? Violet !

17/24 VB Statistique descriptive 1


Retour sur l’exercice de la semaine
La théorie
Résumés statistiques des variables qualitatives
Quelques exemples à ne pas faire
Graphiques statistiques

Diagramme circulaire en 3D
Quelle est la tranche la plus grande ? Violet !

17/24 VB Statistique descriptive 1


Retour sur l’exercice de la semaine
La théorie
Résumés statistiques des variables qualitatives
Quelques exemples à ne pas faire
Graphiques statistiques

Diagramme circulaire en 3D
Quelle est la tranche la plus grande ?

17/24 VB Statistique descriptive 1


Retour sur l’exercice de la semaine
La théorie
Résumés statistiques des variables qualitatives
Quelques exemples à ne pas faire
Graphiques statistiques

Diagramme circulaire en 3D
Quelle est la tranche la plus grande ? Peut-être le cyan du coup...

17/24 VB Statistique descriptive 1


Retour sur l’exercice de la semaine
La théorie
Résumés statistiques des variables qualitatives
Quelques exemples à ne pas faire
Graphiques statistiques

Diagramme circulaire en 3D
Quelle est la tranche la plus grande ?

Bleu 20
Rouge 30
Vert 10
Violet 50
Cyan 60

17/24 VB Statistique descriptive 1


Retour sur l’exercice de la semaine
La théorie
Résumés statistiques des variables qualitatives
Quelques exemples à ne pas faire
Graphiques statistiques

Diagramme circulaire en 3D

Le seul diagramme circulaire en 3D que je tolère...

17/24 VB Statistique descriptive 1


Retour sur l’exercice de la semaine
La théorie
Résumés statistiques des variables qualitatives
Quelques exemples à ne pas faire
Graphiques statistiques

Représenter les variables qualitatives ordonnées


Pour conserver l’ordre naturel sur les modalités, on utilise les diagrammes
en tuyaux d’orgue et les diagrammes empilés.

Figure – Distribution de la variable Viande.


Les diagrammes de Pareto et circulaires sont à éviter car ils perdent
l’ordre naturel sur les modalités.
Le diagramme empilé a l’avantage de faire apparaitre les fréquences
cumulées.
18/24 VB Statistique descriptive 1
Retour sur l’exercice de la semaine
La théorie
Résumés statistiques des variables qualitatives
Quelques exemples à ne pas faire
Graphiques statistiques

Exemple d’une image de BFM TV

19/24 VB Statistique descriptive 1


Retour sur l’exercice de la semaine
La théorie
Résumés statistiques des variables qualitatives
Quelques exemples à ne pas faire
Graphiques statistiques

Exemple d’une image de BFM TV

3D, zone 48% plus que 50%, manque une modalité (32%%), choix des
couleurs
19/24 VB Statistique descriptive 1
Retour sur l’exercice de la semaine
La théorie
Résumés statistiques des variables qualitatives
Quelques exemples à ne pas faire
Graphiques statistiques

Même style (tweet de @Alainmi11)

20/24 VB Statistique descriptive 1


Retour sur l’exercice de la semaine
La théorie
Résumés statistiques des variables qualitatives
Quelques exemples à ne pas faire
Graphiques statistiques

Même style (tweet de @Alainmi11)

Les zones ne sont pas proportionnelles, les demis camemberts ont les
mêmes angles

20/24 VB Statistique descriptive 1


Retour sur l’exercice de la semaine
La théorie
Résumés statistiques des variables qualitatives
Quelques exemples à ne pas faire
Graphiques statistiques

Chez nos homologues américains

21/24 VB Statistique descriptive 1


Retour sur l’exercice de la semaine
La théorie
Résumés statistiques des variables qualitatives
Quelques exemples à ne pas faire
Graphiques statistiques

Chez nos homologues américains

La somme des pourcentages fait 178%.

21/24 VB Statistique descriptive 1


Retour sur l’exercice de la semaine
La théorie
Résumés statistiques des variables qualitatives
Quelques exemples à ne pas faire
Graphiques statistiques

Alors là, je n’ai pas compris (tweet@afp ; effacé depuis)

22/24 VB Statistique descriptive 1


Retour sur l’exercice de la semaine
La théorie
Résumés statistiques des variables qualitatives
Quelques exemples à ne pas faire
Graphiques statistiques

Alors là, je n’ai pas compris (tweet@afp ; effacé depuis)

Des doubles proportions en fonction des mandats, les points sont


illisibles...
22/24 VB Statistique descriptive 1
Retour sur l’exercice de la semaine
La théorie
Résumés statistiques des variables qualitatives
Quelques exemples à ne pas faire
Graphiques statistiques

Avec des barres maintenant

0. Source https://www.liberation.fr/checknews/2019/05/06/
cnews-a-t-elle-diffuse-un-graphique-trompeur-sur-les-intentions-de-vote-aux-eu
1725212
23/24 VB Statistique descriptive 1
Retour sur l’exercice de la semaine
La théorie
Résumés statistiques des variables qualitatives
Quelques exemples à ne pas faire
Graphiques statistiques

Avec des barres maintenant

Critique 1 : l’après barre inégal.


0. Source https://www.liberation.fr/checknews/2019/05/06/
cnews-a-t-elle-diffuse-un-graphique-trompeur-sur-les-intentions-de-vote-aux-eu
1725212
23/24 VB Statistique descriptive 1
Retour sur l’exercice de la semaine
La théorie
Résumés statistiques des variables qualitatives
Quelques exemples à ne pas faire
Graphiques statistiques

Avec des barres maintenant

Critique 2 : barres non proportionnelles.


0. Source https://www.liberation.fr/checknews/2019/05/06/
cnews-a-t-elle-diffuse-un-graphique-trompeur-sur-les-intentions-de-vote-aux-eu
1725212
23/24 VB Statistique descriptive 1
Retour sur l’exercice de la semaine
La théorie
Résumés statistiques des variables qualitatives
Quelques exemples à ne pas faire
Graphiques statistiques

Barres toujours

0. Source https://www.lemonde.fr/les-decodeurs/article/2018/05/22/
sept-conseils-pour-ne-pas-se-faire-avoir-par-les-representations-graphiques_
5302680_4355770.html
24/24 VB Statistique descriptive 1
Retour sur l’exercice de la semaine
La théorie
Résumés statistiques des variables qualitatives
Quelques exemples à ne pas faire
Graphiques statistiques

Barres toujours

0. Source https://www.lemonde.fr/les-decodeurs/article/2018/05/22/
sept-conseils-pour-ne-pas-se-faire-avoir-par-les-representations-graphiques_
5302680_4355770.html
24/24 VB Statistique descriptive 1
Exercice 1
Exercice 2

Énoncé

À partir des données fournies sur un échantillons d’athlètes ayant


participé aux Jeux Olympiques de Tokyo, nous allons étudier la variable
”Discipline”.
1 Faire un tri à plat comme le ferait un logiciel.

25/24 VB Statistique descriptive 1


Exercice 1
Exercice 2

Solution

Pour le tri à plat : 5 modalités (Basketball, Basket-ball, Hockey, hockey


et Natation) avec seulement 58 réponses (donc environ 96,7% de
répondants).

Retour cours

26/24 VB Statistique descriptive 1


Exercice 1
Exercice 2

Solution

Pour le tri à plat : 5 modalités (Basketball, Basket-ball, Hockey, hockey


et Natation) avec seulement 58 réponses (donc environ 96,7% de
répondants).

Retour cours

26/24 VB Statistique descriptive 1


Exercice 1
Exercice 2

Regroupement

Les regroupements pouvant être faits :


• Les modalités ”Basketball” et ”Basket-ball” qui auraient dû être
regroupées dès le début.
• Les modalités ”Hockey” et ”hockey” qui auraient dû être regroupées
dès le début aussi.

27/24 VB Statistique descriptive 1


Exercice 1
Exercice 2

Énoncé

À partir des données fournies sur un échantillons d’athlètes ayant


participé aux Jeux Olympiques de Tokyo, nous allons étudier la variable
”Discipline”.
1 Faire un tri à plat après correction des erreurs de saisies.

28/24 VB Statistique descriptive 1


Exercice 1
Exercice 2

Solution

Pour le tri à plat : 3 modalités (Basket-ball, Hockey et Natation).

Retour cours

29/24 VB Statistique descriptive 1


Exercice 1
Exercice 2

Solution

Pour le tri à plat : 3 modalités (Basket-ball, Hockey et Natation).

Retour cours

29/24 VB Statistique descriptive 1


Exercice 1
Exercice 2

À partir des données fournies sur un échantillons d’athlètes ayant


participé aux Jeux Olympiques de Tokyo, nous allons étudier la variable
”Discipline”.
1 Faire le diagramme en tuyaux d’Orgue ou de Pareto.
Retour cours

30/24 VB Statistique descriptive 1


Exercice 1
Exercice 2

Diagramme en tuyaux d'orgue des disciplines Diagramme de Pareto des disciplines


45% 30
40%
25
35%

30% 20
Porucentages

25%

Effectifs
41% 15
20% 38%
24
15% 22
10
10% 21%
12
5
5%

0% 0
Basket-ball Hockey Natation Hockey Natation Basket-ball
Discipline
Disciplines

Tuyaux d’orgue Pareto

Ces graphiques ont été faits avec 96,7% des répondants.


30/24 VB Statistique descriptive 1 Retour cours
Exercice 1
Exercice 2

À partir des données fournies sur un échantillons d’athlètes ayant


participé aux Jeux Olympiques de Tokyo, nous allons étudier la variable
”Discipline”.
1 Faire le diagramme empilé.
Retour cours

30/24 VB Statistique descriptive 1


Exercice 1
Exercice 2

Diagramme en tuyaux d'orgue des disciplines Diagramme de Pareto des disciplines


45% 30
40%
25
35%

30% 20
Porucentages

25%

Effectifs
41% 15
20% 38%
24
15% 22
10
10% 21%
12
5
5%

0% 0
Basket-ball Hockey Natation Hockey Natation Basket-ball
Discipline
Disciplines

Tuyaux d’orgue Pareto

Diagramme empilé des disciplines


100%
90% 12
80%
70%
Porucentages

60% 22
50% Basket-ball
40% Natation

30% Hockey

20% 24
10%
0%
Effectif
Disciplines

Empilé
Ces graphiques ont été faits avec 96,7% des répondants.
30/24 VB Statistique descriptive 1 Retour cours
Exercice 1
Exercice 2

À partir des données fournies sur un échantillons d’athlètes ayant


participé aux Jeux Olympiques de Tokyo, nous allons étudier la variable
”Discipline”.
1 Faire le diagramme circulaire.
Retour cours

30/24 VB Statistique descriptive 1


Exercice 1
Exercice 2

Diagramme en tuyaux d'orgue des disciplines Diagramme de Pareto des disciplines


45% 30
40%
25
35%

30% 20
Porucentages

25%

Effectifs
41% 15
20% 38%
24
15% 22
10
10% 21%
12
5
5%

0% 0
Basket-ball Hockey Natation Hockey Natation Basket-ball
Discipline
Disciplines

Tuyaux d’orgue Pareto

Diagramme empilé des disciplines Diagramme circulaire des disciplines


100%
90% 12
80%
70%
12
Porucentages

60% 22
50% Basket-ball Hockey
24
40% Natation Natation
30% Hockey Basket-ball
20% 24
22
10%
0%
Effectif
Disciplines

Empilé Circulaire
Ces graphiques ont été faits avec 96,7% des répondants.
30/24 VB Statistique descriptive 1 Retour cours
Exercice 1
Exercice 2

Énoncé

À partir des données fournies sur un échantillons d’athlètes ayant


participé aux Jeux Olympiques de Tokyo, nous allons étudier la variable
”Pays”.
1 Faire un tri à plat.
2 Faire les graphiques vus précédemment : diagramme en tuyaux
d’orgue, diagramme de Pareto, diagramme empilé et diagramme
circulaire.
3 Peut-on regrouper des variables ?

31/24 VB Statistique descriptive 1


Exercice 1
Exercice 2

Solution

Pour le tri à plat : 9 modalités (Argentina, Australia, Canada, Germany,


Great Britain, Japan, Netherlands, Spain et United States of America)
avec seulement 52 réponses (≈ 86, 7%).

32/24 VB Statistique descriptive 1


Exercice 1
Exercice 2

Solution

Pour le tri à plat : 9 modalités (Argentina, Australia, Canada, Germany,


Great Britain, Japan, Netherlands, Spain et United States of America)
avec seulement 52 réponses (≈ 86, 7%).

32/24 VB Statistique descriptive 1


Exercice 1
Exercice 2

Diagramme en tuyaux d'orgues de la variable Pays Diagramme de Pareto de la variable Pays


25,00%
25,00%

20,00%
20,00%

15,00%
15,00%
Pourcentages

Pourcentages
21,15%
10,00% 21,15%
19,23% 19,23% 10,00%
19,23% 19,23%

11,54% 11,54%
11,54% 11,54%
5,00%
5,00%
7,69%
7,69%
5,77%
5,77%

1,92% 1,92%
1,92% 1,92%
0,00%
0,00%
Argentina Australia Canada Germany Great Britain Japan Netherlands Spain United States of
Spain Japan United States of Australia Germany Canada Argentina Great Britain Netherlands
America
America
Nom des pays
Nom des pays

Tuyaux d’orgue Pareto


Diagramme circulaire de la variable Pays Diagramme circulaire de la variable Pays
100% 1,92%
1,92%
5,77%
90%
7,69%

80%
11,54%
1,92%
1,92%
5,77%
70%
21,15% Netherlands
7,69% Spain 11,54%
Great Britain
Japan
60%
Argentina
United States of America

Pourcentages
Canada
Australia
11,54%
50% 19,23% Germany
Germany
Australia
Canada
United States of America
19,23% Argentina 40%
Japan
Great Britain
11,54%
Spain
Netherlands 19,23%
30%

19,23%
20%

10% 21,15%

0%

Circulaire Empilé
Ces graphiques ont été faits avec 86,7% des répondants.
33/24 VB Statistique descriptive 1
Exercice 1
Exercice 2

Regroupement

Les regroupements pouvant être faits :


• Les modalités doivent être traduites en français (attention, pour le
diagramme en tuyaux d’Orgues, l’ordre change).
• Les modalités ”Royaume Unis” et ”Pays-Bas” peuvent être
regroupées sous ”Autre pays européens”.

34/24 VB Statistique descriptive 1


Exercice 1
Exercice 2

Diagramme en tuyaux d'orgue des pays d'appartenance des athlètes Diagramme de Pareto de la variable Pays
25%
25%

21,15%
21,15%

20% 19,23% 19,23% 20% 19,23% 19,23%

15%
15%
Pourcentages

Pourcentages
11,54% 11,54%
11,54% 11,54%

10%
10%

7,69%
7,69%

5,77%
5,77%
5%
3,85% 5%
3,85%

0%
Pays d'appartenance 0%
Pays d'appartenance

Tuyaux d’orgue Pareto


Diagramme circulaire de la variable Pays Diagramme empilé de la variable Pays
100%
3,85%

5,77%
90%
3,85%
7,69%
5,77%

80%
21,15%
11,54%
7,69%
70%

11,54% Autres pays européens


Espagne
60% Argentine
Japon
Canada

Pourcentages
Etats Unis
11,54% Allemagne
Australie 50% 19,23%
Australie
Allemagne
Etats Unis
Canada
40% Japon
Argentine
19,23% Espagne
Autres pays européens
30% 19,23%
11,54%

20%

10% 21,15%
19,23%

0%

Circulaire Empilé
Ces graphiques ont été faits avec 86,7% des répondants.
35/24 VB Statistique descriptive 1

Vous aimerez peut-être aussi